이번 글에서는 그래프 경로 탐색을 통해 데이터간의 복잡한 관계를 찾아보는 것에 대해 다루려고 한다.데이터 간의 연결 관계를 찾아나가는 것은 데이터를 통해 정보를 파악하는 것에 도움이 되는 측면이 있는데 이와 함께 그 연결관계에 대한 명확한 설명력이 있어야 한다.따라서 그래프 경로 탐색 알고리즘을 통해 데이터 간의 연결을 탐색하는 것에 활용할 수 있다.그래프 경로 탐색의 보통 최단 경로 또는 모든 연결 경로를 탐색하는데 대다수의 그래프DB에서 플러그인 형태를 통해 지원을 하고 있다. 지원하지 않더라도 SPARQL을 직접 작성하여 구현이 가능하다.여기에서는 RDF-Star를 지원하는 RDF 계열의 그래프 DB 중 하나인 GraphDB (OntoText)를 사용하여 특정 두 데이터 간의 경로를 찾아보고, ..
이번 글에서는 지난 블로그에서 구축한 지식그래프를 통해 그래프 구조를 활용한 탐색을 해보려고 한다.그래프 구조로 만들어진 데이터는 연결이 생성되어진 경우 그 관계를 따라서 간단하게 데이터를 찾아나갈 수 있는 장점을 제공한다.그리고 연결된 관계를 탐색하다보면 쉽게 발견하지 못했던 관계들을 발견할 수 있는 장점을 가질 수 있다.물론 발견한 정보들은 우리가 가지고 있는 데이터들 사이에 존재하고 있는 정보들이다.반드시 그래프 구조를 통해서만 발견할 수 있다고는 말할 수 없다. 기존의 방식과는 어떻게 쉽게 발견할 수 있는지, 어떠한 구조를 통해 빠르게 접근할 수 있는지가 차이점이라 할 수 있을 것 같다.아래의 예시는 탐색적인 방식으로서기업과 그 기업의 임원, 주주들 간의 관계를 통해 특정 기업이 다른 기업과 어떻..
그래프저장소 중인 하나인 Stardog을 활용하여 데이터를 저장해 두었다면 SPARQL Endpoint를 통해 다양한 검색,질의등을 수행할 수 있다. 이번 글은 Stardog에서 지원하는 엔드포인트를 통해 검색을 하고 그 결과를 테이블 형태로 가져오는 예시를 게시하려고 한다. 쥬피터 노트북을 통해 간단한 코드를 만드는데 여기서 활용하는 라이브러리는 pystardog, panel 이기 때문에 설치를 먼저 진행해야 한다. pip install panel pip install pystardog In [1]: import stardog import pandas as pd import io import panel as pn pn.extension('tabulator') Endpoint 연결을 위한 설정(예시:St..
기업에 대한 정보는 금융감독원의 전자공시시스템을 통해 필요한 정보를 획득할 수 있다. 전자공시시스템(DART : Data Analysis, Retrieval and Transfer System)은 상장법인 등이 공시서류를 인터넷으로 제출하고, 투자자 등 이용자는 제출 즉시 인터넷을 통해 조회할 수 있도록 하는 종합적 기업공시 시스템이다. (참고, https://dart.fss.or.kr/introduction/content1.do) 이번 포스트에서는 전자공시시스템에서 제공하는 기업의 정보들을 가져와 지식그래프 형태로 구성하고 몇가지 내용을 파악하고 분석해보고자 한다. 전자공시시스템 DART에 공시되고있는 공시보고서 원문 등은 오픈API를 통해 활용할 수 있다. 활용을 원하는 누구든지(개인, 기업, 기관 ..
위경도 정보를 활용해 반경 내 특정 정보를 찾아야 하는 태스크가 생겨스타독을 활용하여 반경 내 검색을 적용하였다.스타독에서 기본적으로 지원하는 Geospatial 스펙은 WGS84와 GeoSPARQL 이기 때문에WGS84 위경도 좌표만 입력하면 공간좌표를 활용한 검색이 가능하다.테스트를 위해 특정 위치의 반경 2km내에 존재하는 다른 데이터를 검색하니 매우 빠른 속도로 결과를 내주었다.반경 km를 늘려가며 테스트 했을 때 속도 저하는 거의 없었으며limit 1000 건까지는 1초 내로 결과를 내주는 성능을 보이고 있었다.리미트 1000건 이후로는 큰 의미가 없을 것 같아 테스트 하지 않았고, 이정도라면무난한 서비스가 가능할 것 같다. 물론 SPARQL을 어떻게 작성하는냐에 따라 성능 차이는 있을 ..
- Total
- Today
- Yesterday
- sparql
- 사이퍼
- neosemantics
- 온톨로지
- 트리플
- cypher
- 스프링부트
- RDF
- 지식 그래프
- Linked Data
- TBC
- django
- LOD
- 트리플 변환
- pyvis
- networkx
- Ontology
- RDF 변환
- Thymeleaf
- stardog
- 장고
- TopBraid Composer
- property graph
- Neo4j
- 그래프 데이터베이스
- 지식그래프
- 타임리프
- TDB
- Knowledge Graph
- rdfox
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |