이번 글에서는 그래프 경로 탐색을 통해 데이터간의 복잡한 관계를 찾아보는 것에 대해 다루려고 한다. 데이터 간의 연결 관계를 찾아나가는 것은 데이터를 통해 정보를 파악하는 것에 도움이 되는 측면이 있는데 이와 함께 그 연결관계에 대한 명확한 설명력이 있어야 한다. 따라서 그래프 경로 탐색 알고리즘을 통해 데이터 간의 연결을 탐색하는 것에 활용할 수 있다. 그래프 경로 탐색의 보통 최단 경로 또는 모든 연결 경로를 탐색하는데 대다수의 그래프DB에서 플러그인 형태를 통해 지원을 하고 있다. 지원하지 않더라도 SPARQL을 직접 작성하여 구현이 가능하다. 여기에서는 RDF-Star를 지원하는 RDF 계열의 그래프 DB 중 하나인 GraphDB (OntoText)를 사용하여 특정 두 데이터 간의 경로를 찾아보고..
이번 글에서는 지난 블로그에서 구축한 지식그래프를 통해 그래프 구조를 활용한 탐색을 해보려고 한다. 그래프 구조로 만들어진 데이터는 연결이 생성되어진 경우 그 관계를 따라서 간단하게 데이터를 찾아나갈 수 있는 장점을 제공한다. 그리고 연결된 관계를 탐색하다보면 쉽게 발견하지 못했던 관계들을 발견할 수 있는 장점을 가질 수 있다. 물론 발견한 정보들은 우리가 가지고 있는 데이터들 사이에 존재하고 있는 정보들이다. 반드시 그래프 구조를 통해서만 발견할 수 있다고는 말할 수 없다. 기존의 방식과는 어떻게 쉽게 발견할 수 있는지, 어떠한 구조를 통해 빠르게 접근할 수 있는지가 차이점이라 할 수 있을 것 같다. 아래의 예시는 탐색적인 방식으로서 기업과 그 기업의 임원, 주주들 간의 관계를 통해 특정 기업이 다른 ..
그래프저장소 중인 하나인 Stardog을 활용하여 데이터를 저장해 두었다면 SPARQL Endpoint를 통해 다양한 검색,질의등을 수행할 수 있다. 이번 글은 Stardog에서 지원하는 엔드포인트를 통해 검색을 하고 그 결과를 테이블 형태로 가져오는 예시를 게시하려고 한다. 쥬피터 노트북을 통해 간단한 코드를 만드는데 여기서 활용하는 라이브러리는 pystardog, panel 이기 때문에 설치를 먼저 진행해야 한다. pip install panel pip install pystardog In [1]: import stardog import pandas as pd import io import panel as pn pn.extension('tabulator') Endpoint 연결을 위한 설정(예시:St..
기업에 대한 정보는 금융감독원의 전자공시시스템을 통해 필요한 정보를 획득할 수 있다. 전자공시시스템(DART : Data Analysis, Retrieval and Transfer System)은 상장법인 등이 공시서류를 인터넷으로 제출하고, 투자자 등 이용자는 제출 즉시 인터넷을 통해 조회할 수 있도록 하는 종합적 기업공시 시스템이다. (참고, https://dart.fss.or.kr/introduction/content1.do) 이번 포스트에서는 전자공시시스템에서 제공하는 기업의 정보들을 가져와 지식그래프 형태로 구성하고 몇가지 내용을 파악하고 분석해보고자 한다. 전자공시시스템 DART에 공시되고있는 공시보고서 원문 등은 오픈API를 통해 활용할 수 있다. 활용을 원하는 누구든지(개인, 기업, 기관 ..
ChatGPT는 이제 누구나 어느 정도 잘 알게 되는 상황으로 보여진다. 주어진 단어 이후에 다음 단어를 예측하는 뛰어난 성능으로 인해 다양한 작업에서 유용하게 사용될 수 있다. 하지만 어디까지나 예측이기 때문에 종종 오류가 발생하기도 한다. 한국의 영화와 배우에 대하여 몇가지 질문을 해보면 무언가 답을 내놓기는 한데 자세히 쳐다보면 오류가 있음을 볼 수 있다. 마지막의 경우 전지현이 아이언맨2에 출연을 했었나? 내가 못본걸까? 하는 생각도 잠시 들게 한다. 거대한 데이터셋을 통해 학습을 한 기반으로 대답을 예측하기 때문에 오류가 위와 같이 오류가 발생한다. 이에 대한 보완책으로 지식그래프를 활용하면 오류를 내놓는 대답을 어느 정도 개선 시킬 수가 있다. 지식그래프는 잘 정리되고 구조화된 데이터를 가지고..
- Total
- Today
- Yesterday
- Thymeleaf
- 지식그래프
- 그래프 데이터베이스
- 타임리프
- neosemantics
- RDF 변환
- 지식 그래프
- 스프링부트
- TDB
- django
- Neo4j
- 트리플 변환
- 트리플
- rdfox
- Knowledge Graph
- Ontology
- networkx
- 장고
- Linked Data
- 온톨로지
- TBC
- 사이퍼
- RDF
- pyvis
- LOD
- sparql
- property graph
- cypher
- TopBraid Composer
- stardog
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |