이번 글에서는 그래프 경로 탐색을 통해 데이터간의 복잡한 관계를 찾아보는 것에 대해 다루려고 한다. 데이터 간의 연결 관계를 찾아나가는 것은 데이터를 통해 정보를 파악하는 것에 도움이 되는 측면이 있는데 이와 함께 그 연결관계에 대한 명확한 설명력이 있어야 한다. 따라서 그래프 경로 탐색 알고리즘을 통해 데이터 간의 연결을 탐색하는 것에 활용할 수 있다. 그래프 경로 탐색의 보통 최단 경로 또는 모든 연결 경로를 탐색하는데 대다수의 그래프DB에서 플러그인 형태를 통해 지원을 하고 있다. 지원하지 않더라도 SPARQL을 직접 작성하여 구현이 가능하다. 여기에서는 RDF-Star를 지원하는 RDF 계열의 그래프 DB 중 하나인 GraphDB (OntoText)를 사용하여 특정 두 데이터 간의 경로를 찾아보고..
이번 글에서는 지난 블로그에서 구축한 지식그래프를 통해 그래프 구조를 활용한 탐색을 해보려고 한다. 그래프 구조로 만들어진 데이터는 연결이 생성되어진 경우 그 관계를 따라서 간단하게 데이터를 찾아나갈 수 있는 장점을 제공한다. 그리고 연결된 관계를 탐색하다보면 쉽게 발견하지 못했던 관계들을 발견할 수 있는 장점을 가질 수 있다. 물론 발견한 정보들은 우리가 가지고 있는 데이터들 사이에 존재하고 있는 정보들이다. 반드시 그래프 구조를 통해서만 발견할 수 있다고는 말할 수 없다. 기존의 방식과는 어떻게 쉽게 발견할 수 있는지, 어떠한 구조를 통해 빠르게 접근할 수 있는지가 차이점이라 할 수 있을 것 같다. 아래의 예시는 탐색적인 방식으로서 기업과 그 기업의 임원, 주주들 간의 관계를 통해 특정 기업이 다른 ..
기업에 대한 정보는 금융감독원의 전자공시시스템을 통해 필요한 정보를 획득할 수 있다. 전자공시시스템(DART : Data Analysis, Retrieval and Transfer System)은 상장법인 등이 공시서류를 인터넷으로 제출하고, 투자자 등 이용자는 제출 즉시 인터넷을 통해 조회할 수 있도록 하는 종합적 기업공시 시스템이다. (참고, https://dart.fss.or.kr/introduction/content1.do) 이번 포스트에서는 전자공시시스템에서 제공하는 기업의 정보들을 가져와 지식그래프 형태로 구성하고 몇가지 내용을 파악하고 분석해보고자 한다. 전자공시시스템 DART에 공시되고있는 공시보고서 원문 등은 오픈API를 통해 활용할 수 있다. 활용을 원하는 누구든지(개인, 기업, 기관 ..
ChatGPT는 이제 누구나 어느 정도 잘 알게 되는 상황으로 보여진다. 주어진 단어 이후에 다음 단어를 예측하는 뛰어난 성능으로 인해 다양한 작업에서 유용하게 사용될 수 있다. 하지만 어디까지나 예측이기 때문에 종종 오류가 발생하기도 한다. 한국의 영화와 배우에 대하여 몇가지 질문을 해보면 무언가 답을 내놓기는 한데 자세히 쳐다보면 오류가 있음을 볼 수 있다. 마지막의 경우 전지현이 아이언맨2에 출연을 했었나? 내가 못본걸까? 하는 생각도 잠시 들게 한다. 거대한 데이터셋을 통해 학습을 한 기반으로 대답을 예측하기 때문에 오류가 위와 같이 오류가 발생한다. 이에 대한 보완책으로 지식그래프를 활용하면 오류를 내놓는 대답을 어느 정도 개선 시킬 수가 있다. 지식그래프는 잘 정리되고 구조화된 데이터를 가지고..
- Total
- Today
- Yesterday
- Thymeleaf
- 스프링부트
- property graph
- 지식 그래프
- networkx
- MeCab
- Knowledge Graph
- 트리플 변환
- TBC
- RDF 변환
- neosemantics
- cypher
- Neo4j
- pyvis
- 장고
- 그래프 데이터베이스
- Ontology
- 지식그래프
- 온톨로지
- stardog
- 트리플
- django
- LOD
- sparql
- 타임리프
- Linked Data
- TDB
- 사이퍼
- TopBraid Composer
- RDF
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |