주어진 글들에 존재하는 단어들의 동시 출현 관계를 통해 해당 글이 어떤 의미를 말하고 있는지를 파악해보면 재미있을 것 같았다. 그래서 단어, 정확히는 명사의 출현을 통해 간단히 파악할 수 있도록 구성하였다. 문장에 나타나는 명사들의 출현 거리가 가까우면 그만큼 의미있는 단어들일 것이고, 거리가 멀면 큰 관계가 없다는 전제하에 진행된다. 텍스트는 "세이노의 가르침" 이 PDF 로 무료 배포 되고 있어 이를 활용하였다. https://blog.naver.com/PostView.naver?blogId=dayonepress&logNo=223064751876&categoryNo=11&parentCategoryNo=-1&viewDate=¤tPage=&postListTopCurrentPage=&isAfte..
이번 글에서는 그래프 경로 탐색을 통해 데이터간의 복잡한 관계를 찾아보는 것에 대해 다루려고 한다. 데이터 간의 연결 관계를 찾아나가는 것은 데이터를 통해 정보를 파악하는 것에 도움이 되는 측면이 있는데 이와 함께 그 연결관계에 대한 명확한 설명력이 있어야 한다. 따라서 그래프 경로 탐색 알고리즘을 통해 데이터 간의 연결을 탐색하는 것에 활용할 수 있다. 그래프 경로 탐색의 보통 최단 경로 또는 모든 연결 경로를 탐색하는데 대다수의 그래프DB에서 플러그인 형태를 통해 지원을 하고 있다. 지원하지 않더라도 SPARQL을 직접 작성하여 구현이 가능하다. 여기에서는 RDF-Star를 지원하는 RDF 계열의 그래프 DB 중 하나인 GraphDB (OntoText)를 사용하여 특정 두 데이터 간의 경로를 찾아보고..
이번 글에서는 지난 블로그에서 구축한 지식그래프를 통해 그래프 구조를 활용한 탐색을 해보려고 한다. 그래프 구조로 만들어진 데이터는 연결이 생성되어진 경우 그 관계를 따라서 간단하게 데이터를 찾아나갈 수 있는 장점을 제공한다. 그리고 연결된 관계를 탐색하다보면 쉽게 발견하지 못했던 관계들을 발견할 수 있는 장점을 가질 수 있다. 물론 발견한 정보들은 우리가 가지고 있는 데이터들 사이에 존재하고 있는 정보들이다. 반드시 그래프 구조를 통해서만 발견할 수 있다고는 말할 수 없다. 기존의 방식과는 어떻게 쉽게 발견할 수 있는지, 어떠한 구조를 통해 빠르게 접근할 수 있는지가 차이점이라 할 수 있을 것 같다. 아래의 예시는 탐색적인 방식으로서 기업과 그 기업의 임원, 주주들 간의 관계를 통해 특정 기업이 다른 ..
그래프저장소 중인 하나인 Stardog을 활용하여 데이터를 저장해 두었다면 SPARQL Endpoint를 통해 다양한 검색,질의등을 수행할 수 있다. 이번 글은 Stardog에서 지원하는 엔드포인트를 통해 검색을 하고 그 결과를 테이블 형태로 가져오는 예시를 게시하려고 한다. 쥬피터 노트북을 통해 간단한 코드를 만드는데 여기서 활용하는 라이브러리는 pystardog, panel 이기 때문에 설치를 먼저 진행해야 한다. pip install panel pip install pystardog In [1]: import stardog import pandas as pd import io import panel as pn pn.extension('tabulator') Endpoint 연결을 위한 설정(예시:St..
기업에 대한 정보는 금융감독원의 전자공시시스템을 통해 필요한 정보를 획득할 수 있다. 전자공시시스템(DART : Data Analysis, Retrieval and Transfer System)은 상장법인 등이 공시서류를 인터넷으로 제출하고, 투자자 등 이용자는 제출 즉시 인터넷을 통해 조회할 수 있도록 하는 종합적 기업공시 시스템이다. (참고, https://dart.fss.or.kr/introduction/content1.do) 이번 포스트에서는 전자공시시스템에서 제공하는 기업의 정보들을 가져와 지식그래프 형태로 구성하고 몇가지 내용을 파악하고 분석해보고자 한다. 전자공시시스템 DART에 공시되고있는 공시보고서 원문 등은 오픈API를 통해 활용할 수 있다. 활용을 원하는 누구든지(개인, 기업, 기관 ..
- Total
- Today
- Yesterday
- RDF
- 사이퍼
- 장고
- MeCab
- LOD
- 지식그래프
- 트리플 변환
- 스프링부트
- Knowledge Graph
- 온톨로지
- TBC
- django
- TopBraid Composer
- neosemantics
- sparql
- Neo4j
- stardog
- Ontology
- Linked Data
- pyvis
- Thymeleaf
- TDB
- 그래프 데이터베이스
- RDF 변환
- property graph
- 지식 그래프
- networkx
- 트리플
- cypher
- 타임리프
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | |
7 | 8 | 9 | 10 | 11 | 12 | 13 |
14 | 15 | 16 | 17 | 18 | 19 | 20 |
21 | 22 | 23 | 24 | 25 | 26 | 27 |
28 | 29 | 30 |