그래프저장소 중인 하나인 Stardog을 활용하여 데이터를 저장해 두었다면 SPARQL Endpoint를 통해 다양한 검색,질의등을 수행할 수 있다. 이번 글은 Stardog에서 지원하는 엔드포인트를 통해 검색을 하고 그 결과를 테이블 형태로 가져오는 예시를 게시하려고 한다. 쥬피터 노트북을 통해 간단한 코드를 만드는데 여기서 활용하는 라이브러리는 pystardog, panel 이기 때문에 설치를 먼저 진행해야 한다. pip install panel pip install pystardog In [1]: import stardog import pandas as pd import io import panel as pn pn.extension('tabulator') Endpoint 연결을 위한 설정(예시:St..
기업에 대한 정보는 금융감독원의 전자공시시스템을 통해 필요한 정보를 획득할 수 있다. 전자공시시스템(DART : Data Analysis, Retrieval and Transfer System)은 상장법인 등이 공시서류를 인터넷으로 제출하고, 투자자 등 이용자는 제출 즉시 인터넷을 통해 조회할 수 있도록 하는 종합적 기업공시 시스템이다. (참고, https://dart.fss.or.kr/introduction/content1.do) 이번 포스트에서는 전자공시시스템에서 제공하는 기업의 정보들을 가져와 지식그래프 형태로 구성하고 몇가지 내용을 파악하고 분석해보고자 한다. 전자공시시스템 DART에 공시되고있는 공시보고서 원문 등은 오픈API를 통해 활용할 수 있다. 활용을 원하는 누구든지(개인, 기업, 기관 ..
위경도 정보를 활용해 반경 내 특정 정보를 찾아야 하는 태스크가 생겨 스타독을 활용하여 반경 내 검색을 적용하였다. 스타독에서 기본적으로 지원하는 Geospatial 스펙은 WGS84와 GeoSPARQL 이기 때문에 WGS84 위경도 좌표만 입력하면 공간좌표를 활용한 검색이 가능하다. 테스트를 위해 특정 위치의 반경 2km내에 존재하는 다른 데이터를 검색하니 매우 빠른 속도로 결과를 내주었다. 반경 km를 늘려가며 테스트 했을 때 속도 저하는 거의 없었으며 limit 1000 건까지는 1초 내로 결과를 내주는 성능을 보이고 있었다. 리미트 1000건 이후로는 큰 의미가 없을 것 같아 테스트 하지 않았고, 이정도라면 무난한 서비스가 가능할 것 같다. 물론 SPARQL을 어떻게 작성하는냐에 따라 성능 차이는..
ChatGPT는 이제 누구나 어느 정도 잘 알게 되는 상황으로 보여진다. 주어진 단어 이후에 다음 단어를 예측하는 뛰어난 성능으로 인해 다양한 작업에서 유용하게 사용될 수 있다. 하지만 어디까지나 예측이기 때문에 종종 오류가 발생하기도 한다. 한국의 영화와 배우에 대하여 몇가지 질문을 해보면 무언가 답을 내놓기는 한데 자세히 쳐다보면 오류가 있음을 볼 수 있다. 마지막의 경우 전지현이 아이언맨2에 출연을 했었나? 내가 못본걸까? 하는 생각도 잠시 들게 한다. 거대한 데이터셋을 통해 학습을 한 기반으로 대답을 예측하기 때문에 오류가 위와 같이 오류가 발생한다. 이에 대한 보완책으로 지식그래프를 활용하면 오류를 내놓는 대답을 어느 정도 개선 시킬 수가 있다. 지식그래프는 잘 정리되고 구조화된 데이터를 가지고..
Stardog에서 제공하는 Stardog Designer와 Explorer을 활용하면 간단한 지식그래프를 손쉽게 만들어 시각화까지 해 볼 수 있다. 지난 글에서도 잠깐 언급하였지만 Stardog에서 제공하는 Cloud 서비스는 간단한 회원가입만으로도 Explorer, Designer, Studio 3가지 앱을 사용할 수 있다. 이번 글에서는 영화데이터(배우, 감독, 영화)를 가지고 Stardog Designer를 통해 지식그래프 형태로 데이터를 생성하고, Explorer로 간단한 검색을 하는 과정을 영상으로 기록하였다. 먼저 데이터는 CSV형태로 준비하였는데 영화데이터는 "영화진흥위원회의 통합전산망 오픈 API" 를 통해 수집하였다. https://www.kobis.or.kr/kobisopenapi/ho..
- Total
- Today
- Yesterday
- 장고
- 트리플
- 트리플 변환
- 지식 그래프
- TBC
- networkx
- neosemantics
- sparql
- pyvis
- 타임리프
- LOD
- Linked Data
- Ontology
- TDB
- RDF
- TopBraid Composer
- Neo4j
- property graph
- Knowledge Graph
- 그래프 데이터베이스
- rdfox
- stardog
- django
- 스프링부트
- cypher
- Thymeleaf
- RDF 변환
- 온톨로지
- 지식그래프
- 사이퍼
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |