이번 연재글에서는 전통적인 방법론을 통해 온톨로지를 구축하고 지식그래프를 생성하는 것을 다룹니다.그리고 지식그래프를 생성하는 과정에서 LLM 을 활용하는 방법에 대해서 다룹니다.그리고 마지막으로 생성된 결과물에 대해 추론을 적용하여 활용도를 증가시키는 것에 대해 다룹니다. 관련 연재글:#1. 기본 지식그래프 구축 #2. 키워드 구축 #3. LLM을 활용한 지식그래프 구축 #4. LLM을 활용한 용어 분류 #5. 추론 " data-ke-type="html">HTML 삽입미리보기할 수 없는 소스이번 글에서는 보다 풍부한 데이터를 확보하고 확장하기 위해 논문의 초록으로부터 정보를 추출하려고 합니다. 초록에는 논문의 저자가 핵심적으로 다루고 있는 정보가 포함되어 있으나 텍스트 형태로 존재하기 때문에 이를 파악하..
이번 글에서는 저장소에 저장되어 있는 동일한 데이터에 대해 도메인마다 혹은 데이터를 보는 관점마다 다르게 접근할 수 있는 방안에 대해 다루어 보려고 합니다. 예시로 사용하고자 하는 데이터는 이전 글에서 사용한 arxiv 데이터를 그대로 사용합니다. arxiv 데이터에는 저자, 논문, 분류에 대한 데이터를 그래프 형태로 저장하고 있습니다. 만약 이 데이터를 2개의 부서 혹은 조직 혹은 사용자 그룹에서 사용하고자 한다고 가정할 때, 저자(사람)에 대한 정의가 조금씩 다를 수 있습니다. A조직은 ‘저자'라고 부르지만 B조직은 ‘연구자'라고 부를 수 있습니다. (예시를 위해 비약적으로 레이블을 통해 구분하였습니다. 실제 경우는 도메인마다 다른 유형들이 있을 것입니다.) 예시에서는 간단하지만 데이터가 많아지고 위..
지난 두개의 글은 arXiv의 데이터를 대상으로 용어 목록을 생성하고 개념화를 통한 지식 그래프를 구성하는 것에 대해 간략히 살펴보았습니다. 이는 의도적으로 두개를 분리를 하였습니다. 대부분이 아닐 수도 있지만 상당히 많은 곳에서 부서 혹은 조직 혹은 사용그룹마다 동일한 데이터를 중복으로 생성하고 관리를 하고 있을 것 같습니다. 여기에서는 분류체계를 예로 삼아 설명하고자 합니다. 만약 arxiv 카테고리 택소노미가 업데이트가 되었다고 하면, 우리는 (2개의 글을 각각의 서비스 혹은 시스템이라고 가정하여) 어떤 액션을 취해야 합니까? 변경된 내용을 우리의 것에 반영해야 합니다. 지금은 2개지만 서비스 혹은 시스템이 많아지면 그만큼 동일 작업을 해야 합니다. 대안은 분류체계를 관리를 누군가가 하고 이를 다른..
- Total
- Today
- Yesterday
- property graph
- django
- 사이퍼
- 트리플 변환
- TDB
- pyvis
- Thymeleaf
- TBC
- RDF
- neosemantics
- Knowledge Graph
- cypher
- 지식 그래프
- 지식그래프
- stardog
- Ontology
- Linked Data
- 스프링부트
- networkx
- sparql
- RDF 변환
- 온톨로지
- 그래프 데이터베이스
- TopBraid Composer
- 장고
- LOD
- rdfox
- 타임리프
- 트리플
- Neo4j
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |