
ChatGPT는 이제 누구나 어느 정도 잘 알게 되는 상황으로 보여진다.주어진 단어 이후에 다음 단어를 예측하는 뛰어난 성능으로 인해 다양한 작업에서 유용하게 사용될 수 있다.하지만 어디까지나 예측이기 때문에 종종 오류가 발생하기도 한다.한국의 영화와 배우에 대하여 몇가지 질문을 해보면 무언가 답을 내놓기는 한데 자세히 쳐다보면 오류가 있음을 볼 수 있다.마지막의 경우 전지현이 아이언맨2에 출연을 했었나? 내가 못본걸까? 하는 생각도 잠시 들게 한다.거대한 데이터셋을 통해 학습을 한 기반으로 대답을 예측하기 때문에 오류가 위와 같이 오류가 발생한다.이에 대한 보완책으로 지식그래프를 활용하면 오류를 내놓는 대답을 어느 정도 개선 시킬 수가 있다.지식그래프는 잘 정리되고 구조화된 데이터를 가지고 관계를 기반..

우리가 사용하는 대부분의 데이터는 테이블 형태의 저장소에 저장되어 관리되고, 이를 활용하여 무엇인가를 하고 있다. 이러한 체계는 잘 동작하고 있고, 앞으로도 잘 동작하리라 예상된다. 그럼과 동시에 지속으로 고민하는 한가지 포인트는 "어떻게 하면 데이터를 보다 더 잘 활용할 수 있을까?" 라는 물음이 아닐까 한다. 이 물음에는 '데이터를 잘 찾을 수 있어야 하고, 찾더라도 나에게 맞는 데이터를 찾는 것'과 이 데이터를 '실제 비즈니스와 접목'을 하여 활용을 하고자 할 때 더욱 큰 고민거리로 다가온다. 데이터를 잘 활용할 수 있다는 것은 결국 "데이터를 구조화하여 관리하는 것"과 "데이터간의 통합"을 잘 하는 것에 달려 있다고 생각된다. 데이터를 구조화하여 관리 데이터를 구조화하여 관리하는 방식 중 하나는 ..

지난 글에 이어 이번에는 커뮤니티 탐지에 대해서 다루어보고자 한다. 사실 #5. 지식그래프와 네트워크 분석 과 이번 글은 네트워크 분석에 가까운 내용이긴 하다. 지난 글에서는 네트워크 내의 중심성 계산을 통해 어떠한 노드가 중요한 역할을 하는지 찾았다. 이런 분석은 작은 규모의 네트워크에서 시행하기에 적합하다. 이보다 규모다 좀 더 큰 네트워크에서는 커뮤니티 감지를 통해 노드 그룹간의 관계를 찾고 분석을 수행할 수 있다.자료를 찾아 살펴보다 보면 "클러스터", "커뮤니티", "클러스터링"을 혼용하는 경우도 찾아 볼 수 있다. 따라서 용어에 대한 정의부터 먼저 시작하면, 컴퓨터 과학과 네트워크 과학 분야에서 사용하는 용어의 의미가 약간 다르다. 컴퓨터 과학에서는 "커뮤니티"를 "클러스터"라고 하고 커뮤니티..
- Total
- Today
- Yesterday
- RDF
- RDF 변환
- TDB
- sparql
- 트리플
- Ontology
- Thymeleaf
- LOD
- networkx
- TBC
- neosemantics
- 그래프 데이터베이스
- Neo4j
- 스프링부트
- 장고
- 온톨로지
- 트리플 변환
- pyvis
- 지식 그래프
- 지식그래프
- 타임리프
- Linked Data
- django
- Knowledge Graph
- cypher
- stardog
- rdfox
- 사이퍼
- property graph
- TopBraid Composer
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |