위경도 정보를 활용해 반경 내 특정 정보를 찾아야 하는 태스크가 생겨 스타독을 활용하여 반경 내 검색을 적용하였다. 스타독에서 기본적으로 지원하는 Geospatial 스펙은 WGS84와 GeoSPARQL 이기 때문에 WGS84 위경도 좌표만 입력하면 공간좌표를 활용한 검색이 가능하다. 테스트를 위해 특정 위치의 반경 2km내에 존재하는 다른 데이터를 검색하니 매우 빠른 속도로 결과를 내주었다. 반경 km를 늘려가며 테스트 했을 때 속도 저하는 거의 없었으며 limit 1000 건까지는 1초 내로 결과를 내주는 성능을 보이고 있었다. 리미트 1000건 이후로는 큰 의미가 없을 것 같아 테스트 하지 않았고, 이정도라면 무난한 서비스가 가능할 것 같다. 물론 SPARQL을 어떻게 작성하는냐에 따라 성능 차이는..
ChatGPT는 이제 누구나 어느 정도 잘 알게 되는 상황으로 보여진다. 주어진 단어 이후에 다음 단어를 예측하는 뛰어난 성능으로 인해 다양한 작업에서 유용하게 사용될 수 있다. 하지만 어디까지나 예측이기 때문에 종종 오류가 발생하기도 한다. 한국의 영화와 배우에 대하여 몇가지 질문을 해보면 무언가 답을 내놓기는 한데 자세히 쳐다보면 오류가 있음을 볼 수 있다. 마지막의 경우 전지현이 아이언맨2에 출연을 했었나? 내가 못본걸까? 하는 생각도 잠시 들게 한다. 거대한 데이터셋을 통해 학습을 한 기반으로 대답을 예측하기 때문에 오류가 위와 같이 오류가 발생한다. 이에 대한 보완책으로 지식그래프를 활용하면 오류를 내놓는 대답을 어느 정도 개선 시킬 수가 있다. 지식그래프는 잘 정리되고 구조화된 데이터를 가지고..
우리가 사용하는 대부분의 데이터는 테이블 형태의 저장소에 저장되어 관리되고, 이를 활용하여 무엇인가를 하고 있다. 이러한 체계는 잘 동작하고 있고, 앞으로도 잘 동작하리라 예상된다. 그럼과 동시에 지속으로 고민하는 한가지 포인트는 "어떻게 하면 데이터를 보다 더 잘 활용할 수 있을까?" 라는 물음이 아닐까 한다. 이 물음에는 '데이터를 잘 찾을 수 있어야 하고, 찾더라도 나에게 맞는 데이터를 찾는 것'과 이 데이터를 '실제 비즈니스와 접목'을 하여 활용을 하고자 할 때 더욱 큰 고민거리로 다가온다. 데이터를 잘 활용할 수 있다는 것은 결국 "데이터를 구조화하여 관리하는 것"과 "데이터간의 통합"을 잘 하는 것에 달려 있다고 생각된다. 데이터를 구조화하여 관리 데이터를 구조화하여 관리하는 방식 중 하나는 ..
- Total
- Today
- Yesterday
- django
- 사이퍼
- stardog
- 온톨로지
- TopBraid Composer
- Thymeleaf
- 지식 그래프
- MeCab
- property graph
- LOD
- Neo4j
- Linked Data
- neosemantics
- pyvis
- 스프링부트
- 트리플 변환
- cypher
- Ontology
- 지식그래프
- networkx
- 장고
- RDF 변환
- TBC
- sparql
- TDB
- 그래프 데이터베이스
- 트리플
- Knowledge Graph
- RDF
- 타임리프
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |