티스토리 뷰
LOD 활용 단계
1. 구체적인 use cases를 명시
항상 새로운 서비스나 어플리케이션에 대한 구체적인 use cases를 명시해야 한다. 해결해야 하는 구체적인 문제가 무엇인지, 내부적으로 어떤 데이터를 사용할 수 있으며 외부 데이터에서 필요한 데이터는 무엇인지를 명확히 해야 한다.
2. 적절한 데이터셋을 평가
구체적인 use cases를 바탕으로, 데이터 통합을 위해서 적절한 LOD 데이터셋을 평가해야 한다. 사용할 수 있는 데이터가 무엇인지, 외부에서 제공하는 데이터의 질은 어떠한지 알아보아야 한다. 데이터 평가를 위한 좋은 방법 중 하나는 Sindice 같은 LOD 검색 엔진이나 The Data Hub와 같은 Open Data 카탈로그를 사용하는 것이다. 또한 데이터셋의 업데이트 주기와 마지막 업데이터가 언제였는지도 확인해봐야 한다.
3. 라이선스 확인
데이터의 사용과 재사용을 위해 데이터 소유자가 제공하는 라이선스를 검토해야 한다. 명확하지 않은 라이선스를 가진 데이터는 되도록이면 사용하지 말고, 불확실할 경우 데이터 소유자에게 연락하여 라이선스 확인을 명확히 해야 한다. 또한 다른 데이터와 매쉬업을 해도 무방한 라이선스인지 확인하는 것도 중요하다.
4. 사용 패턴을 생성
사용 패턴을 만드는 것은 어떤 데이터가 다른 데이터에서 재사용되는지를 세부적으로 명확히 나타낼 수 있다. 모든 데이터가 첫번째 단계에서 명시한 use case와 관련되어 있지 않을 수 있기 때문에 이 경우에 관련된 데이터만 명확히 명시한 사용 패턴을 개발하게 끔 도와준다.
5. 얼라이먼트, 캐싱, 업데이트 메커니즘을 관리
LOD를 활용하고자 할때에 몇가지 문제가 발생한다.
그 중 하나는 사용하고자하는 내/외부 데이터의 서로 다른 어휘를 매칭하는 필요가 종종 발생하게 된다. 이는 어휘 alignment에 의해 순조로운 데이터 통합이 가능하게 된다.
또한 LOD는 실시간으로 데이터를 항상 사용할 수 없을 뿐 아니라 안정적이지 않다는 것이다. 특정 시간에 특정 데이터를 사용할 수 없는 것을 방지하기 위해 캐싱 메커니즘을 생성할 필요가 존재한다.
다른 하나는 최신의 정보를 사용하는 것인데 이를 위해서 LOD 사용을 위한 업데이트 메커니즘을 구현하는 접근 방식이 있다.
6. 매쉬업, GUI, 서비스, 어플리케이션 생성
LOD를 통해 유용한 LOD 어플리케이션이나 서비스를 생성하고 사용자에게 제공하기 위해서는 최종 사용자에게 사용자 친화적인 그래픽 사용자 인터페이스(GUI)와 서비스를 제공하는 것이 매우 중요하다.
7. 지속가능한 새로운 파트너십 구축
외부 데이터를 사용하는 경우, 새로운 파트너십을 구축하도록 그 데이터의 제공자에게 문의하고 자신이 구축한 데이터를 사용할 수 있도록 외부 데이터 제공자에게 제공하는 것이 좋다.
모범 사례
- UK Organograms: http://data.gov.uk/organogram/hm-treasury
- reegle.info country profiles: http://www.reegle.info/countries
- EU project: LATC – Linked Open Data Around-The-Clock: http://latc-project.eu
참고자료:
Linked Open Data: The Essentials. A Quick Start Guide for Desicion Makers by Florian Bauer and Martin Kaltenböck
'O:::Linked Data' 카테고리의 다른 글
O_17. OntoSpec 오픈 (0) | 2014.09.24 |
---|---|
O_16. OCLC WorldCat (0) | 2014.07.09 |
O_14. LOD 발행 단계 (0) | 2014.03.04 |
O_13. 국내 LOD 발행 현황 (2) | 2014.03.04 |
O_12. MARC에서 RDF로 (0) | 2013.07.30 |
- Total
- Today
- Yesterday
- 그래프 데이터베이스
- neosemantics
- 트리플
- pyvis
- Knowledge Graph
- 지식그래프
- TopBraid Composer
- RDF
- TDB
- 장고
- RDF 변환
- Linked Data
- property graph
- LOD
- stardog
- 사이퍼
- networkx
- 타임리프
- 온톨로지
- 트리플 변환
- TBC
- Ontology
- 스프링부트
- 지식 그래프
- django
- Neo4j
- Thymeleaf
- rdfox
- sparql
- cypher
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |