티스토리 뷰
LOD 발행 단계
1. 데이터 분석
데이터를 발행하기 전에 데이터 모델, 메타데이터, 데이터 자체를 깊이 들여다보고 분석하는 단계를 통해 대략적인 개요와 발행에 유용한 정보 및 데이터를 준비한다.
2. 데이터 정제
Database, XML, CSV 등과 같이 다양한 포맷과 분산된 데이터 소스로부터 획득한 데이터를 쉽게 효율적으로 모델링하기 위하여 추가적인 작업이 필요하다. 이 작업에는 데이터를 공개하지 않을 데이터를 제거하는 작업도 포함된다.
3. 데이터 모델링
발행하고자 하는 데이터를 RDF로 변환되도록 기존의 어휘나 새로운 모델을 선택해서 모델링을 수행한다. 각각의 개체의 이름으로 사용할 URI 체계를 생성한다. 시간이 지남에 따라 변화하는 데이터가 있을 경우 영속성을 보장하기 위하여 데이터 모델을 꾸준히 관리해야할 필요가 있다.
4. 적절한 어휘 선택
RDF Vocabulary들은 기존의 것들이 많이 존재하고 있다. 이 중 발행하고자 하는 데이터에 적합한 어휘를 선택하여 재사용할 수 있다. 다만 필요에 맞는 데이터가 없다면 내 데이터에 맞도록 어휘를 생성하도록 한다.
5. 라이선스 지정
발행하는 데이터의 광범위하고 효율적으로 재사용이 가능하도록 라이선스를 지정하고 제공해야 한다. 라이선스는 가능하면 많은 사람이 알고 있는 기존의 라이선스를 사용하는 것이 좋다. 이는 다른 데이터 셋과의 상호운용이 가능하기 때문이다.
6. RDF로 변환
데이터를 LOD로 발행하기 위해서는 LOD에 가장 유용한 데이터 형태인 RDF로 데이터를 변환한다. 이때 변환한 RDF 파일에 지정한 라이선스가 포함되어져야 한다.
7. 다른 데이터와 연결
데이터를 발행하기 전에 내 데이터가 다른 데이터와 연결이 있는지를 확인해야 한다. 다른 데이터 셋과 제 3자의 데이터 셋으로의 연결은 매우 유용하다. 이러한 연결은 최적화된 데이터 처리와 데이터 (재)사용을 위한 통합을 보장하고, 다른 도메인의 데이터와 연결되어 새로운 지식을 생성할 수 있게 된다. 그러기 위해서는 자신의 데이터와 연결이 될 적절한 데이터를 신중히 평가하고 선택해야한다.
8. LOD 발행 및 홍보
이전 단계까지 준비가 되고 생성이 되었다면 데이터를 웹상에 발행하고 LOD가 널리 재사용되도록 홍보를 해야 한다. 아무리 유용한 LOD가 발행되었더라도 사람들이 찾지 못하면 사용되지 않기 때문이다.
참고자료:
Linked Open Data: The Essentials. A Quick Start Guide for Desicion Makers by Florian Bauer and Martin Kaltenböck
'O:::Linked Data' 카테고리의 다른 글
O_16. OCLC WorldCat (0) | 2014.07.09 |
---|---|
O_15. LOD 활용 단계 (0) | 2014.03.11 |
O_13. 국내 LOD 발행 현황 (2) | 2014.03.04 |
O_12. MARC에서 RDF로 (0) | 2013.07.30 |
O_11. 국립중앙도서관 Linked Data 개발 사례_2012년 (0) | 2013.07.30 |
- Total
- Today
- Yesterday
- 그래프 데이터베이스
- RDF
- LOD
- 타임리프
- 트리플 변환
- Knowledge Graph
- Ontology
- TopBraid Composer
- 스프링부트
- neosemantics
- rdfox
- RDF 변환
- networkx
- sparql
- 지식그래프
- pyvis
- 지식 그래프
- TBC
- cypher
- Neo4j
- Linked Data
- 온톨로지
- django
- property graph
- 트리플
- stardog
- 사이퍼
- 장고
- TDB
- Thymeleaf
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |