티스토리 뷰
대부분의 도서관에서는 MARC 형태의 데이터를 통해 도서정보들을 관리하고 사용하고 있다. MARC는 기계 가독형 데이터 교환 포맷으로 도서관에서 이용자 서비스를 위해 가장 기초가 되며, 도서관 간 상호 협력의 시작점이 되었다. MARC는 도서관 분야에서만 유통이 되는 표준이기 때문에 도서관 관련 시스템 사이의 정보 유통에 큰 기여를 했지만 이러한 MARC 형태의 구조로 인해 웹을 중심으로 하는 정보 유통 환경에서는 어려움을 겪고 있다.
국내의 주요 도서관은 MARC 기반의 KORMARC를 생성하여 현재 사용하고 있다. KORMARC 기반의 데이터는 웹 세상에서 유통이 어려운 단점이 있다. 이를 해결하기 위해 RDF 기반의 데이터로 기반 구조를 변경해야 한다. RDF는 데이터의 구조를 표현하고, 웹의 분산성에 적합하도록 설계된 트리플 형식의 그래프 기반 데이터 모델이다. RDF는 시맨틱웹 상의 공통 데이터 포맷으로서, 서로 다른 정보원의 데이터라 할지라도 웹상의 호환이 가능하도록 해준다. RDF는 데이터를 (주어, 술어, 목적어)의 트리플 형식으로 표현하고 이러한 트리플들의 집합이 그래프를 구성한다. 이러한 그래프 기반의 데이터 모델은 같은 식별명(URI)을 갖는 동일한 노드를 통해 쉽게 병합되며, 따라서 대규모 분산 데이터 환경인 시맨틱웹의 데이터 모델로서 유연성과 확장성을 제공한다. 바로 이점이 상호운용성 확보에 큰 도움을 준다. ‘서로 다른 정보원’의 연결을 가능하게 해주는 것이 바로 이것이라는 것이 중요하다.
이 RDF 기반으로 구조를 변경하고 Web이라는 형태의 특성을 잘 이용하여 그 생태에 참여하면 도서관에서만 사용하는 제한적인 데이터보다 더 많은 데이터와의 연결을 고려할 수 있으며 도서관 이외의 다른 분야와 융·복합을 통해 데이터의 가치가 더 상승하는 계기가 된다.
Linked Data는 개방형 데이터들을 네트워크(HTTP 프로토콜)를 통해 개방하고, 유통하여 연계, 협업하고자 하는 것이다. URI기반의 HTTP 역참조(dereference)를 통해 외부 자원에 접근하고, RDF를 통해 기계가독형으로 보유 정보를 웹으로 발행하며, 외부 정보 또는 내부 보유 정보에 질의하기 위한 질의 언어로서 SPARQL을 이용한다. SPARQL을 통해서 다수의 곳에 한 번에 질의하는 것도 가능하다. 위에서 언급한 URI, RDF, SPARQL은 모두 W3C의 시맨틱웹 표준으로 Linked Data는 시맨틱웹 서비스의 실제적인 모범실무이다. 위키피디아에서는 Linked Data를 “URI(Unified Resource Identifier)와 RDF(Resource Description Framework)를 이용해 시맨틱웹 상에 널려있는 데이터, 정보, 지식을 노출하고 공유하며 연결하기 위해 추천되는 최고의 방법을 설명하는 용어”라고 설명하고 있다.
좀 더 구체적으로 설명하면, Linked Data는 사실 정보(fact)를 포함하는 데이터 개체(entity)에 URI를 부여하고 이를 웹 프로토콜인 HTTP를 통해 발행하여 누구나 웹상에서 자유롭게 활용할 수 있게 하는 방법 또는 기술을 말한다. Linked Data 통합 운영 시스템은 기존의 레거시 데이터를 Linked Data로 변환하여 저장, 관리하고 이를 인터넷상에 발행하여 공동 활용할 수 있도록 지원하기 위한 시스템을 말한다. 그래서 앞으로는 웹 페이지가 아닌 웹 페이지를 구성하는 데이터 간의 연결이 차세대 웹의 핵심이 될 것이다. 이제는 각각의 리소스들이 RDF로 표현되고, 연결되어 기존의 문서(Document) 중심이 아닌 데이터(Data) 중심의 연결이 이루어져 데이터 중심의 웹이 된다.
도서관 데이터를 RDF기반으로 변경하여 Linked Data로 발행할 때 기대효과는 다음과 같다.
LOD 클라우드에 고품질의 데이터 제공
◦ 전거 데이터, 분류체계, 시소러스, 메타데이터
- 개별 목록에서 이를 이용하여 데이터의 품질 관리
- 웹 데이터의 품질 관리
◦ 데이터의 상호운용성 지원
- 시맨틱 웹 기술 기반의 의미적 상호운용성
도서관 데이터 공개와 연계
◦ 구조화된 데이터의 글로벌 정보 공간
◦ 다른 컨텍스트에서 사용하는 도서관 데이터
◦ 혁신적인 사용자 서비스
Linked Data 기술을 이용한 데이터 노출
◦ 도서관 간의 상호 협력 증진
- 상호 협력을 위한 기술적 부담이 적음
- 웹 프로토콜을 이용한 데이터 교환이 용이
- 애플리케이션 개발 비용이 낮음
◦ 외부 커뮤니티와의 협력 증진
- 도서관 종속적인 프로토콜과 포맷을 모르더라도 손쉽게 도서관 데이터를 사용할 수 있음
- 사회의 지식 자원인 도서관 데이터를 공유 자원화
이러한 효과들은 웹 데이터의 품질 향상, 도서관 데이터의 활용 증가, 도서관의 협력 증진 및 지식자원 공유 확대를 불러 일으키게 될 것으로 예상된다.
<Linked Data를 활용한 응용서비스 구축을 위한 요건 연구 보고서, 2012.12.> 참조
'O:::Linked Data' 카테고리의 다른 글
O_14. LOD 발행 단계 (0) | 2014.03.04 |
---|---|
O_13. 국내 LOD 발행 현황 (2) | 2014.03.04 |
O_11. 국립중앙도서관 Linked Data 개발 사례_2012년 (0) | 2013.07.30 |
O_10. 국립중앙도서관 Linked Data 개발 사례_2011년 (0) | 2012.12.27 |
O_9. 해외 도서관의 URI 사용 체계 (0) | 2012.12.16 |
- Total
- Today
- Yesterday
- 장고
- Knowledge Graph
- RDF
- TBC
- pyvis
- sparql
- property graph
- 사이퍼
- neosemantics
- 트리플 변환
- 스프링부트
- cypher
- TopBraid Composer
- Neo4j
- 온톨로지
- 지식 그래프
- 타임리프
- 그래프 데이터베이스
- LOD
- Linked Data
- RDF 변환
- stardog
- networkx
- TDB
- rdfox
- 지식그래프
- Ontology
- django
- Thymeleaf
- 트리플
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |