티스토리 뷰

O:::Linked Data

O_1. Linked Data

joyHong 2012. 4. 30. 14:08

Linked Data

Linked Data는 개방형 데이터들을 네트워크(HTTP 프로토콜)를 통해 개방하고, 유통하여 연계, 협업하고자 하는 것이다. URI기반의 HTTP 역참조(dereference)를 통해 외부 자원에 접근하고, RDF를 통해 기계가독형으로 보유 정보를 웹으로 발행하며, 외부 정보 또는 내부 보유 정보에 질의하기 위한 질의 언어로서 SPARQL을 이용한다. SPARQL을 통해서 다수의 곳에 한 번에 질의하는 것도 가능하다. 위에서 언급한 URI, RDF, SPARQL은 모두 W3C의 시맨틱웹 표준으로 Linked Data는 시맨틱웹 서비스의 실제적인 모범실무이다. 위키피디아에서는 Linked Data를 “URI(Unified Resource Identifier)와 RDF(Resource Description Framework)를 이용해 시맨틱웹 상에 널려있는 데이터, 정보, 지식을 노출하고 공유하며 연결하기 위해 추천되는 최고의 방법을 설명하는 용어”라고 설명하고 있다.

좀 더 구체적으로 설명하면, Linked Data는 사실 정보(fact)를 포함하는 데이터 개체(entity)에 URI를 부여하고 이를 웹 프로토콜인 HTTP를 통해 발행하여 누구나 웹상에서 자유롭게 활용할 수 있게 하는 방법 또는 기술을 말한다. Linked Data 통합 운영 시스템은 기존의 레거시 데이터를 Linked Data로 변환하여 저장, 관리하고 이를 인터넷상에 발행하여 공동 활용할 수 있도록 지원하기 위한 시스템을 말한다.  그래서 앞으로는 웹 페이지가 아닌 웹 페이지를 구성하는 데이터 간의 연결이 차세대 웹의 핵심이 될 것이다.  이제는 각각의 리소스들이 RDF로 표현되고, 연결되어 기존의 문서(Document) 중심이 아닌 데이터(Data) 중심의 연결이 이루어져 데이터 중심의 웹이 된다.


Linked Data는 시맨틱웹의 창시자인 팀버너스리에 의해 2006년 처음 주장되었으며 Linked Data에 대한 팀버너스리의 설명은 다음과 같다.

  "시맨틱웹은 단지 데이터를 웹으로 제공하는 것이 아니라, 데이터 간의 링크를 만듦으로써, 인간이나 기계 모두 데이터의 웹을 탐험할 수 있도록 해준다. Linked Data를 통해 유용한 데이터를 얻게 되면, 그 데이터에 관계된 데이터로 계속되는 항해가 가능하다."

 2009년 2월 TED 컨퍼런스에서 팀 버너스리는 'Design Issue: Linked Data' 강연을 통해 Linked Data의 네 가지 원칙을 제시하였다. 

1) Use URIs as names for things

2) Use HTTP URIs so that people can look up those names.

3) When someone looks up a URI, provide useful information, using the standards (RDF*, SPARQL)

4) Include links to other URIs. so that they can discover more things.


 위의 네 가지 단계가 Linked Data를 사용하는 기본원칙이며, URI를 통해 특정 개념을 표현하고, HTTP 프로토콜을 이용해 해당 개념에 접근(룩업, Look up)할 수 있도록 하고 있다. 또한 RDF를 이용해 접근한 URI가 포함하고 있는 데이터들을 제공 받으며, 이 데이터 안에 포함되어 있는 또 다른 URI로의 접근을 통해 데이터를 연결시킬 수 있게 된다. 


Linked Data를 통해 관련된 데이터를 서로 연결(link)함으로써 다음과 같은 장점을 얻을 수 있다.

-  데이터를 URI와 RDF, HTTP를 통해 연결하여 사용할 수 있으므로, 내가 만든 데이터가 아니라도 Linked Data로 연결되면 하나의 지식베이스처럼 사용할 수 있다.

- Linked Data를 통해 공개된 데이터를 이용하면 내가 원하는 데이터가 이미 존재하는지, 어디에 존재하는지 알 수 있으므로 시스템의 사일로(silo) 문제에 의해 발생된 불필요한 데이터 중복의 문제를 해결할 수 있다. 

- 시맨틱웹 표준인 RDF 형태의 데이터로 발행하므로 마치 하나의 글로벌 데이터베이스처럼 질의하고 이용할 수 있으며, 이를 통해 상호운용성을 높이고, 데이터 통합을 용이하게 할 수 있다.

- URI로 구별되는 데이터 리소스의 자유로운 접근 및 이용이 가능하고, SPARQL Endpoint를 통해 SPARQL 질의가 가능하며, 이를 응용 프로그램상에서 이용할 수 있으므로, OpenAPI에 비해 데이터 접근을 더욱 구체화할 수 있어 데이터 지향의 매쉬업을 할 수 있다. 

- 초창기의 웹과 같이 데이터의 자유로운 연결과 이용은 새로운 데이터를 생산하고, 양질의 데이터는 트래픽이 증가하게 되는 데이터 네트워크화(Network of Data, Cloud of Data)가 지속될 것이다. 또한, 초기에 LOD Cloud에 진입한 데이터 셋들은 향후에 선점 효과를 누릴 수 있을 것이다. 




Tim Berners-Lee, Linked Data, 2006, http://www.w3.org/DesignIssues/LinkedData.html

위키피디아

'O:::Linked Data' 카테고리의 다른 글

O_6. 국내 SPARQL Endpoint  (0) 2012.05.08
O_5. SKOS의 사용  (0) 2012.05.02
O_4. Linked Data 솔루션  (0) 2012.04.30
O_3. Linked Data 기반 기술 요소  (0) 2012.04.30
O_2. Linked Data 발행 원칙  (0) 2012.04.30
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
«   2024/12   »
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31
글 보관함