티스토리 뷰

이번 글에서는 지난 블로그에서 구축한 지식그래프를 통해 그래프 구조를 활용한 탐색을 해보려고 한다.
그래프 구조로 만들어진 데이터는 연결이 생성되어진 경우 그 관계를 따라서 간단하게 데이터를 찾아나갈 수 있는 장점을 제공한다.
그리고 연결된 관계를 탐색하다보면 쉽게 발견하지 못했던 관계들을 발견할 수 있는 장점을 가질 수 있다.
물론 발견한 정보들은 우리가 가지고 있는 데이터들 사이에 존재하고 있는 정보들이다.
반드시 그래프 구조를 통해서만 발견할 수 있다고는 말할 수 없다. 
기존의 방식과는 어떻게 쉽게 발견할 수 있는지, 어떠한 구조를 통해 빠르게 접근할 수 있는지가 차이점이라 할 수 있을 것 같다.
아래의 예시는 탐색적인 방식으로서
기업과 그 기업의 임원, 주주들 간의 관계를 통해 특정 기업이 다른 기업과 어떻게 관계를 가질 수 있는지 유추해볼 수 있는 정보를 도출한 것이다.
실제 전자공시시스템에서 내려받은 데이터이긴 하지만 특정 기업명과 실명이 있기 때문에 블라인드 처리를 하였다.
따라서 아래의 예시에서는 파란색 원은 사람, 주황색은 기업 혹은 법인, 핑크색은 대학을 가리키는 정보로 인식하고 그래프를 살펴보면 도움이 될 것이다.

시작점으로 특정 기업인을 검색하여 그 사람의 현재 몸담고 있는 기업, 이전 기업, 학력, 그리고 혈연관계등을 찾아본 것이다.

1은 2와 사촌 관계이고 1은 3번 기업의 CEO, 주주 임을 나타내고 있다.

여기서 3번 기업을 확장하여 살펴보면 1번과 사촌 관계인 2번이 3번 기업의 임원과 주주임을 나타내고 있음을 볼 수 있다.

3번 기업의 임원들은 어떤 특성들이 있는지 탐색하기 위해 다른 임원 한명을 선택하여 확장하여 보면 그 임원의 이전 경력으로 다른 기업을 찾아볼 수 있게 된다. 아래의 예시에서 4번이 그 임원에 해당된다.

4번 임원의 이전 경력으로 가진 5번 기업을 확장해보면 현재 기업의 임원들 중 누구와 연관성이 있는지 파악이 될 것 같다.

따라서 5번 기업을 확장하여 보면 역시나 4번 임원 외에 3명이 더 5번 기업에서 이전 경력을 가지고 있었음을 파악이 된다.

실제로 검색을 해보면 3번 기업은 5번 기업에 부품을 납품하는 업체이고, 5번 기업에서 임원으로 근무하다 3번 기업의 임원이 된 사례임을 확인할 수 있다.

간단한 예시라서 3단계 정보의 탐색을 하였기 때문에 쉽게 파악이 가능하다는 생각이 들 수도 있을테지만

더 깊게 정보를 탐색하고 미쳐 알지 못했던 관계를 탐색하는데에는 이러한 그래프 구조를 활용하는 것도 좋은 방안일 것이다.

다음 글에서는  정보를 찾아보기 위해 다른 탐색 방안으로 적용해 보겠다.

끝.

최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
«   2024/05   »
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
글 보관함