![](http://i1.daumcdn.net/thumb/C148x148.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/b1q7n3/btrYSC11omT/VNkhxgv9NhctXwdhGORCpk/img.png)
"영화진흥위원회의 통합전산망 오픈 API" 를 통해 수집한 데이터를 가지고 배우들간에 "출연" 이라는 관계가 어떻게 구성되어 있는지 궁금하여 공동 출연 네트워크를 만들어 보았다.전체 데이터셋 중에서 동일한 영화를 출연한 배우들 각각을 공동출연으로 정의하고, 이렇게 공동으로 출연한 영화가 6편 이상인 배우들을 추출하였다.추출한 데이터는 Networkx를 통해 시각화를 하였는데 이 때 에지에 대한 매개중심성과 부하중심성을 추가하여 네트워크 상에서 존재하는 다른 클러스터 간의 연결자로서의 역할을 어떤 배우들이 하고 있는지 찾아보고자 하였다.전체 네트워크 구조는 위의 그림과 같이 나타났다. 링크의 굵기는 에지 매개 중심성을 계산하여 나온 결과로, 공동으로 출연을 자주하는 그룹간의 연결자로서의 역할을 하는 것을 ..
![](http://i1.daumcdn.net/thumb/C148x148.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/ctQDXU/btrX6igUy6D/PmzkwkbFI4lbaFxKEiLY21/img.png)
오픈 API를 통해 수집한 영화데이터를 지식그래프로 생성하여Stardog 이라는 저장소에 저장하였다.Stardog은 Studio라는 지식그래프 IDE를 제공하는데 이를 이용하여 질의를 하거나 차트를 그려 데이터를 살펴보거나 분석해 볼 수 있다. 영화데이터에는 인물,영화,영화사 데이터가 존재하는데인물은 약 165000건, 영화는 약 59000건, 영화사는 약 4800건 정도의 데이터를 살펴보았다. 먼저 연도별 관객수와 개봉 스크린수를 살펴보았는데 제작연도를 기준으로 2000년부터 2022년까지의 추이를 구성하였다.2004년 이전까지는 관객수도 적은 편이고 개봉 스크린도 적은 편이였으나 2004년 이후는 평균 관객수가 크게 늘어남을 알 수 있다.그리고 2018년까지는 관객수와 개봉 스크린수도 증가를 보이..
![](http://i1.daumcdn.net/thumb/C148x148.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/vfrIw/btrXonjGPUU/0wwl2Jl2HCEgMY1skf8IE1/img.png)
Stardog에서 제공하는 Stardog Designer와 Explorer을 활용하면 간단한 지식그래프를 손쉽게 만들어 시각화까지 해 볼 수 있다.지난 글에서도 잠깐 언급하였지만 Stardog에서 제공하는 Cloud 서비스는 간단한 회원가입만으로도 Explorer, Designer, Studio 3가지 앱을 사용할 수 있다. 이번 글에서는 영화데이터(배우, 감독, 영화)를 가지고 Stardog Designer를 통해 지식그래프 형태로 데이터를 생성하고, Explorer로 간단한 검색을 하는 과정을 영상으로 기록하였다.먼저 데이터는 CSV형태로 준비하였는데 영화데이터는 "영화진흥위원회의 통합전산망 오픈 API" 를 통해 수집하였다.https://www.kobis.or.kr/kobisopenapi/homep..
![](http://i1.daumcdn.net/thumb/C148x148.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/cR8A1s/btrXmB4pGLE/NaZzLkkmRMNclLjKCiuhbk/img.png)
온톨로지 모델을 생성하기 위해 다양한 도구를 사용할 수 있다.이중에 오늘 소개할 도구는Stardog이 제공하는 Designer이다.https://cloud.stardog.com/ Stardog Cloud cloud.stardog.com스타독에서 제공하는 플랫폼을 활용하면 그래프 형태의 데이터를 저장, 관리는 물론이고 온톨로지 모델 생성 및 그래프 탐색을 손쉽게 사용할 수 있다. 설치형을 통해 로컬 환경에 설치하여 사용하거나 간단한 회원가입을 통해 클라우드 환경에서도 사용을 할 수 있다.스타독은 기본적으로 RDF 모델을 사용하며 RDF-Star를 지원한다. 아래의 데모 영상은 영화 도메인을 주제로 영화, 영화인, 영화사에 대해 간단히 모델을 만들어 보는 과정을 기록하였다.이미 생성된 온톨로지 모델을 업로드..
![](http://i1.daumcdn.net/thumb/C148x148.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/begTwA/btrNb0sKBek/JpMAuciuyzPMPKWcKEVjHk/img.png)
지난 글에 이어 이번에는 커뮤니티 탐지에 대해서 다루어보고자 한다. 사실 #5. 지식그래프와 네트워크 분석 과 이번 글은 네트워크 분석에 가까운 내용이긴 하다. 지난 글에서는 네트워크 내의 중심성 계산을 통해 어떠한 노드가 중요한 역할을 하는지 찾았다. 이런 분석은 작은 규모의 네트워크에서 시행하기에 적합하다. 이보다 규모다 좀 더 큰 네트워크에서는 커뮤니티 감지를 통해 노드 그룹간의 관계를 찾고 분석을 수행할 수 있다.자료를 찾아 살펴보다 보면 "클러스터", "커뮤니티", "클러스터링"을 혼용하는 경우도 찾아 볼 수 있다. 따라서 용어에 대한 정의부터 먼저 시작하면, 컴퓨터 과학과 네트워크 과학 분야에서 사용하는 용어의 의미가 약간 다르다. 컴퓨터 과학에서는 "커뮤니티"를 "클러스터"라고 하고 커뮤니티..
- Total
- Today
- Yesterday
- Linked Data
- Ontology
- django
- 스프링부트
- Thymeleaf
- TBC
- sparql
- stardog
- 트리플
- 사이퍼
- neosemantics
- networkx
- TDB
- cypher
- RDF 변환
- RDF
- Knowledge Graph
- 지식 그래프
- 온톨로지
- rdfox
- 타임리프
- pyvis
- 지식그래프
- Neo4j
- 장고
- LOD
- 트리플 변환
- 그래프 데이터베이스
- TopBraid Composer
- property graph
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |