티스토리 뷰

"영화진흥위원회의 통합전산망 오픈 API" 를 통해 수집한 데이터를 가지고 배우들간에 "출연" 이라는 관계가 어떻게 구성되어 있는지 궁금하여 공동 출연 네트워크를 만들어 보았다.

전체 데이터셋 중에서 동일한 영화를 출연한 배우들 각각을 공동출연으로 정의하고, 이렇게 공동으로 출연한 영화가 6편 이상인 배우들을 추출하였다.

추출한 데이터는 Networkx를 통해 시각화를 하였는데

이 때 에지에 대한 매개중심성과 부하중심성을 추가하여 네트워크 상에서 존재하는 다른 클러스터 간의 연결자로서의 역할을 어떤 배우들이 하고 있는지 찾아보고자 하였다.

배우들 간의 공동 출연 네트워크

전체 네트워크 구조는 위의 그림과 같이 나타났다. 링크의 굵기는 에지 매개 중심성을 계산하여 나온 결과로, 공동으로 출연을 자주하는 그룹간의 연결자로서의 역할을 하는 것을 나타낸다.

각각의 원들은 배우 한명씩을 나타내고 있는데 원의 크기는 부하중심성의 값이 반영된 결과로 원이 클 수록 다른 그룹들과 출연을 자주 한다는 의미가 될 수 있다.  색상은 중심성 값의 상위 95% 아래면 하늘색, 95~98%면 진한 파랑색, 99%이면 연두색, 제일 큰 값은 진한 녹색으로 표시하였는데 , 부하중심성이 제일 큰 배우는 브루스 윌리스로 나타났다. (공통 출연 횟수가 가중치로 반영된 결과)

국내 배우 중에서는 이병헌이 제일 큰 값으로 나오고 있다.

브루스 윌리스 외에 사무엘 L. 잭슨도 영향이 큰 것으로 나오고 있다.

국내 배우들간에는 아래의 네트워크처럼 큰 네트워크를 구성하는 부분이 있고 오른쪽 하단으로 작게 구성되어 있는 네트워크가 존재한다.

이 둘간의 연결이 되어지는 핵심 배우들로는 안성기, 김지영, 김영애, 최재호 배우들로 나타난다.

 

전체 구조 외에 어떤 배우들이 공동으로 출연하는 횟수가 많은지 궁금하여 살펴보니

이 배우가 수치상으로는 활발한 작품 활동을 하는 것으로 나오고 있다. 생각해보니 영화를 볼 때 자주 본 인물이기도 한 것 같다.

 


위 내용은 개인적 호기심에 데이터를 수집하여 본인 마음대로 구성을 한 것으로 극히 주관적인 기술입니다. 본인과 다른 해석은 얼마든지 가능합니다.

최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
«   2024/11   »
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
글 보관함