주어진 글들에 존재하는 단어들의 동시 출현 관계를 통해 해당 글이 어떤 의미를 말하고 있는지를 파악해보면 재미있을 것 같았다. 그래서 단어, 정확히는 명사의 출현을 통해 간단히 파악할 수 있도록 구성하였다. 문장에 나타나는 명사들의 출현 거리가 가까우면 그만큼 의미있는 단어들일 것이고, 거리가 멀면 큰 관계가 없다는 전제하에 진행된다. 텍스트는 "세이노의 가르침" 이 PDF 로 무료 배포 되고 있어 이를 활용하였다. https://blog.naver.com/PostView.naver?blogId=dayonepress&logNo=223064751876&categoryNo=11&parentCategoryNo=-1&viewDate=¤tPage=&postListTopCurrentPage=&isAfte..
"영화진흥위원회의 통합전산망 오픈 API" 를 통해 수집한 데이터를 가지고 배우들간에 "출연" 이라는 관계가 어떻게 구성되어 있는지 궁금하여 공동 출연 네트워크를 만들어 보았다. 전체 데이터셋 중에서 동일한 영화를 출연한 배우들 각각을 공동출연으로 정의하고, 이렇게 공동으로 출연한 영화가 6편 이상인 배우들을 추출하였다. 추출한 데이터는 Networkx를 통해 시각화를 하였는데 이 때 에지에 대한 매개중심성과 부하중심성을 추가하여 네트워크 상에서 존재하는 다른 클러스터 간의 연결자로서의 역할을 어떤 배우들이 하고 있는지 찾아보고자 하였다. 전체 네트워크 구조는 위의 그림과 같이 나타났다. 링크의 굵기는 에지 매개 중심성을 계산하여 나온 결과로, 공동으로 출연을 자주하는 그룹간의 연결자로서의 역할을 하는 ..
지난 글에 이어 이번에는 커뮤니티 탐지에 대해서 다루어보고자 한다. 사실 #5. 지식그래프와 네트워크 분석 과 이번 글은 네트워크 분석에 가까운 내용이긴 하다. 지난 글에서는 네트워크 내의 중심성 계산을 통해 어떠한 노드가 중요한 역할을 하는지 찾았다. 이런 분석은 작은 규모의 네트워크에서 시행하기에 적합하다. 이보다 규모다 좀 더 큰 네트워크에서는 커뮤니티 감지를 통해 노드 그룹간의 관계를 찾고 분석을 수행할 수 있다. 자료를 찾아 살펴보다 보면 "클러스터", "커뮤니티", "클러스터링"을 혼용하는 경우도 찾아 볼 수 있다. 따라서 용어에 대한 정의부터 먼저 시작하면, 컴퓨터 과학과 네트워크 과학 분야에서 사용하는 용어의 의미가 약간 다르다. 컴퓨터 과학에서는 "커뮤니티"를 "클러스터"라고 하고 커뮤니..
지난 글에서 개념화를 통해 논문, 저자, 분류 관계를 표현하여 명시적으로 표현하였습니다. 생성된 지식그래프는 그래프 형태이기 때문에 네트워크 분석에서 활용이 가능합니다. 이번 글에서는 그래프 형태로 구성되어 있는 데이터로부터 필요한 정보를 구성하고 이를 네트워크 분석에 활용하는 과정을 다루어 보겠습니다. 구축되어 있는 데이터를 그대로 활용하면 좋겠지만 때로는 기존의 데이터에 일부 추가적인 작업이 필요할 때가 있습니다. 이번 예에서는 논문과 분류 데이터를 활용할 것입니다. 물론 논문과 분류는 개념적인 내용이고 실제로 논문이라는 데이터에는 실제 논문들이 존재합니다. 분류도 마찬가지 입니다. 이번 글에서 분석하고자 하는 내용은 분류라는 데이터가 얼마나 중심성을 가지고 있는지를 분석해보고자 합니다. 이는 논문과..
파이썬, 그래프 라이브러리를 활용하여 네트워크 그리기 기본 이해 NetworkX는 그래프와 네트워크를 연구하기위한 Python 라이브러리로서, BSD-new 라이센스에 따라 공개 된 무료 소프트웨어이다. 이 라이브러리를 통해 그래프를 그려볼 것이다. 공식 홈페이지는 아래와 같다. https://networkx.org/ RDKit은 RDKit은 C++ 및 Python으로 작성된 화학 정보학 및 기계 학습 소프트웨어 모음이다. 이를 활용하여 화학물질을 다룰 수 있다. 공식 홈페이지는 아래와 같다. https://www.rdkit.org/ SMILES 코드는 분자구조 화학식을 문자열로 변환하는 방법 중에 하나로 원자들의 화학 결합을 표현할 수 있다. 위키백과에 따르면 ASCII 문자열을 사용하여 화학종의 구조..
- Total
- Today
- Yesterday
- TopBraid Composer
- 트리플
- stardog
- 온톨로지
- Ontology
- RDF 변환
- Thymeleaf
- neosemantics
- 타임리프
- rdfox
- RDF
- Neo4j
- 지식 그래프
- TBC
- 그래프 데이터베이스
- pyvis
- TDB
- django
- LOD
- 사이퍼
- 스프링부트
- 장고
- 트리플 변환
- Knowledge Graph
- 지식그래프
- networkx
- sparql
- property graph
- cypher
- Linked Data
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |