티스토리 뷰
이번에는 https://projector.tensorflow.org/
Embedding projector - visualization of high-dimensional data
Visualize high dimensional data.
projector.tensorflow.org
에서 임베딩 결과를 시각화해보도록 한다.
임베딩 프로젝터에서 시각화를 하려면 임베딩 모델에서 별도의 tsv 파일을 생성해야 한다.
python -m gensim.scripts.word2vec2tensor --input word2vec --output word2vec
위의 명령을 실행하면 2개의 tsv 파일이 생성된다.
여기서 --input과 --output 옵션 뒤에 word2vec은 임베딩모델을 저장한 파일명이 되겠다.
그럼 파이참에서는 터미널 탭을 눌러 word2vec 파일이 존재하는 폴더로 이동한다.
cd 명령을 통해 디렉토리 이동 후 위의 명령을 실행하면 아래와 같은 메세지와 함께 두 개의 파일이 생성이 된다.
파일이 준비되었으면 임베딩 프로젝트 사이트에서 접속하여 왼쪽에 있는 Load 버튼을 클릭해 두개의 tsv 파일을 업로드 한다.
업로드가 완료되면 PCA, t-SNE 등으로 시각화된 내용을 볼 수 있다
이번에 업로드한 대강의 모습이다. 기본적으로 3차원으로 나타나며, 2차원으로도 볼 수 있다.
특정 단어를 선택하면 관련된 단어들이 하이라이트되어 보여진다.
T-SNE 탭을 클릭하면 초기화 작업 중이라는 메세지가 뜨고 t-SNE 시각화로 변경된다.
'ML&DL' 카테고리의 다른 글
mecab 사전 우선순위 조정 (3) | 2020.08.13 |
---|---|
임베딩 - FastText (2) | 2020.08.13 |
Word2Vec - 시각화(t-SNE, PCA) (2) | 2020.08.12 |
임베딩 - Word2Vec (5) | 2020.08.12 |
명사 추출 - 네이버 영화리뷰 (0) | 2020.08.11 |
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
TAG
- neosemantics
- sparql
- Knowledge Graph
- 스프링부트
- 지식그래프
- Linked Data
- networkx
- django
- property graph
- 지식 그래프
- pyvis
- TopBraid Composer
- 온톨로지
- Neo4j
- cypher
- 타임리프
- stardog
- 그래프 데이터베이스
- RDF 변환
- TBC
- TDB
- 사이퍼
- 장고
- Thymeleaf
- LOD
- rdfox
- 트리플
- 트리플 변환
- RDF
- Ontology
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
글 보관함