형태소 분석기인 mecab에 사용자 사전을 정의하여 사용하다보면 간혹 사전을 생성했음에도 사전에 입력한 대로 결과가 나오지 않고 단어가 분리되어 나올 때가 있다. 실제로 그러한 경우를 재현해 보도록 하겠다. 환경은 Windows 에 파이참을 사용한다. 윈도우 환경 + 파이참 에서 mecab을 사용하는 방법은 아래의 내용을 참고하세요 https://joyhong.tistory.com/127 윈도우 환경에서 mecab 설치 후 파이참(PyCharm) 에서 사용하기 윈도우에서 파이참을 사용하여 개발할 때 형태소 분석기 중 하나인 mecab을 사용하려면 몇가지 설치와 실행을 통해서 가능하다. 먼저 다운 받아야 할 것은 1. mecab-ko-msvc 2. mecab-ko-dic-msvc.zip 이렇게 joyhon..
이번 글에서는 네이버 영화리뷰 데이터에서 실제 리뷰 문장을 읽어 명사만 추출하고자 한다. 형태소 분석기는 Mecab 형태소 분석기를 활용할 것이다. 실행환경은 윈도우즈10에서 파이참을 사용한다. 윈도우즈에서 Mecab을 사용하기 위한 방법은 https://joyhong.tistory.com/127 윈도우 환경에서 mecab 설치 후 파이참(PyCharm) 에서 사용하기 윈도우에서 파이참을 사용하여 개발할 때 형태소 분석기 중 하나인 mecab을 사용하려면 몇가지 설치와 실행을 통해서 가능하다. 먼저 다운 받아야 할 것은 1. mecab-ko-msvc 2. mecab-ko-dic-msvc.zip 이렇게 joyhong.tistory.com 에서 설명한 적이 있다. 명사를 추출할 대상이 되는 파일은 이전 글에..
koNLPy에서 제공하는 mecab은 윈도우에서 사용이 불가능하다. https://konlpy-ko.readthedocs.io/ko/v0.4.3/install/ 설치하기 — KoNLPy 0.4.3 documentation 주석 설치 및 사용 도중 문제가 발생하는 경우 다음 페이지들을 참고해주세요: 리눅스. 맥 OS. 윈도우. 발생한 문제가 어디에도 없는 경우 “New Issue” 버튼을 눌러 새로운 이슈를 생성해주시기 �� konlpy-ko.readthedocs.io 이에 대한 내용은 위의 링크에서 언급하듯이 mecab() 클래스는 윈도우에서 지원하지 않는다고 한다. 아쉽게도 따로 mecab을 설치하여 사용이 가능하다.(이전 포스팅 참조) 그리고 KoNLPy 스타일로 mecab을 래핑한 pyeunjeon..
이번에는 mecab 형태소분석기에 사용자 사전을 추가하는 방법에 대해서 설명한다. 윈도우 환경에서 파이참을 사용할 때 mecab을 설정하는 방법은 이전 포스팅에서 설명하였다. https://joyhong.tistory.com/127 윈도우 환경에서 mecab 설치 후 파이참(PyCharm) 에서 사용하기 윈도우에서 파이참을 사용하여 개발할 때 형태소 분석기 중 하나인 mecab을 사용하려면 몇가지 설치와 실행을 통해서 가능하다. 먼저 다운 받아야 할 것은 1. mecab-ko-msvc 2. mecab-ko-dic-msvc.zip 이렇게 joyhong.tistory.com 사전을 추가하기 위해서는 두 단계를 거치면 된다. 1. 사전 추가 2. 사전 컴파일 사전 파일을 수정, 생성하였으면 반드시 컴파일을 해..
윈도우에서 파이참을 사용하여 개발할 때 형태소 분석기 중 하나인 mecab을 사용하려면 몇가지 설치와 실행을 통해서 가능하다. 먼저 다운 받아야 할 것은 1. mecab-ko-msvc 2. mecab-ko-dic-msvc.zip 이렇게 두가지를 다운 받아야 한다. 첫번째 파일은 mecab 관련한 파일이며 다운 받을 때 각자의 환경에 맞추어 x32 / x64 를 구분하여 다운받으면 된다. 두번째 파일은 사전 관련한 파일이며 여기 에서 최신 목록을 확인해 볼 수도 있다. 파일들이 준비되었으면 이제 mecab을 넣어둘 폴더를 만들어야 한다. C 드라이브 밑에 mecab 폴더를 만들어 준다. "C:\mecab" 여기에 위 두 개의 파일의 압축을 풀어 mecab 폴더 하위에 바로 모든 파일이 들어오도록 조정한다...
- Total
- Today
- Yesterday
- 그래프 데이터베이스
- Neo4j
- 트리플 변환
- TopBraid Composer
- Ontology
- sparql
- TBC
- Linked Data
- RDF
- RDF 변환
- 장고
- LOD
- cypher
- neosemantics
- stardog
- 온톨로지
- 지식그래프
- 트리플
- Knowledge Graph
- property graph
- networkx
- TDB
- 지식 그래프
- rdfox
- 타임리프
- Thymeleaf
- pyvis
- 스프링부트
- django
- 사이퍼
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |