koNLPy 분석 - hexists/konlpy GitHub Wiki
어떤 contribution을 할 수 있을지에 대해 koNLPy repository를 분석합니다.
Contribution Guide
- https://github.com/konlpy/konlpy/blob/master/CONTRIBUTING.rst
- contribution guide는 어떻게 koNLPy에서 활동할 수 있는지 정리되어 있습니다.
- 주요 내용은 다음과 같습니다.
1. 토론하고 배우기 2. 궁금증 해결하기 3. 이슈 제안/해결하기 4. 문서 수정하기 5. 테스트 추가하기
이슈 현황 분석
- https://github.com/konlpy/konlpy/issues
- 총 87개의 이슈가 열려있습니다. (2020년 3월 12일 기준)
- label에 따라 분류해봅니다.
- 가장 많은 개수의 label인 Status/help wanted를 확인해봅니다.
- https://github.com/konlpy/konlpy/labels/Status%2Fhelp%20wanted
- 실행 관련된 오류에 관한 내용이 많습니다.
- 열려있는 이슈들이지만, 문제를 해결한 경우도 종종 보입니다.
해결해 볼 수 있는 이슈 정리
- #276, test_stream_twitter.py가 아무런 테스트를 수행하지 않습니다.
- #273,
make check
failed - #264, konlpy의 설치/환경설정이 잘 되었는지 확인하는 스크립트를 추가로 제공해야 함 (konlpy doctor)
- #249, Okt 사용시 신조 합성어를 사용하기 위한 사전 추가 방법은?
- #232, mecab Inflect 타입 단어 표기 옵션 추가 문의
- #213, "~일까"를 적절히 분해하지 못하는 경우가 있습니다.
- #209, Old version of Hannanum parser
- #207, konlpy 설치 시 필요한 dependency를 정리해 주세요.
- #184, 한국어 stopword
- #172, 'ㄷㄷㄷㄷㄷㄷㄷㄷㄷㄷㄷㄷㄷㄷㄷㄷㄷㄷㄷㄷㄷㄷㄷㄷㄷㄷㄷㄷㄷㄷ' 이 문자열을 분석할 때 굉장히 오래 걸립니다.
- #137, NIAdic 추가
코드 커버리지 확인
- https://coveralls.io/github/konlpy/konlpy
- 현재 57% (2020년 3월 12일 기준)
활용도
-
koNLPy를 사용하는 예제들을 모아봅니다.
-
설치 및 간단한 실행 예제
- https://cceeddcc.tistory.com/8
- https://devtimes.com/bigdata/2019/04/18/konlpy/
- http://blog.frec.kr/2017/12/python-konlpy.html
- https://datascienceschool.net/view-notebook/70ce46db4ced4a999c6ec349df0f4eb0/
- http://incredible.ai/nlp/2016/12/28/NLP/
- http://pearl.cs.pusan.ac.kr/~wiki/images/4/46/TR14-09-PBK-b.pdf
-
워드 클라우드 / 단어 빈도
-
데이터 분석(감정 분석 등)
-
챗봇
-
기타
의견
- 위 내용들을 바탕으로 제가 생각하는 contribution point입니다.
- 이슈 해결, 문서 수정, 테스트 추가 등 contribution 할 수 있는 부분이 많이 보입니다.
- 활용도는 설치 및 간단한 사용 방법이 많습니다. 다양한 예제들을 정리하고 공유가 필요합니다.