3. 日本語の感情分析 - hpscript/nlp GitHub Wiki
メジャーな感情極性辞書
東北大の乾・岡崎研究室が公開されている「日本語評価極性辞書」 ネガティブなワードは「n」、ポジティブなワードは「p」、ニュートラルなワードは「e」
東工大の高村教授が公開されている「単語感情極性対応表」
asari
$ pip3 install asari $ pip install scikit-learn==0.20.4 $ pip install Janome==0.3.7
# -*- coding: utf-8 -*-
from asari.api import Sonar
sonar = Sonar()
text="広告が多すぎる"
res = sonar.ping(text="広告多すぎる♡")
print(res)
$ python3 app.py {'text': '広告多すぎる♡', 'top_class': 'negative', 'classes': [{'class_name': 'negative', 'confidence': 0.9086981552962491}, {'class_name': 'positive',
transformer
$ pip3 install fugashi $ pip3 install ipadic
sentiment.py
# -*- coding: utf-8 -*-
from transformers import AutoTokenizer, AutoModelForSequenceClassification
from transformers import pipeline
tokenizer = AutoTokenizer.from_pretrained("daigo/bert-base-japanese-sentiment")
model = AutoModelForSequenceClassification.from_pretrained("daigo/bert-base-japanese-sentiment")
print(pipeline("sentiment-analysis", model="daigo/bert-base-japanese-sentiment", tokenizer="daigo/bert-base-japanese-sentiment")("私は幸福である。"))
$ python3 sentiment.py [{'label': 'ポジティブ', 'score': 0.9843042492866516}]