3. 日本語の感情分析 - hpscript/nlp GitHub Wiki

メジャーな感情極性辞書

東北大の乾・岡崎研究室が公開されている「日本語評価極性辞書」 ネガティブなワードは「n」、ポジティブなワードは「p」、ニュートラルなワードは「e」

東工大の高村教授が公開されている「単語感情極性対応表」

asari

$ pip3 install asari $ pip install scikit-learn==0.20.4 $ pip install Janome==0.3.7

# -*- coding: utf-8 -*-
from asari.api import Sonar

sonar = Sonar()
text="広告が多すぎる"
res = sonar.ping(text="広告多すぎる♡")
print(res)

$ python3 app.py {'text': '広告多すぎる♡', 'top_class': 'negative', 'classes': [{'class_name': 'negative', 'confidence': 0.9086981552962491}, {'class_name': 'positive',

transformer

$ pip3 install fugashi $ pip3 install ipadic

sentiment.py

# -*- coding: utf-8 -*-
from transformers import AutoTokenizer, AutoModelForSequenceClassification
from transformers import pipeline

tokenizer = AutoTokenizer.from_pretrained("daigo/bert-base-japanese-sentiment")
model = AutoModelForSequenceClassification.from_pretrained("daigo/bert-base-japanese-sentiment")

print(pipeline("sentiment-analysis", model="daigo/bert-base-japanese-sentiment", tokenizer="daigo/bert-base-japanese-sentiment")("私は幸福である。"))

$ python3 sentiment.py [{'label': 'ポジティブ', 'score': 0.9843042492866516}]