今週の目標:感情辞書の拡張
達成度:2%
作業時間:
10/13(木) 3時間
10/14(金) 5時間
10/17(月) 8時間
10/18(火) 6時間
10/19(水) 0時間
合計約22時間くらい
内容:
アンケート結果をまとめた。
評価として
否定的(ネガティブ)
やや否定的
どちらかと言うと否定的
どちらかと言うと肯定的
やや肯定的
肯定的(ポジティブ)
に0~5の値を振り、10単語0~5の平均値を出し、
それを5分の1することで各文の印象値を出す。
単語が含まれる文1~3文分の印象値で各単語の感情値を決定した。
結果
フォロワー 0.422222
ツイート 0.4
フォロバ 0.866667
症候群 0.253333
もう少し 0.486667
双極性障害 0.271111
躁鬱 0.313333
動悸 0.26
やる気 0.426667
図書館 0.713333
となった。
Twitterの用語が中間の値に近く、病気や症状は0に近いのを見ると
辞書拡張に適用できるものにはなったと思う。
だがDictionaryを更新しても
makeでは書き換えたものが反映されていないらしい
これが適用されていないのか形態素解析の問題なのか
これを辞書に追加し感情値算出を行った結果
何も変化がなかった。原因は形態素解析の段階で
文字がバラバラになってしまうことだった。
(例:双極性障害=「双極」「性」「障害」など)
そこで形態素解析のツールも変える必要が出始め、
MeCabのNEologdをインストールしていた。
10月17日更新の記事参照。
これを感情値解析ツールに適用するのが次週の目標。
次週の目標:Dictionaryファイルの適用と形態素解析ソフトの入れ替え