今週の目標:移動平均グラフの作成手順の理解と感情辞書拡張用のアンケート作成
達成率:50%
作業時間:
9/29(木) 4時間半
10/4(火) 5時間
10/5(水) 4時間
合計約14時間半
内容:ツイート取得の続きと移動平均グラフの作成と「よくわかるうつ病」に目を通す。
感情辞書拡張用のアンケートためにうつであると判断したTwitterユーザーのつぶやきを10000ツイート集め
形態素解析を行ってさらにその結果からどの単語を辞書に反映するかという整理を行っていた。
移動平均グラフはエクセルで作ろうとすると範囲が前後ではないので手動で少し調整する部分があった。
10000ツイートを形態素解析したものを
動詞・副詞・名詞のいずれか(品詞の限定)
かつ
出現回数2桁以上(比較的多く出てくるもの)
かつ
記号と英語でない(文字のみに限定)
かつ
2文字以上(1文字では意味を持たない言葉も多いため)
かつ
漢字またはカタカナを含む(ひらがなだけでは意味が何通りにもなってしまう)
ものだけを抽出した。
今までうつ病と双極性障害(躁うつ病)を同等に扱っていたが本の中では別の病気として扱われていたため、
本研究でもうつ病と双極性障害については分けて考えることにした。
それに伴いツイート取得についても一部ツイート取得をし直す予定。
次週の目標:アンケート完成&実施