作業時間:4時間程度
内容:アンケート用単語リストの準備、(グループゼミ)
10000ツイートを形態素解析したものを
動詞・副詞・名詞のいずれか(品詞の限定)
かつ
出現回数2桁以上(比較的多く出てくるもの)
かつ
記号と英語でない(文字のみに限定)
かつ
2文字以上(1文字では意味を持たない言葉も多いため)
かつ
漢字またはカタカナを含む(ひらがなだけでは意味が何通りにもなってしまう)
ものだけを抽出した。
これに絞った残り1060単語をisGrepというフリーソフトで
感情辞書ファイルに含まれているかどうかを調べる。
最後に残ったものとTwitterで使われる用語をあわせて種類ごとに分け、
辞書拡張用のアンケートの中身とする予定。
アンケート内容では単語ではなくこれらの単語を含んだ
文章によって印象評価をする。