11月5日(土)

作業時間:2時間
内容:アンケ作成

昨日の先生のアドバイス通り、
各文に対して答えてもらうようアンケートを書き換えました。

洋次郎に試しにやってもらったところ
思ったより一文に時間がかかっており、
さらに感想をきいたところ

・文が長い
・短ければ40問くらい出来ると思う

115単語各文に対して答えてもらうということは
345問になってしまうので3文ではなく2文くらいにしようかと思っています。
それができれば230問で6つに分けて一人38,9問になるのでその方向で行ければ…
と思います。

文の長さについてはツイート内容を全文ではなく単語を使用している
文だけ抜き出すように改善予定です。

11月3日(木)

作業時間:3時間半
内容:アンケート作成

アンケート内容
単語+5ツイートのまとめたもの内容を見てもらい、値を決めてもらう
軸は2軸
ネガ⇔ポジ
冷静⇔焦燥
単語数116
6つに分けてアンケートを作る
Googleフォームでグリッドを使用して作成。

11月2日(水)

作業時間:3時間
内容:ツイート抜き出しとアンケート作成

ツイート数が少し減り115単語各5ツイートずつの抜き出しが終わった

次はアンケートに貼り付けていく作業だがGoogleフォームは
評価軸を1問につき1つしか作れないので

例えば「眠い」だったら

眠い
ネガティブ・ ・ ・ ・ ・ ・ポジティブ

眠い
 冷静  ・ ・ ・ ・ ・ ・ 焦燥

のようなものにさらにツイートの分もと
一つの単語につき4問作る羽目になってしまう…
なにかいいアンケートサイトか方法はないものか…

10月31日(月)

作業時間:4時間
内容:アンケート用の単語抜き出し

KHCoderの抽出語リストを使用し単語を抜き出した。
名詞、サ変名詞、形容動詞、動詞、形容詞、副詞、形容詞Bに絞りさらに
感情と関係があると思われる語のみを抜き出し
122単語になった。

122単語リスト

当初の予定では100単語という話だったが20単語くらいどうにかならないか…
アンケート受ける側は大変だけど…

10月28日(金)

作業時間:5時間

内容:アンケートのための単語抜き出し

KHCoderを使用して共起ネットワークや階層的クラスター分析などを使って共起の関係にヒントがあるかと思いきや何もなく前回+頻出度10までの単語を全削除して1000単語ほどにまで絞り込めたがそこからどうやって絞り込めばいいのか方法を探索中。
一応「よくわかるうつ病」の症状に出てきた
不眠や食欲、無気力といったものを元に、
うつっぽい単語を手動で絞り込んでいるところ。
だがまだ470単語ほど…何かの基準がほしいところ。

10月26日(水)

作業時間:3時間半
内容:アンケート用単語抜き出しと進捗スライド作成

もはや辞書を自分で作った方が早いということで
10000ツイート形態素解析したものを以下の
基準で絞り込んだ。

・名詞、動詞、形容詞、副詞のみに絞る
・非自立、接尾、固有名詞、特殊、代名詞、副詞可能、ナイ形容詞全削除
・英数字削除
・半角の文字削除
・頻出度1桁のもの削除
・2文字以下ひらがなカタカナ削除
・文頭が小さい文字で始まるもの

これらから残った1,000単語頻出度上から100個位を
選んで大規模にアンケートを取りたい。

10月25日(火)

作業時間:3時間くらい
内容:アンケート用に10000ツイート形態素解析したものから再度単語を絞る、軸の決定

加納先生との話で
楽悲と嬉怒の軸はまとめられないかという話があった。

その2つをまとめた時、もう一方の長閑緊迫(わかりにくいのでリラックス⇔緊張とする)
で辞書が2つになる。そこにアンケートとネガポジの軸をあわせて2軸にできないかと考えた。

1つ目の軸(ネガポジ)
・楽悲嬉怒+ネガポジ+アンケート?

2つ目の辞書(リラックス緊張)
・リラックス緊張+ネガポジ+アンケート?

10月24日(月)

作業時間:1時間半
内容:次のアンケートについてのまとめ

加納先生のJava講座のあと先生と相談をして

新しい感情辞書を作れないかという話に。
もう一度くらいなら研究室内や、先生にお願いして
授業でアンケートを大規模に取れないかという話と、

今感情辞書にある感情の3軸(楽悲、嬉怒、長閑緊迫)、
試しにやってみた単語感情極性対応表の軸(ネガポジ)の話で

辞書2種類とアンケートを使って2軸に絞れないかという話に。

それらについて考えをまとめていました。