12月5日(月)

作業時間:3時間半
内容:グラフ作成

感情値から標準偏差と平均値を出し、グラフを作成していました
軸として
・平均値(NP,IC)
・標準偏差(NP,IC)
・属性
・ツイート数
などが使えるのではないかという話を加納先生として
標準偏差NPと標準偏差ICを軸に使った結果、思ったよりきれいに
一般とかかっている人とが分かれました。
次は一般とかかっている人とを2つに分ける線を引くようにしたいと考えています。
あとサンプル数を増やします。

#memo
今のところの研究の穴らしきところ(改善点?)
・算出ツールの自体の精度
・アンケートに関するもの(選んだツイートが適切だったか、単語はいいのかみたいなもの)
・感情値が算出されないツイートが現在4と算出されるようになっているのでそれが結果にかなり影響しているかも(低いものは上に高いものが下に)←改善予定

12月2日(金)

作業時間:6時間
内容:感情値の結果からの方向性決め

感情値算出の結果から
グラフを一通り作りましたが、パッと見では違いがわからず
統計分析に入ることになりました

加納先生に「統計何もわかりません…」と
タブーとされていた丸投げをしてしまい
とりあえず標準偏差を出してばらつきを見て、
そこから帰無仮説を立てたり相関分析をしようという話になり
標準偏差について調べながら算出結果に適用を試みていました

#memo
仮説と帰無仮説
仮説「うつ群と双極群と一般群にそれぞれ一定の偏りがある」
帰無仮説「偏りがない」

12月1日(木)

作業時間:4時間半
内容:感情値グラフ作成

算出ツールを使った結果
ツイキャス通知についているハッシュタグ
「#双極性障害」「#うつ病」などに反応し
同じ数値が出続けるようなときもありましたが
理想的な数値が出ているものもありますがとりあえずはそのまま進んでいます

算出値をグラフにしたもの移動平均グラフそれぞれ出しましたが
見た感じでそのままでは規則はわかりませんでした(当たり前だけど)
明日またよく見てみます

あと先生から統計分析の話が出たのでそれも一緒に調べつつやっていこうと思います。

11月5週

今週の目標:感情値の算出
達成度:90%

作業時間:
11/24(木) 3時間半
11/25(金) 3時間
11/28(月) 5時間半
11/29(火) 4時間

合計約16時間くらい

今週はずっとアンケート結果から作成した辞書を
算出ツールで使えるように調整する作業でした

改行コードや順番、漢字とひらがなその他表記などの問題

改行コード:秀丸でCR+LF→LFに

漢字とひらがな:「ダメ」や「頑張る」など比較的ひらがなでも表記するユーザーが多い単語に同じ値でひらがな版を追加

表記:jumanに115単語を打ち込み、左から3番目のものに変更する(例:不安→不安だ)

上記の方法で解決し
算出ツールで使えるようにはなりましたが、
算出した値にまだ調整が必要だと思われます。

来週の目標:比較、傾向分析とツールと辞書の調整

11月29日(火)

作業時間:4時間くらい
内容:感情値の算出と調整

感情値は出せるようになったので、
算出したものからどうやって傾向を見つけようかと
色付けをしたりと手を加えておりました。

パッと見たところ精度は50%くらいでしょうか…
皮肉めいたものに関しては全然違う数値を出したり
単語をいくつか使っているものなら暗いという判定になったりと
今あるもので精度を上げる方法を模索すると同時に
さらに見やすいように改良していく予定です。

11月28日(月)

作業時間:5時間半
内容:辞書の作成

前回の
・形式の変更
・文字順ソート
をやっていました

ソートのプログラムを竹島先生に教えてもらい、ソートしました
juman7.01で115単語を試し、出てきた左から3番目のものに変更し
試したところ無事アンケートから作った感情辞書で感情値を算出することができました。
明日からはこの辞書の精度を見ながらグラフを作成します。

11月25日(金)

作業時間:3時間
内容:辞書の修正

感情値算出が上手くいかないので加納先生に聞きながらやっていました。

途中の作業ファイルなどを削除せずに中身を見た結果
・算出にはコード順かなにかの順にソートしてからでないと使えないこと
・形態素解析して左から3番目に出てきた形を感情値算出に使用していること
例:不安の場合
不安 ふあん 「不安だ」←この形 形容詞 3 * 0 ナ形容詞 21 語幹 1 “代表表記:不安だ/ふあんだ 反義:形容詞:安心だ/あんしんだ”

この二つを考慮して辞書の作成を続けます。

11月24日(木)

作業時間:3時間半
内容:感情辞書の実装

感情値算出ツールにアンケートから作成した辞書ファイルを入れたところ数値が出ず,加納先生に聞いたところ改行コードが問題だったらしく,
秀丸を使って改行コードを\nのみにしました

また,算出ツールに合わせて数値をすべて0から1の範囲にする必要がやはりあり,
数値にすべて正規化するためのコードを書いていました

そのコードにより,アンケートで作った二つの辞書は0から1の範囲の値になりました。

11月4週

今週の目標:辞書の作成
達成度:100%

作業時間:
11/17(木) 3時間
11/18(金) 4時間
11/21(月) 2時間
11/15(火) 30分(論文修正)
11/16(水) 4時間半

合計約14時間くらい

今週はほとんど論文の修正を行っていました。
現時点で提案手法の可視化と傾向・因果推定以外の部分は
ひとまず終わっています。(まだここからの修正は抜け等がかなりあると思います)

辞書作成についてはアンケートの受付を終了し、
最終的に各アンケート回答数52となりました。

またそこから集計をし、
アンケートをとった115単語の感情値が1~5の範囲のままですが
決定しました。

来週はこの辞書を算出ツールに適用し、どのように結果が出るかを見てから
元ある(やや数値の怪しい)感情辞書、極性対応表と組み合わせて使用する予定です。

来週の目標:感情値の算出

11月23日(水)

作業時間:4時間半
内容:辞書作成とツイートの取得

アンケート結果をCSVでダウンロードして
感情値を出すため集計していました。

とりあえずアンケートをとった分の感情辞書は作成が終わりました。

ついでにずっと2,3ヶ月前に取得したツイートを使っていたため
テスト用にツイートをもう一度取得しました。