形態素解析

今回は形態素解析の方法としてRMeCabを使用した。

Rは統計解析フリーソフト、MeCabは形態素解析ソフトである。

形態素解析は文章を品詞で分解し頻度を調べるための手法、RMeCabはR内でMeCabを使用するためのオープンソースである。

Rのインストール:https://cran.r-project.org/

MeCabのインストール:http://taku910.github.io/mecab/

RMeCabの手順:http://blog.ecoteki.com/webservice/post-2499/

参考サイト:形態素の頻度分析

RとMeCabをインストールした後、R内で

install.packages("RMeCab",repos = "http://rmecab.jp/R")

を実行することでRMeCabをインスト-ルできる。
RMeCabを使用するときは

library(RMeCab)

を最初に挟む必要がある。

形態素解析

library(RMeCab)//ライブラリ
ans<-RMeCabFreq("形態素解析したい文章の場所")
ans//出力

解析結果をCSVで書き出したい場合

library(RMeCab)//ライブラリ
write.csv(ans,".csv",row.names=TRUE,fileEncoding="CP932",eol="\r\n")
ans//出力

ソート

ans[rev(order(ans$Freq)),]//ソート
ans//出力

を実行することで解析できる。

書き出したCSVファイル等はドキュメントに保存される。

投稿者: kame_238

Twitterに関する研究をしています。 よりいい方法などありましたら教えていただけると助かります。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です