今回は形態素解析の方法としてRMeCabを使用した。
Rは統計解析フリーソフト、MeCabは形態素解析ソフトである。
形態素解析は文章を品詞で分解し頻度を調べるための手法、RMeCabはR内でMeCabを使用するためのオープンソースである。
Rのインストール:https://cran.r-project.org/
MeCabのインストール:http://taku910.github.io/mecab/
RMeCabの手順:http://blog.ecoteki.com/webservice/post-2499/
参考サイト:形態素の頻度分析
RとMeCabをインストールした後、R内で
install.packages("RMeCab",repos = "http://rmecab.jp/R")
を実行することでRMeCabをインスト-ルできる。
RMeCabを使用するときは
library(RMeCab)
を最初に挟む必要がある。
形態素解析
library(RMeCab)//ライブラリ ans<-RMeCabFreq("形態素解析したい文章の場所") ans//出力
解析結果をCSVで書き出したい場合
library(RMeCab)//ライブラリ write.csv(ans,".csv",row.names=TRUE,fileEncoding="CP932",eol="\r\n") ans//出力
ソート
ans[rev(order(ans$Freq)),]//ソート ans//出力
を実行することで解析できる。
書き出したCSVファイル等はドキュメントに保存される。