データサイエ「ソ」ティストは語る

データサイエンティストではない、パチもんのデータサイエ「ソ」ティストのブログ

データサイエ「ソ」ティストのふりくらいだったらできるツール群(20140426)

使う(インストールする)だけじゃなんにもならないんだけど。

install.packages("RMeCab",repos="http://rmecab.jp/R")
options(repos="http://cran.ism.ac.jp/")
install.packages("tseries")
install.packages("forecast")
install.packages("vars")
install.packages("rpart")
install.packages("partykit")
install.packages("randomForest")
install.packages("neuralnet")
install.packages("e1071")
install.packages("arules")
install.packages("arulesViz")
install.packages("psych")
install.packages("igraph")
install.packages("wordcloud")
install.packages("psych")
install.packages("conjoint")
install.packages("XML")
install.packages("RFinanceYJ")
install.packages("RODBC")
install.packages("snowfall")
install.packages("rJava")
  • RStudio: Rをちょっと使いやすくしたIDEhttps://www.rstudio.com/ )。日本語の扱いが若干アヤしい
  • Microsoft Excel: 冗談ではなく。一般企業の大抵のビジネス上のデータ分析はExcelで事足りると思う
    • 分析ツールアドイン: [ファイル]-[オプション]-[アドイン]から有効化。基本統計量の算出、統計的検定、回帰分析などが行える
    • ソルバーアドイン: 線形、非線形の様々な問題を解くことができる
    • Rに読み込ませるデータの前処理に、ピボットテーブルが超便利(Excelで扱える型・規模の場合)
  • MeCab: 日本語テキストをテキストマイニングする際に用いる形態素解析器( http://mecab.googlecode.com/svn/trunk/mecab/doc/index.html
    • RMeCab: 上記コードにもあるが、RからMeCabを呼び出すためのパッケージ
  • FFmpeg: 様々なメディアファイルを操作できるコマンドラインツール。Rで出力したグラフを複数枚くっつけてパラパラ漫画にする、などの時に便利( http://ffmpeg.zeranoe.com/builds/ )。Rで何でもやるよりは多分そっちが楽
  • Amos: データの因果関係(構造)を検証できる共分散構造分析をグラフィカルに行うためのソフトウェア。現在はIBMが販売しており、無償のStudent Editionは配布されなくなったが、あるところにはある