データサイエ「ソ」ティストは語る

データサイエンティストではない、パチもんのデータサイエ「ソ」ティストのブログ

R

RからPowerPointを操作して自動レポート作成環境を作る(2)Rのグラフやデータフレームを挿入する

前回の記事 datasciesotist.hatenablog.jp (1)では、RからPowerPointを起動し、スライドの作成、テンプレートの適用までを紹介した。(2)では、スライドにRのグラフやデータフレームなどを挿入する方法を紹介する。 R2PPTパッケージが提供する関数 まずは…

RからPowerPointを操作して自動レポート作成環境を作る(1)R2PPTの導入

(1)としたものの、続かないかもしれない。ただ、自分の業務上のニーズとして、可能な限り同じ作業の繰り返しを避けて、定型的なレポートは自動生成したい、というのがあるので、やりかたを調べてみた。 ……knitr使えとか、RMarkdownがいいぞ、とかあるのだ…

RとFacebook Graph APIであのサイトのファン層を可視化する

R API

執筆中のBGM アイドルネッサンス「ベステンダンク」(MV) サマリー こういう図が作れます。 Facebook Graph APIを使うと、他人(他社)のFacebookページのファン数を国別に取得できる Rから直接APIにアクセスしてJSONを取得し、パースしてデータフレームに…

日本語WikipediaとRのwordVectorsパッケージで“言葉遊び”

執筆時のBGM:アイドルネッサンス「夏の決心」 アイドルネッサンス「夏の決心」(MV) まえがき 世の中の「でーたさいえんてぃすと」はとうの昔に通り過ぎてしまったところだろうけど、「言葉の意味」をベクトル空間にマッピングして、様々に操作(計算)で…

miniCRANパッケージを使ってパッケージをオフラインインストールする

R

いつも自分でしゃべっていて、「検索したらヒントが出てきますよ」と言っているのだけど、参照先がうまく紹介できないので、研修のネタ帳として。 オフラインのパソコンでRを使う データ分析を専門にしている方からすると信じられないかもしれないが、一般的…

SparkRのインストール(spark-ec2版)

参考:https://github.com/amplab-extras/SparkR-pkg/wiki/SparkR-on-EC2 前提 spark-ec2スクリプトでクラスタが構成されていること。例えば、以下のような感じ。 ./spark-ec2 -k SparkLab -i ~/sparklab/aws_key/SparkLab.pem -s 4 -t m3.xlarge launch Spa…

OpenBLASによるRの高速化(CentOS 6.5)

参考 OpenBLAS と ATLAS の性能を R 上で比較する | 永田 晴久 環境 CentOS 6.5 (Software Development Workstation) on VirtualBox 4.3.12 CPU: 4コア メモリ: 4GB HDD: 40GB OpenBLAS: v0.2.11-0 R 3.1.1(オリジナル): yumでepelレポジトリからインストー…

第40回Tokyo.Rで発表した

時間的にはLT(5分)だったのだけど、用意した資料はわりと盛りだくさん。 40th Tokyo.R "RでExperience API (Tin Can API) をいじる、という話" from sciesotist data Togetterまとめは→http://togetter.com/li/680239

RでTin Can APIなJSONをごにょごにょ

なんかそういう機会があったので。完全にコードのみ。後半は、やりたいことはできたけど、なんだかごちゃごちゃ。 # rjsonパッケージのインストール(初回のみ) # install.packages("rjson") # JSONデータを扱うためのrjsonパッケージのロード require(rjso…

第39回Tokyo.Rで発表した

このブログでも紹介している、「RStudioの日本語化」について主に発表した。その他、研修をやっていく中で気づいたことなども。 39th Tokyo.R "RStudioを日本語化してます、という話" from sciesotist data 第39回Tokyo.Rのまとめは↓ http://togetter.com/li…

RStudioを日本語化してビルドする……道筋

もしかしたら、Rを使いこなす多くの人には不要なのかもしれないけど、それでもGoogleのRStudioの第2検索ワードは「日本語」なので、日本語化にはニーズがあるのだろう。ということで、どこをどういじれば日本語化ができそうなのか探り、実際にビルドしてみた…

データ分析環境をクラウドで

身の回りのいろんなところにRを使う環境はあるのだけど、ちょっとクラウドも使ってみようかと(いまさら)思い、AWSにアカウントを作ってみた。いやまぁ、研修講師としてここ3年以上、クラウドコンピューティングについて語っているのだけど。最小のマイクロ…

データサイエ「ソ」ティストのふりくらいだったらできるツール群(20140426)

使う(インストールする)だけじゃなんにもならないんだけど。 R: 言わずと知れたオープンソースの統計解析ソフト( http://cran.r-project.org/ )。 以下、Rをセットアップする際に導入するパッケージ install.packages("RMeCab",repos="http://rmecab.jp/…