草プログラマー、それはつまり草

CS 会計 法律 サッカー 野球 bitcoin 数学 物理学 などいろいろやってます

R言語入門 おすすめ本 統計・データサイエンスを始めよう

R言語のはじめるに当たって知っておくべきこと、おすすめの入門書を書きました。

R言語とは


オープンソースの統計解析向けのプログラミング言語です。

統計解析向け

研究目的で使われることもおおいですが、まあ統計やらデータサイエンスやらに少しでも興味があるのなら、さわってみるべきプログラミング言語だと思います

統計解析を目的として作られたプログラミング言語ですので統計解析においてはR言語は非常に優秀です。

統計解析用のパッケージがたくさんありますので本格的に統計解析を行うのであればR言語が第一候補になります。

まあライブラリが多すぎてどれを使えばいいのかわからない問題もよく起こりますがね(笑

基本的には統計学の知識がある人がそれを実際に実装して解析するために使うものですので、統計学の知識はあらかじめあった方がいいです。

もちろんRと一緒に統計学を学ぶのもOKです。

統計解析以外の用途では基本使わないので注意。

また基本的な線形代数や微積分もやっておく必要があります。


線形代数

データ解析では行列をよく使いますので、行列の扱いについて知っておかないと行けません。

www.neuralsparrow.com


微積分

最適化するときに微分を使います。微分だけでも学部一年レベルのことは学んでおきましょう。

www.neuralsparrow.com


開発環境

オープンソースですので当然無料で使うことができます。


またマルチプラットフォームですのでWindows・macOS・UNIX・LinuxなどのOSで使うことができます。つまり大抵のパソコンで使うことが可能です。

R言語はこちらから入手可能です。

The Comprehensive R Archive Network


RstudioのようなIDE(統合開発環境)もありますので気軽に始めることができます。

環境構築ではそこまでつまずかないはずです。

Rstudio はこちらから入手できます。

www.rstudio.com

まずは、Rstudioでいろいろいじってみるのがいいと思います。よくできたIDEですのでこれで困ることはあんまりないんじゃないでしょうか。

用途

金融工学

統計解析

データ解析

機械学習

データマイニング

マーケティング

アクチュアリ

などなどデータをいじくる分野でよく使われています。


日本語の情報は少ない

Pythonなんかと比べると日本語の情報はかなり少ないですので英語が読めないとちょっと厳しいかも。

まあ、ある程度使えるようになるぐらいまでなら日本語の情報でもなんとかなるはずですが、英語のドキュメントや記事を読めないとどこかでつまってしまう可能性が大。

頑張って英語の勉強もしましょう。

どっちにしたって英語は求められる時代ですから。

Pythonとの比較


日本語の情報 Python

学びやすさ Python

データの可視化 R

統計解析用パッケージ(ライブラリ、関数) R


特に可視化と解析はRに分があります。

グラフや円グラフ、ヒストグラムなど多くのパッケージがありますので、どんなグラフが必要になっても対応することが可能ですし、最新のアルゴリズムもすぐに実装されています。

取っつきやすさ使いやすさははPythonですが、本格的に統計解析をやる人はRを使っている人が多いように思えます。

KaggleなんかでもRを使っている人が多いですよね。

Pythonについてはこちらを参考にしてください

www.neuralsparrow.com


おすすめ本

RStudioではじめるRプログラミング

RStudioではじめるRプログラミング入門

RStudioではじめるRプログラミング入門


RStudioを使ってRについて学ぶ本です。

Rで統計について学ぶ本ではありませんので注意。

純粋にR言語の文法を学ぶための本ですので、これからR言語を使いたい人やプログラミング自体が初めての人におすすめできる本です。

一番最初に読む本です。

プログラミング言語を学ぶときは必ず自分で書いてみてください。

繰り返しますが統計については触れられていないので注意

はじめてのR

はじめてのR: ごく初歩の操作から統計解析の導入まで

はじめてのR: ごく初歩の操作から統計解析の導入まで

Rと統計の基本について学ぶことができます。

個人的には統計は統計の入門書を読んだ方が理解は早い気はします。

まあ統計について知らなくてもなんとかなるとは思います。

相関係数の検定・t検定・カイ2乗検定・分散分析について触れられています。

RユーザのためのRStudio実践入門

RユーザのためのRStudio[実践]入門−tidyverseによるモダンな分析フローの世界−

RユーザのためのRStudio[実践]入門−tidyverseによるモダンな分析フローの世界−

RStudioを用いたデータの収集、データの整形、可視化、レポーティングなど、データ解析基本を学べます。

解説も丁寧で分かりやすく、一部カラーになっています。レイアウトも良いので個人的な評価は高いです。

入門書としてとても優れていると思います。

R初心者のためのABC

R初心者のためのABC

R初心者のためのABC

  • 作者: A.ジュール,E.イエノウ,E.ミースターズ
  • 出版社/メーカー: 丸善出版
  • 発売日: 2012/04/05
  • メディア: 単行本(ソフトカバー)
  • この商品を含むブログを見る


Rを使ったデータ解析の入門書です。

データを読み込んで、解析して、可視化する、までの流れの基本的なことができるようになるはずです。

あくまでRの入門書ですので統計について色々かかれているわけではない。


R言語徹底解説

R言語徹底解説

R言語徹底解説


関数や環境,遅延評価などについて丁寧に説明されていて、メタプログラミング,パフォーマンスの改善,デバッグ,RとC++との連携などについても触れられている。

本格的な本ですが、他のプログラミング言語について詳しいのであれば行きなりこの本を読んでもいいと思います。

中級~上級者レベルの本です。

Rによるやさしい統計学

Rによるやさしい統計学

Rによるやさしい統計学


R言語と統計学を同時に学ぶことができます。

統計学の入門書としても使えます。多分。

高校でやるデータ分析かなんかぐらいのことは知っておいた方がいいかも。



Rではじめるデータサイエンス

Rではじめるデータサイエンス

Rではじめるデータサイエンス

訳はあれだけど、内容は素晴らしいです。

著者は二人とも重鎮です。

ただデータサイエンスの解説ではなくてデータサイエンスをより効率的にやる方法をかかれている本です。

Rクックブック

Rクックブック

Rクックブック

本当にいろんなトピックについて書かれていますので、R言語を使うのであれば持っておきたい本です。

基本を学んだあとに読む本ですね。

Rグラフィッククックブック

Rグラフィックスクックブック ―ggplot2によるグラフ作成のレシピ集

Rグラフィックスクックブック ―ggplot2によるグラフ作成のレシピ集


グラフィックスパッケージであるggplot2を使ってグラフの作り方がいろいろ書かれている本です。

可視化も非常に重要ですのでちゃんとやっておく必要があります。

グラフィックなら取り敢えずこの本。




最後に


データ解析は今後もその重要度は変わらず高いままだと予想されるので、この分野を学ぶことは仕事とかそういうことを考えても良いことなんだと思います。

あくまでもR言語はツールですので、統計学や機械学習とかをしっかりと学びましょう。




機械学習

www.neuralsparrow.com


DeepLearning

www.neuralsparrow.com

Copyright © 2016 へなちょこプログラマー All rights reserved.