Python・データマイニング・統計・機械学習帳など、データサイエンスを無料で勉強できる教材6選
2022年はデータサイエンスという言葉が色々な場所で聞かれる1年だったと思います。今回は、2023年にもっと多くの人が興味を持つであろうデータサイエンスを無料で学べる教材6選を紹介したいと思います。これらの教材は、アメリカの大学で統計学や機械学習などを勉強している筆者が実際に利用したり、利用しようと思っているものです。Pythonや統計学、機械学習を学んでみたいと思っている方はぜひ活用してみてください。また、この記事の最後にはレッジAIが今までに紹介してきた学習コンテンツ紹介の記事へのリンクもあるのでぜひそちらもチェックしてみてください。
筑波大教授が著した無料の初心者向けPython教材
筑波大学の三谷純教授によって著されたスライド教材で、2021年5月に初公開され、2022年2月に大幅に内容が更新された新たな改訂版が公開された。同スライドは三谷教授の著書である「Python ゼロからはじめるプログラミング」のPython学習用教材で、本書を企業や学校などで教材として利用する方々向けの教材として作成された。以下の関連記事からダウンロードすることができる。
データマイニング入門・統計データ解析Ⅰ・統計データ解析 Ⅱ
こちらは東京大学が公開している講義で、これらの他にも多くの授業が公開されている。その中で、今回紹介するのは、「データマイニング入門」、「統計データ解析Ⅰ」、「統計データ解析 Ⅱ」の3つの講義だ。
データマイニング入門
データ分析・データマイニングの基礎について学ぶことができる講義で、以下の計12回で構成されている。
- イントロダクション
- Python基礎(1)
- Pyhthon基礎(2)
- データの記述統計・前処理
- テキスト分析の基礎
- ネットワーク分析の基礎
- クラスタリング
- 主成分分析
- 教師あり学習(1):線形回帰
- 教師あり学習(2):ロジスティク回帰、過学習と正則化
- 機械学習の実装
- 全体のまとめ
統計データ解析I
統計ソフトRの使い方やランダムネスや極限定理、確率分布、分散分析、回帰分析などについて学ぶことができる。
- 統計ソフトウェアR 入門
- パッケージのインストール・データ構造
- ベクトルと行列の計算
- ファイルを用いたデータの読み書き
- 基本的な描画
- データのプロット
- 中心極限定理
- 確率分布
- 確率分布・基礎的な記述統計量とデータの集約
- 基礎的な記述統計量とデータの集約
- 推定・検定
- 検定・分散分析
- 分散分析・回帰分析
統計データ解析II
多変量解析や時系列データの基本的な解析方法、主成分分析、判別分析について学べる。講義は以下の13回から構成。
- 統計ソフトウェアRの基本的使用法1
- 統計ソフトウェアRの基本的使用法2
- 行列とその演算
- データの抽出
- データの可視化
- 連続分布
- 多次元確率変数と多変量分布
- 重回帰分析・最小二乗法
- 分析の評価
- 主成分分析
- 判別分析
- 時系列解析の概要
- 時系列解析・クラスター分析
『データ分析のための統計学入門』無料PDF公開中 データサイエンティストら執筆
こちらはアメリカのデータサイエンティストたちによって執筆された「OpenIntro Statistics」の日本語版で、2021年に公開された。「データ分析への誘い」「統計データの記述」「確率」「確率変数の分布」「統計的推測の基本」「カテゴルリカル・データの統計的推測」「量的データに対する推測」「線形回帰への入門」「重回帰とロジスティック回帰」の9章から構成されていて、アメリカの大学の授業でも使われている。興味のある方は、以下の関連記事からPDFのダウンロードページへとアクセスすることが可能だ。
統計Web
サイト内の「統計学の時間」において閲覧可能で、統計学の基礎から応用までがWeb上で解説されている。統計学の基礎レベルである統計検定2級の内容をカバーしている。初級編、基礎編、中級編、実践編から構成されている。また、データサイエンス基礎のためのExcelの使い方が学べる「Excelノート」や、統計学に必要な数学を学べる「数学ノート」も掲載されている。
機械学習帳
東京工業大学情報理工学院の岡崎直観教授が作成し、機械学習の講義で使用した資料。単回帰、重回帰、ロジスティック回帰、ニューラルネットワーク、サポートベクトルマシン、クラスタリング、主成分分析、確率的勾配降下法、正則化など、機械学習の重要事項を広くカバーしている。また、初学者でも理解しやすいように、原理や数学的な扱いが丁寧に説明されている。機械学習帳には以下の関連記事からアクセスすることができる。
かめ@米国データサイエンティスト
かめ@米国データサイエンティストというアメリカでデータサイエンティストとして働いている方のブログ。ブログ内にて、「Git超入門講座」、「DSのためのPython入門講座」、「データサイエンス講座(統計編)」、「データサイエンス講座(機械学習編)」などの講義を公開している。それぞれのコンテンツが綺麗にまとめられていて、データサイエンスを体系的に学ぶことができる。無料のブログ以外にも、Udemyの講義公開や有料のオンラインコミュニティの運営も行っている。
レッジAIで以前紹介したコンテンツ
「AI:人工知能特化型メディア「Ledge.ai」」掲載のオリジナル版はこちらデータサイエンスを無料で勉強できる教材6選2023/01/30
ソーシャルもやってます!