機械学習において最も重要なライブラリ、
scikit-learn(サイキット・ラーン)の、
Toy datasetsを使い、
機械学習の一連の流れをつかんでいく。

公式サイトより。7種類ある。
たいていのテキスト本は、
ここから始まる。
わたしが買ったものを、2、3紹介したい。
図が多くていちばんかんたんそうなのが、
『見て試してわかる機械学習アルゴリズムの仕組み 機械学習図鑑』

いい紙を使っているので、少しお高い(値段が)
オールカラーで、たくさんの機械学習の手法を網羅している。
眺めているだけでも楽しく、興味のありそうなものをサクッと試すのにはよい。
いろんな具体例が詰め込まれ実践的なのが、
『すぐに使える!業務で実践できる!PythonによるAI・機械学習・深層学習アプリのつくり方』

2020/10/24現在、amazonでは品切れ状態
過去10年間の気象データの解析、顔にモザイクをかけるなどおもしろそうだが、
Pythonプログラマーでないと、いきなり試すのは難しそうだ。
変わり種の一冊が、
『Raspberry Pi(ラズベリー・パイ)ではじめる機械学習』

電子工作っぽい感じがいい
通称、ラズパイとは、
2012年にイギリスで開発された名刺サイズのコンピュータで、
わたしも昨年買って組み立てた(そのブログは、こちら)

終わってみればなんてことのない作業。
メリットとして、
① Linux系OSが動作する、②Pythonと相性がいい、③公式のカメラモジュールが存在する
が挙げられ、試してみる価値は高そうだ。
で、今回、復習のサブテキストとして使うのは、
オライリーの『Pythonではじめる機械学習』

間違いない!一冊。
アイリス(あやめ)のクラス分類で、
機械学習の一連の流れを学んでいく。
1.データセットの準備(*1)
scikit-learnのToy datasetsから、任意のデータセットを読み込む。
scikit-learnのToy datasetsから、任意のデータセットを読み込む。

2.訓練データとテストデータに分ける
train_test_splitメソッドで切り分け、モデルが汎化できているか検証する。
train_test_splitメソッドで切り分け、モデルが汎化できているか検証する。

3.モデルの宣言
sckit-learnのアルゴリズムをインポートし、インスタンス化する。
sckit-learnのアルゴリズムをインポートし、インスタンス化する。

4.モデルの訓練(学習)
fitメソッドに訓練データを与え、最適なパラメータを求める。
fitメソッドに訓練データを与え、最適なパラメータを求める。

5.モデルの検証(*2)
scoreメソッドでテストデータの精度(正解率)を算出し、汎化されているか調べる。
scoreメソッドでテストデータの精度(正解率)を算出し、汎化されているか調べる。

そして、このあと、
精度向上のためのチューニング、
につづいていく。
精度向上のためのチューニング、
につづいていく。