キカガク・AIスクールの復習その5ーAIにデータサイエンスは欠かせない!

キカガクAIスクール
ブログ用に前回パワポでこんなものまでつくった

AI人材タイプは、ざっくりいうと、

機械学習エンジニア
データサイエンティスト

のどちらかだ(*1)

キャリアチェンジではなく、
自分のドメイン知識にAI/DX分野の知識を加えるのが目的なら、
データサイエンティスト寄りの学習となる(*2)

*1 AIを職にしたいなら『機械学習エンジニアになりたい人のための本』が、データサイエンティスト指向のかたも含め、参考になる。

ガイドブックで参考になることが多い!

*2 キカガクAIスクールでも、データ処理を目的に通っている人は多かった。わたしの知人(東京在住)も何人か、会社に勤めながら、夜間大学でデータサイエンティストの勉強をしている(講義が数学ばかりだと嘆いていたが)。

なぜ、データサイエンティスト寄りなのか?

まず、
AIは、ビッグデータありきなので、
使いこなすためには、統計学の世界は避けて通れない。

そうでなくても『統計学が最強の学問である』が、
数年前ベストセラーになったように(2013年)、

この本は衝撃的だった。

「統計学はデータ社会を生き抜くための武器と教養」で、
専門家ではないふつうのビジネスマンでも、
意思決定の際には、データに基づく分析が必須だ。

なので、現在、
AIの学習の一環として、
2020年9月27日に開講した、
総務省統計局提供社会人のためのデータサイエンス演習
を、gaccoで毎週受講している(スタディガイドは、こちら

ビジネスマン向け講座でわかりやすい。

実際に、
Excelのアドイン「データ分析」を使って、
基本統計量(平均値・中央値はもちろん標準偏差や尖度、歪度まで)を算出したり、
ヒストグラムを描いたりして面白い(*3)

Pandasよりかんたん!

*3 たまに、Excel勉強しとけばPythonとかいらないんじゃない?、と身もふたもないことを思うときがある(ひとりごとです)。

もちろん、これから
『実践で学ぶ機械学習活用ガイド』

機械学習を活用したWebアプリづくりのガイドブック

データ分析で使うライブラリ、
Numpy, Scipy, Pandas, Matplotlibについてチェックするのだが、
操作だけ覚えてもしかたないのだ。

ただ、今回はAIスクールの復習なので、
『東京大学のデータサイエンティスト育成講座』
でも、基本をしっかりチェックすることにした(*4)

東京大学といってひるむことはない!

さらに詳しくは、
『Pythonによるデータ分析入門』となるが、
これは老後の楽しみにとっておこう(*5)

天下のオライリー本。4,000円以上します。

*4 東京大学が大流行で少しうさんくさい気もするが、本書は実際の講座のテキストがベースになっていて信頼できる。なお、本書のAppendix3に参考文献がたくさん掲載されているのもありがたい。
*5 「いつかやる」は「やらない」の同義語だが、この言い訳もそのひとつ。ちなみにこの本はキカガクでも薦められた。

Follow me!

PAGE TOP