さあ、Webアプリづくりを始めよう!
最初は、
「必要なデータの収集」
Webサイトから俳句データを「スクレイピング」して、
csv形式で保存するのが、最初のミッションだ。
まず、環境構築をする。
初心者にとっては、これがいつも悩みの種だ。
![](https://i0.wp.com/uncle-kanazawa.com/wp-content/uploads/2020/04/D48F5911-026C-4201-B1F8-F6F28AF925ED.png?resize=341%2C400&ssl=1)
毎回、憂うつになる。
勉強のためには「Docker」を使うべきなのだが(*1)、
![](https://i0.wp.com/uncle-kanazawa.com/wp-content/uploads/2020/04/8CFB5A7B-C3A2-4BDC-8E82-62E958F05AD2.jpeg?resize=500%2C428&ssl=1)
プロは使っている!(と思う)
ここでつまづいてはいられないので、
Python の仮想環境(virtual environment : venv)でやる。(*2)
Macbook Airで、ターミナルを立ち上げ
python3 -m venv myvenv5
と入力(*3)。
「myvenv5」という名前の仮想環境をつくる。
ちなみに、
仮想環境は何個でも作れ、好きな名前をつけられる。
次に、作業ディレクトリを指定するのだが、
モデルの学習は、Google Colabでやるので、
![](https://i0.wp.com/uncle-kanazawa.com/wp-content/uploads/2019/12/EC35D8EA-D87E-4A61-A544-D703D322C20C.jpeg?resize=500%2C307&ssl=1)
pro版もリリースされたが、日本では利用不可。待ち遠しい!
ここでは省略して、
すぐに、ターミナルに
source myvenv5/bin/activate
と入力。
これで仮想環境を有効化し、
この仮想環境に、
pipコマンドで必要と思われるライブラリをインストールする。
pip install jupyter
pip install numpy
pip install pandas
pip install matplotlib
pip install scikit-learn (これは念のため)
pip install numpy
pip install pandas
pip install matplotlib
pip install scikit-learn (これは念のため)
そして、ターミナルに、
jupyter notebook
と入力すれば、
![](https://i0.wp.com/uncle-kanazawa.com/wp-content/uploads/2020/04/AB868E97-A97C-4156-B6BF-225363DACBFE.jpeg?resize=476%2C200&ssl=1)
ターミナルに入力したところ
実際にコードを書いて作業する「ジュピター・ノートブック」が立ち上がり、
ようやく作業を開始できる(*4)。
![](https://i0.wp.com/uncle-kanazawa.com/wp-content/uploads/2020/04/6928EA7F-0F50-4C58-998D-73C4D4B67D1D.jpeg?resize=500%2C170&ssl=1)
機械学習ではまずこれ!
最初は、ここまでたどり着くだけでしんどい。
自分を
![](https://i0.wp.com/uncle-kanazawa.com/wp-content/uploads/2019/01/seikou_banzai_man-2.png?w=1256)
よくがんばった!
とほめてやりたい。
しかし、現実的には、
まだな〜んも始まってはいないのだ。