よくもこれだけの内容を20ページにまとめたもんだ‼️
この章、内容がむちゃくちゃ濃い。
から、解説はスタート。
形態素解析ってなに❓
という向きには
代表的な形態素解析の理論書
『形態素解析の理論と実装』を読んでみて
と著者は言っているが、
ここも決して、いま、踏み込んではいけない。
(kindleのセールで昔、買ったけれども、未読。)
また、
形態素解析ツールの、
Mecab, Sudachi, Jumanなどは、
このあと実装で使うので、後回しでいい。
ここでは、
ことをおさえたい。
次に、いよいよ
2.ニューラル言語モデル(ニューラルネットワークを使った言語モデル)
が出てくるが、
ニューラルネットワークってなに?
という向きには、
(開発が中止されたが日本製のフレームワーク)「Chainer」のチュートリアル13章がおすすめ、
と紹介されている(よくまとまっていて、復習の意味でも一読の価値あり)。
ここに、
ニューラルネットワークとは、微分可能な変換を繋げて作られた計算グラフ
という説明があるが、
この部分は、AI学習の必読書、
『ゼロから作るDeep Learning 』で、
実際に計算グラフのしくみを理解したいところ。
次に、
ニューラルネットワークで言語モデルを実現する方法の説明があり、
具体例として、
② ELMo(2018年発表)
が挙げられている。
① Word2Vecの理解にも時間がかかるが、
問題は、
② ELMoの説明のなかに、RNNやLSTMの説明があり、
ここを飛ばすと先には進めない。
この部分は、NLP学習の必読書、
『ゼロから作るDeep Learning❷ 自然言語処理編』で、
実際にコードを見てしくみを頭に入れるのがおすすめだが、
膨大なエネルギーと時間が必要だ。
すぐそこの第3章からBERTが始まるのだが、
そこまでたどりつく道が険しすぎる。
踏ん張りどころだ。