種別	[gsm] 2023-06-13T19:04:12Z
セクション	グローバル共有メモ
日時	2023-06-13T19:04:12Z
元URL	(URLなし)

読書。…

jrf> 読書。

『機械学習エンジニアのためのTransformers』を読んだ。Attention 機構の説明を読むために購入。3章でその望みは達せられた。『ゼロから作る Deep Learning 2』ではその学習を理解できなかったが、これは理解できた(気がする)。あとは知識蒸留が興味深かったが、それ以外は飛ばし読み。私に必要なときがくるのだろうか？

『機械学習エンジニアのためのTransformers - 最先端の自然言語処理ライブラリによるモデル開発』(Lewis Tunstall ＆ Leandro von Werra ＆ Thomas Wolf 著, 中山 光樹 訳, オライリージャパン, 2022年8月)
https://www.amazon.co.jp/dp/4873119952
https://7net.omni7.jp/detail/1107312226
https://www.oreilly.co.jp/books/9784873119953/