概要
「大規模言語モデル入門」の続編です。「大規模言語モデル入門」は理論と実装のバランスをとって構成しましたが,本書では実装部分で扱い切れなかった話題を取り上げ,特に大規模言語モデルの評価と生成LLMに関連する解説を充実させます。「大規模言語モデル入門」の9章に続き,10章から始まります。
10章では,後続する章で行う言語モデルの評価方法について解説します。自動評価と人手評価の2つの側面から,ベンチマーク,評価指標,具体的な評価ツールやデータセットなどを取り上げます。11〜13章では,主に大規模言語モデルの性能を上げるためのトピックとして,指示チューニング,人間のフィードバックからの学習,RAGに焦点を当て,それぞれの実装方法,利用するデータセット,評価の方法について解説します。14章では大規模言語モデルの学習における並列・分散処理について詳しく解説します。大規模なデータを限られた計算資源で学習させるノウハウは多くのエンジニアにとって有益な情報となるでしょう。
大規模言語モデルの性能を高めるための各トピックの実装とともに,それぞれの評価について理解できる一冊です。
こんな方におすすめ