大規模言語モデル入門
2023年7月29日紙版発売
2023年7月29日電子版発売
山田育矢 監修/著,鈴木正敏,山田康輔,李凌寒 著
B5変形判/336ページ
定価3,520円(本体3,200円+税10%)
ISBN 978-4-297-13633-8
書籍の概要
この本の概要
ChatGPTに代表される大規模言語モデルが自然言語処理の幅広いタスクで高い性能を獲得し,大きな話題となっています。大規模言語モデルは,大規模なテキストデータで訓練された大規模なパラメータで構成されるニューラルネットワークです。2020年以降,自然言語処理や機械学習の知見をもとに,パラメータ数とテキストデータの拡大により,性能が飛躍的に向上しました。
Hugging Face社の"transformers"というPythonライブラリを利用することで,プログラミングの経験があれば,モデルの操作やデータからの学習がかんたんにできます。モデルを訓練するための日本語もしくは日本語を含む多言語のデータセットも充実してきており,すぐに業務に使える実用的なモデルを作ることが可能な時代がやってきました。
本書は,大規模言語モデルの理論と実装の両方を解説した入門書です。大規模言語モデルの技術や自然言語処理の課題について理解し,実際の問題に対処できるようになることを目指しています。以下のような構成によって,理論とプログラミングの双方の側面から,大規模言語モデルに関する情報を提供します。
こんな方におすすめ
- 大規模言語モデルに興味のあるエンジニア,学生,研究者
この書籍に関連する記事があります!
- 「大規模言語モデル入門」の前書きを公開!
- 「大規模言語モデル入門」は、GPT、BERT、T5といったLLMのしくみから、最新のLLMに関する話題を取り上げ、理論と実装を丁寧に解説した書籍です。日本語データセットを試すことができる実装例を収録し、無料で試すことができるColabも話題になっています。本稿では、購入を迷われている方のために、本書の「前書き」の一部を公開します。
この本に関連する書籍
-
Data-centric AI入門
Data-centric AIとは,機械学習の権威でありGoogleのAI研究チームを率いたAndrew Ngが2021年に提唱した,モデルよりもデータに主眼を置くというAI開発のアプローチです...
-
大規模言語モデル入門Ⅱ 〜生成型LLMの実装と評価
「大規模言語モデル入門」の続編です。「大規模言語モデル入門」は理論と実装のバランスをとって構成しましたが,本書では実装部分で扱い切れなかった話題を取り上げ,...
-
Vision Transformer入門
自然言語処理分野におけるブレイクスルーとなったTransformerをコンピュータビジョンに応用したモデルがVision Transformer(ViT)です。さまざまなコンピュータビジョ...