ML Systemsシリーズ深層ニューラルネットワークの高速化

[表紙]深層ニューラルネットワークの高速化

紙版発売
電子版発売

A5判/256ページ

定価3,300円(本体3,000円+税10%)

ISBN 978-4-297-14309-1

電子版

→学校・法人一括購入ご検討の皆様へ

この本の概要

本書は深層ニューラルネットワークによる予測を高速化する技法を解説します。巨大なニューラルネットワークを用いた予測には多くの時間と計算コストがかかります。これにより,応答が遅くなりユーザー体験が悪くなるといった問題や,運用コストが大きくなるといった問題が生じます。本書はニューラルネットワークの予測性能を下げることなく高速化することでこれらの問題を解決する技法を解説します。紹介する技法は量子化・枝刈り・蒸留・低ランク近似・モデルマージなど多岐にわたり,幅広い局面に対応します。また,平坦解や宝くじ仮説など,深層ニューラルネットワークの理論を通して,これらの手法がうまくいく理由についても深く本質的な理論を解説します。深層ニューラルネットワークを活用するエンジニアや研究者は必読の一冊です。

こんな方におすすめ

  • ニューラルネットワークの計算や時間にかかるコストを削減したい人
  • Webサービスにニューラルネットワークを使っている方

著者プロフィール

佐藤竜馬(さとうりょうま)

1996年生まれ。2024年京都大学大学院情報学研究科博士課程修了。博士(情報学)。現在,国立情報学研究所 助教。専門分野はグラフニューラルネットワーク,最適輸送,および情報検索・推薦システム。NeurIPSやICMLなどの国際会議に主著論文が採択。競技プログラミングでは国際情報オリンピック日本代表,ACM-ICPC世界大会出場,AtCoderレッドコーダーなどの戦績をもつ。PDF翻訳サービスReadableを開発し,深層ニューラルネットワークを用いた翻訳システムにも詳しい。著書に『グラフニューラルネットワーク』『最適輸送の理論とアルゴリズム』(ともに講談社)がある。