WEB+DB PRESS plusシリーズクラウドを支える技術
──データセンターサイズのマシン設計法入門
2014年9月26日紙版発売
ルイス・アンドレ・バロッソ,ジミー・クライダラス,ウルス・ヘルツル 著,Hisa Ando 訳
A5判/232ページ
定価2,838円(本体2,580円+税10%)
ISBN 978-4-7741-6730-5
ただいま弊社在庫はございません。
書籍の概要
この本の概要
「クラウド」の設計/構築/運用の基本にスポットを当てた技術解説書。
本書は,超大規模クラウドの一つGoogleのデータセンターを題材に,数千台のサーバを「1つのマシン」として協調動作させるための,一連のハードウェア+ソフトウェア関連技術を厳選解説。
レイヤごとのポイント,コスト効率,消費電力,大規模な故障対策なども盛り込み,実稼働のシステムを支える基盤技術を丁寧に解き明かします。
Google規模のインフラを,ゼロから作り,実際に動かし続ける。
そこには,何が必要なのでしょうか。
巨大なクラウドを通して,エンジニアリングの源が見えてくる1冊です。
『The Datacenter as a Computer: An Introduction to the Design of Warehouse-Scale Machines, Second Edition』(Morgan and Claypool Publishers,2013)の日本語翻訳版。
こんな方におすすめ
- 大規模システムに興味をお持ちの方々
- コンピュータサイエンスに関心のあるエンジニアおよび学生の方々
著者の一言
- ※本書,前書き「日本語版に寄せて」より。
エレクトロニクスが大好きな子供としてブラジルで成長し,電気工学を学ぶ学生となった筆者は,日本の工業,とくにデジタルやコンピュータのテクノロジーの革新に関して日本の豊かな歴史をずっと尊敬してきました。このため,筆者達の著作の第2版が日本で広く手に入るようになることは,特別に名誉なことと感じています。
原著共著者を代表し,本書の翻訳にあたり英文を詳細にレビューし,日本語訳を作るにあたって,いくつもの誤りを正し,わかりやすい注釈を加えてくれた翻訳者のHisa Ando氏に感謝します。今日のクラウドコンピューティングサービスを実行するマシンの設計とプログラミングの入門書である本書が,日本の学生や実務家の方々の役に立つことを期待しています。
本書に関するお知らせ
本書に関連する記事を公開しております。
この書籍に関連する記事があります!
- 日本語版に寄せて
- エレクトロニクスが大好きな子供としてブラジルで成長し,電気工学を学ぶ学生となった筆者は,日本の工業,とくにデジタルやコンピュータのテクノロジーの革新に関して日本の豊かな歴史をずっと尊敬してきました。
- 第2版について
- 倉庫規模のコンピューティングに関して,ほぼ4年間の学会や業界での大きな発展を踏まえて,この講義の最初の主要な改訂版を出す運びになったことを嬉しく思います。
- 本書について
- コンピューティングがクラウド(Cloud)に移行するにつれて,インターネットで使用されるコンピュータプラットフォームは宅配ピザの箱や冷蔵庫のような格好ではなく,倉庫(Warehouse)いっぱいのコンピュータ群になってきています。
- Q&Aでわかる「超」基本!「クラウド」を支える技術
- ここ数年,世界規模の高速接続の発達,インターネットサービス/Web技術の発展に加え,PCや,スマートフォンをはじめとしたモバイルの普及による端末バリエーションの充実と,わたしたちを取り巻くコンピューティグ環境は一変し,とても便利になりました。
目次
- 日本語版に寄せて(Preface to the Japanese edition)
- 本書について(Abstract)
- 第2版について(Notes for the second edition)
- キーワード(Keywords)
- 謝辞(Acknowledgments)
- 読者の方々へ(Note to the Reader)
第1章 倉庫サイズのコンピュータの概要(Introduction)
1.1 倉庫サイズのコンピュータ(WSC)
1.2 規模拡大によるコスト効率
1.3 (WSCは)単なるサーバの集合ではない
1.4 1つのデータセンター vs. 複数のデータセンター
1.5 なぜ,WSCがあなたにとって重要か
1.6 WSCのアーキテクチャの概要
- 1.6.1 ストレージ
- 1.6.2 ネットワークファブリック(ネットワーク接続)
- 1.6.3 ストレージ階層
- 1.6.4 (WSCの記憶階層ごとの)定量的なレイテンシ,バンド幅,記憶容量
- 1.6.5 電力の使用量
- 1.6.6 故障に対する対処
第2章 ワークロードとソフトウェアインフラストラクチャ(Workloads and Software Infrastructure)
2.1 データセンター vs. デスクトップ
2.2 性能と可用性に関する道具箱(Toolbox)
2.3 プラットフォームレベルのソフトウェア
2.4 クラスタレベルのインフラストラクチャソフトウェア
- 2.4.1 資源管理(Resource Management)
- 2.4.2 ハードウェアの抽象化と他の基本サービス
- 2.4.3 デプロイとメンテナンス
- 2.4.4 プログラミングのフレームワーク
2.5 アプリケーションレベルのソフトウェア
- 2.5.1 ワークロードの例
- 2.5.2 オンライン:Web検索
- 2.5.3 オフライン:学術論文の類似性計算
2.6 モニタリングインフラストラクチャ
- 2.6.1 サービスレベルダッシュボード
- 2.6.2 性能デバッグツール
- 2.6.3 プラットフォームレベルの健康(正常動作)モニタリング
2.7 買うか,自作か
2.8 テイルトレランス(テイル耐性,長い尾を許容する)
2.9 参考文献
第3章 ハードウェアの構成ブロック(Hardware Building Blocks)
3.1 コスト効率の高いサーバハードウェア
- 3.1.1 大型SMPの通信効率の効果
- 3.1.2 強力(Brawny)サーバ vs. 非力(Wimpy)サーバ
- 3.1.3 バランスのとれた設計
3.2 WSCのストレージ
- 3.2.1 WSCの非構造化データ用ストレージ
- 3.2.2 WSCの構造化データ用ストレージ
- 3.2.3 ストレージとネットワーク技術の相互作用
3.3 WSCのネットワーク
3.4 参考文献
第4章 データセンターの基礎(Datacenter Basics)
4.1 データセンターの階層分類と仕様
4.2 データセンターの電力供給システム
- 4.2.1 UPSシステム
- 4.2.2 PDU(配電盤)
- 4.2.3 代案:直流配電(DC配電)
4.3 データセンターの冷却システム
- 4.3.1 CRAC,チラーとクーリングタワー
- 4.3.2 CRAC
- 4.3.3 チラー(Chiller)
- 4.3.4 クーリングタワー(Cooling tower)
- 4.3.5 外気冷却(Free Cooling)
- 4.3.6 エアフロー(Air flow)に対する考慮
- 4.3.7 ラック内,ラック列内の冷却と,コールドプレート(Cold plate)
- 4.3.8 ケーススタディ:Googleのラック列内冷却
- 4.3.9 コンテナ型データセンター
4.4 まとめ
第5章 エネルギーと電力の効率(Energy and Power Efficiency)
5.1 データセンターのエネルギー効率
- 5.1.1 データセンターの効率を示すPUE
- 5.1.2 PUEという指標の問題
- 5.1.3 データセンターにおける効率低下の原因
- 5.1.4 データセンターのエネルギー効率の改善
- 5.1.5 施設以外の改善
5.2 計算処理のエネルギー効率
- 5.2.1 エネルギー効率の測定
- 5.2.2 サーバのエネルギー効率
- 5.2.3 WSCの使用状況
5.3 エネルギー比例な計算処理
- 5.3.1 エネルギー比例性の悪化要因
- 5.3.2 エネルギー比例性の改善
- 5.3.3 その他の部分のエネルギー比例性
5.4 低電力モードの有効性
5.5 エネルギー比例性にソフトウェアが果たす役割
5.6 データセンターへの電源供給能力
- 5.6.1 適切な量の機器を設置する
- 5.6.2 電源供給能力を超える消費
5.7 サーバのエネルギー使用の傾向
- 5.7.1 蓄積されたエネルギーを電源制御に使う
5.8 まとめ
- 5.8.1 参考文献
第6章 コストモデル(Modeling Costs)
6.1 設備投資
6.2 運営費
6.3 ケーススタディ
- 6.3.1 データセンターのコストの現実
- 6.3.2 一部しか使用されていないデータセンターのモデル化
- 6.3.3 パブリッククラウドのコスト
第7章 故障と修理の対処(Dealing with Failures and Repairs)
7.1 ソフトウェアベースの耐故障性とそれがもたらすもの
7.2 故障の分類
- 7.2.1 故障の重大さ
- 7.2.2 サービスレベルの故障(Service-level fault)の原因
7.3 マシンレベルの故障
- 7.3.1 マシンクラッシュの原因は?
- DRAMのソフト(一過性の)エラー
- ディスクエラー
- 7.3.2 故障を予知する
7.4 修理
7.5 故障を隠すのではなく,故障に耐える
第8章 今後へ向けて(Closing Remarks)
8.1 ハードウェア
8.2 ソフトウェア
8.3 経済性
8.4 カギとなる挑戦
- 8.4.1 急速に変化するワークロード
- 8.4.2 応答性を確保した大規模システムの建設
- 8.4.3 CPU以外の部品のエネルギー比例性
- 8.4.4 デナードスケーリングの終焉を乗り越える
- 8.4.5 残酷なアムダールの法則
8.5 まとめ
Appendix [比較でさらに見えてくる]スーパーコンピュータとWSC(2種類の巨大コンピュータの似ている点,違う点)
A.1 どちらも倉庫サイズのコンピュータ
A.2 スーパーコンピュータは何に使われているのか
- A.2.1 研究分野での利用
- A.2.2 産業界での利用
- A.2.3 スーパーコンピュータのユーザ
A.3 WSCとスーパーコンピュータのワークロードの性質の違い
- A.3.1 科学技術計算の特性
- A.3.2 信頼性,可用性に対する要件の違い
A.4 電源供給,冷却系
A.5 スーパーコンピュータのハードウェア
- A.5.1 スーパーコンピュータの計算ノード
- A.5.2 重要性が増すインターコネクト
- WSCのインターコネクト
- スーパーコンピュータのインターコネクト
- ビッグデータとインターコネクト
- A.5.3 スーパーコンピュータのストレージ
A.6 スーパーコンピュータのOSとソフトウェア
- A.6.1 スーパーコンピュータのOSはOSジッタが問題
- A.6.2 分散処理にはMPIを使う
- A.6.3 運用管理ツール
- A.6.4 アプリケーションソフトウェア
A.7 まとめ
- 参考文献(Bibliography)
- 索引(Index)
- 著者紹介(Author Biographies)
この本に関連する書籍
-
[増補改訂]GPUを支える技術 ――超並列ハードウェアの快進撃[技術基礎]
GPUの基本構造と技術動向に焦点を当てた『GPUを支える技術』の増補改訂版。GPU/AIアクセラレータの劇的進化に合わせて,解説も大幅に増強しました。 3Dグラフィック...
-
Google Cloud Platform GAEソフトウェア開発入門 ―Google Cloud Authorized Trainerによる実践解説
Google Cloudは,すぐにクラウドでアプリを開発できるので,ビジネスをすばやくIT化できます。フルマネージド(サーバー管理が要らない!)なので,Googleの技術基盤に...
-
GPUを支える技術 ――超並列ハードウェアの快進撃[技術基礎]
GPUの基本構造と技術動向に焦点を当てた解説書。3Dグラフィックス,ゲーム,モバイル,VR/AR,科学技術計算,そして人工知能/ディープラーニングに至るまで,幅広い分野...
-
オンラインゲームを支える技術 ―壮大なプレイ空間の舞台裏
オンラインゲームをテーマとした技術解説書。 ソフトウェア開発において,オンラインゲーム開発者は卓越した技術力を持つ専門性の高い花形と言われています。そこでは...
-
[Web開発者のための]大規模サービス技術入門 ―データ構造、メモリ、OS、DB、サーバ/インフラ
サーバを単に増やすだけでは解決しない(?!)。大規模サービスの難所は,サービスの成長に伴い巨大化するデータの処理です。データ量の変化は緩やかには推移せず,突然...
-
Googleを支える技術 ……巨大システムの内側の世界
たとえば,ふだんなにげなく行っているWeb検索。背後には,想像以上に膨大な計算,多数のコンピュータの働きがあります。 本書では,論文やWebなどで公開されているパ...