いよいよ今回が最終回です。これまではKaiの動作原理やインストールの説明でしたが,今回は実際の運用に役立つポイントなどを説明します。
Kaiの利用事例紹介
まずは,実際にKaiを利用しているサービスをご紹介したいと思います。その後で,運用に当たってのノウハウをご紹介していきます。
筆者が所属しているgooではgooホームというSNSサービスを提供しています。OpenSocialにいち早く対応するなど,積極的に新しい技術を取り入れています。プロフィールやソーシャルグラフなどの主要なデータはMySQLで管理していますが,アクティビティと呼んでいるユーザの更新情報をKaiに格納しています。
Kaiの構成は至ってシンプルで,CentOS 5.1で動作するノードが3台あるクラスタです。このクラスターに約150万件のデータと約3Gバイトのデータを格納しています。ストレージにはdetsを使用しています。ロードバランサーと組み合わせて,アプリケーションからは単一のノードにしか見えないようになっています。バランシングは単純なラウンドロビンで十分です。
MySQLなどのRDBにmemcachedを組み合わせて,SQLの発行回数を劇的に抑える手法はかなり普及したと思いますが,Kaiも同様にmemcachedと組み合わせて利用しています。detsを利用していますのでこのようになっていますが,etsを利用した場合はmemcachedは不要かもしれません。もちろん事前に十分なサイジングが必要です。
動作状況をレポートするstatsコマンド
それでは運用に用いるKaiの機能をみていきましょう。memcachedではstatsコマンドを送るとオブジェクトの数などが取得できましたが,Kaiでも同様にstatsコマンドが使えます。statsコマンドで得られる情報は以下の通りです。
| uptime | kaiが起動してからの通算秒 |
| time | 現在のUNIXタイム |
| version | Kaiのバージョン番号 |
| bytes | ノードが格納しているデータのサイズ。単位はbyte |
| curr_items | ノードが格納しているデータの個数 |
| curr_connections | ノードに接続中のクライアントの数 |
| cmd_get | ノードがgetコマンドを実行し,成功した回数 |
| cmd_set | ノードがsetコマンドを実行し,成功した回数 |
| bytes_read | ノードがクライアントにデータを送信したバイト数 |
| bytes_write | ノードがクライアントからデータを受信したバイト数 |
| kai_node | ノードを識別するためのソケットアドレス |
| kai_quorum | 複製数と読み書き数(N,R,Wのこと) |
| kai_number_of_buckets | consistent hashing のバケット数 |
| kai_number_of_virtual_nodes | ノードにおけるconsistent hashingの仮想ノード数 |
| kai_store | ローカルストレージの種類。etsまたはdetsになる |
| kai_curr_nodes | ノードが認識しているクラスターのノードリスト |
| kai_unreconciled_get | 値が重複してしまったデータの数 |
| erlang_procs | Erlang プロセス数 |
| erlang_version | Erlang バージョン |
Kaiにtelnetで接続してstatsコマンドを送っても値を確認できますが,ここではPHPのmemcached実装を使ってみましょう。リスト1のような簡単なPHPスクリプトを実行すると以下のような結果が得られます。
リスト1 kai_stats.php
<?php
$host = "localhost";
$port = 14013;
$memcache = new Memcache;
$memcache->connect($host, $port) or die ("Could not connect");
$status = $memcache->getStats();
print_r($status);
?>
リスト1の実行結果
$ php kai_stats.php
Array
(
[uptime] => 1077608
[time] => 1246117054
[version] => 0.3.0
[bytes] => 2116619959
[curr_items] => 1039170
[cmd_get] => 1977438
[cmd_set] => 100357
[bytes_read] => 3350521698
[bytes_write] => 257731220
[kai_node] => 172.20.200.40:14012
[kai_quorum] => 3,2,2
[kai_number_of_buckets] => 1024
[kai_number_of_virtual_nodes] => 128
[kai_store] => dets
[kai_curr_nodes] => 172.20.200.40:14012 172.20.200.41:14012 172.20.200.42:14012
[erlang_procs] => 2699
[erlang_version] => 5.6.5
)
このように,memcachedと全く同様にKaiのstatsを取得することができます。これにより多くのプログラミング言語のmemcached実装を用いてKaiのstatsの値が取得できると思います。正しい現状把握が安定運用の第一歩ですのでこれらの情報を活用してチューニングや設備増強の判断などに役立ててみてください。
statsをグラフにする
statsについてみてきましたが,この情報を便利かつ簡単に把握できるようにしなければシステム運用とは言えません。多くの現場ではMRTGやrrdtoolを使ってグラフにすることが行われていると思います。この分野で著名なオープンソースのソフトウェアにcactiがあります。Kaiのversion 0.4.0からcactiのプラグインが同梱されています。格納場所はcontrib/cactiです。具体的なインストール方法はプラグイン本体にドキュメントがありますのでそちらを参考にしてください。
このプラグインが描画の対象としている項目はbytes,curr_items,cmd_get,cmd_set,bytes_read,bytes_writeになります。実際にこのプラグインを使って作成したグラフを紹介します。

