分散Key/Valueストア,Kaiを使ってみよう!

第5回 gooホームにおけるKaiの運用例 ─監視や統計情報の活用

この記事を読むのに必要な時間:およそ 3 分

いよいよ今回が最終回です。これまではKaiの動作原理やインストールの説明でしたが,今回は実際の運用に役立つポイントなどを説明します。

Kaiの利用事例紹介

まずは,実際にKaiを利用しているサービスをご紹介したいと思います。その後で,運用に当たってのノウハウをご紹介していきます。

筆者が所属しているgooではgooホームというSNSサービスを提供しています。OpenSocialにいち早く対応するなど,積極的に新しい技術を取り入れています。プロフィールやソーシャルグラフなどの主要なデータはMySQLで管理していますが,アクティビティと呼んでいるユーザの更新情報をKaiに格納しています。

Kaiの構成は至ってシンプルで,CentOS 5.1で動作するノードが3台あるクラスタです。このクラスターに約150万件のデータと約3Gバイトのデータを格納しています。ストレージにはdetsを使用しています。ロードバランサーと組み合わせて,アプリケーションからは単一のノードにしか見えないようになっています。バランシングは単純なラウンドロビンで十分です。

MySQLなどのRDBにmemcachedを組み合わせて,SQLの発行回数を劇的に抑える手法はかなり普及したと思いますが,Kaiも同様にmemcachedと組み合わせて利用しています。detsを利用していますのでこのようになっていますが,etsを利用した場合はmemcachedは不要かもしれません。もちろん事前に十分なサイジングが必要です。

動作状況をレポートするstatsコマンド

それでは運用に用いるKaiの機能をみていきましょう。memcachedではstatsコマンドを送るとオブジェクトの数などが取得できましたが,Kaiでも同様にstatsコマンドが使えます。statsコマンドで得られる情報は以下の通りです。

uptimekaiが起動してからの通算秒
time現在のUNIXタイム
versionKaiのバージョン番号
bytesノードが格納しているデータのサイズ。単位はbyte
curr_itemsノードが格納しているデータの個数
curr_connectionsノードに接続中のクライアントの数
cmd_getノードがgetコマンドを実行し,成功した回数
cmd_setノードがsetコマンドを実行し,成功した回数
bytes_readノードがクライアントにデータを送信したバイト数
bytes_writeノードがクライアントからデータを受信したバイト数
kai_nodeノードを識別するためのソケットアドレス
kai_quorum複製数と読み書き数(N,R,Wのこと)
kai_number_of_bucketsconsistent hashing のバケット数
kai_number_of_virtual_nodesノードにおけるconsistent hashingの仮想ノード数
kai_storeローカルストレージの種類。etsまたはdetsになる
kai_curr_nodesノードが認識しているクラスターのノードリスト
kai_unreconciled_get値が重複してしまったデータの数
erlang_procsErlang プロセス数
erlang_versionErlang バージョン

Kaiにtelnetで接続してstatsコマンドを送っても値を確認できますが,ここではPHPのmemcached実装を使ってみましょう。リスト1のような簡単なPHPスクリプトを実行すると以下のような結果が得られます。

リスト1 kai_stats.php

<?php

$host = "localhost";
$port = 14013;

$memcache = new Memcache;
$memcache->connect($host, $port) or die ("Could not connect");
$status = $memcache->getStats();
print_r($status);

?>

リスト1の実行結果

$ php kai_stats.php
Array
(
    [uptime] => 1077608
    [time] => 1246117054
    [version] => 0.3.0
    [bytes] => 2116619959
    [curr_items] => 1039170
    [cmd_get] => 1977438
    [cmd_set] => 100357
    [bytes_read] => 3350521698
    [bytes_write] => 257731220
    [kai_node] => 172.20.200.40:14012
    [kai_quorum] => 3,2,2
    [kai_number_of_buckets] => 1024
    [kai_number_of_virtual_nodes] => 128
    [kai_store] => dets
    [kai_curr_nodes] => 172.20.200.40:14012 172.20.200.41:14012 172.20.200.42:14012
    [erlang_procs] => 2699
    [erlang_version] => 5.6.5
)

このように,memcachedと全く同様にKaiのstatsを取得することができます。これにより多くのプログラミング言語のmemcached実装を用いてKaiのstatsの値が取得できると思います。正しい現状把握が安定運用の第一歩ですのでこれらの情報を活用してチューニングや設備増強の判断などに役立ててみてください。

statsをグラフにする

statsについてみてきましたが,この情報を便利かつ簡単に把握できるようにしなければシステム運用とは言えません。多くの現場ではMRTGやrrdtoolを使ってグラフにすることが行われていると思います。この分野で著名なオープンソースのソフトウェアにcactiがあります。Kaiのversion 0.4.0からcactiのプラグインが同梱されています。格納場所はcontrib/cactiです。具体的なインストール方法はプラグイン本体にドキュメントがありますのでそちらを参考にしてください。

このプラグインが描画の対象としている項目はbytes,curr_items,cmd_get,cmd_set,bytes_read,bytes_writeになります。実際にこのプラグインを使って作成したグラフを紹介します。

図1 コマンド実行数のグラフ

図1 コマンド実行数のグラフ

著者プロフィール

橋本智哉(はしもとともや)

NTTレゾナント株式会社所属。金融系システム構築に参画ののち,gooの担当に。2005年ごろgooブログのシステム構築・運用を通じてmemcachedを導入しKey/Valueの世界に触れる。現在はSNSであるgooホームの担当。

コメント

コメントの記入