2011年1月21日、Apache HBase 0.90.0がリリースされました。HBaseはGoogle BigTableのオープンソースクローンであり、Apache Hadoopの一部である分散ファイルシステムHDFS(Hadoop Distributed File System)上に構築されるNoSQLプロダクトです。以前のバージョンである0.20.0からのメジャーバージョンアップになり、1,000を超えるアップデートが行われています。バージョン番号に開きがあるのは、HBaseのベースとなっているHadoopのバージョンに合わせるのを止めたことと、1.0に近いバージョンであることの意味が含まれているのだそうです。動作させるHadoopのバージョンは0.20系である必要があり、最新バージョンである0.21系および開発バージョンでは動作しないことに注意が必要です。Hadoop 0.21系は開発ブランチという位置づけであり、Yahoo!やFacebookなど主要企業は0.20系で運用していることから、それほど問題になることはないでしょう。
今バージョンでの主な変更点は、まず堅牢性や安定性が向上したことです。堅牢性をフルに有効にするにはHDFSの追記機能が有効になっている必要があり、Hadoopのコードリポジトリには専用ブランチが用意されています。HDFS追記とWAL(Write-Ahead Logging;ログ先行書き込み)の向上によりデータ消失に強くなっています。また、マスタに障害が発生した際にZookeeperを利用して別マシンに切り替えるMaster Rewrite機能やレプリケーションなど、運用が楽になる機能が追加されています。さらにMapReduceの出力をすばやくテーブルに取り込むバルクロードやI/Oのパフォーマンス向上など大容量データに対応した改善なども含まれています。今回のバージョンには含まれませんが、アクセス制御やセカンダリインデックスなどの機能拡張が行える「HBase Coprocessors」という機能追加も0.92にて予定されています。
ちなみに、今回のバージョンアップに際し公式サイトがリニューアルされ、HBaseの機能を包括的に解説するドキュメント「The Apache HBase Book」も準備中です。
URL:http://hbase.apache.org/