濃縮還元オレンジニュース

Apache HBase 0.90.0 リリース

この記事を読むのに必要な時間:およそ 0.5 分

2011年1月21日,Apache HBase 0.90.0がリリースされました。HBaseはGoogle BigTableのオープンソースクローンであり,Apache Hadoopの一部である分散ファイルシステムHDFS(Hadoop Distributed File System)上に構築されるNoSQLプロダクトです。以前のバージョンである0.20.0からのメジャーバージョンアップになり,1,000を超えるアップデートが行われています。バージョン番号に開きがあるのは,HBaseのベースとなっているHadoopのバージョンに合わせるのを止めたことと,1.0に近いバージョンであることの意味が含まれているのだそうです。動作させるHadoopのバージョンは0.20系である必要があり,最新バージョンである0.21系および開発バージョンでは動作しないことに注意が必要です。Hadoop 0.21系は開発ブランチという位置づけであり,Yahoo!やFacebookなど主要企業は0.20系で運用していることから,それほど問題になることはないでしょう。

今バージョンでの主な変更点は,まず堅牢性や安定性が向上したことです。堅牢性をフルに有効にするにはHDFSの追記機能が有効になっている必要があり,Hadoopのコードリポジトリには専用ブランチが用意されています。HDFS追記とWAL(Write-Ahead Logging;ログ先行書き込み)の向上によりデータ消失に強くなっています。また,マスタに障害が発生した際にZookeeperを利用して別マシンに切り替えるMaster Rewrite機能やレプリケーションなど,運用が楽になる機能が追加されています。さらにMapReduceの出力をすばやくテーブルに取り込むバルクロードやI/Oのパフォーマンス向上など大容量データに対応した改善なども含まれています。今回のバージョンには含まれませんが,アクセス制御やセカンダリインデックスなどの機能拡張が行えるHBase Coprocessorsという機能追加も0.92にて予定されています。

ちなみに,今回のバージョンアップに際し公式サイトがリニューアルされ,HBaseの機能を包括的に解説するドキュメントThe Apache HBase Bookも準備中です。

URLhttp://hbase.apache.org/

著者プロフィール

角田直行(かくだなおゆき)

普段はお仕事でPHPやJavaを使ってWeb開発をしています。一部でセレブエンジニアとか言われてますが,全然セレブじゃありません。

コメント

コメントの記入