濃縮還元オレンジニュース

Apache Cassandra 1.0リリース

この記事を読むのに必要な時間:およそ 0.5 分

2011年10月18日,⁠Apache Cassandra」のメジャーアップデートとなるバージョン1.0がリリースされました。CassandraはNoSQLのカラム指向分散データベースで,当初Facebookの開発チームによって生まれたプロダクトです。TwitterではWebページのメタデータ保存に,SoundCloudではユーザ管理に利用するなど,多くの有名サービスで利用されています

今回のメジャーバージョンアップで改善された主な機能として,カラムファミリ単位のデータ圧縮があります。これは長い間ユーザの間で強く望まれていた機能の一つで,圧縮されることで全体のデータサイズが少なくなり,より少ない台数で運用できるだけでなくディスクI/Oのコストが削減され,読み書きのパフォーマンス向上にも貢献します。また,コンパクション処理注1について,これまでGoogle BigTable方式で行っていた際に生じていた問題を解消すべく,同じGoogleプロダクトであるLevelDBが採用しているアルゴリズムにも対応しました。ほかにもWindowsサービスとして稼働するための対応やメモリ管理,ディスクスペース管理の改善,一時的に停止したノードにあとで書き込む必要がある情報を別レプリカに記録するHinted Handoff機能に関する改善など数多くあります。

これらの積み重ねにより,ちょうど1年前のバージョン0.6と比較して書き込み性能が40%,読み込み性能はなんと400%も向上しました。

少し残念なのはドキュメントがあまり充実していないことです。公式ドキュメントはWikiのみであり,市販されている洋書も対応バージョンが古いのが気になります。公式以外では,CassandraプロジェクトをリードするJonathan Ellis氏が勤めるDataStax社のWebサイトにていくらかまとまったドキュメントが用意されています。クラスタをきれいなUIで管理できる「OpsCenter」というツールも無料版が公開されています。

注1)
異なるSSTable(Sorted String Table)に複数バージョンの行が散らばってしまうのを整理するための処理。

URLhttp://cassandra.apache.org/

著者プロフィール

角田直行(かくだなおゆき)

普段はお仕事でPHPやJavaを使ってWeb開発をしています。一部でセレブエンジニアとか言われてますが,全然セレブじゃありません。

コメント

コメントの記入