アンケートご協力のお願いgihyo.jpでは,2010年度に向けて豪華プレゼントが当たる読者属性アンケートを実施しております。ご協力ください。

gihyo.jp » ADMINISTRATOR STAGE » FreeBSD Daily Topics » 2009年12月15日 ≪注目≫FreeBSD UFS+Softupdateにミニジャーナリングを追加してバックグラウンドfsckを不要にする取り組み

FreeBSD Daily Topics

2009年12月15日 ≪注目≫FreeBSD UFS+Softupdateにミニジャーナリングを追加してバックグラウンドfsckを不要にする取り組み

heads-up

Journaled Softupdates Hybrid system

current - Jeff Roberson氏およびKirk McKusick氏がFreeBSD UFS/Softupdatesに最小限のジャーナリング機能を追加することで,バッググラウンドfsckを不用にするための取り組みをしていると発表しています。2009年12月の間には9-CURRENTにコードをマージするとしており,向こう2週間の間にはソースコードを公開すると説明されています。

設計と実装の解説や評価はBSDCan 2010で発表される見通しです。この取り組みはiXsystems,Yahoo!,Juniper networksの支援を得て実施されたものだと説明されています。

ファイルシステムのfsckを不用にする取り組みはいくつかあります。ジャーナリングを使う,コピーオンライトを使う,Softupdates+bgfsckを使う,などです。コピーオンライトのアイディアは1990年にはすでに論文で登場しており,現在最もよく知られているのはZFSです。ZFSはファイルシステムのデータ書き込みの仕組み上(コピーオンライト),ファイルシステムの不整合が発生することがなく,fsckが不要とされています。フラッシュのようなメディアと相性がいいのも特徴の1つです。既存のファイルシステムにジャーナリングの機能を追加するのもよくとられる方法です。

仕組みや実装が簡単という特徴がありますが,性能を発揮させようとするとコードが複雑になりがちという問題もあります。

FreeBSD UFSはコピーオンライトやジャーナリングではなく,Softupdatesという機能を実装することで性能の向上とfsckの不要化の双方を実現しました。Softupdatesはディスクに書き込む前に確実に処理すべき必要がある依存関係のリストを保持しつつ,書き込むべきタイミングまで対象となる書き込みを待ちます。こうすることでファイルシステムの一貫性が保証できるとともに,不要な書き込みを減らし,さらに小さいファイル操作に関してはオンメモリで処理が実施されディスク操作が発生しないという特徴があります。小さいファイルの作成,数ブロックのデータの書き込み,ファイルの削除といった操作は実際にディスクに書き込まれることなくオンメモリで処理されます。

Softupdatesでファイルシステムに不整合が発生するのはシャットダウンが正しく実施されなかったケースで,inodeリークとブロックリークが発生します。FreeBSDではバックグラウンドfsckを実行することで,システムを起動した状態でリーク部分の修正を実施します。問題はバックグラウンドfsckのコストがきわめて高いことです。IO負荷が高く,しかもかなり時間がかかります。大規模ストレージでバックグラウンドfsckを実行するのは,実用的とは言い難いところがあります。

Jeff Roberson氏およびKirk McKusick氏の取り組みは,inodeリークとブロックリークに関連する部分のみをジャーナリングするというものです。ジャーナルごとのサイズが32バイトとほかのジャーナリングファイルシステムと比較してきわめてサイズが小さいといった特徴があります。さらに従来のUFS+Softupdatesが実現していたディスク書き込みの低減と並列性能の高さには影響を与えないとしています。1MBのジャーナルで32,768のファイルオペレーションを処理するようですが,この復旧にかかる時間は2秒未満と報告されています。バックグラウンドfsckと比較して圧倒的な高速化と言えます。

FreeBSD UFS/Softupdatesには長い実績があり,高負荷がかかるような状況で安定して動作するファイルシステムとして定評があります。このファイルシステムの基本構造を保ったまま,ここにジャーナルの機能が追加されるというところがポイントです。バックグラウンドfsckのコストの高さは大規模ストレージにおけるUFS/Softupdates採用の懸念点であるため,Jeff Roberson氏およびKirk McKusick氏の取り組みはきわめて注目の高いものと言えます。

著者プロフィール

後藤大地(ごとうだいち)

ONGS Inc.代表取締役。FreeBSD committer。MYCOMジャーナルにおけるニュース執筆他,『改訂第二版 FreeBSDビギナーズバイブル』,『D言語パーフェクトガイド』,『UNIX本格マスター 基礎編~Linux&FreeBSDを使いこなすための第一歩~』など著書多数.

著書

  • UNIX本格マスター 基礎編 〜Linux&FreeBSDを使いこなすための第一歩〜

    UNIX本格マスター 基礎編 〜Linux&FreeBSDを使いこなすための第一歩〜

コメント

コメントの記入

パスサポ

多数の情報処理技術者試験対策書籍の発行実績を誇る技術評論社がお届けする,資格試験合格サイト「めざせ! 情報処理試験 パスサポ」が開設されました。

ピックアップ

サクセスストーリーに続く,快適サーバー運用管理のヒント!

データの増大,煩雑な管理,システムダウン,セキュリティなど,迫りくる課題からシステム管理者の負担を軽くするポイントを解説します。

gihyo.jp インフラエンジニア情報局

ネットワークやITにかかわるあらゆる業種で必要とされるインフラエンジニアに向けた技術情報や心構え,その魅力について多角的に紹介。

テストエンジニア ステーション

いま,ITに関わるあらゆる開発業務で注目されつつあるテスト系エンジニアをターゲットにしたコンテンツサイトを展開します。

一行クイックアンケート

gihyo.jpで取り上げてほしいネタは?

※検索はページ右上の検索ボックスをご利用ください。

その他の連載

Ubuntu Weekly Recipe

Ubuntuの強力なデスクトップ機能を活用するための,いろいろなレシピをお届けします。

C/C++プログラマのためのDTrace入門

よくカーネルのチューニングや解析で活用されるDTraceですが,実はユーザプログラムの開発においても非常に有用です。連載ではC/C++プログラマやテストに関わる方向けにDTraceの使い方を解説します。

Blogopolisから学ぶ計算幾何

計算幾何学は,図形に関するアルゴリズムを研究するコンピュータサイエンスの一分野です。本連載では,ビジュアルブログ検索エンジン「Blogopolis」で採用されている計算幾何のアプローチを例に取り上げながら,計算幾何の初歩を実践的に学習します。

検索エンジンはいかにして動くのか?

本連載では, 今や誰もが利用している検索エンジンの中身を,全体の仕組みやデータ構造,アルゴリズムから分散インデックスまで,最近の研究事例も交えて紹介します。

サイエンスに片思い

本連載では,サイエンスという学問を軸に,そこから広がる可能性やつながり,そしてWebの世界との関係について,前田邦宏氏がさまざまな取材を元に考察し,これからの可能性について展望します。

使ってみよう! Windows Live SDK/API

Windows Liveサービスの一部にはAPIやSDKとして提供されているものがあります。本連載では各API・SDKの紹介とそれらを利用したアプリケーションを開発していきます。

Lifelog~毎日保存したログから見えてくる個性

コンピュータを使って,日常のさまざまなことの記録(ログ)をとり,それを分析して活用することで,もう一段階上の「楽な生活」をめざす日々の研究報告です。

もっと便利に!jQueryでラクラクサイト制作(実践サンプル付き)

本連載では,実践サンプルとともに,jQueryを上手に活用してサイト制作の品質向上・効率化を実現するための実践テクニックを解説します。

連載一覧

gihyo.jp

  • DEVELOPER STAGE
  • ADMINISTRATOR STAGE
  • WEB+DESIGN STAGE
  • LIFESTYLE STAGE
  • SCIENCE STAGE
  • NEWS & REPORT

書籍案内

  • 新刊書籍
  • 書籍ジャンル一覧
  • 書籍シリーズ一覧
  • 新刊ピックアップ
  • ロングセラー
  • 電脳会議

定期刊行物一覧

  • Software Design
  • WEB+DB PRESS
  • Web Site Expert
  • 組込みプレス