ソースコード・リテラシーのススメ

第14回initrdを読む

前回はLinuxの起動の仕組みをブートローダ段階、カーネル段階、/sbin/init段階の3つに分けて解説しました。

その際にも簡単に触れましたが、最近のほとんどのディストリビューションでは、初期化用ramdiskを用いて起動に必要なモジュールドライバを組み込むようになっています。

初期化用ramdiskは、1つの汎用的なカーネル設定であらゆる環境に対応できるようになる、ディストリビューターにとっては便利な仕組みですが、余計な仕組みが入っている分、カーネル再構築の敷居が高くなっていることも事実です。そこで、今回はこの初期化用ramdiskやその元になっているモジュールカーネルの考え方について解説すると共に、実際の初期化用ramdiskを調べてその中身を紹介しようと思います。

モノリシックカーネルとマイクロカーネル

最近では大型コンピュータから携帯機器までカバーしていますが、元々のLinuxはUNIXを参考にしながらPC互換機向けに0から開発されたカーネルです。

最初のバージョンのLinuxは、ヘルシンキ大学の学生だったリーナス・トーバルズ(Linus Torvalds)さんが一人で書きあげました。その際に彼は、プログラミングやデバッグの容易さから、モノリシック(monolithic)カーネルという伝統的なデザインを採用しました。

カーネルには各種ハードウェアを操作するデバイスドライバからファイルシステムやネットワークの操作、メモリやプロセスの管理、スケジューリングといったさまざまな機能が必要です。モノリシック(一枚岩)カーネルとは、これらすべての機能が1つの実行ファイルの中にまとめて組み込まれているタイプのカーネルのことです。

元々UNIXのカーネルはモノリシックカーネルのデザインになっていましたが、OSの研究が進むにつれ、モノリシックカーネルには欠点が目立つようになってきました。

たとえば、モノリシックカーネルは多数の機能が1つの実行ファイルに詰め込まれているため、複雑で肥大化しがちな上、一部の機能に問題が生じても全体に影響が出ますし、新しいハードウェア用のデバイスドライバを追加するだけでも全体を再構築する必要がありました。

それらの欠点を克服するために考案されたのがマイクロ(micro)カーネルというデザインです。マイクロカーネルでは、カーネルに必要なさまざまな機能をカーネル本体とは独立したアプリケーションとして実現し、カーネル本体にはそれら外部アプリケーション間の通信を管理する最小限の機能だけを残すことで、見通しがよく移植性や拡張性を高めることを目指しています。

モノリシックカーネルとマイクロカーネルの違い
モノリシックカーネルとマイクロカーネルの違い

'80年代の半ばにマイクロカーネルの概念とそれを実装したMachと呼ばれるマイクロカーネルが公開されると、OS研究の中心はモノリシックカーネルからマイクロカーネルへと移り、OSF/1やNEXTSTEPなど新しく開発されたOSではマイクロカーネルのデザインが積極的に採用されるようになり、Linuxが公開されたころにはモノリシックカーネルのデザインは時代遅れと考えられていました。

もっとも、モノリシックカーネルは時代遅れな分、必要な機能や処理の詳細が十分検討され、実現が容易になっていたことも忘れてはならないでしょう。GNUプロジェクトではHurdというマイクロカーネルのデザインを採用したシステムを開発していますが、HurdはLinuxと同じころに開発が始まったものの、完成は大幅に遅れ現在も正式版のリリースには至っていません。

モジュールカーネル

モノリシックカーネルとして生まれ、開発の容易さから多数の開発者を集めることで急速に成長したLinuxですが、リーナスさんを始めとする開発者たちもモノリシックカーネルの問題点は熟知していました。一方、マイクロカーネルではカーネル外部のアプリケーション間の通信が多数発生するためにパフォーマンスが出にくいという問題点も明らかになってきました。そこでLinuxの開発者たちが採用したのは、両者の長所を組み合わせたモジュールカーネルというアプローチです。

LinuxがターゲットとしているPC互換機の場合、利用可能な周辺機器は膨大な種類に及びます。これら周辺機器を操作するためのドライバをすべてカーネルの実行ファイルに組み込むことは現実的ではありません。かと言って、新しい周辺機器を追加する度に実行ファイルを作り直すのも面倒な作業です。

そこでLinuxではこれら周辺機器用のドライバをモジュールとしてカーネル本体の実行ファイルとは独立に用意しておき、必要に応じてそれらをカーネル本体に動的に組み込むという方法を採用しました。

モジュールカーネルの場合、マイクロカーネルのようにOSの本質的な機能を分割してカーネル外部へ出すのではなく、必要な機能を担うモジュールをプラグイン的にカーネル本体に組み込むため、モノリシックカーネルの特徴である効率性は維持しつつ、マイクロカーネルの持つ拡張性も手に入れた形になっています。

当初、モジュール化に対応していたのは一部のデバイスドライバだけでしたが、次第にその範囲は広がり、最近のカーネルではネットワーク機能やファイルシステム、I/Oスケジューラといったカーネルの本質的な部分までモジュール化され、多くの機能を動的に追加したり削除したりすることが可能になっています。

初期化用ramdisk

カーネル本体の実行ファイルと周辺機器用のドライバを分離して、最小機能のみを持つ汎用的なカーネル本体にユーザ環境に合わせた周辺機器用のドライバを組み合わせることで、それぞれのユーザ環境にカスタマイズしたカーネルを利用することができるようになりました。

しかしながら、モジュールドライバはハードディスク(HDD)上に保存しておく必要があるため、HDD用のドライバやファイルシステム用のドライバは単純にカーネル本体から独立させることはできません。

この問題に対処するために考案されたのが初期化用ramdiskです。

初期化用ramdiskとは、その名の通りシステムの初期化用に使われるramdiskで、モジュールドライバやそれらを組み込むためのコマンドなどを収めた小さなファイルシステムをメモリ上に展開し、そこからHDD上のrootファイルシステムを読み込む際に必要となるモジュールドライバなどを読み込ませるようになっています。

初期化用ramdiskは複数のファイルやコマンドを含むファイルシステムですが、HDD上では1つのファイルとしてcpio形式に固めて圧縮されています。

圧縮された初期化用ramdiskファイルは、ブートローダからカーネルのイメージファイルと共にBIOS経由で(カーネルの機能を使わずに)読み込まれ、メモリ上に配置されます。メモリに読み込まれブートローダから処理を委ねられたカーネルは、共に読み込まれた initrd のイメージをramdisk上に展開して仮のrootファイルシステムとしてマウントし、そのファイルシステム上の/initコマンドを実行します。

この/initコマンドが初期化用ramdisk内に用意されているユーザの環境に応じたHDD用のドライバモジュールやrootファイルシステム用のモジュールなどをカーネル本体に組み込むことで、カーネルがHDD上のrootファイルシステムを利用できるようになります。

初期化用ramdisk上の/initは、必要なモジュールの読み込み等を終えれば、HDD上の本来のrootファイルシステムをマウントし、rootファイルシステムを切り替えます。以後の処理は本来のrootファイルシステム上にある/sbin/initの仕事となり、前回説明したように /sbin/init は/etc/inittabを見ながら必要なサービスを起動していきます。

初期化用ramdiskの実際

さて、前置きがずいぶん長くなってしまいましたが、いよいよ初期化用ramdiskの中身を具体的に調べてみることにします。

今回紹介する初期化用ramdiskはFedora Core 9のβ版を手元のVMware Server環境にインストールした際に生成されたものです。初期化用ramdiskのファイル名はカーネルのバージョンやビルド番号によって変わりますし、初期化用ramdiskに組み込まれるモジュールドライバもインストールしたハードウェア環境やファイルシステムの設定によってさまざまに変化するのでご注意ください。

まず、圧縮されている初期化用ramdiskを展開します。初期化用ramdiskは/boot ディレクトリinitrd-<カーネルバージョン>.imgの名称で保存されています。このファイルは先述のようにcpio形式のアーカイブをgzipで圧縮した形式になっていますので、適当なディレクトリを用意してそこに展開することにします。なお、/boot以下のファイルを読み出すにはroot権限が必要です。

# mkdir Initrd ; cd Initrd
# gunzip -c /boot/initrd-2.6.25-0.163.rc7.git1.fc9.i686.img | cpio -ivd
lib
lib/libparted-1.8.so.8
lib/libgcc_s-4.3.0-20080326.so.1
..
usr/lib/libdhcp6client-1.0.so.2.0.12
usr/lib/libdhcp6client-1.0.so.2
init
14818 blocks

# ls -lh
合計 40K
drwx------ 2 root root 4.0K 2008-06-03 06:13 bin
drwx------ 3 root root 4.0K 2008-06-03 06:13 dev
drwx------ 4 root root 4.0K 2008-06-03 06:13 etc
drwx------ 2 root root 4.0K 2008-06-03 06:13 firmware
-rwx------ 1 root root 2.1K 2008-06-03 06:13 init
drwx------ 4 root root 4.0K 2008-06-03 06:13 lib
drwx------ 2 root root 4.0K 2008-06-03 06:13 proc
lrwxrwxrwx 1 root root    3 2008-06-03 06:13 sbin -> bin
drwx------ 2 root root 4.0K 2008-06-03 06:13 sys
drwx------ 2 root root 4.0K 2008-06-03 06:13 sysroot
drwx------ 3 root root 4.0K 2008-06-03 06:13 usr

これで初期化用ramdiskが作業用に作成した Initrd ディレクトリ内に展開されました。展開されたディレクトリのいくつかを眺めてみます。

# ls -l bin
合計 804K
-r-xr-xr-x 1 root root 614K 2008-06-03 06:13 lvm
-rwxr-xr-x 1 root root  81K 2008-06-03 06:13 modprobe
-rwxr-xr-x 1 root root  80K 2008-06-03 06:13 nash
-rwxr-xr-x 1 root root 8.4K 2008-06-03 06:13 rmmod

このディレクトリにあるのが初期化用ramdisk内で動作するコマンドです。

lvmは最近のfedora coreが採用しているLVM(Logical Volume Manager)を制御するコマンドで、HDD上のrootファイルシステム自身がLVM上に構築されているため、初期化用ramdiskでLVMを読む準備をしておく必要があります。

modprobermmodはモジュールドライバを組み込んだり取り外したりするコマンド、nashはRed Hatが開発している初期化用ramdisk用のコマンドインタプリタです。nashはシェルの一種のような名称を持っていますが、通常のシェルのような対話機能は持たず、初期化用ramdisk用の初期化スクリプトを実行するための機能に特化しています。

# ls -l lib
合計 2.6M
drwx------ 3 root root 4.0K 2008-06-03 06:13 i686
-rwxr-xr-x 1 root root 143K 2008-06-03 06:13 ld-2.7.90.so
lrwxrwxrwx 1 root root   12 2008-06-03 06:13 ld-linux.so.2 -> ld-2.7.90.so
lrwxrwxrwx 1 root root   20 2008-06-03 06:13 libblkid.so.1 -> /lib/libblkid.so.1.0
 ..
drwx------ 3 root root 4.0K 2008-06-03 06:13 modules

/libディレクトリには /bin以下のコマンドが利用するライブラリが収められています。Fedora Coreの場合、初期化用ramdiskにも通常のCライブラリ(libc-2.7.90)を使っているようです。

/lib/modulesディレクトリには初期化用ramdiskで組み込まれるモジュールドライバが収められています。今回、VMware Server環境用に組み込まれたモジュールドライバは以下の通りでした。

# ls -lh lib/modules/2.6.25-0.163.rc7.git1.fc9.i686/
合計 764K
-rw------- 1 root root  67K 2008-06-03 06:13 BusLogic.ko
-rw------- 1 root root  32K 2008-06-03 06:13 dm-mirror.ko
-rw------- 1 root root  62K 2008-06-03 06:13 dm-mod.ko
-rw------- 1 root root  23K 2008-06-03 06:13 dm-snapshot.ko
-rw------- 1 root root 7.0K 2008-06-03 06:13 dm-zero.ko
-rw------- 1 root root  38K 2008-06-03 06:13 ehci-hcd.ko
-rw------- 1 root root 129K 2008-06-03 06:13 ext3.ko
-rw------- 1 root root  55K 2008-06-03 06:13 jbd.ko
-rw------- 1 root root  13K 2008-06-03 06:13 mbcache.ko
-rw------- 1 root root  892 2008-06-03 06:13 modules.alias
-rw------- 1 root root   69 2008-06-03 06:13 modules.ccwmap
-rw------- 1 root root 1.3K 2008-06-03 06:13 modules.dep
-rw------- 1 root root   73 2008-06-03 06:13 modules.ieee1394map
-rw------- 1 root root  141 2008-06-03 06:13 modules.inputmap
-rw------- 1 root root   81 2008-06-03 06:13 modules.isapnpmap
-rw------- 1 root root   74 2008-06-03 06:13 modules.ofmap
-rw------- 1 root root  645 2008-06-03 06:13 modules.pcimap
-rw------- 1 root root   43 2008-06-03 06:13 modules.seriomap
-rw------- 1 root root 7.6K 2008-06-03 06:13 modules.symbols
-rw------- 1 root root  189 2008-06-03 06:13 modules.usbmap
-rw------- 1 root root  27K 2008-06-03 06:13 ohci-hcd.ko
-rw------- 1 root root 155K 2008-06-03 06:13 scsi_mod.ko
-rw------- 1 root root 6.1K 2008-06-03 06:13 scsi_wait_scan.ko
-rw------- 1 root root  33K 2008-06-03 06:13 sd_mod.ko
-rw------- 1 root root  28K 2008-06-03 06:13 uhci-hcd.ko

これらのうち、BusLogic.koscsi_mod.koscsi_wait_scan.kosd_mod.koがVMware ServerがエミュレートしているBusLogic製のSCSIアダプタとそれを経由して利用するSCSI HDD用のドライバモジュールです。

dm-mirror.kodm-mod.kodm-snapshot.kodm-zero.koはLVM用のデバイスマッパー用のドライバモジュール、ext3.kojbd.kombcache.koはext3形式でフォーマットしたrootファイルシステム用のドライバモジュール、echi-hcd.koohci-hcd.kouhci-hcd.koはUSBホストコントローラ用のドライバモジュールです。

modules.alias等、modules.XXX という名称のファイルはモジュールドライバ用の設定ファイルで、モジュールドライバの別名定義やそれぞれのモジュールドライバが対応するハードウェアのリストになっています。

この初期化用ramdiskが仮のrootファイルシステムとしてマウントされると、カーネルは/initを実行します。このファイルは先に紹介したnash用のスクリプトになっていますので、まず先頭部分を眺めてみます。

リスト1
 1  #!/bin/nash
 2  
 3  mount -t proc /proc /proc
 4  setquiet
 5  echo Mounting proc filesystem
 6  echo Mounting sysfs filesystem
 7  mount -t sysfs /sys /sys
 8  echo Creating /dev
 9  mount -o mode=0755 -t tmpfs /dev /dev
10  mkdir /dev/pts
11  mount -t devpts -o gid=5,mode=620 /dev/pts /dev/pts
12  mkdir /dev/shm
13  mkdir /dev/mapper
14  echo Creating initial device nodes
15  mknod /dev/null c 1 3
16  mknod /dev/zero c 1 5
17  mknod /dev/systty c 4 0
...

1行目はスクリプトのお約束であるシェバンの指定です。実際の処理の始まりである3行目で各種情報を利用するためにprocファイルシステム、7行目でsysファイルシステムをマウントします。次に、udevを用いて動的にデバイスファイルを生成するため、メモリ上に生成されるtmpファイルシステムを/devにマウントして(9行目⁠⁠、/dev 上に必要なデバイスファイルを生成していきます(15行目以下⁠⁠。

その後、42行目あたりから /lib/modules ディレクトリに用意されたモジュール類を組み込んでいきます。

リスト2
42  echo "Loading ehci-hcd module"
43  modprobe -q ehci-hcd
44  echo "Loading ohci-hcd module"
45  modprobe -q ohci-hcd
46  echo "Loading uhci-hcd module"
...

HDDとファイルシステムを読み込むために必要なモジュールを組み込んだ後、LVM用のモジュールを組み込んだ上で、lvmコマンドを実行して論理ボリュームを利用可能にします(73行目⁠⁠。

リスト2
70  echo Scanning logical volumes
71  lvm vgscan --ignorelockingfailure
72  echo Activating logical volumes
73  lvm vgchange -ay --ignorelockingfailure  VolGroup00
74  resume /sys/block/dm-1
75  echo Creating root device.
76  mkrootdev -t ext3 -o defaults,ro /dev/VolGroup00/LogVol00
77  echo Mounting root filesystem.
78  mount /sysroot
79  echo Setting up other filesystems.
80  setuproot
81  loadpolicy
82  echo Switching to new root and running init.
83  switchroot
84  echo Booting has failed.
85  sleep -1

その後、nashは76行目で論理ボリューム上のファイルシステムをrootファイルシステムとして設定し、78行目でそれをマウント、新しくマウントしたファイルシステムをrootファイルシステムとして設定し(80行目)SELinuxのポリシーファイルを読み込んだ上で(81行目⁠⁠、新しいrootファイルシステムに切り替える(83行目⁠⁠、という処理を行ないます。この処理の結果、rootファイルシステムが初期化用ramdiskからHDD上の本来のrootファイルシステムに切り替わり、以後の処理はHDD上(実際はHDDを抽象化したLVM上)のrootファイルシステムの/sbin/initの仕事になります。

初期化用ramdiskの使い方はディストリビューションごとに大きく異なり、今回紹介したFedora Core以外にも、SUSEやDebianなどさまざまなディストリビューションが独自の考え方から初期化用ramdiskを活用しています。考え方はディストリビューションごとに異なりますが、cpio+gzipという形式は共通していますので、今回紹介した手順で一度自分の使っている初期化用ramdiskを調べてみるのも面白いでしょう。

おすすめ記事

記事・ニュース一覧