Ubuntu Weekly Recipe

第165回 Ubuntuでマイクを使う

この記事を読むのに必要な時間:およそ 4 分

前回久々に担当したリーダーから,ものすごいネタが披露されました。私としては今回,リーダーができなかった音声認識を実現したいと思いあれこれ試してみたのですが,しかし,どう呼びかけても魔理沙さんは答えてくれません。読者の誰かがきっと実現してくれるに違いないとの希望と共に,筆者は2次元から3次元へと戻る決意をしました。

さて,実は筆者は日本の割と北の方,青森県八戸市に住んでいます。みなさんご存知かと思いますが,八戸は,先日の東北地方太平洋沖地震の影響を受けました。地震による被害はほとんどなかったのですが,その後に来た津波で沿岸部が大きな被害を受けました。幸いなことに,筆者は八戸の中でも内陸に住んでいるため津波の直接的な被害は受けませんでしたが,震災後3日ほど停電が続き,さらにNTT回線や携帯電話通話のパンク,携帯電話のメール送信不能に陥りました。

そんな中で最も役に立ったのは,ラジオとインターネットでした。災害に関する情報はラジオを使い,自分の身の回りの連絡はインターネットを利用しました。ADSL回線は生きていたもののプロバイダのサーバが応答しないために使えませんでしたが,携帯電話のネットワークは3日ほど生きていました注1)⁠今回は使いませんでしたが,ネットワークが利用できるなら,SkypeやEkigaといったソフトウェアによる通話も便利かなと思いました。

インターネットを介して通話するにしても,ディスプレイの向こうの嫁とキャッキャウフフするにしても,マイクの使用は欠かせません。そこで今回は,マイクからの入力を設定する方法をお届けします。

注1
基地局の保守担当者が,地震の直後に自家発電のための燃料の確保に走り回った成果と,関係者から伺いました。緊急時における燃料の適正配分の問題をはらむ話題ですが,しかしそのおかげで,混乱のなかでも,身の回りのたくさんの人が家族と連絡を取ることができました。

マイクとフォン端子

市販されているマイクやヘッドフォンは,そのほとんどがフォン端子の3.5mm径プラグ(いわゆるミニプラグ)を採用しています。

図1 3.5mm径フォン端子のプラグ。これは3極のプラグで,アンバランスのステレオ接続あるいはバランスのモノラル接続に用いることができる

図1 3.5mm径フォン端子のプラグ。これは3極のプラグで,アンバランスのステレオ接続あるいはバランスのモノラル接続に用いることができる

そして市販されている大抵のコンピュータの匡体には,この3.5mm径プラグを差し込むためのジャックが入力/出力共に設けられています。このジャックとサウンドデバイスは直結しているため,プラグを差し込むことで,マイクやヘッドフォンとサウンドデバイスが音声の電気信号をやりとりできるようになります。

図2 3.5mm径フォン端子のジャック。ジャックの作りにより,どの極性のプラグを受け入れることができるか決まる

図2 3.5mm径フォン端子のジャック。ジャックの作りにより,どの極性のプラグを受け入れることができるか決まる

なお,このフォン(Phone)端子の形状は,米国のEIA (Electronics Industries Alliance) という業界団体によりEIA-453で規格化されています注2)⁠3.5mm径の他にも,音響の現場などで標準的に使われている6.3mm(1/4インチ)径のプラグ/ジャック(いわゆる標準プラグ)があります。極性を2つ持つのか,3つ持つのかでモノラル/ステレオあるいはアンバランス/バランスと用途が分かれ,米国のApple社のポータブルオーディオ製品などでは4極3.5mmミニプラグ/ジャックも使われています。極性が同じであれば中を流れる電気信号は同じですので,プラグの形状を変えるだけの簡単なアダプタも市販されています。

図3 各種アダプタ。右から,6.3mm径(標準プラグ)と3.5mm径(ミニプラグ)のアダプタ、RCA端子と6.3mm径(標準プラグ)のアダプタ。左はビデオケーブルなどで用いられるRCA端子。中を流れる電気信号は同じで、2極のアンバランス接続となっている

図3  各種アダプタ。右から,6.3mm径(標準プラグ)と3.5mm径(ミニプラグ)のアダプタ、RCA端子と6.3mm径(標準プラグ)のアダプタ。左はビデオケーブルなどで用いられるRCA端子。中を流れる電気信号は同じで、2極のアンバランス接続となっている

USB接続のマイクも市販されておりますが,こちらを利用する場合はフォン端子を考慮する必要はありません。デバイス自体がサウンドデバイスとして扱われるからです。そのため,何らかの事情によりマザーボードに搭載されているサウンドデバイスが使い物にならない場合などに便利です。

注2
現在,EIAという団体は2010年12月31日をもって解散し,規格の管理はTechAmerica傘下のECAが行っている。

マイクとサウンドデバイスの役割

装置としてのマイクの役割は,空気振動を電気信号に変換することです。空気の振動は微細なので,マイクから取得できる電気信号はとても弱く,そのままでは扱いにくいです。そのため,サウンドデバイス側で増幅した後にサンプリングしてPCMデータに変換します。これにより,音声情報をコンピュータ上で処理できるようになります。

ここで注意してほしいのは,サウンドデバイスでPCMデータに変換できる信号の強さには上限が設けられているということです。もしマイクから送られてくる電気信号を増幅した結果がこの上限を超えていた場合,上限の超過分がカットされます。これをクリッピングと呼びます。クリッピングされた箇所の音声は,再生するとガリガリといった感じで聞こえます。いわゆる「音割れ」です。

このクリッピングを防ぐために,大抵のサウンドデバイスは,電気信号の増幅の程度を調整することが可能です。これを「レベルゲインを調整する」と呼びます。入力レベルゲインの調整方法はサウンドデバイスにより,ハードウェアのつまみで調整するもの,ソフトウェアで調整するものに分けられます。

例えば,本連載の第150回で紹介したCreative EMU 0404 USBはハードウェア本体に付いているつまみで入力レベルゲインを調整します。後述するalsamixerを用いても,ソフトウェアから調整することはできません。

デバイスの入力レベルゲインの調整を行うソフトウェアとして,Firewire接続のサウンドデバイスの場合は本連載の第161回でお伝えしたFFADOミキサーを使います。それではマザーボードに搭載されているサウンドデバイスなど,本連載の第159回でご紹介したUSB/PCIバス/PCI-Expressバス接続のものの場合はどうかというと,alsamixer,サウンドの設定(gnome-volume-control)⁠PulseAudio Volume Control(pavucontrol)などで入力レベルゲインの調整を行います。

著者プロフィール

坂本貴史(さかもとたかし)

Ubuntuのマルチメディア編集環境であるUbuntu Studioのユーザ。主にUbuntu日本コミュニティとUbuntu Studioコミュニティで活動。いつかユーザ同士で合作するのが夢。

コメント

  • ご指摘ありがとうございます。

    図3の件,ご指摘通り,左右間違っておりました。
    申し訳ございません。
    修正させていただきました。

    Commented : #2  gihyo.jp編集部 (2011/03/30, 15:34)

  • Re:

    図3の右と左逆じゃないかなぁ・・・
    こういう細かいところでひっかかると記事が色褪せるよ。

    Commented : #1  od (2011/03/30, 13:23)

コメントの記入