ゲームをおもしろくするコツ

第4回ゲームを盛り上げるサウンド

デジタルゲームは視聴覚体験であり、音はゲームを特徴付ける重要な要素です。同じように視聴覚体験である映画にサウンドトラックがあるように、1984年にリリースされたゲーム音楽レコード『ビデオ・ゲーム・ミュージック』以降は音楽だけを独立して楽しめるようになり、ゲーム音楽というジャンルも確立されています。

今回はゲームの音について、電子技術的な側面から脳の認知的な側面まで幅広くお話します。

音の構造

音は波であり、音の特性を決定する要素は次の3つです。

  • 周波数:音の高さ、音程を示す
  • 振幅:音の大きさ、音量を示す
  • 波形:音の周波数成分、音質を示す

初期のゲームハードは、この3要素を指定して、プログラムでタイミングに合わせて音を出すことで音楽を作っていました。この工程を簡単にしたのがGeneral InstrumentのAY-3-8910に代表される、PSGProgrammable Sound Generatorという音源ICです。

このICは前記の3つの要素をパラメータとしてプログラムで指定して発音することが可能で、シーケンサ[1]を組み込むことで楽曲を演奏できました。1980年代前半のアーケードゲームやPCはほとんどがサウンドにPSGを採用しており、ビデオゲームの代名詞である「ピコピコ音」が浸透したのです。

ゲームサウンドの種類

ゲームでは次の3種類のサウンドが使われます。

  • SESound Effect
  • ジングル
  • BGMBackground Music

SEはゲーム内の出来事に合わせて出す効果音で、PSG以前でもブザー音などが使われていました。アクションゲームではジャンプ音やアイテムのゲット音など、プレイヤーの操作とゲーム進行との一体感を生む大切な要素になっています。

ジングルはイベントに連動して流れる短い音楽です。レベルアップしたときのファンファーレやゲームオーバー時のサウンドなど、SEほど頻繁に現れることはないですが、ゲームの流れで重要なことがあった場合の効果音にあたります。

BGMはゲームのプレイ内容とは関係なく、プレイ中常に流れている音楽です。リアルタイムでアクション性が高いゲームの場合はSEが重視されてBGMは添え物的扱いですが、RPGのようにリアルタイム性が低く落ち着いてプレイできる場合は、BGMが強く印象に残ります。

音楽データの進歩

PSGの時代はすべての音についてパラメータをセットし、シーケンシャル[2]に発音するプログラムが必要だったため、音楽を作る人はある程度以上のコンピュータの知識が必要でした。同じ時期に電子楽器も大きく発展し、楽器の種類や音のパラメータ、さらにシーケンサのデータをやりとりするための統一規格MIDIMusical Instrument Digital Interfaceが1981年に生まれました。MIDIは音楽関係者の間にも浸透し、ゲームにMIDIデータで演奏するプログラムが組み込まれていれば、プログラムの知識がなくても簡単にゲーム音楽が作れるようになったのです。これによって著名な作曲家が音楽を提供するゲームも現れました。

一方単純なPSGの音ではなく、より深みのある発音方法も生まれました。FMFrequency Modulation音源とPCMPulse Code Modulation音源です。

FM音源は周波数変調を利用して音色を作る技術で、ヤマハが専用のICを製品化して1980年代からゲームにも使われるようになりました。FM音源初期の代表的なゲームとして『マーブルマッドネス』注3がありますが、PSGとは異なる高い表現力で現在につながるゲーム音楽のターニングポイントとなっています。作者のMark Cernyは初めてゲームにBGMを採用した『ニューラリーX』注4に衝撃を受け、ゲームにおけるサウンドの重要性に気付いて最新技術を導入したと聞きました。

PCM音源は実際の音をデジタル録音して使う方法で、1979年に統一規格が策定されました。メモリの価格が下がる中でゲームにも使われるようになりました。スーパーファミコンでもサウンド用メモリの制約内でPCMを使用しているゲームがあり、アーケードゲームでは音用に大容量メモリを割り振って生音を聞かせるものも現れました。またキャラクターに声を出させるためにPCMを利用した例もあります。

PCM音源はどんな音でも出すことができるのですが、データ量が大きく、発音時にデータを加工することが難しいという欠点があります。一方FM音源はデータ量が少なく、ゲーム内で発音にアレンジを加えることが可能ですが、音色を作るのが難しく生音の録音はできません。

サウンドの作り方

通常の音楽とゲームサウンドの作り方で最も大きな違いは、人間が演奏することを想定するかしないかです。通常の音楽では、ピアノなどの音域の広い楽器を弾きながら土台となるメロディ・リズム・ハーモニーを組み立て、実際に演奏する楽器に合わせてオーケストレーションなどのアレンジを加えます。それに対してゲームサウンドでは、特にSEをシーケンサで演奏させる場合に、メロディを決めてデータを打ち込み、演奏速度を上げてゲームっぽいポップさを出したりします。

SEは実際にある音を録音して使う方法もよく使われます。個人制作では著作権フリーの音源データも便利です。シーケンサで出す場合は、自分でイメージする音を口に出して、それをコピーするように作ると1980年代風のSEになります。⁠ビョ~ン」のように言ってみて発音データを打ち込み、再生して再現するわけですが、ポルタメント[5]「~」の部分を表現したり、近接複数音[6]を不協和音として濁りを出したり、パルスのデューティー[7]やフィルタ[8]のカットオフポイントにエンベロープ[9]をかけて「ョ」感を入れます。アナログシンセサイザー的な音作りですね。ゲーム中に何度も鳴るので、耳障りな高周波を抑えたほうがプレイヤーのストレスになりません。

ジングルは逆にゲーム中にハッキリ聞こえる必要があるので、音程が高い曲や高周波成分の多い音を使うと効果的です。アクションゲームなどの流れの中で使う場合は短めに、ゲームの流れが切り替わる場合はプレイヤーが一呼吸入れられる程度の長さに作りましょう。

ゲームに馴染むBGM

BGMはゲームの雰囲気や世界観を決定するので、プレイヤー層に合わせることが常套手段です。ゲームの仕様が決まって、ある程度できた状態で作曲者がそれに合った曲を付けます。しかし、音楽は必要な楽曲が決まっていれば、ゲーム制作の進行とは別に作ることもできます。

BGMだけ独立して作られた場合、ゲームに組み入れてみたらゲームデザイナーが想定したものとまったく違うことがあります。こんなとき、そのまま開発中に音を出して作業をしているうちに、不思議とその曲がゲームに馴染んで聞こえてくるのです。結局このままで良いという結論になって市場に出されると、プレイヤーは何の違和感もなくBGMを受け入れてくれます。乱暴に言えば、BGMのイメージがゲームのイメージを作るわけで、格好良い曲が付いていればゲームも格好良くなるのです。

BGMの長さは使われる場面に合わせますが、想定されるゲーム時間より長めに作って、ゲームの途中で切ってしまうのが最近の流れです。シーケンサで発音する際は、楽曲のデータを繰り返して流すことがあります。この場合は繰り返し部分が滑らかにつながるよう作るのは言うまでもありません。また一般の曲のようにイントロからスタートして繰り返し部分に入り、曲の終わりは繰り返しから抜けてコーダで終わることもできます。しかしゲームはインタラクティブであり、任意のタイミングでコーダに入れるような楽曲は難易度が高いので、フェードやジングルで曲を切る工夫が必要です。

ゲームならではの特徴

ゲームの音はインタラクティブ性があるのですが、情報としてプレイヤーに与える影響もあります。

まずはBGMのテンポです。同じBGMを制限時間が迫ったときなどに「スパート」と言ってテンポを上げることがあります。サウンドの効果だけを考えると、曲のテンポが速いほうがプレイヤーのプレイ効率が上がります。逆に時間に余裕がないと気付くと、プレッシャーとなって判断の冷静さを欠くことがあります。音程を上げることでも状況の変化を伝えられるので、スキルレベルにかかわらず制限時間のプレッシャーを与えるなら、転調が効果的です。

また音を出すタイミングにもゲームならではの配慮が必要です。ゲームは主に視覚と聴覚によって表現されますが、脳がこの2つを認知する場合、視覚刺激は聴覚刺激より0.1秒遅れて認知されます。また視覚刺激に速く反応するためには注視している必要がありますが、聴覚刺激は特に注意していなくても反応します。これはホラーゲームのように、プレイヤーにインパクトを与える演出を入れる際に関わります。グラフィックの切り替えと同時に発音した場合、脳には音が先に認知されるので絵のインパクトが薄れてしまうのです。より強い刺激としてプレイヤーに伝えたい場合は、視覚と聴覚を同時にするために発音を0.1秒遅らせる必要があります。

音の影響力

脳は入力された情報に足りない部分がある場合、経験からそれを補完する能力があります。聴覚は視覚に次いで情報量が多く、補完によって強い体験を与えます。

立体音響はすでに高い技術が確立されていて、環境さえ用意できれば正確な音場の定位を提供し、環境音の遮蔽などの手がかりから、近接する物体の存在をもプレイヤーに知覚させることができます。近くに誰かが立っている感覚など、プレイヤーの経験によって音以外の情報も補完されます。

ゲームに限る話ではないのですが、印象的なシーンに使われているBGMは、その曲を聴いただけでシーンを思い出します。映画やアニメなどのメディアとは異なり、ゲームはインタラクティブであるがゆえに強く脳に記憶され、自分が熱心にプレイしたゲームの曲を聴いて、思わず涙ぐむことも珍しくありません。筆者は先述のゲーム音楽を初めてレコード化した『ビデオ・ゲーム・ミュージック』のプロジェクトの一員だったことから、2012年よりゲーム音楽を専門に演奏するオーケストラJAGMOに関わっていますが、コンサートで涙するお客様の姿を見て、総合芸術としてのゲームに占めるサウンドの重要性を再確認しています。

WEB+DB PRESS

本誌最新号をチェック!
WEB+DB PRESS Vol.130

2022年8月24日発売
B5判/168ページ
定価1,628円
(本体1,480円+税10%)
ISBN978-4-297-13000-8

  • 特集1
    イミュータブルデータモデルで始める
    実践データモデリング
  • 特集2
    いまはじめるFlutter
    iOS/Android両対応アプリを開発してみよう
  • 特集3
    ブロックチェーン、スマートコントラクト、NFT
    作って学ぶWeb3

おすすめ記事

記事・ニュース一覧