優しいUI~ボイスユーザインターフェースで変わるコト

第4回 音声を扱うアプリに必要な考え方

この記事を読むのに必要な時間:およそ 1.5 分

音声と言われて思い浮かべるのは何でしょうか?

多くの人は,振幅を示す波形表示を頭に思い浮かべるはずです。他は?と聞かれると,これ以上は思いつかないはずです。なじみ深いはずなのに意外に知らないのが音声です。

作り手は,なじみのないものを使いアプリを開発している意識を持たないと,取って付けたようなものができあがったり,特徴を活かせない使い方をすることになって,ボイスユーザインターフェースが持つ魅力をユーザに伝えられません。

音声合成や音声認識との付き合い方は,これまでの原稿を参照していただくとして,今回は音声を扱うアプリが持つべき考え方を説明します。

喋りすぎないようにする

ボイスユーザインターフェースでは,ユーザへの情報提供は音声合成を使います。

音声合成の場合,男性か女性を選べたり,有名な声優さんの声が自由にコントロールできるので,あらゆる場面で使いたくなるのが人の常です。音声でガイドできる場面は,探せば結構あるもので,ここでも・あそこでもと見つけられます。こうした場面すべてに音声を使うと,お喋りなコンピュータができあがります。

これがダメではありませんが,お喋りなコンピュータと毎日付き合うのは疲れます。ところかまわず,ペラペラと話す人が敬遠されがちなのと同じです。また,のべつ幕なしに読み上げると,重要な情報はどれなのか判断できなくなります。人の場合,大切なことを伝える時は相手の目を見て話しますが,コンピュータは,これができないので節度ある読み上げが重要です。

読み上げなくて良い状況であれば読み上げない工夫をする

たとえば,ユーザがわかっている可能性があったり,使えばおおよそ理解できることには,読み上げを使うべきではありません。人にでもわかっていることを言われるのは,気持ちの良いものではないのに,これが機械になればなおさらです。

たいていの場合は,作る側はユーザが知らないと考えて,親切心つもりで読み上げ機能を組み込みます。実際は,造り手が想像するほどユーザは無知ではありません。一般教養を持った大人が使っているので,あれやこれやと口出しして(読み上げて)子供扱いするのはやめるべきです。

VUIの確認メッセージは少なめに

また,確認メッセージの読み上げも,元に戻せないコマンドを実行する旨を伝える場合などに留めるべきです。他にも,コマンドの実行を復唱する必要もありませんし,実行結果を読み上げる必要もありません。また,頻繁に行う操作の最中に読み上げを使うのもやめたほうが良いです。毎回,同じ読み上げをされるのは煩わしく感じるだけです。人と話す時も,毎回同じことを言われるとうんざりするのと同じです。どうしても必要ならば,効果音が代替にならないか検討すべきです。

音声は文字のように読み飛ばすのが難しいので,ユーザは知識があることを前提にしてUXを検討するほうが心地良いものができ上がります。コンピューターは,あらかじめ決めた振る舞いしかできないので,造り手が丁寧だと考えたことが,ユーザは小馬鹿にしていると感じる可能性があります。これも程度が難しいところですが,大人らしい振る舞いをするUXを意識してください。

画像

自分のタイミングで使えるようにする

音声入力を使ったアプリであれば,入力の前に操作方法の説明があって「ピーとなったらお話ください」などのガイダンスが再生されたあとで音声入力します。

多くのアプリやサービスで,この入力方法が使われていますが,最初使ったときはドギマギしてうまく使えなかった経験をお持ちの方も多いはずです。この理由の1つに,自分が決めたタイミングで音声入力できないからと考えられます。

多くのボイスユーザインターフェースには,GUIのように,ユーザの入力待ちの考え方がありません。操作は時間軸に沿って進み,この過程で作り手が決めたタイミングで入力が行われます。ユーザのタイミングで入力できないのは,ボイスユーザインターフェースくらいで,これがまかり通ってきました。

アプリごとに試行錯誤は必要ですが,ボタン操作が併用できるならば,これが押されたときに割り込んで音声入力するUIが検討できます。これで,ユーザは準備が整ったタイミングで操作ができます。また,コマンドの発話中はボタンを押し続けることにすれば,ユーザは,この間コマンドの聞き取りを行っていると意識するので,発話コマンドの前後が録音できないなど,音声認識にありがちなトラブルが避けられます。

どうしても音声入力しかない場合は,たとえば,操作が進んでいる最中でもユーザが割り込んでコマンドが発話できるUXを検討してください。先で書いた「ピーとなったら…」の入力方法の方がプログラムの処理は簡単ですが,これは最良の入力方法でなく試行錯誤する余地があることを意識してください。

画像

特別に考えることはない

使うのは人なのでボイスユーザインターフェースだからと言って,奇抜な考えを持ってUXを検討する必要はありません。

人は,これまでに得た経験値をもとにものごとを判断して動きます。ここで言う「これまでに得た経験値」とは長年使っているGUIのことです。たとえば,ボイスユーザインターフェースのUXを検討する際にGUIで得たノウハウをアレンジできないか考えてみるのも良い方法です。

文中でも何度か触れたように,検討しているUXを人に置き換えて考えてみれば,おのずと結果は出ます。何事もなく自然に振る舞う普段着のようなUXを持つアプリが最良です。

著者プロフィール

傍島康雄(そばじまやすお)

5月30日生まれ。

モバイルデバイスが大好物。それで動くアプリの開発に喜びを感じている。スマートフォン前夜のWindows Mobile,PalmOSのアプリに情熱を傾けていたが,最近は停滞気味でコードを書くよりも文章を書く機会が多くなっており,文章を書くのも,プログラミングと同じくらい奥深い作業だと感じている。

ブログ:http://yasuos.com/blog/

コメント

コメントの記入