CPaaSを使ったアプリケーション開発

知られざるCPaaSの世界へようこそ

CPaaSってなに?

みなさんはCPaaSという用語をご存知でしょうか。

CPaaSはCommunications Platform as a Serviceの略で、⁠シーパース」もしくは「シーパス」と呼ばれます。CPaaSを簡単に言えば、⁠電話やSMSなどのコミュニケーション機能をクラウド上で提供するプラットフォームサービス」です。たとえば、プログラムを使ってSMSを送信したり、電話をかけたり、電話に自動応答することができます。

筆者は日本で2016年からCPaaSのエバンジェリストをしていますが、CPaaSの紹介をするときによく目にする反応は「ふーん。それで?」です。たしかに最近、パスワード認証でSMSが届くことが増えてきたり、自宅の固定電話に政治家の自動音声が流れてきたりして、何かシステムでやっているのだろうなと想像できることが増えてきました。もちろんこのような仕組みはCPaaSの得意とするところではあるのですが、CPaaSの可能性はこれだけにはとどまりません。筆者はよくCPaaSは発明だ!と話していますが、なぜそう思うのでしょうか。

今回、gihyo.jpで3回にわたってCPaaSをテーマに寄稿する機会をいただいたので、まずはこの記事で、なぜCPaaSが発明なのかをじっくり解説していきます。次の記事では、実際にCPaaSを使ってSMSを送信してみます。そして、最後の記事では電話の着信にAIを組み合わせたハンズオンを行いたいと思います。

コミュニケーションの多様化

我々の身の回りには数多くのコミュニケーションツールが存在します。昭和の時代には、電話を中心としたコミュニケーションがよく用いられましたが、その後LINEに代表されるテキストベースのコミュニケーションが普及し、最近ではビデオ機能を用いたコミュニケーションも普通になってきています。

一見すると、いろいろなツールがあるので便利そうですが、実はこれらのツールは閉鎖的です。たとえば、電話をするときは、相手も電話を使っている必要があります。FAXはFAX機同士でなければ情報を伝えられません。LINEもSNSもそうです。すなわち、我々は時と場合、さらには相手によって使うツールを決めながらコミュニケーションを取っているのです。

コミュニケーションの現状

そこでCPaaSの登場です。CPaaSを使うことによって、コミュニケーションを次のように変化させることができます。

CPaaS時代のコミュニケーション

今までのように電話を使って「こんにちは」と発話すると、CPaaSがその音声を文字認識させることで音声を文字に変換できるようになります。文字になってしまえば、相手は電話である必要はないので、たとえばLINEに「こんにちは」と送ることができます。また、レストランの予約をスマホアプリで行った際に、実際のレストランに電話をかけて音声で予約を伝えることもできます。

すなわち、同じコミュニケーションツールを使うのではなく、その人のその時に使える、もしくは使いたいツールを使って、異なるツール同士でコミュニケーションが取れるようになるのです。

Slackfone

みなさんは実際に電話とLINEでコミュニケーションを取っているところを見たことがあるでしょうか? 多分ないと思いますが、実際にCPaaSを使えば同様のことが可能になります。

ここで、筆者の会社で実際に利用されているSlackfoneを紹介しましょう。ちなみに、このSlackfoneは筆者自身がCPaaSを使って作成したアプリケーションです。

Slackfone

実際の動作は、以下の動画やこちらから確認できます。

このSlackfoneの仕組みは次のようになっています。

  1. 会社の固定電話に着信が発生すると、物理的な電話機は鳴らずにSlackに通知が届くようになっています。
  2. 相手の電話に応答しているのは人間ではなく、CPaaSがどのような要件なのかを聞いてくれます。
  3. 相手がそれに対して応答すると、CPaaSが応答した音声を音声認識し、Slackのスレッドとして通知してくれます。
  4. こちらはそれに対して文字で応答することができ、入力した文字はCPaaSのTTS(Text to Speech)機能を使って音声として相手に伝わります。
  5. 電話によっては通話をしなくてはならないケースもあるので、そのときは特別な絵文字で応答することで、物理的な電話機や携帯電話に電話が転送されるようになっています。

Slackfoneの機能で重要なのは着信番号のリンクです。このリンクは、インターネット上の迷惑電話データベースにつながるようになっていて、どこからかかってきたのかを応答する前に確認できるようになっています。これにより、迷惑電話を事前に認知できますし、裏側には電話帳アプリ(kintoneで作られています)とも連携していて、ブラックリストを作れるようにしています。

このように、筆者の会社ではSlackfoneによって、電話を取るという作業がなくなり迷惑電話に悩まされることもなくなりました。

この記事を読んでいる多くのエンジニアは、突然かかってくる電話に嫌悪感を持っていると思います。実際、筆者も突然かかってくる電話は大嫌いです。そのためにSlackfoneを作ったのです。

CPaaSはなぜ発明なのか

CPaaSはクラウドで動作する仕組みですし、Slackも同じくクラウドサービスです。よって、Slackfoneは筆者のスマートフォンでも動きますし、実際電車の中でスマホのSlackアプリで電話に応答したことも何度もあります。

しかもCPaaSは完全従量制の課金モデルで提供されることが多いので、使った分しかコストがかからないのも魅力です。たとえば、Slackfoneのコストは電話番号利用料として月110円、着信料も1分あたり1円くらいです。

CPaaSがなかった時代でも、ものすごく頑張れば同じような仕組みを作ることができたかもしれません。しかし、実現には莫大な初期投資や運用費が必要になります。CPaaSであれば、プログラムの知識があれば非常に安いコストでシステムを自分で作ることができるし、ニーズに合わせて簡単にブラッシュアップもできます。しかも使わなければコストも掛かりません。

もう一点、APIを基本としているところもCPaaSの特長といえます。つまり、APIをサポートしているサービスとの相性がとても良いわけです。別のサービスからCPaaSをAPI経由で呼び出すことで、本来そのサービスにはないコミュニケーションの機能を追加したり、CPaaSから別のAPIサービスを呼び出すこともできます。

たとえば、先ほどのSlackfoneで音声認識をしているのは、アドバンストメディアが提供する音声認識APIを利用しています。また、SlackのAPIを使うことでスレッドに書き込みをしたり、SlackからCPaaSのAPIを呼び出すことで文字を音声に変換しています。

Slackfoneは筆者が電話に出るのが嫌なために作ったものですが、別の視点で見ると、このサービスは耳の聞こえない人や喋れない人などにも役立ちます。さらに、音声認識だけでなく翻訳機能も連携させれば、外国人との会話にも利用できるでしょう。

このようにCPaaSを使えば、みなさんのアイデア次第で今までにはなかった新しいコミュニケーションをつくることができるのです。これが筆者がCPaaSを発明と呼ぶ理由です。

CPaaSベンダーの紹介

アメリカの調査会社であるガートナーが発表した2024年度のCPaaSベンダー分析(Magic Quadrant)によると、リーダーにカテゴライズされたベンダーは以下の4社です。

Twilio

Twilioは、2008年に創業したCPaaSの老舗です。Voiceはもちろん、SMSやチャット、メールなどのコミュニケーションAPIを提供しています。日本では、2013年からKDDIウェブコミュニケーションズが代理店となって日本で広く使われるようになりました。筆者は2016年から2023年まで、Twilioのエバンジェリストをしていましたが、その間ユーザー数も利用額も毎年右肩上がりで伸びていたサービスです。現在は、Twilio本社の意向によって日本市場での大きなリストラや代理店の見直しなどが起きたために、少し失速している感が否めません。

Vonage

Vonageは現在、スウェーデンの通信大手エリクソン傘下となっていますが、さまざまな企業を買収することによって成長してきたCPaaSベンダーです。Twilio同様に、VoiceだけでなくSMSやVideoなどのコミュニケーションAPIを提供しています。コミュニケーションAPIは元々、2010年にnexmoという会社が作ったもので、その後Vonageに買収されました。

Vonage Japanという日本法人もありますが、2024年からはKDDIウェブコミュニケーションズが代理店となって販売を行っています。筆者は現在、Vonageのエバンジェリストをしています。

Infobip

Infobipは、クロアチア発のグローバルなCPaaSベンダーです。2006年に設立され、SMS、音声、チャット、メールなど多様なコミュニケーションチャネルを提供しています。特に、企業向けの顧客エンゲージメントやオムニチャネルソリューションに強みを持ち、世界中の大手企業や通信事業者と提携しています。

日本法人もありますが、先の2社に比べると日本国内での知名度は低いです。

Sinch

Sinch AB (旧 CLX Communications) は、スウェーデンのストックホルムに本社があり、世界60か国以上で4,000人以上の従業員がいます。2024年現在、日本法人はなく、Infobip同様に知名度も低い状態です。

日本におけるCPaaSの状況

先ほども説明したとおり、日本で本格的にCPaaSが使われ始めたのはKDDIウェブコミュニケーションズがTwilioのリセールを開始した2013年です。

当時はまだCPaaSという言葉もなく、電話やSMSをプログラムから操作できるコミュニケーションプラットフォームということで、アーリーアダプタのみなさん(とくにエンジニアの方々)に注目されていた程度でした。

しかし、2014年に050番号の利用料(税抜き)が月額490円から100円に値下げされたことで、CPaaSの普及が急速に広まってきました。とくにサーバーの障害通知など、導入が簡単でかつ従量課金制が馴染む使い方などが数多く登場してきました。2015年にはVideoのAPIが登場したり、チャットAPIや、本格的なコールセンターで使われるような機能などもリリースされたことで、利用用途はかなり広がりました。なかでもセキュリティ強化の一環としてのSMSを使った二要素認証はCPaaSの普及に大きく寄与しました。

CPaaSは、SlackやLINEのようなソリューションではなく、あくまでAPIプラットフォームです。そのため、他のシステムの裏側で使われることが多く、一般の人たちの目につくことはほとんどないですが、すでにみなさんの普段使っているサービスに取り込まれています。

CPaaSベンダー選択のポイント

それぞれのベンダーによって若干の違いはあるものの、APIを保有してプログラマブルで機能が利用できることや従量課金制など、基本的な考え方はほぼ同じです。料金についても、当然各社で差異はあるものの大きな違いはないです。

CPaaSで気をつける点は、通信事業は世界の国々によって異なるレギュレーションがあるということです。たとえば、日本の電話番号を購入して利用するためには、本人確認を含めた厳しいレギュレーションが設定されています。これはその国の法律に準拠するために必要な手続きです。

法律は定期的に変更されるため、CPaaSベンダー側もそれに追従して対応できなければ、最悪法律違反になってしまいサービスの運営ができなくなるリスクを伴います。そのような点からも、日本法人がきちんと存在していることや、日本語でのサポートがしっかりしているベンダーを選定することをおすすめします。

まとめ

今回はCPaaSの魅力について説明しました。

筆者自身は通信業界に長くいたこともあって、CPaaSができる前の世界をある程度知っています。そのため、最初にCPaaSに出会ったときの衝撃は今でも忘れられません。だからこそ、CPaaSには世の中を変えるポテンシャルが存在していると確信し、実際に2013年以降、CPaaSのエバンジェリストとして、日本でのCPaaSの成功事例を数多く見てきました。

次回はいよいよVonageを使って、実際にSMSを送信してみたいと思います。ぜひお楽しみに。

おすすめ記事

記事・ニュース一覧