はじめに
ChatGPTの衝撃
2022年11月にChatGPTが登場してから、早くも一年が経とうとしています。
今となっては毎日当たり前のように利用しているChatGPTですが、筆者が初めてChatGPTを触ったときの驚きや感動は今でも忘れられません。本書を手に取った読者のみなさまも、きっとそのような感動を味わったことと想像します。
まるで中に人間がいるかのように、どんな質問でも自然に応答してくれるという衝撃。ビジネスメールや企画書だけでなく、簡単なプログラムコードの作成まで粛々とこなしてしまう姿を目の当たりにし、いよいよAIが人間に成り代わる時代が来るかもしれないと思ったほどでした。
同様のインパクトを世界中の人が感じたのかはわかりませんが、ChatGPTは登場からわずか二ヶ月で月間一億人以上ものユーザーが利用するサービスになりました。現在も積極的な機能アップデートが続いており、ユーザー数も拡大を続けています。
特に、ChatGPTにおける現在の最新モデルであるGPT-4が2023年3月に登場してからは、より複雑なタスクをChatGPTがこなすことができるようになり、活用の幅が一気に拡がりました。
プロンプトとプログラミング言語
その流れを受けてビジネスパーソン向けの情報サイトでは、「プロンプト」と呼ばれるChatGPTへの指示方法を扱った特集記事に強い注目が集まっています。指示の仕方を工夫すればするほど、私たちの求めるクオリティで成果物を生成してくれる可能性が高まるからです。ビジネスパーソンにとっては、プロンプトを使いこなすことで作業生産性を何倍にも高められる可能性があります。
この状況はソフトウェア開発の専門家である筆者にとって、とても興味深い光景に見えています。
私たちが日常的に利用しているコンピューターに要望を伝えるためには、「プログラミング言語」という特別にデザインされた言語体系で、「ソースコード」と呼ばれる文章を書くことによって伝えます。「ソースコード」をインプットとしてコンピューターが理解できるデータ形式に変換することで、コンピューターは人間の命令を認識し、その通りに実行することができるのです。
しかしプログラミング言語を介したコンピューターとのコミュニケーションは非常に複雑で、多くの専門的な知識を必要とします。コンピューターは、言ったことを言った通りにしか実行してくれず、言ったことに何らかの問題があったとしても、空気を読まずお構いなしにそのまま実行するからです。そのため、ソフトウェア開発者は実行したプログラムが問題を起こさないよう、専門的な知識を活用して慎重にソフトウェアを設計する必要があります。
一方で俯瞰して見てみると、ソフトウェア開発者がプログラミング言語を活用してソースコードによってコンピューターに要望を伝えている姿と、ビジネスパーソンが日本語や英語といった日常的に利用する言語を活用してプロンプトによってAIに要望を伝えている姿は、どこか構造が似ているようにも思えます。ソフトウェア開発者はより表現力の高いソースコードを書くことで、複雑な要望をコンピューターに伝えることができますし、ビジネスパーソンはよりChatGPTにとって理解されやすいプロンプトを書くことで、私たちの求めるクオリティでChatGPTが生成結果を返してくるようにできるからです。
ある意味で、プロンプトは人間がコンピューターに要望を伝えるための新しいプログラミング言語であるともいえるのではないでしょうか。
指示待ちAIと自律型AI
このように考えると、プロンプトに対するリテラシーをより高めることで、私たちがChatGPTのような高度なAIをより効果的に活用できる未来が想像できます。
一方で、そのように思考する枠組みを洞察すると、コンピュータに対する私たちのスタンスには根本的な変化がないことも同時にわかります。
それは、人間が事細かに指示を出さないとコンピューターが動いてくれないのには変わりがないからです。ソースコードがプロンプトに変化することで、ソースコードよりは少ない文字数で多くのことをコンピューターに伝えられるようにはなりましたが、上手く伝えなければ上手く動いてくれないという構造自体はそもそも変わっていないのです。
それでは、この構造を変化させるような、細かく指示を出さなくとも複雑な仕事をやり遂げてくれるような仕組みはないのでしょうか?
それが本書で扱う「AIエージェント」と呼ばれる仕組みです。
人間が何らかのゴールをAIエージェントに与えると、AIエージェントは自身でそのゴールを達成するためには何が必要なのかを考え、自身で一つひとつのタスクに分解し、利用可能なツールを駆使しながらゴールを達成しようと自律的に行動します。
一例として、あるビジネスについての市場調査をAIエージェントに頼むとしましょう。すると、AIエージェントは市場調査を完遂させるために必要なタスクを考えます。例えば、いくつかのキーワードで検索し、多面的に情報を収集する必要があるでしょう。収集した情報に矛盾点がないか、セルフチェックすることも必要です。さらに、調査結果をわかりやすく依頼者にレポートすることも必要なので、レポートの章立てや内容を考えることもAIの仕事です。
細かな指示を期待するのではなく、このように自身で何をするべきかを考えて行動するのがAIエージェントの大きな特徴です。ChatGPTがあくまで指示待ちだとするならば、AIエージェントは自律型だといえるのではないでしょうか。
昨今の研究では、AIエージェント同士をコラボレーションさせることで、ソフトウェア開発すらも完遂させることができるという研究結果も発表されています。MarketsandMarketsによる世界のAIエージェント市場規模のリサーチでは、2023年の48億ドルから、2028年には285億ドルにも市場規模が成長するとの予測も出されています。
本書の目的と構成
このように非常にパワフルで大きな可能性を秘めたAIエージェントですが、AIエージェントという言葉や概念自体は未だ世の中に広く知られているものではありません。
筆者はこれまで、大企業の業務基幹システムの開発からスタートアップの新規ビジネスモデル構築に必要なソフトウェア開発まで、多岐にわたるプロジェクトに関わってきました。特に近年は、ChatGPTを中心とした大規模言語モデルをビジネスに応用するプロジェクトにもアドバイザリーとして参加しており、一般のビジネスパーソン向けにChatGPTを活用するための講座も提供しています。その中で感じることは、よりAIを私たちの業務や生活に応用していくためには、チャット型ではなく自律型、つまりAIエージェントの活用が不可欠になっていくであろうということです。私たちが業務や生活で求めているAIの役割は、私たちを取り巻く環境に点在する情報を自律的に活用しながら、私たちの知的活動をサポートしてくれることにあるからです。
そこで本書では、これから市場に大きな影響を与える可能性のあるAIエージェントについて、その仕組みや具体的な活用例を、ビジネスパーソンの方がわかりやすいように紹介していきます。
第1章ではAIエージェントの詳細についての解説に入る前に、生成AIによって変化するビジネスモデルを交えながら、「AIエージェントによって私たちの仕事にどのような変化が訪れるのか」を示します。続いて第2章では、ChatGPTに代表される「チャット型AI」との違いに着目しながら、「AIエージェントとは何なのか」を明らかにしていきます。そして第3章では、一歩踏み込んだ内容として、「AIエージェントはどのような仕組みで動くのか」を深掘りします。最後に第4章では、具体的なプロダクトを使用している様子を紹介することで、AIエージェントへの解像度を高めていただく構成になっています。AIエージェントが私たちの仕事をどのように変化させるかに興味のあるビジネスパーソンの方は第1章から、むしろAIエージェントの仕組みそのものに関心があるエンジニアの方は第2章から読み進めていただくと読みやすいかと思われます。
本書を手に取った方がAIエージェントについて強い関心を抱いてくれたとしたならば、筆者にとってこれ以上に勝る喜びはありません。