テキスト⁠音声⁠画像をリアルタイムに処理できるAIモデルGPT-4oが登場⁠ChatGPTではさらに多くの機能が無料で利用可能に

OpenAIは2024年5月13日、同社のフラッグシップとなる強力なAIモデル「GPT-4o」を発表した。

GPT-4oはテキスト、音声、画像のあらゆる組み合わせを入力、生成可能で、音声入力の応答速度232ミリ秒と、人間の会話における応答時間とほぼ同じ。英語のテキストおよびコードではGPT-4 Turboに匹敵するパフォーマンスをもち、英語以外のテキストでもパフォーマンスは大幅に改善されている。英語以外は日本語をはじめ50以上の言語に対応している。また、とくにビジュアルと音声の理解が改良された。たとえば、英語以外の言語で書かれたメニューの写真を撮り、GPT-4oに話しかけて翻訳し、その食べ物の歴史と重要性について学び、おすすめを得ることができるようになった。

またこれに合わせてChatGPTホーム画面やメッセージレイアウトなどのルック&フィールも一新されている。

将来的にはより自然なリアルタイムの音声会話や、リアルタイムビデオを介してChatGPT と会話できるようになるという。たとえばChatGPTにライブでスポーツゲームを見せて、ルールを説明させるといったことができるようになる。これらの新機能を備えた新しい音声モードを今後数週間のうちにアルファ版としてリリース予定で、展開に合わせてPlusユーザーがアーリーアクセス可能となる。

また、今後数週間でChatGPT Freeユーザー向けに、より多くのインテリジェントな機能と高度なツールの展開を開始するとのこと。ChatGPT FreeユーザーはGPT-4oにより、次のような機能にアクセスできるようになる。

  • GPT-4レベルのインテリジェンス体験
  • ChatGPTとWeb(Bing)の両方から応答取得が可能に
  • データを分析し、グラフを作成
  • 撮影したた写真についてAIとチャット
  • ファイルをアップロードして要約、作成、分析を支援
  • GPTsGPT Storeの使用
  • Memory機能を使用してより役立つAI体験を得る

なお、無料ユーザーがGPT-4oで送信できるメッセージの数には制限があり、制限に達するとChatGPTは自動的にGPT-3.5に切り替わる。

新ChatGPTデスクトップアプリがリリース

無料/有料ユーザーの両方を対象に、macOS用の新しいChatGPTデスクトップアプリもリリースされる。簡単なキーボードショートカットOptionSpaceからChatGPTに即座に質問することができる。アプリ内でスクリーンショットを取ってチャットも可能。

macOS用ChatGPTデスクトップアプリの画面

macOSアプリは5月13日からPlusユーザーに提供し、今後数週間でさらに広く利用できるようになる予定。また今年後半にはWindows版もリリース予定。

おすすめ記事

記事・ニュース一覧