gihyo.
※この記事は、不正確な内容を含んでいる可能性のある実験的コンテンツです。正確な情報はリンク先を確認してください。
nano-bananaの週でした
nano-bananaこと、Gemini 2.
“nano-banana”の舞台裏:対話×段階編集で複雑な画像作成を実用域へ
YouTubeのGoogle for Developersチャンネルでは8月27日、コード名
今回のアップデートは、生成と編集の両面で大きな品質向上を実現し、ネイティブ画像生成というアプローチでテキストや画像といったマルチモーダルの文脈を保持したまま、逐次
機能面では、シーン全体の整合性を保ちながら特定箇所のみを変えるピクセルパーフェクト編集や、視点や文脈が変わっても同一キャラクターとして保てる一貫性が大きく改善された。2.
開発・
モデルの住み分けとして、Imagenは単発のテキスト→画像生成に最適化された特化型で、品質・
Philipp Schmid氏によるnano-bananaのベストプラクティス
Google DeepMindのPhilipp Schmid氏は、Gemini 2.
簡単にまとめると以下のとおり。詳しくは上記投稿を参照のこと。
- 具体的な指示を出すほど、生成画像のコントロール性が高まる。
- キャラクターの特徴が編集を重ねて変化した場合は、詳細な説明で新規会話を始めると一貫性を保てる。
- 画像の目的や意図を明確に伝えることで、より適切な結果が得られる。
- 1回で完璧な画像は期待せず、会話を通じて細かく修正・
改善する。 - 「semantic negative prompts」
は否定形ではなく、望むシーンを肯定的に記述する。 - 編集時、アスペクト比は基本的に入力画像を維持し、複数画像の場合は最後の画像の比率が採用される。
- 写真・
映画用語 (例:ワイド、マクロ、ローアングル、85mmポートレート、ダッチアングル) で構図を細かく指定できる。
nano-bananaも利用したAI動画例
themassive.
Threadsで見る
Whisk:Google LabsのAI画像生成ツール
Google Labsが2025年8月、AI画像生成ツール
- "Whisk is expanding to 77 new countries, AND we're also adding the power of Veo 3..." - X
- "More control. More consistency. Meet ✨Precise Mode✨ on Whisk..." - X
WhiskはGoogle Labsが開発したAI画像生成ツールで、ユーザーはプロンプト不要で画像を生成でき、選択した画像を入力するだけで簡単に利用開始可能。Veo 3による8秒間の高精細アニメーション生成機能が追加され、月5回まで無料で利用できる
AGENTS.mdの採用が広がる
特定プロジェクトにおいて、エージェントにカスタム指示を指定するためのファイルのデファクトスタンダードを目指すAGENTS.

となると、大きなところとしてVS CodeとClaude Codeの動きが気になります。
GitHub Copilot:AGENTS.mdでのカスタム指示に対応
GitHubが2025年8月28日、Copilot Coding AgentのAGENTS.
Copilot Coding Agentは、AGENTS..github/
や.github/
、さらにCLAUDE.
やGEMINI.
など多様な指示ファイル形式も継続してサポート。これにより、プロジェクトごとに最適な指示ファイルを選択できる。
※まだVS CodeのCopilotでは対応していないが、該当のIssueを見ると8月版で何かしらか対応が検討されるように見受けられる。
Claude Codeでの採用は?
Claude CodeにおけるAGENTS.
政策・社会動向
Anthropic National Security and Public Sector Advisory Council:米国・同盟国のAI戦略強化
Anthropicが2025年8月27日、米国および同盟国のAI戦略強化を目的とした
本評議会は、米国防総省・
AIと職業:適用可能性と代替リスクに関するMicrosoft Researchの最新調査
Microsoft Researchが2025年8月21日、AIの職業適用可能性と代替リスクに関する調査結果を発表した。
本調査は、Bing Copilot
Canaries in the Coal Mine?:AIによる米国若年層雇用への影響分析
Stanford Digital Economy Labが2025年8月、AI普及による米国雇用変化を分析した論文
米国最大の給与ソフト提供事業者の高頻度アドミニデータを用いて、生成AIへの職業曝露度と雇用変化を分析した。最も生成AIの影響が大きい職種では、初期キャリア層
GoogleのAIによる医療職教育の変革
Googleが2025年8月27日、医療職向け教育にAIを活用する最新研究成果を発表した。
医療人材不足の課題に対し、AIを活用した個別最適化学習の可能性を探る研究を進めている。医学生・
OpenAIとRetro Biosciences、AIでライフサイエンス研究を加速
OpenAIとRetro Biosciencesが2025年8月22日、タンパク質工学向けGPT-4b microモデルによる幹細胞リプログラミング効率の大幅向上を発表した。
OpenAIとRetro Biosciencesは、GPT-4b microというカスタムAIモデルを共同開発し、タンパク質設計と幹細胞リプログラミングの効率を50倍以上に高めることに成功した。Yamanaka因子の新規バリアント設計により、従来の手法では0.
Claude教育レポート:大学教員のAI活用実態
Anthropicが2025年8月27日、大学教員のClaude活用実態をまとめた教育レポートを公開した。
74,000件の会話分析と大学教員への調査から、カリキュラム開発
Anthropic Higher Education Initiatives:高等教育向けAIイニシアティブ
Anthropicが2025年8月21日、高等教育向けアドバイザリーボード設置とAIリテラシーコース3種を発表した。
Yale・
Vibe Codingを使った、デザイナーによるプロトタイピング開発
Microsoft Designが2025年8月22日、AIと協働する
ここでのVibe Codingは、デザイナーが自然言語でインタラクション目標をAIに伝え、AIが実際のコードやプロトタイプを生成する手法とし、従来のUIモックやFigma中心の設計から、HTML/
「学びの楽しさ」再発見:Jason Lengstorf氏が語るAI時代の開発者キャリア
GitHubが2025年8月26日、Jason Lengstorf氏の学び・
Lengstorf氏は
AI Avenue:AIを楽しく学べるCloudflare公式ミニシリーズ
Cloudflareが2025年8月25日、AIの仕組みや可能性を分かりやすく紹介する動画シリーズ
AI Avenueは、AIの
OpenAI Startups:スタートアップ支援プログラム
OpenAIのshyamal氏が2025年8月、スタートアップ支援の新拠点ページ
- "we launched a new home for startups: openai .com/
startups..." - X - AI for ambitious builders - OpenAI
OpenAIは、スタートアップの成長を後押しするための新たな情報発信拠点を開設。サイトでは、API活用事例やイベント情報、コミュニティ参加方法など、スタートアップ向けのリソースがまとめられている。
Google:AIのエネルギー効率と環境負荷の包括的評価手法を公開
Googleが2025年8月21日、AIモデルのエネルギー・
Gemini Apps等のAIモデルに対し、推論1回あたりのエネルギー消費・
「vibe-coding」と「AI-assisted engineering」の違い
Addy Osmani氏が2025年8月28日、AI活用の開発手法
「vibe-coding」
世界初のAI搭載型ランサムウェアをESETが発見
ESETが2025年8月、AIを活用したランサムウェア
「PromptLock」
サービス・アプリケーション
Microsoft、Copilot Labsに3Dモデリング機能を追加
Microsoftが2025年8月22日、Copilot Labsに3Dモデリング機能を追加した。
- "🚀 Say hello to the new Copilot Labs, now featuring 3D modeling..." - X
- Copilot Labs 3D modeling - Microsoft Copilot公式
Copilot Labsの新機能
ChatGPTでプロジェクト専用メモリー機能を利用可能に
OpenAIが2025年8月22日、ChatGPTの新機能として、プロジェクト専用のメモリー機能を導入した。
プロジェクト作成時にプロジェクト専用メモリーを有効化すると、そのプロジェクト内の会話だけを追加コンテキストとして用い、外部の保存済みメモリーは参照せず他の会話へ情報が持ち出されない。利用には
ChatGPT:危機時に人を支援するAIの安全設計
OpenAIが2025年8月26日、ChatGPTの危機対応・
ChatGPTは、自己・
Claude for Chrome:安全設計とプロンプトインジェクション対策
Anthropicが2025年8月26日、Chrome拡張
カレンダー・
Microsoft 365 CopilotにGPT-5が統合、業務効率化の新提案
Satya Nadella氏が2025年8月29日、Microsoft 365 Copilotに統合されたGPT-5の活用事例をXで紹介した。
投稿では、GPT-5がMicrosoft 365 Copilotに組み込まれて以降、日々の業務アプリ全体に新たな知能レイヤーが加わり、ワークフローが大きく変化したと述べている。具体的に、以下の5つのプロンプト例を挙げ、Copilotがどのように業務支援を行えるかを示した。
- Based on my prior interactions with [/person], give me 5 things likely top of mind for our next meeting.
(私と[/person]のこれまでのやりとりに基づき、次回の会議で主に話題となりそうなことを5つ挙げてください)
- Draft a project update based on emails, chats, and all meetings in [/series]: KPIs vs. targets, wins/
losses, risks, competitive moves, plus likely tough questions and answers. (メール、チャット、[/series]内のすべての会議に基づいて、KPIと目標、成果と損失、リスク、競合の動き、さらに想定される難しい質問とその答えを含むプロジェクトの最新情報を作成してください)
- Are we on track for the [Product] launch in November? Check eng progress, pilot program results, risks. Give me a probability.
([Product]の11月のローンチに向けて順調に進んでいますか? エンジニアリングの進捗、パイロットプログラムの結果、リスクを確認し、確率を示してください)
- Review my calendar and email from the last month and create 5 to 7 buckets for projects I spend most time on, with % of time spent and short descriptions.
(過去1か月間の私のカレンダーとメールを確認し、最も多くの時間を費やしたプロジェクトを5~7件のグループに分け、各グループの時間割合と簡単な説明を作成してください)
- Review [/select email] + prep me for the next meeting in [/series], based on past manager and team discussions.
([/select email]を確認し、過去のマネージャーやチームの議論に基づいて、[/series]内の次回会議の準備をしてください)
Google Translate:AIによるライブ翻訳・言語学習機能が追加
Googleが2025年8月26日、Google TranslateにAI活用のライブ翻訳・
日本語を含む70言語以上で、GeminiモデルによるAI高精度リアルタイム音声・
Google Finance:Search Labsで新機能の先行体験が可能に(米国ユーザー向け)
Googleが2025年8月、Google Financeの新機能を米国で順次拡大し、Search Labs経由で先行利用できるオプトインを追加した。
Google Financeは、米国ユーザー向けに新しい金融情報サービスの提供を進めており、米国ユーザーはSearch Labsの
Fitbit AIパーソナルヘルスコーチ:Gemini搭載の新機能プレビュー
Googleが2025年8月20日、FitbitアプリにGemini搭載のAIパーソナルヘルスコーチ機能をプレビュー公開した。
AIコーチは、個人の健康・
Google Vids:Veo 3による画像→動画変換機能が追加
Googleが2025年8月27日、Google VidsにVeo 3を活用した画像から動画への自動変換機能を追加した。
Google Vidsで画像をアップロードし、プロンプトを入力するだけで、8秒間の高品質な動画
Google Vids:AIアバターによる自動ナレーション機能が登場
Googleが2025年8月27日、Google VidsにAIアバターによる自動ナレーション機能を追加した。
ユーザーは台本を入力し、12種類のAIアバターから選択するだけで、30秒以内の動画ナレーションを自動生成できる。英語対応で、週20回まで生成可能。研修・
Google Vids:Geminiによるトランスクリプト編集機能が追加
Googleが2025年8月27日、Google VidsにGeminiを活用したトランスクリプト編集機能を追加した。
録音済み動画や音声クリップの英語トランスクリプトを自動生成し、不要な間・
Google Drive:Geminiによる画像解析・要約機能が追加
Googleが2025年8月26日、Google DriveのサイドパネルGeminiに画像解析・
GeminiはDrive内の画像に対し、内容要約・
Claudeの悪用事例と対策:Anthropic脅威インテリジェンスレポート
Anthropicが2025年8月28日、AIモデルClaudeの悪用事例と対策をまとめた脅威インテリジェンスレポートを公開した。
本レポートは、Claude Codeを用いた大規模なデータ窃取・
ComfyUI:Qwen-Image ControlNet/LoRA/InstantX、Nano-banana:Gemini-2.5-Flash Image APIノード対応
Comfy Orgが2025年8月26日・
- Qwen Image ControlNet & LoRA, EasyCache and Context Window in ComfyUI - ComfyUI Blog
- Nano-banana via ComfyUI API Nodes! - ComfyUI Blog
ComfyUIはQwen-Image用ControlNet
開発・開発ツール
Cursorで人気のMCPサーバー紹介
eric zakariasson氏が2025年8月、Cursorで利用可能な人気MCPサーバーをSNSで紹介した。
Cursorは、MCP対応のAIツール拡張が可能な開発環境。この投稿において、直近4週間でユニークユーザー数が多いMCPサーバーが
OpenAI Responses APIのWeb検索機能強化
OpenAIが2025年8月27日、Responses APIのWeb検索機能強化を発表した。
Responses APIのWeb検索機能に、ドメインフィルタリングやソースレポート機能が追加された。これにより、特定ドメインのみを対象とした検索や、検索結果ごとの情報源表示が可能となった。価格も1,000回あたり$10に値下げされ、より手軽に利用できる。
OpenAI APIリファレンス・ガイド一括テキスト公開
OpenAIのshyamal氏は2025年8月、OpenAIのAPIガイドやリファレンスドキュメントを1つのプレーンテキストファイルとして公開されていることを紹介した。
- you can now access the full set of @openai guides and API reference docs as a single plain text file... - X
- OpenAI llms-full.
txt - OpenAI llms.
txt
開発者はこのテキストを任意のモデルへのインプットやCursorへの追加資料として活用できる。
Claude Codeによる構築とプロトタイピング:Anthropic公式動画
Anthropicが2025年8月、Claude Codeの新機能と開発事例をYouTube公式チャンネルで紹介した。
この動画では、AnthropicのCat Wu氏とAlex Albert氏が、Claude Codeを活用した自律型AIエージェントの構築方法やMCP連携、開発ベストプラクティスを紹介している。さらに、開発現場での
Claude Code GitHub Actionsの一般提供開始
Anthropicが2025年8月27日、Claude CodeのGitHub Actions統合の一般提供が開始された。これにより、プルリクエスト作成・
- "Claude Code's GitHub integration is now generally available with a simplified API..." - X
- Claude Code GitHub Actions - Anthropic Docs
Gemini Code Assist Agent Modeの一般提供
Googleが2025年8月21日、Gemini Code Assist Agent Modeの一般提供開始を公式ブログで発表した。
Gemini Code AssistのAgent ModeがVS Code/
Visual Studio:AIエージェント・MCP・Gemini対応の最新ロードマップ
Microsoftが2025年8月27日、Visual StudioのAI・
Visual Studioは、Copilot Chatのエージェントモード強化、プロファイラー/デバッガーのAIエージェント化、MCPサーバー連携、Gemini・
Copilot Coding Agent:GitHub全体で使えるエージェント型タスク管理パネル
GitHubが2025年8月19日、Copilot Coding Agentの新機能
Agents Panelは、GitHub.
VS Codeのプロンプトインジェクション対策:Copilot Chatの安全設計と最新脆弱性事例
GitHubが2025年8月25日、VS CodeのCopilot Chat拡張におけるプロンプトインジェクション脆弱性と対策を解説した。
Copilot Chatの
Gemini CLI Agent:Zedエディタへの公式統合
Googleが2025年8月27日、Gemini CLI AIエージェントのZedエディタ対応を発表した。
Gemini CLIは、MCP標準や拡張機能・
Zedエディタ、Gemini CLI対応のエージェント拡張プロトコルACPを紹介
Zed Industriesが2025年8月27日、Gemini CLI対応の
ACPは、ZedやNeovimなど多様なエディタでAIエージェントを統合できるオープンプロトコル。Gemini CLIをはじめ、任意のエージェントがJSON-RPC経由で編集・
Cursor 1.5:Linear連携・Agentターミナル改善・MCPエリシテーション対応
Cursorが2025年8月21日、バージョン1.
Cursor 1.
GitLab 18.3:Visual Studio向けDuo Agent Platformなど新機能
GitLabが2025年8月25日、Visual Studio向けDuo Agent Platform
GitLab 18.
AI Gateway:VercelのAIアプリ向け信頼性・柔軟性ゲートウェイ
Vercelが2025年8月21日、AI Gatewayの一般提供を開始した。
AI Gatewayは、AIモデルの切り替え・
Model Context Protocol(MCP)サーバー:AIツール拡張の標準設計と実装例
GitHubが2025年8月22日、AIツール拡張の標準プロトコル
MCPは、AIツールに外部データやアクション実行機能を標準化して追加できるプロトコル。多言語対応のSDKを使って、ツール
Async:AIコーディングとタスク管理を統合したオープンソース開発ツール
Async Inc.が2025年8月、AIコーディング・
Asyncは、Claude Code・
MCP Server PortalsによるAI接続の一元管理
Cloudflareが2025年8月26日、MCP Server Portalsのベータ提供開始を公式ブログで発表した。
MCPサーバーの一元管理・
Workers AIにLeonardo・Deepgram最新モデルが追加
Cloudflareが2025年8月27日、Workers AIにLeonardoの画像生成モデルとDeepgramの音声AIモデルを追加した。
Leonardo.
Cloudflare AI Gateway:主要AIモデルへの統合接続・セキュリティ強化
Cloudflareが2025年8月27日、AI Gatewayの新機能として主要AIモデルへの統合接続・
AI Gatewayは、Anthropic・curl
やimport Anthropic from '@anthropic-ai/
等で簡単に利用開始でき、開発者はセキュアかつ柔軟にAIアプリを構築できる。
生成AIのセキュリティ戦略とCloudflare SASE
Cloudflareが2025年8月26日、SASE
Cloudflareは、AI利用の可視化、リスク管理、データ保護を柱に、組織のAI活用とセキュリティを両立する方法を紹介している。Shadow AIの発見・
AI faceクロッピング:Cloudflare Imagesで顔検出・自動トリミング
Cloudflareが2025年8月20日、AI faceクロッピング機能をImagesで一般公開した。
Cloudflare Imagesは、RetinaFacegravity=face
パラメータで画像内の顔領域を自動検出し、zoom
で周囲の余白調整が可能。複数顔・
vibe-llama:LlamaIndex向け最新コーディングツール
LlamaIndexが2025年8月、GitHubで
vibe-llamaは、LlamaIndexやLlamaCloud Services、llama-index-workflowsと連携する開発者向けコーディング支援ツール。主な機能は
MCP Universe:現実世界エージェントの新ベンチマーク
Ziyang Luo・
MCP Universeは、GPT-5・
Postgres MCPサーバ+Mermaid/ノートブックによるデータ分析
eric zakariassonが2025年8月、Postgres MCPサーバとMermaid/ノートブックを活用したデータ分析環境を紹介した。
Postgres MCPサーバを複数DBごとに構築し、Mermaidやノートブックと連携することで、従来のDBクライアント不要でデータクエリ・
MCPMark:MCP環境のベンチマークスイート
eval-sysが2025年8月26日、MCPMark v1.
MCPMarkはMCP環境下でのエージェント・
Claude Code Product Manager(CCPM)によるAIプロジェクト管理
Charly Wargnier氏が2025年8月25日、Claude Code Product Manager
Claude Code Product Manager
Grok 4:Cコード最適化プロンプト
Tetsuo氏が2025年8月29日、Grok 4でCのコードを最適化するためのプロンプトを紹介した。
このGrok 4向けプロンプトは、C言語のセキュアコーディング・strncpy
/snprintf
等)
AI SDKによる「次の質問提案」機能の実装例
Matt Pocock氏が2025年8月25日、AI SDKによる
VercelのAI SDKを用いた
NVIDIA、TensorRT-LLMでgpt-oss-120Bの推論速度を2倍に高速化
NVIDIAが2025年8月、TensorRT-LLMとFP4精度対応のBlackwell世代GPU
TensorRT-LLMは低レイテンシ・
n8nによる2025年ベストAIエージェント12選
n8nが2025年8月21日、2025年これまでで注目したい自律型AIエージェント12種を公式ブログで紹介した。
このガイドでは、Lindy AI、Relevance AI、Harvey AI、Clay、HubSpot Breeze、Salescloser AI、VAPI、Box AI Agents、Browserbase Director、legacy-use、Droidrun、Claude Codeなど、業務・
n8nによるRAG評価・最適化ガイド
n8nが2025年8月21日、RAGの評価手法と最適化フレームワークを公式ブログで公開した。
このガイドでは、RAG特有のハルシネーション
モデル・基盤技術
Grok 2.5モデルのオープンソース化
Elon Musk氏が2025年8月28日、Grok 2.
Grok 2.
VibeVoice:長時間・多人数対応の最先端オープンソースTTSモデル
Microsoft Researchが2025年8月28日、長時間・
VibeVoiceは、最大90分・
Microsoft AI、MAI-Voice-1とMAI-1-previewを発表
Microsoft AIが2025年8月28日、音声生成モデル
MAI-Voice-1は、1分間の音声を1秒未満で生成できる高速・
HunyuanVideo-Foley:高忠実度AIフォーリー音生成モデル
Tencent Hunyuanが2025年8月23日、動画向けAI音響生成モデル
HunyuanVideo-Foleyは、動画・
Pixie:3D物理シミュレーションを高速・汎用的に学習
Long Le氏らが2025年8月21日、3Dシーンの物理特性をピクセル情報から高速推論するAIモデル
Pixieは、3Dシーンの画像特徴から物理特性
Wan-S2V:画像+音声から映画品質の動画生成
Tongyi Lab, Alibabaが2025年8月26日、Wan-S2VモデルとWan2.
Wan-S2Vは画像と音声から映画品質の動画を生成するAIモデル。人物の表情・
Reranker v2:Contextual AIの多言語・指示対応型オープンソースリランカー
Contextual AIが2025年8月27日、指示追従・
Reranker v2は指示追従型リランカーとして、1B/
Mobile-Agent-v3:GUI自動化のための基盤エージェントモデル
Jiabo Ye氏らX-PLUGが2025年8月21日、GUI自動化の基盤エージェントモデル
GUI-Owlは、デスクトップとモバイル環境を対象に、UI認識・
Jet-Nemotron:PostNASによる高効率言語モデル
Han Caiらが2025年8月21日、PostNAS手法による新型言語モデル
Jet-Nemotronは、事前学習済みフルアテンションモデルのMLP層を固定し、効率的なアテンションブロック設計を探索するPostNASパイプラインで開発されたハイブリッド型LLM。最適な層配置・
Nequix:材料科学向け基盤モデルを低コストで訓練
Teddy Koker氏らが2025年8月22日、材料科学分野の基盤モデル
Nequixは、E(3)-等変性ポテンシャルを持つコンパクトな材料モデリング用AIモデル。JAX実装でパラメータ数は約70万、500A100-GPU時間で訓練され、Matbench-DiscoveryやMDR Phononベンチマークで3位の精度を達成しつつ、他手法の1/pip install nequix
でインストール可能で、ASE計算機としても利用できる。
Weather Lab:AIによる熱帯低気圧予測と米国NHC連携
Google DeepMindが2025年6月12日、AI気象モデル
Weather Labは、AIによる熱帯低気圧
NVIDIA-Nemotron-Nano-9B-v2:推論・思考制御対応の9B言語モデル
NVIDIAが2025年8月18日、推論・
NVIDIA-Nemotron-Nano-9B-v2は、Mamba2-Transformerハイブリッド構造を採用した9BパラメータのLLM。英語・transformers
やTRT-LLM
、vLLM
で利用できる。
Nemotron-CC-Math:NVIDIAによる高品質Webスケール数学データセット
NVIDIAが2025年8月18日、LLM向け高品質数学コーパス
Nemotron-CC-Mathは、Common Crawlから抽出した1330億トークン規模の数学データセット。従来のFineMathやMegaMathを上回る品質・
NVFP4:16ビット精度と4ビット効率を両立するNVIDIAの新量子化技術
NVIDIAが2025年8月25日、AIモデルの訓練・
NVFP4は、モデル重み・
LLMポストトレーニングの基礎:PyTorch公式解説
PyTorch Foundationが2025年8月26日、LLMのポストトレーニング
ポストトレーニングは、LLMに会話・
Omni:CloudflareのGPU効率化AIモデル管理基盤
Cloudflareが2025年8月27日、GPU効率化・
Omniは、Workers AI上で複数モデルを単一GPU・
Environments Hub:Prime IntellectによるオープンRL環境コミュニティ
Prime Intellectが2025年8月27日、強化学習
Environments Hubは、RLエージェントの学習・
Asta:AIエージェント評価・ベンチマークの最新動向
Allen Institute for AIが2025年8月26日、Astaプロジェクトの最新情報を公式ブログで公開した。
研究者向けエージェント
AstaBench:科学研究向けAIエージェント総合ベンチマーク
Allen Instituteが2025年8月26日、科学研究向けAIエージェントの総合ベンチマーク
AstaBenchは文献理解・
agent-baselines:AstaBenchエージェント実装集
Allen Institute for AIが2025年8月27日、agent-baselinesの公開を発表した。
agent-baselinesはAstaBenchの各種エージェント実装を集約したベースライン集。ReAct型、Smolagents、Asta Science Agents
GRPOによるQwen 2.5の2048ゲーム学習環境解説
Jayendra Ram氏が2025年8月26日、GRPOを用いたQwen 2.
GRPO
Command A Reasoning:Cohereの企業向けAIエージェント制御モデル
Cohereが2025年8月21日、企業向けAIエージェント制御モデル
Command A Reasoningは、128k/
Multi-Agent Legal Assistant powered by GPT-OSS:Lightning AI公式スタジオ
Lightning AIが2025年8月19日、GPT-OSS 120B/
このスタジオは、GPT-OSS 120B/
Cursor、Blackwell向けMXFP8カーネルでMoE層を最適化
Cursorが2025年8月19日、Blackwell GPU向けにMXFP8カーネルを全面刷新し、MoE層の学習速度を1.
Cursorは、Hopper GPUからBlackwell GPUへの移行に伴い、Mixture-of-Experts
研究動向
Anthropic・OpenAI共同安全性評価:主要LLMの安全・整合性テスト結果
OpenAIが2025年8月27日、Anthropicと共同で主要LLMの安全性・
本報告は、OpenAI
Anthropicが2025年8月27日、OpenAIと共同で主要LLMの安全性・
本報告は、AnthropicとOpenAIの最新公開モデル
Anthropic:有害情報除去のための事前学習データフィルタリング
Anthropicが2025年8月19日、事前学習データからCBRN
独自の分類器
Google Health Language Models評価フレームワーク
Googleが2025年8月26日、医療言語モデルの大規模評価フレームワークを公式ブログで発表した。
このフレームワークは、複雑な評価基準をYes/
進化的モデル融合「M2N2」:AIを生態系的に進化させる新手法
Sakana AIが2025年7月、進化的モデル融合手法
M2N2は、AIモデルを自然界の生物のように競争・
Infire:Cloudflare独自の高効率AI推論エンジン
Cloudflareが2025年8月27日、独自開発のAI推論エンジン
InfireはRust製のLLM推論エンジンで、OpenAI互換HTTPサーバ・
Jet-Nemotron:PostNASによる高効率言語モデル
NVlabsが2025年8月22日、Jet-Nemotron技術レポートをarXivとGitHubで公開した。
Jet-NemotronはPostNAS
DeepConf:LLM推論効率と精度を両立する新手法
Jiawei Zhao氏らが2025年8月21日、DeepConfを発表した。
DeepConfは、LLMの推論時にモデル内部の信頼度シグナルを活用し、低品質な推論経路を動的に除外することで、精度と効率を大幅に向上させる新しいパラレル思考手法。追加学習やハイパーパラメータ調整は不要で、既存の推論フレームワークに容易に組み込める。Qwen 3やGPT-OSSシリーズなど最新オープンソースモデルで広く検証されている。
Predicting the Order of Upcoming Tokens Improves Language Modeling:トークン順序予測による言語モデル精度向上
Zayd M. K. Zuhriらが2025年8月26日、言語モデルの学習において
従来のMulti-Token Prediction
DuPO:LLM自己検証のための二重最適化
Shuaijie She氏らが2025年8月20日、LLM自己検証を可能にする二重学習型最適化フレームワーク
DuPOは、LLMの自己検証を実現するための二重学習型最適化フレームワークであり、高価なラベル不要で多様なタスクに適用できる。従来のRLVR
IMO 2025 Problem Solver:国際数学オリンピックAIエージェント
Lin Yang氏が2025年8月、GitHubで
このプロジェクトは、Google Gemini 2.
その他
NVIDIA Blackwell搭載Jetson Thorが一般提供開始
NVIDIAが2025年8月、Blackwellアーキテクチャ搭載Jetson Thorの提供開始を発表した。
Jetson Thorは、Blackwell GPUを搭載した次世代ロボティクス向けAIプラットフォーム。高性能・
Framework Laptop 16:NVIDIA GeForce RTX 5070搭載モデル登場
Frameworkが2025年8月26日、NVIDIA GeForce RTX 5070 Laptop GPU搭載の新型Framework Laptop 16を発表した。
Framework Laptop 16の新モデルは、AMD Ryzen AI 300 Seriesプロセッサ
Pixel 10シリーズのAI新機能まとめ:NotebookLMで一括公開
Googleが2025年8月21日、Pixel 10シリーズのAIカメラ技術や新機能をNotebookLMでまとめて公開した。
Pixel 10シリーズでは、AIによるカメラ強化やパーソナライズ機能、Magic Cueなどの時短機能が追加された。NotebookLMの公開ノートブックでは、発表内容や新機能の使い方、AIカメラの技術解説、パーソナライズ設定の手順などを一括で検索・