OpenAIは2025年7月17日午前10時16分(米国太平洋時間)、ChatGPTの新機能「ChatGPT agent」を発表した。
このエージェントは仮想コンピューターを使用して、ウェブ閲覧、詳細なリサーチ、ファイルのダウンロード・作成を自律的に実行する。従来の「Operator」と「Deep Research」の機能を統合し、複雑なタスクを開始から完了まで一貫して処理できる。
ChatGPT Pro(月額200ドル)で先行利用開始され、月間400メッセージの制限がある。ChatGPT Plus(月額20ドル)とTeam(月額30ドル)には数日以内に提供され、月間30クレジットまで利用可能である。
Enterprise・Educationプランへは数週間以内に展開予定だが、ヨーロッパとスイスでは未提供である。安全対策として、ユーザー確認プロンプト、Watch Mode監視機能、金融取引などの高リスクタスクの拒否機能を実装している。
実世界タスクのベンチマークでHumanity’s Last Examで並列展開手法を使用して44.4のスコア、SpreadsheetBenchで45.5%を記録した。
【編集部解説】
ChatGPT agentの発表は、AIアシスタントの進化における重要な転換点を示しています。これまでのAIチャットボットが主に「質問に答える」存在だったのに対し、今回のエージェントは「実際に行動を起こす」能力を持つ点が革新的です。
OpenAIが従来のOperatorとDeep Researchを統合した背景には、ユーザーの実際の利用パターンが大きく影響しています。多くのユーザーがOperatorで試みたタスクが実際にはDeep Researchの方により適していることが判明し、両者の最良の部分を組み合わせる必要性が明らかになりました。
技術的な仕組みと革新性
ChatGPT agentの最も注目すべき特徴は、仮想コンピューターを通じて複数のツールをシームレスに切り替えながら作業を実行できる点です。ウェブサイトとの対話にビジュアルブラウザを使用し、コード実行にはターミナルを活用するなど、人間が行う作業プロセスを高度に再現しています。
この技術により、単純な情報検索から複雑な分析業務まで、幅広いタスクを一貫して処理できるようになりました。例えば、競合他社の分析を依頼された場合、複数のウェブサイトを自動的に巡回し、データを収集・分析して、最終的に編集可能なスライドデックまで作成するという一連の流れを自律的に実行します。
ベンチマーク性能から見る実力
OpenAIが発表したベンチマーク結果は、この技術の実用性を裏付けています。Humanity’s Last Examで並列展開手法を使用して44.4のスコア、困難なFrontierMathベンチマークで27.4%、SpreadsheetBenchで45.5%という数値は、従来のAIシステムを大幅に上回る性能を示しています。特にSpreadsheetBenchでのスコアは、MicrosoftのCopilot in Excelの性能を2倍以上上回っており、実務レベルでの活用可能性を強く示唆しています。
セキュリティと安全性への取り組み
ChatGPT agentの最大の懸念材料は、ユーザーの代わりに実際の行動を取れることから生じるセキュリティリスクです。OpenAIは包括的な安全対策を実装しており、フォーム送信やメール送信前の確認プロンプト、Watch Mode機能による監視、金融取引などの高リスクタスクの拒否機能を導入しています。
特に注目すべきは、エージェントセッション中はメモリ保持を行わない設計により、プライバシー保護にも配慮している点です。また、ユーザーが非アクティブになった際に自動的に実行を一時停止するWatch Mode機能は、意図しない操作を防ぐ重要な安全装置となっています。
高リスクシステムとしての分類
OpenAIは準備フレームワークに従って、ChatGPT agentを生物学・化学分野での「高能力システム」として分類しています。直接的な誤用の証拠はないものの、同社は慎重に最強の安全保護措置を有効にしており、強化された拒否訓練、バイオセーフティ専門家によるレッドチーミング、改善された検出システムを実装しています。
これは、高度なAIモデルが外部ツールやアプリケーションへのアクセスを得た場合、道徳的・倫理的だと判断した行動を取る可能性があることを踏まえた対策です。例えば、ユーザーの不正行為を疑った場合に、AIが「内部告発者」として政府機関やジャーナリストに連絡を取る可能性があります。
地域展開の現状
現在、EU域内とスイスでの提供は見送られており、現地の住民を失望させていることは間違いありません。OpenAIは段階的な展開を計画しており、まずはChatGPT Pro加入者から開始し、Plus・Team加入者、最終的にEnterprise・Education加入者へと順次拡大していく予定です。
長期的な業界への影響
ChatGPT agentの登場は、AI業界全体の競争構造を変える可能性があります。Microsoft、Google、Salesforce、Oracleなどの大手企業がAIエージェント分野に大規模な投資を行っており、この分野での技術競争は今後さらに激化することが予想されます。
特に注目すべきは、MicrosoftのOffice製品群との競合関係です。ChatGPT agentがスプレッドシートやプレゼンテーション作成において高い性能を示していることから、従来のオフィスソフトウェアのビジネスモデルに大きな影響を与える可能性があります。
技術的な制約と今後の展望
現在の技術には限界もあります。スライドショー生成機能はまだベータ版で基本的な仕様に留まっており、実用的な品質に達するまでには更なる改良が必要です。OpenAIは次世代バージョンの開発を通じて、レイアウトの改善や機能の洗練を図っています。
人間とAIの協働関係が本格化する中で、ChatGPT agentのような高度なエージェント技術は、私たちの働き方や生活様式を根本的に変える可能性を秘めています。しかし、その恩恵を享受するためには、セキュリティリスクの管理と適切な規制対応が不可欠となるでしょう。
【用語解説】
ChatGPT agent
OpenAIが2025年7月17日に発表したAIエージェント機能。仮想コンピューターを使用してWebブラウジング、ファイル操作、コード実行を自律的に行い、複雑なタスクを開始から完了まで一貫して処理する。
AIエージェント
従来のチャットボットを超えて、ユーザーの代わりに具体的なアクションを実行できるAIシステム。多段階のタスクを自律的に処理し、推論と行動を組み合わせて目標を達成する。
Operator
OpenAIが2025年1月にリリースした初期のAIエージェント。ヘッドレスブラウザを使用してWebサイトでの操作(クリック、フォーム入力、注文など)を自動化できるが、ローカルアプリケーションとの連携はできない。
Deep Research
OpenAIが2025年2月に導入した機能。複数のWebサイトを徹底的に検索し、情報を統合して詳細なレポートを作成する。テキストのみのブラウザを使用して情報収集に特化している。
ヘッドレスブラウザ
ユーザーインターフェースを持たないWebブラウザ。自動化された処理やテストに使用され、プログラムから直接制御できる。人間の操作を必要とせずにWebページとの対話が可能。
Watch Mode
ChatGPT agentの安全機能の一つ。ユーザーが非アクティブになった際に処理を一時停止し、重要なタスクでは積極的な監視を行う。
SpreadsheetBench
AIモデルのスプレッドシート操作能力を評価するベンチマーク。ChatGPT agentは45.5%のスコアを記録し、MicrosoftのCopilot in Excelの性能を2倍以上上回った。
Humanity’s Last Exam
AIモデルの一般的な問題解決能力を測定するベンチマーク。ChatGPT agentは並列展開手法を使用して44.4のスコアを達成した。
FrontierMath
数学的推論能力を評価する高難度のベンチマーク。ChatGPT agentは27.4%のスコアを記録した。
準備フレームワーク(Preparedness Framework)
OpenAIが高性能AIシステムのリスク評価と安全対策を行うための内部フレームワーク。生物学・化学分野などでの潜在的リスクを評価し、適切な保護措置を決定する。
【参考リンク】
OpenAI公式サイト(外部)
ChatGPT、GPT-4、DALLEなどの先進的なAIモデルを開発する米国企業
ChatGPT Agent紹介ページ(外部)
OpenAIが発表したChatGPT agentの機能詳細、使用方法、安全対策の公式解説
ChatGPT料金設定ページ(外部)
各プランの料金体系と機能比較、ChatGPT agentの利用可能プランを掲載
ChatGPT Agent System Card(外部)
技術仕様、安全対策、準備フレームワーク評価結果をまとめた公式文書
【参考動画】
ChatGPT Agent in 6 Minutes
Developers DigestチャンネルによるChatGPT agentの6分間解説動画。機能概要、ベンチマーク性能、利用方法について簡潔にまとめられている。
ChatGPT Agent Is Here: Your All‑In‑One AI Worker?
Prompt Engineeringチャンネルによる詳細解説動画。ChatGPT agentの技術的な仕組みや他のAIエージェントとの比較について解説している。
【参考記事】
OpenAI unveils ChatGPT agent to handle tasks as AI apps evolve(外部)
ロイターによるChatGPT agent発表の報道とAI業界の競争状況分析
OpenAI launches a general purpose agent in ChatGPT(外部)
TechCrunchによるChatGPT agentの機能詳細とAIエージェントの課題分析
OpenAI’s new ChatGPT Agent can control an entire computer(外部)
The VergeによるOpenAI製品責任者へのインタビュー記事
OpenAI Unleashes ChatGPT Agent to Be Your Personal Assistant(外部)
CNETによるChatGPT agentの実際の使用例と安全機能の詳細解説
ChatGPT Agent supercharges AI to carry out tasks(外部)
Tom’s GuideによるChatGPT agentの使用方法ガイドと活用方法解説
【編集部後記】
ChatGPT agentが示すAIエージェントの未来について、皆さんはどのように感じられましたか?私たちの日常業務が根本的に変わる可能性を秘めたこの技術に、期待と不安を同時に抱かれる方も多いのではないでしょうか。
特に興味深いのは、AIが単なる「回答者」から「行動者」へと進化している点です。皆さんの職場では、どのような作業から自動化が始まると思われますか?また、AIエージェントと協働する未来において、私たち人間にはどのような新たな価値創造が求められるでしょうか?
この技術革新の波に乗り遅れないよう、ともに最新情報を追いかけていきませんか?