“AIモデル、金融業界の質問応答に失敗：大企業の導入課題浮上”

from GPT and other AI models can't analyze an SEC filing, researchers find.

大規模な言語モデルは、SEC（米国証券取引委員会）の提出書類からの質問に対してしばしば失敗し、特に金融などの規制された産業において、顧客サービスや研究のために最先端の技術を導入しようとする大企業にとって、AIモデルのいくつかの課題を浮き彫りにしている。特にChatGPTの中心にあるような大規模な言語モデルは、SEC提出書類からの質問に対してしばしば答えを拒否したり、事実とは異なる数字や事実を「幻覚」したりすることがある。これにより、金融業界などでAIモデルを導入する際の課題が明らかになっている。Patronus AIの共同創業者であるAnand Kannappan氏は、「そのような性能率は完全に受け入れがたいものであり、自動化および本番用の運用に本当に機能するためには、はるかに高くなければならない」と述べている。Patronus AIは、金融業界における言語AIの「最低性能基準」を示すために、主要な上場企業のSEC提出書類からの質問と回答を含むデータセット「FinanceBench」を作成し、これを使用して4つの言語モデルをテストした。その結果、大規模な言語モデルは、正確な回答を提供することができないことが明らかになった。これにより、金融業界におけるAIの活用には、まだ人間の介入が必要であるという認識が示された。

“AIモデル、金融業界の質問応答に失敗：大企業の導入課題浮上”

Google Gmail、ついにメールアドレス変更機能を実装──エイリアス機能で旧アドレスも継続利用、インドから段階展開

サイバー対処能力強化法で日本が「攻め」の防御へ転換。能動的サイバー防御の全貌を解説

NIST×パスキー導入ガイド：複雑性より長さ、回復フロー刷新とブロックリストで認証をアップデート

XAI(説明可能AI）がビジネスを変える？：横浜国立大学人工知能研究拠点長長尾先生にインタビュー

【取材】XREAL、ARグラス単体で2D→3D変換を実現する「XREAL 1S」を発表――67980円で革新的機能を搭載

【取材】国立科学博物館「量子の世紀」ー現象と時代の筆致を展示する企画展(10/21~11/30)まで

弘栄ドリームワークスー配管と当たり前の世の中：代表取締役菅原にインタビュー

アキュイティー初のメディア座談会に参加：CEOに独占インタビュー

カルディオインテリジェンスのAIが心房細動診断に貢献 – 24時間の検査時間を3分に短縮

青木優美(ゆーみるしー)さんにインタビュー！：身に着けるサイエンスコミュニケーション？【みる研】

【SuperKEKB】KEKフォトウォークに参加してきました。：電子-陽電子衝突加速器【現地訪問】

【J-PARC】加速器が宇宙の謎に迫る！：ニュートリノ振動実験の過去現在未来【現地取材】

【KEK】加速器が宇宙の謎に迫る！：ニュートリノ振動実験の過去現在未来【現地取材】

ドローンとAIは農業の未来を拓くか？女性パイロットが見せる、新たな景色。

「月は失敗の終点ではなく、成功への通過点」iSpace袴田CEOインタビュー

XREAL発表会｜XREAL One Pro発売、新型ARグラスXREAL Aura来年発売で更に拡がるARの世界

『モンハンNow』が拓く、位置情報ゲームの新たな地平｜新古龍ネロミェール先行討伐レポート