統合型入出力モデル「Unified-IO 2」がAIの進化において大きな飛躍を遂げた。このモデルは、画像、テキスト、オーディオ、アクションなど様々なデータ形式を理解し生成する能力を持ち、単一のエンコーダー・デコーダー変換モデルを用いて複雑なモデルの訓練を克服している。35以上のベンチマークで優れた性能を発揮し、画像生成、自然言語理解、ビデオ・オーディオ理解、ロボティック操作など多岐にわたるタスクをこなす。特に、一般ロバストイメージタスク(GRIT)ベンチマークでは前モデルを2.7ポイント上回る成績を示した。このモデルは、多様なタスクに対応する汎用性と適応性を持ち、AIの未来に向けた新たな地平を開いている。
from Unified-IO 2: A Giant Leap in Multimodal AI Evolution.

