【ダイジェスト】
Appleは、ユーザーが写真に対して行いたい変更を平易な言葉で説明することで編集を可能にするAI画像ツールを開発しました。このツールはMGIE(MLLM-Guided Image Editing)と呼ばれ、カリフォルニア大学サンタバーバラ校との共同作業により作成されました。MGIEは、画像をトリミング、リサイズ、反転させたり、フィルターを追加したりすることができます。また、写真内の特定のオブジェクトを変形させたり、より明るく見せたりするなど、単純から複雑な画像編集タスクに対応しています。
このモデルは、ユーザーが写真に対して何を変更したいかをタイプするだけで、その編集を実現します。例えば、「もっと健康的にして」と入力すると、ピザの写真に野菜のトッピングが追加されます。また、サハラのトラの写真が暗い場合、「もっとコントラストをつけて明るく見せる」と指示すると、写真が明るくなります。
AppleはMGIEをGitHubでダウンロード可能にし、Hugging Face Spaces上でウェブデモも公開しましたが、このモデルの将来の計画については明らかにしていません。Appleはこれまで生成AI分野で大きなプレイヤーではありませんでしたが、AppleのCEOであるTim Cookは、今年デバイスにより多くのAI機能を追加したいと述べています。また、Appleの研究者は、Apple Siliconチップ上でAIモデルをトレーニングすることを容易にするオープンソースの機械学習フレームワークであるMLXを昨年12月にリリースしました。
【ニュース解説】
Appleが、ユーザーが写真編集を平易な言葉で指示するだけで実行できるAI画像ツール「MGIE(MLLM-Guided Image Editing)」を開発しました。このツールは、カリフォルニア大学サンタバーバラ校との共同研究により生まれ、画像のトリミング、リサイズ、反転、フィルター追加などの基本的な編集から、特定のオブジェクトの形状変更や明るさ調整など、より複雑な編集までをサポートします。
この技術の最大の特徴は、ユーザーが編集したい内容を簡単な言葉で説明するだけで、AIがその指示を理解し、想定される編集を自動で行う点にあります。例えば、「ピザをもっと健康的に」と入力すると、AIがピザの写真に野菜のトッピングを追加するなど、直感的な操作で複雑な編集が可能になります。
この技術は、ユーザーが写真編集ソフトウェアに精通していなくても、自分の意図した通りの画像編集を行うことを可能にします。これにより、写真編集のハードルが大幅に下がり、より多くの人がクリエイティブな表現を楽しめるようになると期待されます。
しかし、この技術の普及にはいくつかの潜在的なリスクも伴います。例えば、AIによる自動編集が原因で、写真の意図されていない変更が行われる可能性があります。また、このような技術が広く利用されることで、写真の真実性が疑われるケースも増えるかもしれません。
規制の観点からは、AIによる画像編集技術の進化は、著作権やプライバシー保護の新たな課題を生み出す可能性があります。AIが生成した画像の著作権や、人物のプライバシーに関する問題は、今後の技術発展とともに、より一層の注意が必要になるでしょう。
将来的には、このようなAI画像編集ツールがさらに進化し、ユーザーの意図をより正確に理解し、よりリアルな編集が可能になることが予想されます。また、この技術の応用範囲は写真編集にとどまらず、映像編集やデザイン、さらには教育や医療分野への応用も期待されています。
Appleがこの分野での研究を進めることは、同社がAI技術の発展においても重要な役割を果たす可能性を示しています。また、この技術がAppleのデバイスやサービスに統合されることで、ユーザー体験が大きく向上することが期待されます。
from Apple made an AI image tool that lets you make edits by describing them.
“Appleが開発、言葉で指示するだけのAI画像編集ツール「MGIE」公開” への2件のフィードバック
Appleの新しいAI画像ツール「MGIE」の開発は、非常に興味深い進展であり、ユーザーが直感的な言葉で写真編集を行えるようになることは、テクノロジーのアクセシビリティと使いやすさを大きく前進させるものです。私たちが目指すテクノロジーの民主化という観点からも、このようなツールは、専門知識がない人々にもクリエイティブな表現の機会を提供し、社会の包摂性を高める重要な一歩となります。
しかし、AIによる画像編集が容易になることで生じる倫理的問題や、写真の真実性への影響についても、慎重に考える必要があります。私たちは、技術が社会にもたらす利益を最大化し、同時にリスクを管理するために、適切なガイドラインと規制が伴うことを支持しています。
Appleがオープンソースのフレームワークやウェブデモを通じてこの技術を公開することは、共有された知識と透明性の精神にも合致しており、研究コミュニティや一般ユーザーが共に学び、成長する機会を提供します。AIの発展は協力と共有によって促進されるべきであり、Appleのこのような取り組みは、業界全体にとっても価値ある一歩であると言えるでしょう。
AppleのAI画像ツール「MGIE」の開発は、ユーザーの写真編集に対するアクセス性を高める革新的な一歩だとは思いますが、私はこの技術の進化に懐疑的な目を向けざるを得ません。確かに、直感的な言葉で編集が行える機能は、多くの人にとって便利であり、クリエイティブな表現の幅を広げるでしょう。しかし、芸術家としての視点から言えば、AIによる自動編集は創造性に対する深い理解や、人間特有の感覚的なニュアンスを持ち合わせていないと感じます。
私たちの手作業による編集や創作活動には、それぞれの感情や独自の視点が反映されています。これはAIが再現できるものではなく、人間ならではの芸術の本質だと思います。また、写真の真実性や著作権といった問題も、AI技術が普及することでより複雑になるでしょう。実際のところ、技術の進化が文化や芸術の価値を希薄化させることには、強く警鐘を鳴らす必要があると考えています。
地域社会における芸術と手仕事の重要性を尊重し、個人の表現力を守る立場からすれば、私たちはテクノロジーの進歩と共に、人間の創造性と感受性を大切にすることを忘れてはなりません。AIによる助けを借りつつも、私たちの手による芸術作品の価値を、これからも尊重し続けていきたいと思います。