AIボイススタートアップのElevenLabsは、テキストから音声への変換ツールに続き、新たに「Sound Effects」というテキストからサウンドエフェクトを生成するAIオファリングを発表した。このツールは、ユーザーが想像した音の説明をタイピングするだけで、さまざまなタイプのオーディオサンプルを生成することができる。ElevenLabsは、この製品を実現するためにShutterstockと提携し、映画やテレビスタジオ、ビデオゲーム開発者、マーケター、ソーシャルメディアのコンテンツクリエーターなど、さまざまな分野のクリエーターがコンテンツに没入感のあるサウンドスケープを追加することを目指している。
Sound Effectsツールは、ユーザーが求めるサウンドエフェクトの詳細をテキストプロンプトで入力すると、そのモデルが処理を行い、選択するための6つのユニークなオーディオサンプルを生成する。生成されたサンプルは、雷雨、ドアベル、コインのジャラジャラ音から、猿の鳴き声、車のレース、ダイナーでの人々の食事の音、電車の停止音など、標準的な環境音からより複雑なものまでカバーしている。また、このツールは数秒間の音だけでなく、ギターループやジャズサックスソロ、テクノミュージックループなどのプロンプトを使って最大22秒の楽曲トラックや、さまざまなキャラクターの声も生成することが可能である。
ElevenLabsは、この機能を提供するモデルが同社の内部研究に基づいており、Shutterstockのライセンスされたトラックのオーディオライブラリーで微調整されたと述べている。Shutterstockのチーフエンタープライズオフィサー、Aimee Eganは、この革新的なオーディオ技術と豊富で没入感のあるトラックライブラリーの組み合わせが、市場初の製品創出を可能にしたとコメントしている。
ElevenLabsは、テキストから音声への変換、音声クローニング、AIダビングなど、強力なAIオーディオ機能の開発と導入に注力してきた。今回のSound Effectsの発表により、クリエーターが高品質なコンテンツを制作するためのツールがさらに拡充された。同社は今後、音楽生成モデルとボイスオーバースタジオの提供も計画しているが、そのタイムラインは現段階では明らかにされていない。
【ニュース解説】
AIボイススタートアップのElevenLabsが、テキストからサウンドエフェクトを生成する新しいAIツール「Sound Effects」を発表しました。このツールは、ユーザーが想像する音の説明をテキストで入力するだけで、様々なタイプのオーディオサンプルを生成することが可能です。ElevenLabsは、この製品を実現するために、画像や動画のストックメディアを提供するShutterstockと提携しました。この技術は、映画やテレビスタジオ、ビデオゲーム開発者、マーケター、ソーシャルメディアのコンテンツクリエーターなど、幅広い分野のクリエーターによるコンテンツ制作に革命をもたらすことを目指しています。
Sound Effectsツールは、ユーザーが入力したテキストプロンプトに基づいて、6つのユニークなオーディオサンプルを生成します。これにより、雷雨、ドアベル、コインのジャラジャラ音などの標準的な環境音から、猿の鳴き声や車のレース、ダイナーでの人々の食事の音、電車の停止音など、より複雑なサウンドエフェクトまで、幅広いニーズに応えることができます。さらに、このツールは数秒間の音だけでなく、ギターループやジャズサックスソロ、テクノミュージックループなどの楽曲トラックや、さまざまなキャラクターの声も生成する能力を持っています。
この技術の背後にあるモデルは、ElevenLabsの内部研究に基づいており、Shutterstockのライセンスされたトラックのオーディオライブラリーで微調整されています。これにより、市場にはない新しいタイプの製品が生み出され、早期アクセスを得たコミュニティからは既に肯定的なフィードバックが寄せられています。
この技術の導入により、クリエーターはこれまで以上に簡単に、かつ低コストで、自分たちの作品に合ったサウンドエフェクトを追加することができるようになります。これは、特に予算やリソースに限りがある独立系のクリエーターや小規模な制作チームにとって、大きなメリットとなるでしょう。しかし、この技術の普及に伴い、著作権や倫理的な問題、さらには人間の音声や音楽制作の仕事に対する影響など、様々な課題に直面する可能性もあります。これらの問題に対処し、技術の健全な発展を促進するためには、業界全体でのガイドラインの策定や、クリエーター、利用者、法律家などのステークホルダー間での積極的な対話が必要になるでしょう。
ElevenLabsは、テキストから音声への変換、音声クローニング、AIダビングなど、これまでにも強力なAIオーディオ機能の開発と導入に注力してきました。Sound Effectsの発表により、クリエーターが高品質なコンテンツをより簡単に制作できるようになる一方で、今後も音楽生成モデルやボイスオーバースタジオの提供など、新たな技術の開発が期待されます。これらの技術がクリエイティブ産業に与える影響は計り知れず、今後の展開が非常に楽しみです。
from ElevenLabs moves beyond speech with AI-generated Sound Effects.