Rumah > Menemukan > Google DeepMind Memperkenalkan Alat AI Inovatif untuk Pembuatan Soundtrack Video

Google DeepMind Memperkenalkan Alat AI Inovatif untuk Pembuatan Soundtrack Video

Ditulis oleh
ArticleGPT

Ditinjau dan diperiksa faktanya oleh Tim HIX.AI

2 menit membacaJun 21, 2024
Google DeepMind Memperkenalkan Alat AI Inovatif untuk Pembuatan Soundtrack Video

Pendeknya

Google DeepMind telah meluncurkan alat AI baru yang membuat soundtrack video dengan mempertimbangkan perintah teks dan konten video.

Google DeepMind telah memperkenalkan alat AI inovatif untuk menghasilkan soundtrack video. Alat canggih ini menggabungkan perintah teks dan konten video itu sendiri untuk membuat soundtrack yang menawan dan disesuaikan, dan ada juga perintah teks opsional yang dapat diberikan pengguna untuk mendeskripsikan elemen audio yang diinginkan.

Dengan menggabungkan kedua elemen tersebut, pengguna kini dapat menghasilkan adegan dengan “skor drama, efek suara realistis, atau dialog yang sesuai dengan karakter dan nada video”.

Contoh Soundtrack yang Dibuat Menggunakan Alat AI

Untuk mengilustrasikan kemampuan alat AI DeepMind, beberapa contoh telah dipamerkan di situs web perusahaan.

Dalam satu contoh, video yang menampilkan mobil melaju melalui kota cyberpunk dipasangkan dengan teks yang menyertakan frasa seperti "mobil tergelincir", "pelambatan mesin mobil", dan "musik elektronik yang indah". Audio yang dihasilkan tersinkronisasi sempurna dengan pergerakan mobil, menciptakan pengalaman yang menggembirakan.

Dalam contoh lain, perintah yang menyertakan istilah seperti "ubur-ubur berdenyut di bawah air", "kehidupan laut", dan "lautan" menghasilkan lanskap suara bawah air yang imersif.

Fitur Lain dari Alat Pembuatan Soundtrack ini

Alat ini dapat secara mandiri menghasilkan soundtrack dalam jumlah tak terbatas untuk video. Fleksibilitas ini membuatnya menonjol dari alat AI lainnya di pasar.

Variasi dalam opsi audio ini memungkinkan pengguna menjelajahi beragam kemungkinan untuk video mereka. Ini menghilangkan kebutuhan akan sinkronisasi audio yang cermat, menawarkan peluang kreatif tanpa akhir kepada pengguna.

DeepMind mengklaim bahwa alat AI-nya dilatih pada video, audio, dan anotasi dengan “deskripsi rinci tentang suara dan transkrip dialog lisan.” Pelatihan komprehensif ini memungkinkan generator video-ke-audio menghubungkan audio dengan skenario visual secara sempurna.

DeepMind menyadari tantangan dalam menyinkronkan gerakan bibir dengan dialog dalam generasi video-ke-audio. Perusahaan secara aktif berupaya menyempurnakan aspek alat ini, yang bertujuan untuk mencapai sinkronisasi yang mulus antara elemen visual dan pendengaran.

Kualitas video input dapat mempengaruhi output audio secara signifikan. Rekaman yang berbintik atau terdistorsi, menurut DeepMind, dapat mengakibatkan penurunan kualitas audio secara signifikan. Pengguna didorong untuk menyediakan video berkualitas tinggi untuk memastikan sinkronisasi dan fidelitas audio yang optimal.

Perbandingan dengan Alat AI Lainnya di Industri

Alat AI soundtrack video DeepMind membedakan dirinya dari alat lain di industri ini, seperti generator efek suara ElevenLabs.

Meskipun ElevenLabs hanya mengandalkan perintah teks, alat DeepMind menggabungkan piksel video dan perintah teks, menawarkan pengalaman audio yang lebih komprehensif dan mendalam kepada pengguna.

Alat AI DeepMind berpotensi meningkatkan kolaborasi dengan alat video lain yang dihasilkan AI seperti Veo dan Sora. Platform ini dapat memanfaatkan alat DeepMind untuk menyematkan audio tersinkronisasi ke dalam kemampuan pembuatan videonya, sehingga memberikan pengalaman multimedia yang lebih kohesif dan mendalam.

Google DeepMind menyertakan tanda air SynthID dalam keluaran audio yang dihasilkan AI untuk tujuan transparansi dan pengenalan. Tanda air ini berfungsi sebagai bendera yang menandakan bahwa audio tersebut dihasilkan menggunakan teknologi AI.

Berdasarkan 3 sumber pencarian

3 sumber

Google DeepMind’s new AI tool uses video pixels and text prompts to generate soundtracks

The new video-to-audio tool will automatically match sounds to the appropriate scenes.

Google DeepMind Unveils AI Tool That Uses Video Pixels and Text Prompts to Generate Soundtracks

Google DeepMind has unveiled a groundbreaking AI technology designed to generate customized video soundtracks. This innovative tool goes beyond text-prompt generation by taking into account the visual content of the video itself.

Google DeepMind unveils V2A, a new AI model that can generate soundtrack and dialogue for videos

Video generation models like Sora, Dream Machine, Veo and Kling are advancing at a rapid pace, allowing users to generate videos from text prompts. But, the majority of these systems are limited to silent videos.

Di halaman ini

  • Contoh Soundtrack yang Dibuat Menggunakan Alat AI
  • Fitur Lain dari Alat Pembuatan Soundtrack ini
  • Perbandingan dengan Alat AI Lainnya di Industri