Google Memperkenalkan Veo, AI untuk Membuat Video dari Teks, Sebagai Pesaing Sora



Google Memperkenalkan Veo, AI untuk Membuat Video dari Teks, Sebagai Pesaing Sora


Pada pertemuan Google I/O 2024 yang digelar pada Rabu (15/5/2024) waktu setempat, DeepMind, bagian dari Google yang berfokus pada penelitian dan pengembangan kecerdasan buatan (artificial intelligence/AI), mempersembahkan inovasi terbaru mereka, yakni model AI generatif yang diberi nama Veo, kepada publik.


Veo, sebuah kecerdasan buatan, memiliki kemampuan untuk menghasilkan video berdasarkan anjuran teks (prompt) yang diterima dari penggunanya.


Veo beroperasi dalam gaya serupa dengan instrumen kecerdasan buatan lainnya yang mengubah teks menjadi video, seperti Sora yang dioperasikan oleh OpenAI dan Make-A-Video yang dipandu oleh Meta.


Perusahaan raksasa teknologi Google, sudah dikenal memiliki sebuah perangkat keras AI dengan identitas 'Lumiere'. Meski demikian, Veo, yang masih dalam lingkup perusahaan yang sama, dianggap unggul berkat kemampuannya menghasilkan video berstandar tinggi dengan kualitas mencapai 1080p serta durasinya yang dapat mencapai hingga 60 detik.


Durasi video ini sebanding dengan kualitas Sora, yang jelas lebih canggih dibanding dengan fitur Make-A-video atau Lumiere yang hanya menawarkan durasi video hingga 5 detik.


"Veo memiliki kapasitas untuk menghasilkan film berdefinisi tinggi 1080p dengan variasi estetika dan presentasi visual yang melampaui satu menit," ujar Demis Hassabis, Pemimpin Utama dari Google DeepMind.


Diklaim dapat menciptakan video dengan tingkat ketajaman, kualitas, dan keakuratan yang impresif, Veo juga menyandang kemampuan untuk memanjangkan durasi rekaman. Tak hanya itu, aplikasi ini juga menawarkan fitur peningkatan visual dalam bentuk gaya sinematik dan animasi yang dapat disesuaikan sesuai dengan preferensi pengguna.


Dalam sebuah cuitan di platform Twitter, Google telah memamerkan kecakapan teknologi Veo melalui akun bernama @GoogleDeepMind.


Dalam sebuah video yang diunggah oleh Google, terpampang sebuah kreasi visual yang disajikan oleh Veo, memperlihatkan kendaraan bergerak dalam lingkungan perkotaan masa depan yang terbentuk dengan kerlipan lampu berbagai warna dan dibalut kabut malam.


Sebagai penutup cuplikan video, kendaraan yang difokuskan kemudian menembus tabir terowongan, dan saat muncul di ujung lain, kota bertransformasi menjadi pemandangan siang hari yang ramai, penuh perkawasan dengan mobil yang berlalu lalang dan struktur gedung menjulang tinggi.


Rekaman video yang mencakup waktu sekitar 60 detik tersebut merupakan produk dari petunjuk sebagai berikut:



Menggunakan sorotan kilat melintasi ramai gerumbul distopia yang dipenuhi dengan tanda neon berkilau, mobil terbang dan kabut, malam, cahaya lensa menghujam, pencahayaan volumetrik yang dramatis.


Suatu bidikan cepat melesat melintasi hembusan dystopian futuristik yang diterangi dengan papan reklame neon berkilauan, kapal antariksa yang menghiasi langit malam, dan pencahayaan tiga dimensi.


Sebuah hologram neon dari sebuah mobil yang melaju dengan kecepatan maksimal, kecepatan cahaya, menampilkan presentasi visual sinematik dengan detail menakjubkan dan pencahayaan volumetrik.


Mobil-mobil tersebut menerobos keluar dari terowongan, kembali ke kehidupan nyata di kota Hongkong.


Dalam tahap saat ini, Veo hanya dapat diakses oleh para pembuat konten terpilih dalam jumlah terbatas. Bagi Anda yang berminat untuk mencoba generator video AI ini dapat mengakses tautan di bawah ini, masuk menggunakan akun Google Anda dan bergabung dalam daftar antrean uji coba Veo.



Adapun rencana dari Veo untuk meluaskan jangkauannya kepada sejumlah pengguna yang lebih besar di masa yang akan datang, serta fungsi utamanya yang akan berada dalam fitur pembuat video di lingkungan YouTube Shorts.


Menggantikan rilis AI text-to-video sebelumnya, Google kini memperkenalkan Veo, model AI generasi kedelapan yang khusus dirancang untuk fungsionalitas tersebut. Veo dihargai sebagai model AI text-to-video yang lebih unggul dibandingkan model-model Google sebelumnya.


Google telah secara konsisten mengembangkan berbagai model text-to-video berbasis Kecerdasan Buatan (AI) yang impresif. Serangkaian inovasi terus berlanjut dengan pemunculan Generative Query Network pada 2018, yang disusul oleh DVD-GAN tahun berikutnya. Tidak lama kemudian, Imagen Video dan Phenaki muncul pada tahun 2022 yang memperkaya portofolio tersebut. WALT (2023), VideoPoet (2024), dan Lumiere (2024) menjadi tambahan terbaru dalam lini inovasi model AI ini.


LihatTutupKomentar