Internasional Alat baru OpenAI memungkinkan Anda membuat video realistis dengan mengetikkan kalimat

Alat baru OpenAI memungkinkan Anda membuat video realistis dengan mengetikkan kalimat

2
0

Seekor anjing Samoyed dan Golden Retriever bermain-main di kota neon futuristik di malam hari.

OpenAI

OpenAI, yang menjadi populer tahun lalu berkat popularitas ChatGPT, menghadirkan teknologi kecerdasan buatannya ke dalam video.

Pada hari Kamis, perusahaan memperkenalkan Sora, model AI generatif barunya. Sora bekerja mirip dengan alat AI penghasil gambar OpenAI, DALL-E. Pengguna mengetik adegan yang diinginkan dan Sora akan mengirimkan kembali klip video definisi tinggi. Sora juga dapat menghasilkan klip video yang terinspirasi oleh gambar diam, memperluas video yang ada, atau mengisi bingkai yang hilang.

Video bisa menjadi garda depan bagi AI generatif setelah chatbots dan pembuat gambar telah memasuki dunia konsumen dan bisnis. Meskipun peluang kreatif akan menggairahkan para penggemar AI, teknologi baru ini menimbulkan masalah disinformasi yang serius menjelang pemilu politik besar di seluruh dunia. Jumlah deep fake yang dihasilkan oleh AI meningkat sebesar 900% dari tahun ke tahun, menurut data dari Clarity, sebuah perusahaan pembelajaran mesin.

Dengan Sora, OpenAI ingin bersaing dengan alat AI generasi video dari perusahaan sejenis Meta Dan Google, yang diumumkan Lumiere pada bulan Januari. Alat AI serupa juga tersedia dari startup lain, seperti Stability AI, yang memiliki produk bernama Stable Video Diffusion. Amazon juga merilis Create with Alexa, model yang berspesialisasi dalam pembuatan konten animasi anak-anak berdurasi pendek berbasis cepat.

Sora saat ini terbatas pada pembuatan video yang berdurasi satu menit atau kurang. OpenAI, didukung oleh Microsofttelah menjadikan multimodalitas – kombinasi pembuatan teks, gambar, dan video – sebagai tujuan dalam upayanya menawarkan model AI yang lebih luas.

“Dunia ini multimodal,” kata Brad Lightcap, chief operating officer OpenAI, kepada CNBC pada bulan November. “Jika Anda berpikir tentang cara kita sebagai manusia memproses dunia dan berinteraksi dengan dunia, kita melihat sesuatu, kita mendengar sesuatu, kita mengatakan sesuatu — dunia ini jauh lebih besar daripada teks. Jadi bagi kami teks selalu terasa tidak lengkap dan kode menjadi satu-satunya modalitas, satu-satunya antarmuka yang dapat kita miliki untuk mengetahui seberapa kuat model ini dan apa yang dapat mereka lakukan.”

Sora sejauh ini hanya tersedia untuk sekelompok kecil penguji keamanan, atau “petugas tim merah”, yang menguji model untuk mengetahui kerentanan di berbagai bidang seperti misinformasi dan bias. Perusahaan tersebut belum merilis demonstrasi publik apa pun selain 10 sampel lagu yang tersedia di situs webnya, dan dikatakan bahwa makalah teknis yang menyertainya akan dirilis Kamis malam.

OpenAI juga mengatakan sedang membangun “pengklasifikasi deteksi” yang dapat mengidentifikasi klip video yang dibuat oleh Sora, dan berencana untuk memasukkan metadata tertentu dalam keluarannya yang akan membantu mengidentifikasi konten yang dibuat oleh AI. Ini adalah jenis metadata yang sama yang Meta ingin gunakan pada tahun pemilu ini untuk mengidentifikasi gambar yang dihasilkan AI.

Sora adalah model AI difusi yang, seperti ChatGPT, menggunakan arsitektur Transformer, yang diperkenalkan oleh peneliti Google dalam makalah tahun 2017.

“Sora berfungsi sebagai landasan bagi model yang dapat memahami dan mensimulasikan dunia nyata,” tulis OpenAI dalam pengumumannya.

LIHAT: OpenAI sedang menuju ‘terobosan teknologi sejati’

OpenAI sedang menuju 'terobosan teknologi sejati' dengan AGI, kata Geoff Lewis dari Bedrock

Jangan lewatkan cerita ini dari CNBC PRO:

Tinggalkan Balasan