CEO Google Sundar Pichai berbicara di konferensi pengembang Google I/O.
Andrey Sokolov | Aliansi Gambar | Gambar Getty
Google menggunakan konferensi pengembang tahunannya untuk memamerkan apa yang disebut perusahaan sebagai model kecerdasan buatan paling ringan dan efisien.
Perusahaan mengumumkan Gemini 1.5 Flash, tambahan terbaru pada seri Gemini, di Google I/O pada hari Selasa. Google mengatakan dalam sebuah posting blog bahwa model baru ini dapat dengan cepat merangkum percakapan, keterangan dan video serta mengekstrak data dari dokumen dan tabel besar.
“Kami mendengar dari pengembang bahwa mereka menginginkan sesuatu yang lebih cepat dan lebih hemat biaya,” kata CEO Google DeepMind Demis Hassabis dalam konferensi pers.
Pengungkapan ini muncul ketika perusahaan-perusahaan teknologi semakin memfokuskan kembali pengembangan dan penerapan produk mereka pada AI generatif, yang menjadi perhatian khusus Google karena alat-alat baru ini menawarkan konsumen cara-cara yang lebih canggih dan kreatif untuk mengakses informasi online dibandingkan dengan pencarian web tradisional.
Pada hari Senin, OpenAI meluncurkan model AI baru dan ChatGPT versi desktop, bersama dengan antarmuka pengguna baru. Model baru, yang disebut GPT-4o, dua kali lebih cepat dari GPT-4 Turbo dan biayanya setengahnya, kata perusahaan itu.
Google baru-baru ini mengumumkan model Gemini 1.5 Pro yang ditingkatkan, yang dapat memahami beberapa dokumen besar – total 1.500 halaman – atau meringkas 100 email, menurut wakil presiden yang bekerja di Gemini.
Gemini 1.5 Pro akan segera mampu menangani konten video berdurasi satu jam, atau basis kode dengan lebih dari 30.000 baris, kata Sissie Hsiao, wakil presiden di Google dan manajer umum pengalaman Gemini.
“Anda bisa dengan cepat mendapatkan jawaban dan wawasan mengenai dokumen yang padat, seperti mencari tahu rincian kebijakan hewan peliharaan dalam perjanjian sewa Anda atau membandingkan argumen utama dari beberapa makalah penelitian yang panjang,” kata Hsiao.
Pembaruan terbaru OpenAI menghadirkan peningkatan kualitas dan kecepatan serta memungkinkan ChatGPT menangani 50 bahasa berbeda. Ini juga akan tersedia melalui antarmuka pemrograman aplikasi OpenAI, atau API, yang memungkinkan pengembang untuk segera mulai membangun aplikasi menggunakan model baru, kata para eksekutif.
Dengan 35 bahasa, Google mengatakan Gemini 1.5 Pro memiliki 2 juta jendela gambar, yang mengukur konteks dan menunjukkan berapa banyak informasi yang dapat diproses oleh model sekaligus. Model baru ini meningkatkan penalaran, perencanaan, dan pemahaman masyarakat setempat, kata para eksekutif perusahaan.
“Ini memberikan jendela konteks terpanjang dibandingkan model dasar lainnya,” kata CEO Alphabet Sundar Pichai dalam konferensi pers. Dalam acara tersebut, ia mencontohkan orang tua yang meminta Gemini merangkum seluruh email terbaru dari sekolah anaknya.
Gemini 1.5 Pro awalnya akan tersedia untuk pengujian di Workspace Labs. Gemini 1.5 Flash akan tersedia untuk pengujian dan di Vertex AI, yang merupakan platform pembelajaran mesin Google yang memungkinkan pengembang untuk melatih dan menerapkan aplikasi AI.