OpenAI Rilis GPT-4o, Bawa Kemampuan Asisten Suara Mirip Film Her


Jakarta, Gizmologi – Ketika Google sedang mempersiapkan acara tahunan Google I/O yang kemudian bakal disusul oleh Apple dengan WWDC, kemarin (13/5) merupakan saat yang tepat bagi OpenAI untuk merilis model baru mereka, yakni GPT-4o yang bisa diakses langsung dari ChatGPT. Dibandingkan model sebelumnya, ada banyak peningkatan yang dihadirkan, termasuk mode suara lebih natural.

GPT-4o sendiri merupakan model flagship terbaru dari OpenAI, versi lebih sempurna dari GPT-4 Turbo, dengan kapabilitas yang lebih kencang namun juga lebih ringan. Tidak hanya untuk mereka yang berlangganan, model GPT-4o nantinya juga bisa diakses oleh mereka pengguna gratisan ChatGPT—menjadi tujuan utama perusahaan untuk hadirkan kecerdasan buatan yang bisa diakses lebih banyak orang.

Sam Altman, CEO OpenAI mengatakan bila konsep awal saat memulai OpenAI adalah menciptakan AI dan menggunakannya untuk menciptakan beragam manfaat untuk dunia. “Sebaliknya, sekarang sepertinya kita akan menciptakan AI dan kemudian orang lain akan menggunakannya untuk menciptakan beragam hal menakjubkan, yang bisa memberikan manfaat bagi kita semua.”

Baca juga: Google Gemini Resmi Diluncurkan, Model AI Generatif Pesaing ChatGPT!

GPT-4o Mendukung Voice Mode yang Jauh Lebih Canggih

Lebih lanjut tentang kehadiran GPT-4o, Sam mengatakan lewat blog pribadinya bila selain nantinya bakal tersedia untuk semua pengguna, peningkatan signifikan lainnya adalah mode audio (suara) dan video baru dengan tampilan antarmuka sangat mudah, serta pengalaman serupa asisten suara canggih di film Her (2013). Hal tersebut pun dibuktikan langsung pada sesi pengenalan GPT-4o secara live.

Asisten suara yang ada saat ini, termasuk asisten Google dan Siri, memerlukan input suara satu per satu dan bergantian, dengan jeda sekian detik yang masih kurang natural. Dalam demo yang dipertunjukkan di atas, ChatGPT ingin membuktikan bila GPT-4o bisa berikan gaya obrolan lebih natural.

Kini pengguna tak lagi perlu menunggu hingga model AI selesai berbicara, alias mereka dapat melakukan interupsi dan input pengguna akan didengar dan diproses secara real-time, begitu pula dengan gabungan input foto serta video. Bahkan respons yang diberikan hanya memiliki jeda sekitar 320 milidetik, setara kecepatan respons antar manusia.

GPT-4o memanfaatkan model baru yang mendukung input teks, kamera, dan audio secara end-to-end dalam neural network yang sama, sehingga kini mampu mendukung lebih dari satu input suara berbeda, memberikan maupun mendeteksi ekspresi emosi. Hal ini bermanfaat termasuk ketika digunakan sebagai penerjemah real-time antar dua pembicara dengan bahasa masing-masing.

Contoh pemanfaatan GPT-4o lainnya adalah dengan menunjukkan pertandingan olahraga melalui kamera video, dan meminta ChatGPT untuk menjelaskan peraturan olahraga tersebut secara real-time. Bakal hadir untuk semua pengguna, anggota ChatGPT Plus mendapatkan benefit untuk mengaksesnya lebih awal.

Bakal Hadir ke Semua Pengguna, Pelanggan ChatGPT Plus Bisa Akses Duluan

Kemampuan berbasis teks maupun gambar dari GPT-4o sudah bisa diakses saat ini juga melalui ChatGPT, termasuk pengguna gratisan dan anggota Plus dengan benefit limit lima kali lebih besar. Voice Mode terbaru siap hadir dalam bentuk alpha pada pengguna Plus beberapa pekan ke depan.

Selain itu, bagi para pengembang, API untuk GPT-4o diklaim dua kali lebih kencang, harga 50% lebih murah, dengan limit lima kali lebih tinggi dibandingkan GPT-4 TUrbo sebelumnya. ChatGPT dengan GPT-4o juga mulai dihadirkan dalam bentuk aplikasi dekstop, hadir lebih dulu untuk macOS dengan pintasan mudah melalui perintah Option + Space pada keyboard.

ChatGPT Desktop untuk macOS mulai tersedia untuk pengguna Plus hari ini, dan ke depannya akan dihadirkan ke lebih banyak pengguna dalam beberapa pekan ke depan. Sementara untuk Windows PC, bakal diluncurkan sepanjang tahun ini. Tidak hanya aplikasi, tampilan ChatGPT juga dibuat lebih simpel di semua platform.


Dilansir dari dan telah tayang di: https://gizmologi.id/news/openai-rilis-gpt-4o/