Di penghujung tahun 2024, markas OpenAI dipenuhi suasana istimewa. Sam Altman, CEO OpenAI, duduk bersama Mark Chen (Head of Frontiers Research di OpenAI), Hongyu Ren(Research Scientist di OpenAI), dan Greg Kamradt(Presiden ARC Prize Foundation). Bukan untuk meeting biasa, tapi untuk memperkenalkan dua bintang baru: o3 dan o3-mini.
Anda bisa melihat mereka disini OpenAI o3 and o3-mini—12 Days of OpenAI: Day 12
Ini seperti momen peluncuran film Avengers baru. Sam, dengan gaya santainya, membuka pembicaraan. Mark, si jenius coding yang ternyata juga seorang coach kompetisi pemrograman, sudah siap dengan data teknis memukau.
Hongyu, yang melahirkan seri model o3, penuh semangat ingin menunjukkan keajaiban karyanya. Sementara Greg, tamu spesial mereka, datang dengan kabar mengejutkan tentang pencapaian o3 dalam tes AI yang selama ini belum pernah bisa ditaklukkan.
Lucu juga, sebenarnya model ini harusnya diberi nama o2 (karena sebelumnya ada o1). Tapi Sam, dengan candaan khasnya, mengakui bahwa OpenAI memang “payah dalam memberi nama”. Seperti restoran yang salah menulis menu tapi makanannya luar biasa — yang penting isinya, kan?
Kemampuan Model o3 yang Bikin Melongo
Yang membuat saya kagum — dari apa yang disampaikan mereka, o3 ini punya kemampuan penalaran yang luar biasa. Bayangkan dia seperti mahasiswa genius yang bisa memecahkan soal olimpiade dengan cara yang sangat sistematis. Dalam tes pemrograman? Skornya 71,7% – naik 20% dari o1. Dalam kompetisi coding, o3 bahkan bisa mengalahkan programmer handal dengan skor ELO 2727!
Tapi yang paling mencengangkan adalah kemampuan matematikanya. Dalam ujian tingkat PhD, o3 mencapai akurasi 87,7%. Untuk memberi gambaran, ini seperti mahasiswa S3 yang bisa mengerjakan soal-soal super rumit dengan mata tertutup. Biasanya, seorang expert PhD pun “hanya” mencapai 70% untuk soal di bidang keahliannya.
Lalu datang Greg Kamradt membawa sebuah teka-teki visual sederhana — seperti puzzle anak-anak, tapi ternyata ini adalah bagian dari tes AI yang sangat serius.
“Lihat kotak-kotak ini,” katanya sambil menunjukkan beberapa pola di layar. “Apa yang hilang?” Saat Sam menjawab “kotak biru di pojok kosong”, Greg tersenyum. Bagi manusia, ini memang relatif mudah. Tapi bagi AI? Ini adalah tantangan yang luar biasa.
ARC AGI— sebuah tes yang dia dan timnya buat sejak 2019, seperti ujian masuk universitas untuk AI. Bedanya, setiap soal menguji kemampuan yang berbeda-beda. Tidak ada pengulangan. AI harus bisa belajar hal baru setiap kali menghadapi soal, persis seperti cara manusia berpikir.
Selama 5 tahun, tak ada AI yang bisa menyelesaikan tes ini dengan baik. Dari 2019 sampai 2024, skor tertinggi hanya 5%. Seperti siswa yang selalu dapat nilai 5 dari 100, sungguh memprihatinkan! Tapi hari itu, Greg membawa kabar menggembirakan. o3 berhasil mencapai skor 75,7% dalam mode saver, dan bahkan 87,5% saat dioptimalkan, melampaui rata-rata manusia yang 85%!
O3-mini: Si Kecil yang Gesit
Hongyu Ren punya cara unik memperkenalkan O3-mini.
“Ini seperti adik O3 yang lebih efisien,” jelasnya sambil tersenyum. Saya terbayang o3-mini seperti motor matic yang gesit, mungkin tidak sekencang moge, tapi jauh lebih praktis untuk dipakai sehari-hari.
Demo langsung yang dilakukan Hongyu bikin semua tercengang. Dengan UI sederhana, o3-mini bisa mengerjakan berbagai tugas dalam hitungan detik. Yang lebih menakjubkan? Dia bahkan bisa mengevaluasi kemampuannya sendiri — bayangkan kalkulator yang bisa mengukur seberapa akurat perhitungannya!
Mark Chen geleng-geleng kepala saat melihat o3-mini mengerjakan soal-soal PhD secepat orang mengetik pesan WhatsApp. “Ini gila,” katanya, “kecepatannya setara GPT-4, tapi dengan kemampuan yang jauh lebih canggih.”
o3-mini juga punya fitur unik: bisa diatur mode berpikirnya — bisa cepat untuk tugas sederhana, bisa lebih mendalam untuk masalah rumit. Seperti mobil dengan tombol Eco, Normal, dan Sport mode. Plus, akan mendukung semua fitur API yang diminta developer selama ini.
Kapan Model o3 Rilis?
OpenAI tidak terburu-buru merilis model ini ke publik. Seperti koki yang mengundang food taster sebelum menu baru diluncurkan, mereka membuka kesempatan untuk pengujian keamanan publik sampai 10 Januari 2025. Mereka bahkan mengembangkan sistem keamanan baru bernama “deliberative alignment” — semacam ‘pagar moral’ yang membuat AI lebih bijak dalam memilah konten aman dan tidak.
Rencananya, o3-mini akan diluncurkan akhir Januari 2025, diikuti o3 tak lama setelahnya. Sambil menunggu, para peneliti security diundang untuk “mencicipi” kemampuan model ini lebih dulu.
Dengan o3 dan o3-mini, OpenAI tidak hanya mendorong batas kemampuan AI, tapi juga memastikan teknologi ini bisa diakses lebih luas dengan tetap memperhatikan aspek keamanan. Seperti kata Greg Kamradt di akhir presentasinya, “Ini masih awal. Kita masih punya banyak PR untuk membuat AI benar-benar cerdas seperti manusia.”
Jadi, siap-siap saja menyambut era baru AI yang lebih pintar, lebih efisien, dan lebih aman di tahun 2025 nanti!
Terimakasih sudah membaca, semoga bermanfaat.