13 Mayıs Pazartesi günü Türkiye saati ile 21.00 sularında genel izleyici kitlesi ekranları başında Kızıl Goncalar’ın Cüneyd’inin izhar ettiği kerametleri izlerken; teknoloji ve yapay zeka meraklıları aynı saatlerde dünyaca ünlü yapay zeka şirketi OpenAI’ın lansmanında, tıpkı birkaç gün önce Reuters’un “arama motoru yayınlayacaklar iddiasına verdiği cevapta OpenAI CEO’su Sam Altman’ın belirttiği gibi “sihir gibi bir şey” izlediler.
Şirketin San Francisco ofisinde bir talk show tadında gerçekleşen lansmanda, baş teknoloji sorumlusu, Arnavutluk asıllı Mira Murati ve ekibi yapay zekanın “sihir gibi” yeni kerametlerini, dünyanın her yerinden ağzı açık bir şekilde ekranları başına mıhlanmış seyirciler için birbiri ardına sıraladılar.
Bahar Güncellenmesi (Spring Update) adıyla duyurulan lansman bir bahar temizliği misali tüm soru işaretlerini, dedikoduları sildi süpürdü. Mira Murati’nin ve OpenAI’dan iki araştırmacının katıldığı sunumda tüm demolar ekranın sol üst köşesine iliştirilmiş “Live” ibaresi ile yapıldı.
Bunun aslında hususi bir anlamı var, OpenAI son modelini, GPT 4’ü, bundan yaklaşık 14 ay önce Mart 2023’de duyurmuştu. GPT 4’ün hemen akabinde Google’ın duyurduğu Gemini modeli nefesleri kesen örneklerle GPT 4’ü gölgede bıraksa da, çok geçmeden Google’ın paylaştığı demo görüntülerinin bir prodüksiyon ürünü olduğu iddiaları dolaşmaya başladı. Ekranın sol köşesinde izleyicilere göz kırpan “Live” ibaresi bir nevi bu yaşanan hadiseye bir göndermeydi.
Sadece bu kadar da değil, Mira Murati izleyicilerden gelen simültane tercüme(anında çeviri) demo talebine de bizzat İtalyanca konuşarak eşlik etti.
OpenAI’ın Bahar Güncellemesi’nde mevcut ürün ve servislerde yapılacak güncellemelere ek olarak GPT4o adı verilen yeni modelin tanıtımı da yapıldı. OpenAI’ın yeni amiral gemisi olarak duyurduğu GPT4o, bugüne dek başarım testlerinde üst sıralardaki yerini koruyan GPT4’den iki kat daha hızlı ve yüzde 50 daha ucuz olacak bir çoklu model.
GPT4’ün yanına iliştirilen “O” harfi de aslında çok yönlü, her şey anlamına gelen Omni kelimesine işaret ediyor. Bu yeni model, tıpkı selefi GPT4 gibi, metin, ses ve görsel işleyip, yanıt verebiliyor.
Sadece bu kadar da değil, GTP4o ile birlikte telsiz telefonlardan aşina olduğumuz half duplex, bas konuş, tarzı bir iletişim yerine; insani iletişime en yakın, kesintisiz, araya girip hızlıca soru sorup yorum katabileceğiniz diyaloglar da GPT4o modeliyle kurulabiliyor. OpenAI’ın açıkladığı başarım testi sonuçlarına göre GPT4o yaklaşık 250 milisaniyede yanıt dönebiliyor. Bu biz insanlar arasındaki iletişimde yaşanan gecikme süresine en yakın oran.Dolayısıyla lansmanı izleyen pek çok Twitter kullanıcısının belirttiği gibi, bir metin yazarı ile yapay zekanın aşkını konu edinen “Her” filminin gerçek olabileceğini rahatlıkla söyleyebiliriz.
Şirketin yeni amiral gemisi olarak lanse ettiği GPT4o modelinin iki önemli özelliği daha var: Windows ve MacOS işletim sistemleri için duyurulan masaüstü ChatGPT uygulaması. Bu uygulamayı GPT4o’nun yeteneklerini parlatan, kullanıcı ile yapay zeka arasındaki işbirliğini kolaylaştıran enstrümanlar olarak düşünebiliriz. Masaüstü ve güncellenen mobil uygulama sayesinde GPT modeliyle ekranınızı paylaşabilecek, sesli olarak iletişim kurabileceksiniz.
GPT4o modeli ilerleyen günlerde, belirli limitler dahilinde ücretsiz olarak kullanıcılara sunulacak. Hem lansman esnasında, hem de OpenAI şirketinin yeni model duyurusunda yer alan demolar, GPT4o’un bir “game changer” olacağının ispatı niteliğinde.
Nitekim Khan Academy’nin kurucusu Salman Khan’ın oğlu ile birlikte yaptığı demoda GPT4o’yu bir özel öğretmen rolünde görüyoruz. Khan’ın oğlunun bir kağıt üzerinde çözmeye çalıştığı geometri sorusuna GPT4o sorularıyla yön verip, belki birkaç gün önce izlesek çevrimiçi bir özel ders seansı olabileceğini düşüneceğimiz bir deneyimi bizlerle sunuyor.
OpenAI’ın yayınladığı videolarda en dikkat çeken husus sesli tur rehberlerinin, ve hatta belki de turist rehberlerinin yerini alacak özelliklerin tanıtım videoları oldu. BeMyEye ile OpenAI’ın işbirliğini vurgulayan başka bir video ise, telefon kamerasından çevredeki olan biteni izleyerek sesli talimatlar veren GPT4o modelinin engelli kişiler için sosyal yaşamdaki erişilebilirlik imkânlarını attıracağına dair umutlarımızı pekiştiriyor.
“Sihir gibi bir şey” olarak günler öncesinden spoiler’ı verilen bu etkinliği izleyen herkesin sorduğu bir soru, cevaplanmayı bekliyor.
Kullanıcılara sunulacak model de bu kadar hızlı mı olacak, yoksa bu demo gününe özel, çalışılmş bir senaryo mu? Bunu tabii ki bilmek imkânsız, ama lansman sonunda Murati’nin Nvdia’ya demoları mümkün kılan yüksek performanslı GPU’ları vererek destek oldukları için yaptığı teşekkür, hız konusunda emin olmak için biraz daha beklemek gerektiğini gösteriyor.