Bir önceki gün gerçekleşen OpenAI’ın sunumundaki talk show havası, günlük kıyafetlerden ziyade daha resmi bir havanın hakim olduğu etkinlikte, Google yetkilileri “biz buradayız” dercesine ciddiyetle sunumlarını gerçekleştirdiler. 2 saat süren etkinlik boyunca şirketin yapay zeka konusundaki gelişmeleri, yeni donanım geliştirmeleri bir bir duyuruldu.
Tıpkı geçen yıl olduğu gibi bu yıl da sessiz ve derinden geliştirmelerini sürdüren Google ekibi tüm sürprizleri Mayıs ayındaki lansmana saklamışlar besbelli. OpenAI ‘dan farklı olarak Google yaptığı geliştirmeleri IO etkinliğinde duyurmayı tercih ediyor. Nitekim dünkü toplantıda tanıtılan Project Astra, Veo, LearnLM gibi yeni teknolojiler bugüne dek sadece şirket çalışanlarının bildiği sır olarak kalmayı başardılar.
Her ne kadar kendini bir veri şirketi olarak tanımlasa da Google, rakipleri arasındaki güçlü bulut bilişim aktörlerinden biri. Dünkü toplantıda tanıtılan 6’ıncı nesil Trillion isimli işlemciler de “siz ne yaparsanız yapın, bu yenilikler benim donanımlarım üzerinde koşacaklar” iddiasının resmi bir dille ispatı gibiydi. Google bu son etkinliğinde de “mekanın sahibi” olduğunu bir kez daha kanıtladı diyebiliriz.
Geçen yıl duyurulan Gemini modeliyle ilgili de dikkat çeken yenilikler paylaşıldı. Gemini 1.5 sürümüyle birlikte kullanıcıların verebileceği girdi boyutlarında radikal bir artışa giden Google 2 milyon tokenlık (kelime diye düşünebilirsiniz.) bir girdi boyutunu hedeflediklerini belirtti. Etkinlik sonrası geliştirmeler aralarında Türkiye’nin dahil olduğu 130 ülkede Gemini Advanced kullanan ücretli üyelere açıldı bile. An itibariyle 1 milyon token olarak belirtilen girdi boyutu yaklaşık 1.500 sayfalık bir PDF dosyasını Gemine’ye yükleyip bu modele dosya hakkında sorular sorup, özetler alabileceğimizin göstergesi.
OpenAI’ın metinden video üretebilen Sora modeli epey ses getirse de uzun bekleyişe rağmen hâlâ genel kullanıma açılabilmiş değil. Google bir hamle yaparak Veo isimli metinden sinematik videolar üreten modelini dünkü toplantıda alkışlar eşliğinde duyurdu. Sadece metinden video üretmekle kalmıyor, aynı zamanda videonun süresini de tek bir tuşla uzatabiliyorsunuz.
Büyük bir arama şirketi olmanın tüm avantajlarını kullanan Google Gemini’in Google arama sonuçlarının zenginleştirilmesinde de kullanılacağının sinyallerini dünkü toplantıda vermiş oldu. Her ne kadar Microsoft, Edge tarayıcılarla entegre halde gelen Copilot ile aylar öncesinden kullanıcılara bu imkânı sunmuş olsa da, Google en güçlü arama motoru olarak kısa zamanda üstünlük sıralamasında bazı değişikliklere yol açabilir. Google bu hamle ile webte arama yaparak bir kolaj oluşturan Perplexity gibi şirketlerin de tahtını sarsabilir.
Toplantıda özellikle vurgulanan 2 milyardan fazla kullanıcıya Google servisleri ile ulaşan Gemini; eposta, takvim, Google fotoğraflar gibi hayatımızın bir parçası olan servislerde de etkin olmaya devam edecek. Buna göre X bir kişiden ya da kurumdan son 1 haftada gelen okunmamış epostaların özetlerini bir kere de yapay zeka asistanımızdan isteyebileceğiz.
13 Mayıs’taki toplantısında GPT4o’nun yetenekleriyle yürekleri ağızlara getiren OpenAI’ın görüntü ve ses işleyebilen asistanına karşılık Project Astra ile veriliyor. Her ne kadar GPT4o gibi doğal bir ses yerine robotik bir sesi olsa da oturum boyunca sunulan tanıtım videolarında benzer faydalar üretebileceğini düşündürüyor Project Astra.
Kişiselleştirilmiş chat robotları geliştirme imkanını aylar öncesinden OpenAI, GPTs özelliği ile pro kullanıcılarına armağan etmişti. Google da bu hamleye Gems özelliği ile karşılık veriyor. Kullanıcılar Gems ile kendi kişiselleştirilmiş sohbet robotlarını üretebilecekler.
Beni en çok heyecanlandıran ise LearnLM oldu. Gemini tabanlı bu özetlik Youtube’daki eğitim videolarında aktifleşecek ve video hakkında sorular sormanıza, ek açıklamalar istemenize ve hatta videodaki bilgilerden hareketle bir test yapmanıza da olanak sağlayacak.
Son olarak boyutları her gün daha da küçülen dil modellerinin ne zaman taşınabilir cihazlarımızda kullanabileceğimiz merak konusu idi. IO etkinliğinde Google Android işletim sistemi çekirdeğinde ve yeni cihazlarda dil modellerinin olacağının da müjdesini vermiş oldu.
Öyle görünüyor ki yapay zeka alanındaki gelişmeler birbiri ardına gelmeye devam edecek. Devlerin güç gösterisinde ucuzlayan servis fiyatları ile son kullanıcılar olarak bizler yapay zekanın nimetlerinden daha fazla istifade ediyor olacağız. Nitekim OpenAI’ın GPT4o modelinin 2 kat daha hızlı ve GPT 4 modelinden yarı yarıya daha ucuz olması bu iddiamızı doğrular nitelikte.