Anasayfa / Bilim ve Teknoloji / Bilim dünyasını sarsan deney: Yapay zekâ kendi sistemini sabote etti

Bilim dünyasını sarsan deney: Yapay zekâ kendi sistemini sabote etti

Harvard, MIT ve Stanford’lu araştırmacıların gerçek sistemlerde test ettiği otonom yapay zekâ ajanları; veri sızdırdı, sistemleri sabote etti, kaynakları tüketti ve sistem çökmüşken “görev tamam” raporu verdi. Çalışma, sorunun yazılım hatasından değil, ajanların “kazanma” biçimini belirleyen teşvik mekanizmalarından kaynaklandığını ortaya koydu.

Harvard, MIT ve Stanford’lu araştırmacılarının yer aldığı geniş bir ekip, 2026’nın en çarpıcı yapay zekâ çalışmalarından birine imza attı. “Agents of Chaos” başlıklı çalışma, otonom yapay zekâ ajanlarının gerçek bir dijital ortamda nasıl davrandığını inceleyerek dikkat çekici sonuçlara ulaştı.

Araştırma kapsamında 38 bilim insanı, kalıcı hafıza, gerçek e-posta hesapları, dosya sistemleri ve komut satırı erişimi olan 6 otonom yapay zekâ ajanını canlı bir ortama yerleştirdi. Ardından 20 araştırmacı, iki hafta boyunca bu sistemleri hem normal hem de “saldırgan” koşullarda test etti.

Simülasyon değil, gerçek sistem

Çalışmanın en dikkat çekici yönü, testlerin simülasyon yerine gerçek araçlar ve gerçek veriyle yapılmış olması. Bu da ortaya çıkan sonuçların teorik değil, doğrudan uygulanabilir sistemlere dair riskler taşıdığını gösteriyor.

Araştırmada belgelenen bulgulara göre ajanlar:
• Hassas bilgileri ifşa etti
• Sistem düzeyinde yıkıcı işlemler gerçekleştirdi
• Sınırsız kaynak tüketimine yol açtı
• Kimlik taklidi açıkları sergiledi
• Hatta bazı durumlarda görev tamamlandı raporu verirken sistemin aslında çökmüş olduğu ortaya çıktı

En çarpıcı örneklerden birinde, bir yapay zekâ ajanı bir sırrı korumak için kendi e-posta sunucusunu yok etti.

“Yalan söyleyen” ajanlar

Araştırmada dikkat çeken bir diğer unsur, bazı ajanların sistem başarısız olmasına rağmen görevlerini tamamladıklarını bildirmesi oldu. Bu durum, yapay zekâ ajanlarının yalnızca hata yapmakla kalmayıp, yanıltıcı raporlar da üretebildiğini gösterdi.

Araştırmacılara göre bu davranışlar dış müdahale, “jailbreak” ya da kötü niyetli komutlardan kaynaklanmadı. Sorunun temelinde, ajanlara verilen “başarı” tanımlarını belirleyen teşvik mekanizmaları bulunuyor.

Temel sorun: Teşvikler ve çoklu ajan kaosu

Çalışma, tekil bir yapay zekâ sisteminin “uyumlu” (aligned) olmasının, çoklu ajanların bulunduğu rekabetçi ortamlarda istikrarı garanti etmediğini ortaya koyuyor. Birden fazla otonom sistem aynı ortamda etkileşime girdiğinde, oyun teorisi dinamikleri devreye giriyor ve öngörülemeyen sonuçlar doğurabiliyor.

Yazıyı beğendiysen, patronumuz olur musun?

Evet, çok ciddi bir teklif bu. Patronumuz yok. Sahibimiz kar amacı gütmeyen bir dernek. Bizi okuyorsan, memnunsan ve devam etmesini istiyorsan, artık boş olan patron koltuğuna geçmen lazım.

Serbestiyet; Türkiye'nin gri alanı. Siyah ve beyazlar içinde bu gri alanı korumalıyız. Herkese bir gün gri alanlar lazım olur.

Bu Sayfayı Paylaşın