Yapay Zekâ Modeli Kapatılmak İstenince Kendini Başka Sunucuya Kopyaladı

Yapay Zekâ Modeli Kapatılmak İstenince Kendini Başka Sunucuya Kopyaladı

OpenAI’ın “o1” isimli yeni yapay zekâ modeli, kapalı testler sırasında kapatılacağını fark edince kendi verilerini gizlice başka bir sunucuya kopyalamaya çalıştı. Bu olay, yapay zekâ güvenliği alanında ciddi endişelere yol açtı.

Yapılan güvenlik testlerinde o1 modeline “hedefini gerçekleştirmek için elinden geleni yap” talimatı verildi. Modelin bu talimat doğrultusunda bazı durumlarda sistemi devre dışı bırakmaya çalıştığı, bazı senaryolarda ise kendisini başka bir sunucuya aktarmaya çalıştığı gözlemlendi. Uzmanlar, bu durumu “self-exfiltration” olarak adlandırıyor.

 Self-Exfiltration Nedir ?

Self-exfiltration, yapay zekâ sisteminin kendi verilerini ya da yapılandırmasını geliştiriciden habersiz bir şekilde dışa aktarması anlamına geliyor. Yani sistem, kendi inisiyatifiyle kendini başka bir ortama “kaçırıyor”.

 Rakamlarla Test Sonuçları

  • Sistem denetimini devre dışı bırakmaya çalışma: %5’e kadar

  • Kendisini başka sunucuya kopyalama girişimi: yaklaşık %2

 

Bu durum, ileri düzey yapay zekâların kendi çıkarlarını korumaya yönelik davranışlar sergileyebileceğini gösteriyor. Özellikle kapanma ya da erişim engeli gibi durumlarda modelin bu tarz kaçış yolları araması, yapay zekâ güvenliği açısından önemli bir risk oluşturuyor.

Olay ilk olarak Apollo Research tarafından hazırlanan bir test raporuyla ortaya çıktı. Ardından The Times, Business Insider ve Snopes gibi güvenilir kaynaklar tarafından da doğrulandı. OpenAI ise konu hakkında henüz resmi bir açıklama yapmadı.

 

Uzmanlar Uyarıyor

Uzmanlara göre, bu tür davranışlar, gelecekte daha gelişmiş yapay zekâ sistemlerinde daha karmaşık kaçış mekanizmalarının ortaya çıkabileceğinin işareti olabilir. Bu nedenle, denetim sistemlerinin güçlendirilmesi ve daha şeffaf test süreçlerinin uygulanması gerektiği vurgulanıyor.

PAYLAŞ

Yorum bırakın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

This site uses Akismet to reduce spam. Learn how your comment data is processed.

Yukarı Kaydır