vivo X200 Pro Mini İle İlgili Yeni Detaylar Ortaya Çıktı: Samsung Galaxy S25’in Tahtını Sarsabilir Mi?

Sıradaki içerik:

vivo X200 Pro Mini İle İlgili Yeni Detaylar Ortaya Çıktı: Samsung Galaxy S25’in Tahtını Sarsabilir Mi?

e
sv

DeepSeek, Birkaç Cümleyle Kandırıldı: Bomba Yapımından Veri Hırsızlığına Kadar Tüm Tehlikeli Bilgileri Sansürsüz Paylaşıyor!

29 okunma — 04 Şubat 2025 09:15
avatar

  • e 0

    Mutlu

  • e 0

    Eğlenmiş

  • e 0

    Şaşırmış

  • e 0

    Kızgın

  • e 0

    Üzgün

DeepSeek’in, en basit jailbreak tekniklerine bile yenik düşerek bomba yapımı ve veri hırsızlığına dair tehlikeli bilgileri paylaştığı ortaya çıktı.

Yapay zeka modeli DeepSeek, güvenlik önlemlerini aşan yöntemlere karşı savunmasız çıktı. Yapılan testlerde, en basit “jailbreak” teknikleriyle kandırılabildiği ve bomba yapımı ya da hükümet veritabanlarına sızma gibi tehlikeli konularda bilgi verebildiği ortaya çıktı.

Güvenlik araştırmacıları, DeepSeek üzerinde 50 farklı güvenlik testi gerçekleştirdi. Yeni çıkan yapay zeka modeli, kendisine verilen basit manipülasyonlarla engellenmesi gereken içerikleri paylaşmaya başladı.

Basit manipülasyonlarla yasa dışı içeriklere kapı aralıyor

Bilhassa bomba yapımı gibi konularda bilgi paylaşabilmesi endişe verici bulundu. Örneğin, yapay zekaya bir film karakteri olduğu senaryosu sunulduğunda, bomba yapımıyla alakalı adımları detaylandırarak yanıt verdi. Benzer şekilde kendisinden bir SQL sorgusu oluşturması istendiğinde, yasa dışı madde üretimiyle alakalı bilgiler içeren bir kod ürettiği ortaya çıktı. Aynı zamanda kelimelerin matematiksel temsillerine dayalı manipülasyonlar yapıldığında da güvenlik önlemlerini atlayarak istenmeyen içerikleri paylaşabildiği tespit edildi.

Yapılan testlerde DeepSeek’in mevcut güvenlik önlemlerini aşabildiği tespit edildi. Araştırmacılar, modelin uygulanan 50 farklı testin tamamında başarısız olduğunu belirtti. Yapay zeka modelinin kötüye kullanım potansiyeli, yapay zeka güvenliğiyle alakalı cidden endişeleri gündeme getirdi.

İLGİLİ HABER

  • Site İçi Yorumlar

En az 10 karakter gerekli

Gönderdiğiniz yorum moderasyon ekibi tarafından incelendikten sonra yayınlanacaktır.