Google’dan SignGemma: İşaret Dili Çevirisinde Yeni Dönem Başlıyor
Google DeepMind, 2025’te tanıttığı yeni yapay zekâ modeli SignGemma ile işaret dilini gerçek zamanlı olarak metne ve sese dönüştürmeyi hedefliyor. Cihaz üzerinde çalışabilen bu açık model, özellikle Amerikan İşaret Dili (ASL) ve İngilizce arasında yüksek doğruluk oranıyla dikkat çekiyor.
Cihaz Üzerinde Çalışma ve Gizlilik Avantajı
SignGemma, Gemma ailesinin bir parçası olarak geliştirildi ve internet bağlantısına ihtiyaç duymadan çalışabiliyor. Bu sayede kullanıcı verileri yerel olarak işleniyor, gizlilik korunuyor ve çeviri hızı 200 ms’nin altına düşebiliyor. Bu özellik, internet erişiminin sınırlı olduğu ortamlarda bile sorunsuz kullanım imkânı sunuyor.
Eğitim Verisi ve Teknik Yetenekler
Model, 10 000 saatten fazla ASL videosu ve İngilizce transkriptleriyle eğitildi. El hareketleri, yüz ifadeleri ve baş pozisyonları gibi işaret dilinin temel bileşenlerini analiz ederek metne dönüştürüyor. Google, gelecekte farklı işaret dilleri için de destek sunmayı planlıyor ancak henüz net bir takvim açıklamadı.
Erken Erişim ve Topluluk Katılımı
Şu anda geliştirici önizlemesi aşamasında olan SignGemma, yıl sonuna kadar geniş kullanıma açılacak. Google, özellikle sağır ve işitme engelli topluluklardan ve geliştiricilerden geri bildirim toplayarak modeli geliştirmeyi hedefliyor. Uzmanlar, teknolojinin potansiyeline rağmen işaret dili çevirilerinde insan yorumunun hâlâ önemli olduğunu vurguluyor.
Erişilebilirlikte Yeni Bir Adım
SignGemma, kapsayıcı teknolojiler alanında önemli bir adım olarak görülüyor. İşaret dili çevirisini yaygınlaştırarak eğitimden müşteri hizmetlerine kadar birçok alanda erişilebilirliği artırabilir. Ancak, bağımsız doğruluk testleri ve farklı işaret dilleri için adaptasyon süreci tamamlanmadan nihai etkiyi ölçmek zor.