Günümüzde iletişim, teknolojinin hızlı gelişimiyle yeni boyutlara taşınıyor. Güney Kore’deki Pohang Bilim ve Teknoloji Üniversitesi’nden (POSTECH) araştırmacılar, sessizce söylenen kelimeleri gerçek sesle konuşmaya dönüştüren yenilikçi bir boyunluk geliştirdi. Bu cihaz, konuşma sırasında boyun hareketlerini algılayarak kullanıcının kendi sesiyle mesajı iletmesini sağlıyor. Sessiz iletişim ve engelleri aşma konusunda çığır açacak bu buluş, teknik ve pratik birçok soruna çözüm sunuyor.
POSTECH ekibi, konuşmanın sadece ses üretmekle kalmayıp boyundaki kas ve derinin de belirli hareketler oluşturduğuna dikkat çekti. Her kelime telaffuzu sırasında ortaya çıkan bu küçük hareketler, kullanıcının benzersiz “sessiz parmak izi” olarak tanımlanabilir. Önceki çalışmalarda çoğunlukla kasların elektriksel aktivitelerini ölçen elektromiyografi (EMG) veya beyin dalgalarını takip eden elektroensefalografi (EEG) kullanılırken, bu yöntemler genellikle büyük, rahatsız edici ve laboratuvar dışı kullanımda tutarsız sonuçlar veriyordu. POSTECH araştırmacıları ise bu alanda daha pratik ve hassas bir çözüm geliştirmeyi amaçladı.
Yeni boyunluk, yumuşak silikon malzeme, mini bir kamera ve hareket sensörlerini yapay zekayla birleştirerek çok eksenli gerinim haritalama sensörü olarak görev yapıyor. Bu teknoloji, konuşma esnasında derinin sadece ne kadar gerildiğini değil, aynı zamanda hangi yönde hareket ettiğini de anlık olarak kaydediyor. Silikon boyunluğa basılan referans işaretler, iç kameranın deformasyonları hassas biçimde gözlemlemesini sağlıyor. Algoritmalar ise boyunluğun her takılışında oluşabilecek küçük konum değişikliklerini düzelterek tutarlı veri elde edilmesine imkan tanıyor.
Sistemin başarısı, kullanıcının sesine özgü olarak eğitilen yapay zeka modelinde gizli. Araştırmacılar, NATO fonetik alfabesi kullanarak yapılan testlerde %85,8 doğruluk oranı sağladı. Bu yapay zeka, hangi kelimenin söylendiğini tanımladıktan sonra kablosuz olarak sunucuya gönderiyor ve burada kişiye özel metin-konuşma teknolojisiyle orijinal ses tonuna oldukça yakın bir şekilde seslendirilme gerçekleşiyor. Sadece 10 dakikalık bir kayıt süreci, sistemin kullanıcının ses karakterini yakalaması için yeterli oluyor.
Sadece ortam gürültüsüne karşı dayanıklı olmakla kalmayan boyunluk, yaklaşık olarak inşaat alanı ses seviyesine eşdeğer 90 desibel beyaz gürültüye karşı da başarılı performans gösteriyor. Bu durumda sinyal-gürültü oranı 33,75 dB’ye ulaşarak ticari EMG sistemlerine kıyasla üstünlüğünü ortaya koyuyor. POSTECH ekibinden Prof. Sung-Min Park, bu teknolojinin konuşma engelli hastaların seslerini yeniden kazanmasında önemli bir adım olduğunu belirtiyor ve potansiyel kullanım alanlarının hastalık tedavisi dışında endüstriyel ortamlar, gürültülü iş sahaları ve sessiz iletişim gerektiği her yerde olduğunu vurguluyor.
Bu teknoloji tıp alanının ötesinde, mikrofon kullanımının mümkün olmadığı veya güvenilir olmadığı durumlar için de yeni iletişim kapıları açabilir. Araştırma makalesinde belirtilen skenarolar arasında acil müdahale, havacılık, denizcilik ve askeri operasyonlar yer alıyor. Cihazın dayanıklılığı, sadece beyaz gürültüye değil, aynı zamanda zorlu koşullarda silah ateşi ve titreşimlere karşı da test edilerek gerçek saha performansı değerlendirildi.
Elbette cihazın bazı sınırları mevcut. Şu an için sadece önceden tanımlanmış 26 kelimelik sınırlı bir kelime haznesiyle çalışıyor ve kullanıcı hareket ettiğinde doğruluk oranı %40’a kadar düşebiliyor. Gelecekteki çalışmalar bu sınırlamaları aşmayı, kelime dağarcığını genişletmeyi ve hareket halindeyken performansı artırmayı hedefliyor. POSTECH ekibi, daha geniş kullanıcı testleri ve deneylerle sistemin günlük hayatta kullanımını mümkün kılmayı amaçlıyor.
Bu alanda benzer başka çalışmalar da var; Cambridge Üniversitesi geçen yıllarda boğaz titreşimlerini algılayan ve sessiz konuşmayı %95 doğrulukla tanıyabilen bir boyunluk geliştirmişti. Ancak POSTECH ekibi, kişisel sesin yapay zeka ile yeniden üretilmesi yönünde önemli bir fark yaratıyor. Önümüzdeki dönemde bu tür teknolojilerin, hem engelli bireylere hem de gürültülü ortamlarda çalışanlara yeni iletişim olanakları sağlaması bekleniyor.
📎 Kaynak: newatlas.com



