BİLDİRİLER

BİLDİRİ DETAY

Zeynep CAN , Tuğrul TAŞCI
MAKİNE ÖĞRENMESİ İLE KONUŞMACI AKSAN SINIFLANDIRILMASI
 
Konuşma, insanların birbiriyle ses yolu aracılığıyla iletişimi gerçekleştirmelerini sağlamada en önemli faktördür. İnsanların sesinden tanınması, konuşmacı tanıma olarak adlandırılmaktadır. Ve konuşma işleme sırasında konuşmacı tanıma önemli bir yere sahiptir. Microsoft’un konuşma tanıma sistemi 1950’li yılların sonunda teknolojik olarak bu alanın ilk örneklerindendir. Günümüzde ise konuşmayla kontrol edilen sistemler, kimlik doğrulama ve e-ticaret gibi birçok alanda kullanılmaktadır. Ve gelişen teknolojiyle konuşma tanıma sistemlerinin önemi daha da artmaktadır. Her konuşmacının yaş, cinsiyet, coğrafi bölge ve ana dilin gerekliliklerine göre değişen bir aksanı vardır. Konuşma tanıma işlemlerinde biyometrik olarak aksan tanıma kullanılır. Aksan tanımlamanın konuşma tanımadan önce yapılması, konuşma tanıma performansını arttırabilmektedir. Makine öğrenmesi ise büyük veriyi işleme , veriyi analiz etme , robotik , bankacılık, konuşma ve görüntü işleme gibi pek çok alanda kullanılmakdır. Makine öğrenmesi algoritmaları ise veri madenciliği , sınıflandırma, kümeleme , regresyon yaklaşımlarına dayanmaktadır. Bu çalışmada, makine öğrenmesi algoritmaları kullanılarak konuşmacı aksan sınıflandırması hedeflenmiştir. Çalışmada, UCI Machine Learning Speaker Accent Recognition 2020 veri kümesi üzerinde çalışılmıştır. 329 konuşmacının Amerikan, İngiliz, İspanyol, Alman, Fransız ve İtalyan aksanlarına sahip konuşmacılarından ses kayıtları alınmıştır. Mel-Frekans Kepstral Katsayıları (MFCC) yöntemi kullanılarak ses sinyallerinden özellik çıkarımı gerçekleştirilmiş böylece makine öğrenmesi algoritmaları kullanılabilecek veri kümesi oluşturulmuştur. Bu metrik formata çevrilen veri kümesi, 6 farklı aksana sahip konuşmacıların sınıflandırılması sağlanmıştır. Sonuçlar yöntem başarım değerleriyle birlikte paylaşılmıştır.

Anahtar Kelimeler: Konuşmacı tanıma, Aksan, Makine Öğrenmesi, Sınıflandırma 


Keywords: