Konuþma, insanlarýn birbiriyle ses yolu aracýlýðýyla iletiþimi gerçekleþtirmelerini saðlamada en önemli faktördür. Ýnsanlarýn sesinden tanýnmasý, konuþmacý tanýma olarak adlandýrýlmaktadýr. Ve konuþma iþleme sýrasýnda konuþmacý tanýma önemli bir yere sahiptir. Microsoft’un konuþma tanýma sistemi 1950’li yýllarýn sonunda teknolojik olarak bu alanýn ilk örneklerindendir. Günümüzde ise konuþmayla kontrol edilen sistemler, kimlik doðrulama ve e-ticaret gibi birçok alanda kullanýlmaktadýr. Ve geliþen teknolojiyle konuþma tanýma sistemlerinin önemi daha da artmaktadýr. Her konuþmacýnýn yaþ, cinsiyet, coðrafi bölge ve ana dilin gerekliliklerine göre deðiþen bir aksaný vardýr. Konuþma tanýma iþlemlerinde biyometrik olarak aksan tanýma kullanýlýr. Aksan tanýmlamanýn konuþma tanýmadan önce yapýlmasý, konuþma tanýma performansýný arttýrabilmektedir. Makine öðrenmesi ise büyük veriyi iþleme , veriyi analiz etme , robotik , bankacýlýk, konuþma ve görüntü iþleme gibi pek çok alanda kullanýlmakdýr. Makine öðrenmesi algoritmalarý ise veri madenciliði , sýnýflandýrma, kümeleme , regresyon yaklaþýmlarýna dayanmaktadýr. Bu çalýþmada, makine öðrenmesi algoritmalarý kullanýlarak konuþmacý aksan sýnýflandýrmasý hedeflenmiþtir. Çalýþmada, UCI Machine Learning Speaker Accent Recognition 2020 veri kümesi üzerinde çalýþýlmýþtýr. 329 konuþmacýnýn Amerikan, Ýngiliz, Ýspanyol, Alman, Fransýz ve Ýtalyan aksanlarýna sahip konuþmacýlarýndan ses kayýtlarý alýnmýþtýr. Mel-Frekans Kepstral Katsayýlarý (MFCC) yöntemi kullanýlarak ses sinyallerinden özellik çýkarýmý gerçekleþtirilmiþ böylece makine öðrenmesi algoritmalarý kullanýlabilecek veri kümesi oluþturulmuþtur. Bu metrik formata çevrilen veri kümesi, 6 farklý aksana sahip konuþmacýlarýn sýnýflandýrýlmasý saðlanmýþtýr. Sonuçlar yöntem baþarým deðerleriyle birlikte paylaþýlmýþtýr.
Anahtar Kelimeler: Konuþmacý tanýma, Aksan, Makine Öðrenmesi, Sýnýflandýrma
|