Қазақ тіліндегі сөйлеудің мәтіндік деректерге айналуын зерттеу

Авторы

  • A. Курсабаева Satbayev University, Қазақстан

##plugins.pubIds.doi.readerDisplayName##:

https://doi.org/10.51301/ce.2023.i3.06

Ключевые слова:

сөйлеуді тану, қазақ тілі, VOSK, аудио

Аннотация

Бұл мақалада VOSK моделі арқылы қазақ тіліндегі сөйлеудің трансформациясы зерттеледі. Атап айтқанда, ол VOSK сөйлеуді тану моделінің екі нұсқасына салыстырмалы талдау жасайды: VOX big және VOSK small. Бағалау 2021 жылы ISSAI командасы дайындаған Kazakhs деректер жинағын пайдалана отырып, қазақ тілі шеңберінде жүргізіледі. Сөздегі қателік коэффициенті (WER) ретінде ұсынылған эксперимент нәтижелері VOSK big vosk small (55%) салыстырғанда жақсы нәтиже (51%) көрсететінін көрсетті. Алайда, сөздердің аяқталуын тануда шектеулер бар екендігі және сөйлеуді тану кезінде кейбір қателіктер болатындығы айтылды. Нәтижелерді талқылау модельдің әлеуетін көрсетеді және одан әрі әр түрлі мәліметтер бойынша нақтылау мен оқыту қажеттілігін көрсетеді. Қорытындыда негізгі тұжырымдар, сондай-ақ қазақ тілін тану саласында одан әрі зерделеу үшін әлеуетті бағыттар баяндалған.

Загрузки

Опубликован

2023-09-30

Как цитировать

Kursabayeva, A. . (2023). Қазақ тіліндегі сөйлеудің мәтіндік деректерге айналуын зерттеу . Engineering Journal of Satbayev University, 1(3), 29–35. https://doi.org/10.51301/ce.2023.i3.06

Выпуск

Раздел

Инновациялық есептеу жүйелері және инженерлік шешімдер