Қазақ тіліндегі сөйлеудің мәтіндік деректерге айналуын зерттеу
##plugins.pubIds.doi.readerDisplayName##:
https://doi.org/10.51301/ce.2023.i3.06Ключевые слова:
сөйлеуді тану, қазақ тілі, VOSK, аудиоАннотация
Бұл мақалада VOSK моделі арқылы қазақ тіліндегі сөйлеудің трансформациясы зерттеледі. Атап айтқанда, ол VOSK сөйлеуді тану моделінің екі нұсқасына салыстырмалы талдау жасайды: VOX big және VOSK small. Бағалау 2021 жылы ISSAI командасы дайындаған Kazakhs деректер жинағын пайдалана отырып, қазақ тілі шеңберінде жүргізіледі. Сөздегі қателік коэффициенті (WER) ретінде ұсынылған эксперимент нәтижелері VOSK big vosk small (55%) салыстырғанда жақсы нәтиже (51%) көрсететінін көрсетті. Алайда, сөздердің аяқталуын тануда шектеулер бар екендігі және сөйлеуді тану кезінде кейбір қателіктер болатындығы айтылды. Нәтижелерді талқылау модельдің әлеуетін көрсетеді және одан әрі әр түрлі мәліметтер бойынша нақтылау мен оқыту қажеттілігін көрсетеді. Қорытындыда негізгі тұжырымдар, сондай-ақ қазақ тілін тану саласында одан әрі зерделеу үшін әлеуетті бағыттар баяндалған.
Загрузки
Опубликован
Как цитировать
Выпуск
Раздел
Лицензия
Copyright (c) 2023 Engineering Journal of Satbayev University

Это произведение доступно по лицензии Creative Commons «Attribution-NonCommercial-NoDerivatives» («Атрибуция — Некоммерческое использование — Без производных произведений») 4.0 Всемирная.
<div class="pkpfooter-son">
<a rel="license" href="http://creativecommons.org/licenses/by-nc/4.0/"><img alt="Creative Commons License" style="border-width:0" src="https://i.creativecommons.org/l/by-nc/4.0/80x15.png"></a><br>This work is licensed under a <a rel="license" href="http://creativecommons.org/licenses/by-nc/4.0/">Creative Commons Attribution-NonCommercial 4.0 International License</a>.
</div>