Разработка системы распознавания рукописного текста на казахском языке
DOI:
https://doi.org/10.51301/ce.2024.i4.01Ключевые слова:
распознавание рукописного текста, машинное обучение, казахский язык, глубокое обучение, сверточные нейронные сети, рекуррентные нейронные сети, частота ошибок в символах, частота ошибок в словахАннотация
Низкая степень цифровизации казахского языка является проблемой, которая влияет на эффективность бюрократии, доступность литературы и образования на казахском языке. В этом исследовании представлен современный подход к распознаванию рукописного текста (HTR) для казахского языка. Оно оптимизирует документооборот и анализ текста, повышает доступность казахской литературы и исторических ресурсов, помогает преподавателям в оценке эссе учащихся, а судьям - в принятии решений. Это решение оптимизирует операционные процессы в бизнесе, образовании и государственных службах. Для повышения точности и производительности перевода текста интегрированы самые современные алгоритмы. В HTR для казахского языка используются эффективные методы машинного обучения (ML) для создания системы HTR, специально адаптированной для казахского алфавита. В se используются возможности сверточных нейронных сетей (CNN), рекуррентных нейронных сетей (RNN), увеличения изображений, обучения переносу и классических методов ML. HTR реализован с использованием языка программирования Python, библиотек OXV, PyTorch и Scikit- learn. Система была обучена на большом наборе данных казахского рукописного текста различной тематики.
Загрузки
Опубликован
Как цитировать
Выпуск
Раздел
Лицензия
Copyright (c) 2024 Computing & Engineering

Это произведение доступно по лицензии Creative Commons «Attribution-NonCommercial-NoDerivatives» («Атрибуция — Некоммерческое использование — Без производных произведений») 4.0 Всемирная.
<div class="pkpfooter-son">
<a rel="license" href="http://creativecommons.org/licenses/by-nc/4.0/"><img alt="Creative Commons License" style="border-width:0" src="https://i.creativecommons.org/l/by-nc/4.0/80x15.png"></a><br>This work is licensed under a <a rel="license" href="http://creativecommons.org/licenses/by-nc/4.0/">Creative Commons Attribution-NonCommercial 4.0 International License</a>.
</div>