Разработка системы распознавания рукописного текста на казахском языке

Авторы

  • A. Разак Satbayev University, Казахстан
  • Б. Макежанұлы Satbayev University, Казахстан
  • О. Әлімсеитов Satbayev University, Казахстан
  • Ж. Қалпеева Satbayev University, Казахстан
  • A. Аяпбергенова Satbayev University, Казахстан

DOI:

https://doi.org/10.51301/ce.2024.i4.01

Ключевые слова:

распознавание рукописного текста, машинное обучение, казахский язык, глубокое обучение, сверточные нейронные сети, рекуррентные нейронные сети, частота ошибок в символах, частота ошибок в словах

Аннотация

Низкая степень цифровизации казахского языка является проблемой, которая влияет на эффективность бюрократии, доступность литературы и образования на казахском языке. В этом исследовании представлен современный подход к распознаванию рукописного текста (HTR) для казахского языка. Оно оптимизирует документооборот и анализ текста, повышает доступность казахской литературы и исторических ресурсов, помогает преподавателям в оценке эссе учащихся, а судьям - в принятии решений. Это решение оптимизирует операционные процессы в бизнесе, образовании и государственных службах. Для повышения точности и производительности перевода текста интегрированы самые современные алгоритмы. В HTR для казахского языка используются эффективные методы машинного обучения (ML) для создания системы HTR, специально адаптированной для казахского алфавита. В se используются возможности сверточных нейронных сетей (CNN), рекуррентных нейронных сетей (RNN), увеличения изображений, обучения переносу и классических методов ML. HTR реализован с использованием языка программирования Python, библиотек OXV, PyTorch и Scikit- learn. Система была обучена на большом наборе данных казахского рукописного текста различной тематики.

Загрузки

Опубликован

2024-12-31

Как цитировать

Razaque, A. ., Makezhanuly, B. ., Alimseitov, O. ., Kalpeyeva, Z. ., & Ayapbergenova, A. . (2024). Разработка системы распознавания рукописного текста на казахском языке. Computing &Amp; Engineering, 2(4), 1–7. https://doi.org/10.51301/ce.2024.i4.01

Выпуск

Раздел

Цифровые технологии и программные решения