Құрылымданбаған мәтіндерде жеке ақпаратты тану үшін машиналық оқыту әдістерінің салыстырмалы талдауы

Авторы

  • A. Махамбет Satbayev University, Қазақстан
  • A. Молдагулова Satbayev University, Қазақстан

##plugins.pubIds.doi.readerDisplayName##:

https://doi.org/10.51301/ce.2025.i1.07

Ключевые слова:

жеке ақпаратты анықтау, машиналық оқыту, құрылымданбаған мәтін, деректердің құпиялылығы, нейрондық желілер, трансформаторлар (BERT), аталған нысанды тану (NER), ақпараттық қауіпсіздік

Аннотация

Құрылымданбаған деректердің жылдам өсуімен және жеке ақпараттың құпиялылығына көңіл бөлінуімен, деректерді автоматты түрде тану және қорғау міндеттері барған сайын өзекті бола түсуде. Бұл құжат құрылымдалмаған мәтіндердегі жеке ақпаратты тану үшін машиналық оқыту әдістерінің салыстырмалы талдауын ұсынады. Зерттеу ережелерге негізделген әдістерді, жіктеу алгоритмдерін (SVM, кездейсоқ ормандар) және терең оқыту модельдерін (нейрондық желілер, трансформаторлар) қарастырады. Үлгілердің тиімділігі дәлдік, еске түсіру және F1-өлшемдері сияқты көрсеткіштер арқылы бағаланады. Эксперименттік нәтижелер BERT сияқты терең оқыту үлгілері дәстүрлі әдістерден озып, жоғары дәлдік пен еске түсіруді көрсетеді. Дегенмен, олар айтарлықтай есептеу ресурстары мен оқу деректерінің үлкен көлемін қажет етеді. Мақалада әрбір тәсілдің артықшылықтары мен кемшіліктері қарастырылып, тапсырманың ерекшеліктері мен қолда бар ресурстарға байланысты үлгіні таңдау бойынша ұсыныстар берілген. Техникалық жетістіктерден басқа, зерттеу деректер қауіпсіздігін, автоматтандырылған сәйкестікті және операциялық тиімділікті қоса алғанда, тиімді жеке ақпаратты тиімді тану арқылы қамтамасыз етілетін құндылықты құруға баса назар аударады.

Загрузки

Опубликован

2025-03-31

Как цитировать

Makhambet, A. ., & Moldagulova, A. . (2025). Құрылымданбаған мәтіндерде жеке ақпаратты тану үшін машиналық оқыту әдістерінің салыстырмалы талдауы. Computing &Amp; Engineering, 3(1), 41–52. https://doi.org/10.51301/ce.2025.i1.07

Выпуск

Раздел

Инновациялық есептеу жүйелері және инженерлік шешімдер