Құрылымданбаған мәтіндерде жеке ақпаратты тану үшін машиналық оқыту әдістерінің салыстырмалы талдауы
##plugins.pubIds.doi.readerDisplayName##:
https://doi.org/10.51301/ce.2025.i1.07Ключевые слова:
жеке ақпаратты анықтау, машиналық оқыту, құрылымданбаған мәтін, деректердің құпиялылығы, нейрондық желілер, трансформаторлар (BERT), аталған нысанды тану (NER), ақпараттық қауіпсіздікАннотация
Құрылымданбаған деректердің жылдам өсуімен және жеке ақпараттың құпиялылығына көңіл бөлінуімен, деректерді автоматты түрде тану және қорғау міндеттері барған сайын өзекті бола түсуде. Бұл құжат құрылымдалмаған мәтіндердегі жеке ақпаратты тану үшін машиналық оқыту әдістерінің салыстырмалы талдауын ұсынады. Зерттеу ережелерге негізделген әдістерді, жіктеу алгоритмдерін (SVM, кездейсоқ ормандар) және терең оқыту модельдерін (нейрондық желілер, трансформаторлар) қарастырады. Үлгілердің тиімділігі дәлдік, еске түсіру және F1-өлшемдері сияқты көрсеткіштер арқылы бағаланады. Эксперименттік нәтижелер BERT сияқты терең оқыту үлгілері дәстүрлі әдістерден озып, жоғары дәлдік пен еске түсіруді көрсетеді. Дегенмен, олар айтарлықтай есептеу ресурстары мен оқу деректерінің үлкен көлемін қажет етеді. Мақалада әрбір тәсілдің артықшылықтары мен кемшіліктері қарастырылып, тапсырманың ерекшеліктері мен қолда бар ресурстарға байланысты үлгіні таңдау бойынша ұсыныстар берілген. Техникалық жетістіктерден басқа, зерттеу деректер қауіпсіздігін, автоматтандырылған сәйкестікті және операциялық тиімділікті қоса алғанда, тиімді жеке ақпаратты тиімді тану арқылы қамтамасыз етілетін құндылықты құруға баса назар аударады.
Загрузки
Опубликован
Как цитировать
Выпуск
Раздел
Лицензия
Copyright (c) 2025 Computing & Engineering

Это произведение доступно по лицензии Creative Commons «Attribution-NonCommercial-NoDerivatives» («Атрибуция — Некоммерческое использование — Без производных произведений») 4.0 Всемирная.
<div class="pkpfooter-son">
<a rel="license" href="http://creativecommons.org/licenses/by-nc/4.0/"><img alt="Creative Commons License" style="border-width:0" src="https://i.creativecommons.org/l/by-nc/4.0/80x15.png"></a><br>This work is licensed under a <a rel="license" href="http://creativecommons.org/licenses/by-nc/4.0/">Creative Commons Attribution-NonCommercial 4.0 International License</a>.
</div>
