Многоуровневая архитектура защиты от спама: интеграция правил, черных списков и методов машинного обучения
DOI:
https://doi.org/10.51301/ce.2025.i2.03Ключевые слова:
спам, фильтрация спама, безопасность электронной почты, корпоративные сети, многоуровневая фильтрация, фильтрация на основе правил, черные списки на основе DNS, DNSBL, URIBL, машинное обучение, наивный Байес, дере-вья решений, логистическая регрессия, почтовые серверы, обнаружение спама, предотвращение фишинга, контент-ная фильтрация, IP-репутация, фильтрация на уровне протокола, классификация электронной почты, архитектура антиспамаАннотация
Спам в электронной почте продолжает представлять значительную угрозу для корпоративных коммуникаций, составляя почти половину мирового почтового трафика. Спам, особенно фишинговые письма, не только засоряет почтовые ящики, но и приводит к серьезным финансовым потерям: например, только на мошенничество с компрометацией деловой электронной почты в 2022 году пришлось 2,7 млрд долларов США. В данной статье предлагается многоуровневая архитектура защиты от спама, объединяющая три взаимодополняющих подхода: фильтрацию на основе правил, фильтрацию на основе черных списков и классификацию на основе машинного обучения (ML). Мы подробно описываем функционирование каждого уровня и анализируем их сильные и слабые стороны в корпоративной среде, где высокая точность и минимальное количество ложных срабатываний имеют первостепенное значение. Предлагаемая архитектура объединяет средства защиты на уровне протоколов (например, черные списки на базе DNS), эвристику на базе контента (системы правил) и классификаторы ML (Naïve Bayes, Decision Trees, Logistic Regression) в многоуровневую модель «защита в глубину». Мы проводим сравнительную оценку с использованием последних исследований (2020-2024 гг.), чтобы продемонстрировать, что этот интегрированный подход может значительно улучшить показатели обнаружения спама, контролируя при этом количество ложных срабатываний. Представлена реальная статистика и экспериментальные результаты из литературы, включая показатели производительности (точность, прецизионность, отзыв, F1-score) и время выполнения для каждого метода. Многослойная система достигает превосходной производительности (часто 98-99 % обнаружения при низком уровне ложных срабатываний) по сравнению с любой отдельной методикой. Данная работа предлагает всесторонний и актуальный анализ для практиков и исследователей, описывая надежную структуру защиты от корпоративного спама и освещая будущие направления исследований в области адаптивной, многогранной фильтрации спама.
Загрузки
Опубликован
Как цитировать
Выпуск
Раздел
Лицензия
Copyright (c) 2025 Computing & Engineering

Это произведение доступно по лицензии Creative Commons «Attribution-NonCommercial-NoDerivatives» («Атрибуция — Некоммерческое использование — Без производных произведений») 4.0 Всемирная.
<div class="pkpfooter-son">
<a rel="license" href="http://creativecommons.org/licenses/by-nc/4.0/"><img alt="Creative Commons License" style="border-width:0" src="https://i.creativecommons.org/l/by-nc/4.0/80x15.png"></a><br>This work is licensed under a <a rel="license" href="http://creativecommons.org/licenses/by-nc/4.0/">Creative Commons Attribution-NonCommercial 4.0 International License</a>.
</div>
