Оценка технологий Data Lake и Apache Spark для планирования и управления городской инфраструктурой

Авторы

  • Г. Бектемысова Международный университет информационных технологий, Казахстан
  • С. Қалназар Международный университет информационных технологий, Казахстан

DOI:

https://doi.org/10.51301/ce.2024.i1.05

Ключевые слова:

городская инфраструктура, Data Lake, Apache Spark, аналитика больших данных, масштабируемость, автоматиза-ция, качество данных, планирование умного города

Аннотация

Данное исследование анализирует использование технологий Data Lake и Apache Spark в управлении городской инфраструктурой. Рассмотрены их возможности для обработки структурированных, полуструктурированных и неструктурированных данных, подчеркивая их потенциал в оптимизации рабочих процессов обработки данных. Система была развернута в Yandex Cloud с использованием распределенных вычислений и горизонтальной масштабируемости для эффективного хранения данных, аналитики в реальном времени и отказоустойчивости. Реализованы процессы автоматизации и контроля качества данных для упрощения загрузки, преобразования и проверки данных. Результаты показывают значительное улучшение эффективности обработки данных, масштабируемости и оптимизации ресурсов, предлагая надежную платформу для планирования и оценки инфраструктуры умных городов.

Загрузки

Опубликован

2024-03-31

Как цитировать

Bektemisova, G. ., & Kalnazar, S. . (2024). Оценка технологий Data Lake и Apache Spark для планирования и управления городской инфраструктурой. Computing &Amp; Engineering, 2(1), 25–31. https://doi.org/10.51301/ce.2024.i1.05

Выпуск

Раздел

Автоматизация, роботизация и интеллектуальные системы