Анализ больших графов на Apache Spark

ID46066

Apache Spark — это фреймворк с открытым исходным кодом для параллельной обработки и анализа слабоструктурированных данных в оперативной памяти. Мы рассмотрим применение данного фреймворка для обработки графов большой размерности.

В этой лекции будут освещены самые необходимые понятия и алгоритмы теории графов. Графы занимают важное место в прикладных исследованиях по различным разделам знаний. Однако, обработка графов больших размерностей требует специальных инструментов как Apache Spark и библиотек. Мы рассмотрим краткую историю создания инструмента и его будущее развитие. Практическое применение на различных задачах и датасетах.   
Мы узнаем: 
  • Краткая история Apache Spark 
  • Задачи графов в программировании, науке, бизнесе. Место графов в модели распределенных вычислений
  • Представление графов в GraphX, GraphFrames. Создание графов
  • Операции с графами 
  • Apache Spark 3.0 и новые возможности
Лектор Даутов Руслан (Shenzhen University, Big Data Institute)

Начисление баллов за посещение мероприятия

1 балл

Выполнение административных функций

1 балл

Обмен информацией и коммуникации

1 балл

Инновации в экономике

Рекомендованные мероприятия