Задание №5

Задание №5

Дерзкий Ден

Работа с Datasets

В этом задании требуется сбор и обработка набора данных из источника https://www.kaggle.com/heesoo37/120-years-of-olympic-history-athletes-and-results. Тут содержится файл athlete_events.csv, в котором собраны данные олимпийских игр, спортсменов и их результатов за последние 120 лет.


Итак, нам нужно обработать эти данные и выдать следующие результаты в формате .csv:

  1. Записи по всем прошедшим соревнованиям, которые содержат информацию о странах, занявшие 1-е места, по каждому виду спорта.


Основной упор в этом задании дается на: 

• Работа с фреймворком Spark

• Обработка больших данных