Задание №5
Дерзкий ДенРабота с Datasets
В этом задании требуется сбор и обработка набора данных из источника https://www.kaggle.com/heesoo37/120-years-of-olympic-history-athletes-and-results. Тут содержится файл athlete_events.csv, в котором собраны данные олимпийских игр, спортсменов и их результатов за последние 120 лет.
Итак, нам нужно обработать эти данные и выдать следующие результаты в формате .csv:
- Записи по всем прошедшим соревнованиям, которые содержат информацию о странах, занявшие 1-е места, по каждому виду спорта.
Основной упор в этом задании дается на:
• Работа с фреймворком Spark
• Обработка больших данных