Своевременность
Этот набор данных содержит информацию от Бюро статистики транспорта.
Создание таблицы
Импорт из необработанных данных
Загрузка данных:
Загрузка данных с использованием нескольких потоков:
(если у вас будут проблемы с нехваткой памяти или другими вопросами на вашем сервере, удалите часть -P $(nproc)
)
Импорт из сохраненной копии
В качестве альтернативы вы можете импортировать данные из сохраненной копии по следующему запросу:
Снимок был создан 29-05-2022.
Запросы
Q0.
Q1. Количество рейсов в день с 2000 по 2008 год
Q2. Количество рейсов, задержанных более чем на 10 минут, сгруппированных по дням недели, за 2000-2008 годы
Q3. Количество задержек по аэропортам за 2000-2008 годы
Q4. Количество задержек по перевозчикам за 2007 год
Q5. Процент задержек по перевозчикам за 2007 год
Лучшая версия того же запроса:
Q6. Предыдущий запрос для более широкого диапазона лет, 2000-2008
Лучшая версия того же запроса:
Q7. Процент рейсов, задержанных более чем на 10 минут, по годам
Лучшая версия того же запроса:
Q8. Самые популярные направления по количеству напрямую связанных городов за различные диапазоны лет
Q9.
Q10.
Бонус:
Вы также можете поиграть с данными в Playground, пример.
Этот тест производительности был создан Вадимом Ткаченко. См.:
- https://www.percona.com/blog/2009/10/02/analyzing-air-traffic-performance-with-infobright-and-monetdb/
- https://www.percona.com/blog/2009/10/26/air-traffic-queries-in-luciddb/
- https://www.percona.com/blog/2009/11/02/air-traffic-queries-in-infinidb-early-alpha/
- https://www.percona.com/blog/2014/04/21/using-apache-hadoop-and-impala-together-with-mysql-for-data-analysis/
- https://www.percona.com/blog/2016/01/07/apache-spark-with-air-ontime-performance-data/
- http://nickmakos.blogspot.ru/2012/08/analyzing-air-traffic-performance-with.html