Задачи - grin3s/technosfera_dm_taxi GitHub Wiki

  1. Посмотреть, какие значения medallion и hack_licence самые популярные. Они соответствуют, как я понял, первое - автомобилю, второе - водителю. Но до конца не уверен. Узнать, кто больше всех зарабатывает денег. (Ларичев) Здесь же, если какие-то значения medallion и hack_licence встречаются довольно часто, можно посмотреть средний заработок за одну поездку у каждого такого водителя. Тут же построить соотношение количества водителей к среднему заработку за поездку и график, показывающий количество водителей в зависимости от количества их поездок.

  2. Посмотреть на пространственное распределение точек забора клиентов. Отобразить их на карте. Выяснить, какие районы самые загруженные. (Москвин) Карта, на которой изображены места забора с некоторой окрестностью. Распределение количества поездок по дням недели и по категории день-ночь. Графики: barplot, круговая диаграмма. Ничего особо там не видно.

  3. Выяснить зависимость стоимости поездки от длины маршрута и времени пребывания в пути.(Грингауз)

  4. Посмотреть, как народ расплачивается (карточкой, наличкой и т.п.). Чего больше, каким образом таксисты больше зарабатывают. (Ракитин)

  5. Исследовать количество поездок в зависимости от времени суток и дня недели. Возможно, скомпоновать это каким-то образом с пунктом 2. (Грингауз)

  6. Исследовать распределение количества пассажиров в такси. (Пархоменко)

  7. Исследоват поле trip_fare::vendor_id. Я пока не разобрался, что это вообще такое. (Москвин)

  8. Посмотреть, какую часть общей стоимости составляют налоги и сборы на платных дорогах. (Пархоменко)

  9. Чаевые. Посмотреть - кому и за что дают, попытаться вывести какие-нибудь простые закономерности. (Ларичев)