Что, если у приложения услуг такси по Вашему сотовому телефону была кнопка на нем, которые позволяют Вам указать, что Вы были готовы разделить поездку с другим пассажиром? Как решительно разделяющий такси мог уменьшить движение, плату за проезд и выделения углекислого газа?
Авторитетно ответ на тот вопрос требует анализирующих огромных объемов данных, которые не были в вычислительном отношении выполнимы с традиционными методами. Но в сегодняшней проблеме Слушаний Национальных академий наук, исследователи в MIT, Корнелльском университете и Институте итальянского Национального исследовательского совета Информатики и Телематики представляют новую технику, которая позволила им исчерпывающе проанализировать 150 миллионов отчетов поездки, собранных больше чем из 13 000 такси Нью-Йорка в течение года.Их заключения: Если бы пассажиры были готовы терпеть не больше, чем пять минут в задержках за поездку, почти 95 процентов поездок, возможно, были разделены. Оптимальная комбинация поездок уменьшила бы полное время прохождения на 40 процентов с соответствующими сокращениями эксплуатационных затрат и выделениями углекислого газа.
«Конечно, никто никогда не должен вынуждаться разделить транспортное средство», говорит Карло Ратти, преподаватель практики в Отделе MIT Городских Исследований и Планирующий (DUSP) и одного из соавторов газеты. «Однако наше исследование показывает то, что произошло бы, если у людей есть разделение как выбор. Это – больше, чем теоретическое осуществление с услугами, такими как Фонд Uber, приносящий эти идеи в практику».Нахождение оптимальной комбинации поездок действительно требует предвидения стартовых времен поездок: Например, 30-минутная поездка длина Манхэттена могла бы быть объединена с 10-минутной поездкой, начинающейся 15 минут спустя. Но такое долгосрочное планирование маловероятно, если пассажиры используют приложения для сотового телефона.
Таким образом, исследователи также проанализировали данные при условии, что только поездки, начинающиеся в течение минуты друг после друга, могли быть объединены. Даже тогда они все еще нашли 32-процентное сокращение в полное время прохождения.«Мы думаем, что с потенциалом 30-процентного сокращения эксплуатационных затрат, есть много комнаты для перераспределения этих льгот для клиентов, потому что мы должны предложить им более низкую плату за проезд; водителям, потому что мы должны простимулировать их, чтобы принадлежать этой системе; к компаниям; и конечно, есть выгода для сообщества», говорит Паоло Санти, приглашенный ученый в DUSP и первый автор на бумаге.
На самом деле Санти говорит, результаты его и анализ его коллег были так поразительны, что они попросили, чтобы математик Корнелла Стивен Строгэц рассмотрел их методологию. Строгэц – соавтор на бумаге, как Ратти и postdoc Станислав Соболевский, обе из Senseable City Lab MIT. Закруглением списка автора является Майкл Сзелл, который был postdoc в лаборатории Сенсибл-Сити, когда работа была сделана и теперь в Северо-восточном университете, и Джованни Ресте, исследователе в домашнем учреждении Санти, Институте Информатики и Телематики.
В анализе данных о такси для возможностей совместного пользования автомобилем, «Как правило, подход, который был проявлен, был изменением так называемой ‘проблемы коммивояжера’», объясняет Санти. «Это – основная алгоритмическая структура, и затем есть расширения для разделения».Проблема коммивояжера спрашивает, есть ли, учитывая ряд городов и время прохождения между ними, маршрут, который позволил бы коммивояжеру достигать всех их в течение некоторого срока. К сожалению, проблема коммивояжера – также пример – действительно, возможно самый известный пример – проблемы NP-complete, означая, что даже для наборов данных умеренного размера, это не может (насколько любой знает) быть решенным за разумное количество времени.
Таким образом, Санти и его коллеги проявили другой подход. Во-первых, они характеризуют каждую поездку на такси согласно четырем измерениям: время и координаты GPS и погрузки и снижения. Затем для каждой поездки их алгоритм определяет набор других поездок, которые накладываются с ним – те, которые начинают, прежде чем это закончится.
Тогда это определяет, может ли поездка, которую они исследуют, быть объединена с какой-либо из тех других поездок, не превышая порог задержки. В среднем любая данная поездка «общая» приблизительно с 100 другими поездками.Затем, алгоритм представляет shareability всех 150 миллионов поездок в базе данных как граф. Граф – математическая абстракция, состоящая из узлов – обычно изображаемый как круги – и края – обычно изображаемый как линии между узлами.
В этом случае узлы представляют поездки, и края представляют свой shareability.Само графическое представление было ключом к анализу исследователей. С этим в руке известные алгоритмы могут эффективно найти, что оптимальные соответствия или максимизируют разделение или минимизируют время прохождения.Исследователи также провели эксперименты, чтобы гарантировать, что их соответствие алгоритму работало бы в режиме реального времени, если бы это работало на сервере, используемом, чтобы скоординировать данные из сотовых телефонов, управляющих разделяющим такси приложением.
Они нашли, что, даже работая на единственной коробке Linux, это могло найти оптимальные соответствия приблизительно для 100 000 поездок через одну десятую секунды, тогда как данные о GPS указали, что в среднем, приблизительно 300 новых поездок на такси начинались в Нью-Йорке каждую минуту.Наконец, онлайн-приложение, разработанное Szell, HubCab, позволяет людям исследовать данные о такси самим, используя карту Нью-Йорка как интерфейс.