ВЫЯВЛЕНИЕ ОПТИМАЛЬНЫХ РАЙОНОВ БЕРЛИНА ДЛЯ РАЗМЕЩЕНИЯ КАФЕ ЗДОРОВОГО ПИТАНИЯ

ВЫЯВЛЕНИЕ ОПТИМАЛЬНЫХ РАЙОНОВ БЕРЛИНА ДЛЯ РАЗМЕЩЕНИЯ КАФЕ ЗДОРОВОГО ПИТАНИЯ

Kulikova Arina @arirrr


ЦЕЛЬ ПРОЕКТА

Последние десятилетия заметен растущий интерес к здоровому образу жизни. Отказ от ряда продуктов, в том числе животного происхождения, а также грамотный и экологичный подход в потреблении. В связи с этим стремительно растет количество кафе и ресторанов, следующих данным трендам. Несмотря на моду на здоровые, вегетарианские заведения, для повышения успеха их размещения, необходимо определить, интересны ли они людям, которые населяют и являются частыми гостями района размещения потенциального кафе. Поэтому было решено с целью определения портрета среднего жителя (или гостя) района сформировать внутригородские кластеры. Согласно характеристикам кластеров определить районы, которые вероятнее всего притянут людей, которые разделяют вышеописанные предпочтения в питании и образе жизни, а также имеют достаточное количество средств.


ГИПОТЕЗЫ

1) В Берлине найдутся районы с потенциальной целевой аудиторией заявленных кафе (обеспеченные молодые люди 19-30 лет, следующие экологическим трендам, например, перерабатывающие мусор и передвигающиеся на велосипеде, часто посещающие кафе и культурные места).

2) Районы потенциальной аудитории кафе характеризуются низким уровнем криминогенности, а также небольшим количеством столкновений с участием пешеходов и велосипедистов (для минимизации количества опасных ситуаций с курьерами во время доставки еды из предполагаемых кафе).


ДАННЫЕ

1. Стоимость квадратного метра жилья (Сайт недвижимости Immobilien Scout GmbH);

2. Локации столкновений с участием пешеходов, велосипедистов и машин (Berlin Open Data portal);

3. Локации краж, нападений, взломов, поджогов и наркотиков (Berlin.de ist ein Angebot des Landes Berlin);

4. Количество проживающих людей в административных районах по возрастам (Statistik berlin brandenburg de);

5. Локации галерей, парков, больниц, аренды велосипедов, детских садов, университетов, туристических мест, фастфуда, кафе и точек переработки отходов (Openstreetmap.org);

6. Уровень шума, загрязнения воздуха, биоклиматического стресса и обеспеченность зелеными зонами (Berlin.de ist ein Angebot des Landes Berlin);

7. Локации успешных берлинских кафе здоровой/вегетарианской кухни.

МЕТОДЫ И ХОД РАБОТЫ

1. Рассчитаны все данные для каждого района (для анализа были выбраны не административные районы Берлина, а менее крупные участки).

2. При расчете средней порайонной стоимости жилья было обнаружено, что у некоторых районов отсутствуют данные.

Порайонная стоимость квадратного метра жилья

При помощи интерполяции методом ближайших соседей для нахождения стоимости жилья в пропущенных районах были построены значения на основе дискретного набора известных данных.

Полная порайонная стоимость квадратного метра жилья

2. Данные были обработаны на наличие выбросов - была рассчитана сумма среднего значения каждого параметра и его трех стандартных отклонений. Значения, превышающие данную сумму, были приравнены к ней. Исключены параметры с высоким уровнем корреляции (среди коррелирующих признаков приоритет отдавался параметрам, описывающим целевую аудиторию здоровых кафе). После этого данные были нормализованы.

3. Определено оптимальное число кластеров, основываясь на степени уменьшения искажения (The Elbow Method) и показателе разделенности кластеров между собой (silhouette coefficient).

4. Применена кластерная модель k-means.

5. Были выбраны кластеры с подходящими характеристиками целевой аудитории кафе. Внутри данных кластеров построены буферы 350 метров у существующих наиболее успешных кафе и ресторанов схожей кухни и концепции. Районы, которые попадают в построенные буферы, были исключены для того, чтобы разместить кафе в зонах, где уровень конкуренции не повышен.

6. Оставшиеся районы отранжированы на основе косинусного сходства с исключенными в предыдущем пункте успешными районами кафе.

7. Районы-лидеры по косинусной схожести нанесены на тепловую карту по ряду параметров для визуализации результатов.


РЕЗУЛЬТАТЫ

После оценки корреляции признаков были учтены в модели: уровень шума, загрязнения воздуха, биоклиматического стресса, криминогенности, обеспеченность зелеными зонами, количество аварий с пешеходами и весипедистами, количество детских садов, университетов, больниц, туристических мест, кафе, парковок, точек переработки отходов и аренды велосипедов, арт галерей, процент детей, подростков, молодых, взрослых и пожилых.

Анализ показал, что оптимальным количеством кластеров является 6.

Итоговые кластеры


Описание кластеров

0. Низкокриминогенные, зеленые районы, много взрослых людей с детьми-подростами и пожилыми, достаточно экологичная обстановка относительно других районов, невысокая стоимость жилья и небольшое количество кафе, креативных и туристических мест.

1. Низкокриминогенные, зеленые районы, где проживает много взрослых и пожилых, обилие больниц, средняя стоимость жилья и небольшое количество кафе, университетов креативных и туристических мест.

2. Менее экологичные и зеленые районы, однако все еще с низким уровнем криминогенности, в которых проживают семьи с детьми и подростками, количество кафе, университетов, креативных и туристических мест на низком уровне, стоимость жилья ниже среднего.

3. Обилие кафе, туристических мест, точек переработки отходов, средний житель молодого возраста, высокая стоимость жилья, но повышенный уровень криминогенности и плохая экология.

4. Лучшие показатели в Берлине по количеству кафе, туристических мест, арт-пространств, университетов, точек аренды велосипедов и переработки отходов. Самая высокая стоимость жилья. Однако, большое количество аварий с участием пешеходов и велосипедистов и повышенный уровень криминогенности, плохая экология.

5. Много взрослых, стоимость жилья выше среднего, много кафе, экология ниже среднего, среднее и пониженное количество галерей и университетов, уровень криминогенности повышен.

Показатели по кластерам


Выбор оптимальных кластеров

Были выбраны 3 и 4 кластеры, поскольку их характеристики наиболее исчерпывающе соответствуют описанию потенциальной целевой аудитории кафе и ресторанов со здоровой едой и экологичным подходом к подаче и упаковке. Именно в этих кластерах живет много молодых людей, большое количество университетов, которые притягивают молодых из других районов. Много точек аренды велосипедов и переработки отходов говорят о том, что образ жизни жителей района похож на образ целевой аудитории кафе. В кластерах большое количество кафе, арт-пространств, которые притянут творческих людей и любителей поесть вне дома. Высокая стоимость недвижимости характеризует финансовую обеспеченность жителей района.


Размещение успешных кафе

Внутри 3 и 4 кластеров были нанесены существующие успешные здоровые и вегетарианские кафе и рестораны. Исключены те районы, которые попадают в 350 метровый буфер.

Потенциальные районы для размещения кафе


Определение косинусного сходства

Был произведен расчет по выбранным районам косинусного сходства с успешными существующими здоровыми и вегетарианскими кафе.

Ранжируемость районов по косинусному сходству с успешными примерами

Были выделены лидеры, которые наиболее похожи на успешные примеры (показатель косинусного сходства выше 0,79).

Итоговые районы для размещения кафе


Визуализация некоторых параметров с учетом выбранных районов

Ключевым минусом выбранных районов является то, что они находятся в достаточно криминогенных местах, однако, не в самых пиковых точках.

Уровень криминогенности

Районы находятся близ креативных пространств, что положительно скажется на посещаемости.

Концентрация арт-галерей

Проанализировав расположение всех кафе в городе, было выявлено, что выбранные районы располагаются в местах со средней и высокой концентрацией кафе, что говорит о том, что данные районы могут быть успешны с точки зрения расположения кафе. При этом у них не повышенная конкуренция, поскольку они расположены не в пиковых точках.

Концентрация кафе

Таким образом, первая гипотеза подтвердилась, потому что существуют районы, населяющие и привлекающие потенциальную целевую аудиторию заявленных кафе и ресторанов. Вторая гипотеза не была подтверждена, поскольку в выбранных районах достаточно опасно. Частично решить данную проблему можно отменив ночную доставку.

Report Page