Pull to refresh
12
0
Дмитрий @dklmn

Business Intelligence developer

Send message
А что являлось источником данных для расчетов?
Я в свое время сделал подобную карту для Саратова:
Статистика по стоимости недвижимости — визуализация на карте
, с тех пор периодически думаю:
'… надо бы расширить эту аналитику, как географически, так и в разрезе времени..', но главным препятствием является трудности парсинга авито (ну или недостаток знаний, нужных для того, чтобы защиту от спарсивания обойти).
А никто не в курсе, — где-то можно получить данные по году постройки домов в в других городах?
Ну кроме сайта МинЖКХ, где данные неполные, к по крайней мере для нашего города.
Есть вялотекущее желание развить тему, которую я описал здесь, — Статистика по стоимости недвижимости — визуализация на карте, но для мотивации не хватает какой то новой идеи… Введение в модель данных по возрасту домов могло бы быть таким катализатором.
Понятно, что для того, чтобы улучшить модель, нужно исследовать и вводить еще как минимум ряд факторов:
— год постройки дома
— тип дома для домов типовых серий (например, 90 серия )
— Количество комнат
— Первый или последний этаж
— Деньги вложенные в ремонт.
Вот только последний фактор наверно влияет на общую дисперсию сильнее всего, а получить по нему какую то числовую оценку — фактически невозможно.
Кстати, подскажите если кто знает, есть ли сейчас возможность получить открытые данные по году постройки дома по адресу?
Да, наверно вы правы по терминологии. Просто у Гугла The Heatmap Layer provides client side rendering of heatmaps. — это про распределение плотности.
Я не особо «инвестигировал» альтернативные источники данных.
Думаю, что в нашем городе Авито — самый популярный ресурс по недвижимости.
Так то да.
Но доступа к данным регистрационной палаты у меня нет, так что приходится дейстовать по принципу «я его слепила из того что было».
Спасибо за ссылочку.
Только, мне кажется термин «Тепловая карта» здесь не совсем корректен, под Heat map обычно понимают, насколько я понимаю, не распределениие цифровой метрики, а распределение «наличие факта».
Например Heat map of London crime
image
Исходники чего? Парсилки для Авито? Там много кода, по которому рефакторинг плачет, поэтому не стал выставлять ссылку на репозиторий. Если есть интерес, могу лично выслать.
Чтобы увеличить массив входных данных «вширь» (по другим регионам) и «вглубь» (хранить историю), нужно сначала решить вопрос с баном на Авито.
Можно попробовать техническими способами — например через пул прокси-айпишников, но лучше организационными — через договоренности с Авито.

Information

Rating
Does not participate
Location
Саратов, Саратовская обл., Россия
Registered
Activity