Komzpa
+5
А можно было взять https://github.com/kostya/pg_reindex :)
Komzpa
0
Возможно, потому что zson_learn() выглядит, как ужасный костыль.
Komzpa
0
А решает ли это https://habrahabr.ru/post/169751/?
Можно ли им прокинуть статистику?
Komzpa
0
Почему вы рекомендуете make install, даже не checkinstall, не говоря уже о сборке пакета дистрибутива? :)
Как правильно пакетировать экстеншены для постгреса?
Komzpa
+4
Основная проблема в том, что у среднего человека нет чувства прекрасного.

Задача дизайна карт сродни задаче вёрстки веб-сайтов, только на порядок сложнее, потому что вместо десятка страничек у вас пятьсот гигабайт граничных случаев исходного вектора в базе.

А так тулсет для этого всего есть, тот же Mapbox Studio: https://www.mapbox.com/studio/ — всё можно настроить, посмотрите, насколько сложным становится интерфейс и насколько быстро в нём разберётся нечаянно попавший неподготовленный пользователь.
Komzpa
+4
Тут совсем недавно Gard писал, как обеспечивал связность графа для maps.me: https://habrahabr.ru/company/mailru/blog/280970/

Задача вполне решаемая, если пустить в неё не дизайнеров-колористов с видением «о, вот тут карта выглядит грязно, это некрасиво», а нормальных специалистов. Что бывает достаточно сложно в большой компании, как показывает опыт :)
Komzpa
0
А можно получить результирующие данные в адекватном формате на условиях ODbL? :)
Komzpa
–2
Во-первых, unique constraint на поле с таймстампом это вполне гарантирует.
Во-вторых, это автоматически реализует антифлуд.
Komzpa
–4
Например, никнейм (для «несерьёзных» проектов) / номер телефона (для «серьёзных» проектов) и timestamp.

В нормальных базах у timestamp разрешение в 1 микросекунду, www.postgresql.org/docs/9.4/static/datatype-datetime.html
Komzpa
0
А сколько это в настоящих числах? А то вот случается, что 0*7=0.
Komzpa
+3
А если поменять xargs на parallel, то можно ещё и прозрачно загрузить подсчётами все ядра системы, и получить ещё больший буст.
Komzpa
0
А линейки в какой системе? А то опять похоже на дизайн без UX, отмасштабировал — получил нечто непохожее ни на миллиметры, ни на дюймы.
Komzpa
+4
Бесполезно. Без what3words преобразование не осуществить, а если они захотят закозлиться и/или умереть — пользоваться этим будет более нельзя.
Komzpa
0
А можно ссылку на конкретное место, чтобы всё было более похоже на багрепорт и менее похоже на нытьё? :)
Komzpa
+1
LVEE в этом году — торт, ждём видео :)
Komzpa
0
Как-то так: github.com/Komzpa/furry-sansa/blob/master/config/h64-12.conf#L3
-С до 20000, .style-файл без лишнего, и flat nodes.

Komzpa
0
Для роутинга положительный опыт водится только с двумя движками — gosmore и osrm. На нынешнем размере планеты для gosmore дамп без вариантов нужно резать на куски, но поднимать его проще. osrm способен заглотить всю планету, но очень паметежорок.
Komzpa
0
У постгреса есть хорошие расширения на тему поиска похожих хешей:
zdk.github.io/detecting-similar-images-with-phash-and-pg_similarity
Komzpa
0
На i7 / 32GB RAM / SSD импорт 400-гиговой базы занимает всего часов 12.
Если у вас нет похожей машины, вы всё равно потом не сможете нормально работать с полной базой.
Komzpa
0
Как раз наоборот, экономия: beacon будет неизвестно когда, и слушать-парсить чужие beacon'ы придётся беспрерывно, а так можно быстро включить радио, спросить и быстро выключить, если не повезло.
Komzpa
0
Кому нужен ГИС, уходят на PostgreSQL/PostGIS. В MySQL с этим всё грустно.
Komzpa
0
А почему вы создаёте частоту на основе BigInt? Не лучше ли будет взять какой-нибудь тип с плавающей точкой?
Komzpa
+2
Скажите, почему, если mail.ru экономит трафик, он не включает на своих серверах SPDY? Там, в конце концов, много вкусной компрессии и параллелизации из коробки.
Komzpa
+2
Потому в сравнениях для векторов зачастую используют именно квадрат расстояния.
Komzpa
+4
Перешёл с xargs на GNU Parallel — сильно быстрее во многих случаях, особенно на сложных операциях над файлами.
Komzpa
0
Не путайте непроецированные угловые координаты в градусах и проецированные в EPSG:4326 (которая де-факто стандарт индустрии). Численно они равны, но в EPSG:4326 цифры означают декартовы x и y. Чтобы не было соблазна и быстрее выявлять ошибки в восприятии, некоторый софт (proj4/pyproj, например) принципиально хранит угловые координаты только в радианах.
Komzpa
0
Есть люди, не входящие в vk/fb, обычно из-за них продлевают цепочку на два звена в обе стороны.
Komzpa
+8
Совершенно забыта самая правильная лицензия для тех, кто не знает, под какой лицензией выложить кусок кода — WTFPL:

ru.wikipedia.org/wiki/WTFPL
Komzpa
0
Очень странный ассемблер, можно было бы и SHL/SHR оставить для сдвигов влево-вправо, и не называть их «делением на 2» и «умножением на 2».
Komzpa
0
1) расстояние между двумя позициями на сфере считается напрямую, gis-lab.info/qa/great-circles.html — переход в UTM создаёт проблемы с масштабом на краю зоны, и зачем-то ограничивает область применимости вашего устройства.

2) сильно меняется — это по косинусу. cos(lat) и cos^2(lat) — множители, которые позволяют корректно считать расстояния/площади для небольших изменений по широте. Между двумя измерениями GPS-трекера широта меняется незначительно, если только вы не делаете что-то из аэрокосмической области — но тогда у вас и чипы будут другими.

Заходите по четвергам в минский хакерспейс на день открытых дверей, порисуем на доске.
Komzpa
0
Скажите, у вас в компании практикуют код-ревью?
Komzpa
0
Да понятно, что Дуглас-пойкером давить — тоже вариант. Но у меня есть кучка треков, на которых узелки так не давятся :)
Komzpa
+8
Вообще, тема не раскрыта.

Топик называется «Алгоритмы устранения ложных и избыточных данных в GPS-потоке», а рассказано только про избыточные данные.

Как фильтровать «узелки» на стоянках?
Komzpa
0
Посмотрел исходник из аттача.

Скажите, а зачем там переход в UTM вообще? Расстояния куда лучше считать напрямую из градусов координат.
Komzpa
+4
>> (previous_sample.course — sample->course)*(previous_sample.course — sample->course) >= COURSE_LIMIT*COURSE_LIMIT)

А как оно обрабатывает переход через 360 градусов?

И положите исходники на гитхаб, что ли.
Komzpa
0
И где?

Помнится, не так давно кому-то захотелось пересчитать все рассчёты в пейперах на какую-то тему, и обнаружилось, что исходных данных нет у примерно 80% работ. Вернее, они есть, но «где-то у кого-то на флешке неизвестно где, если мы ещё не переписали поверх новой версией скрипта или не потёрли». А что, пейпер-то написан, делов-то, кто проверять будет.

На данный момент у меня нет оснований верить ни единому слову из поста, потому что я даже не знаю, каким способом вы выщемливали из всего многообразия телефонные разговоры, например, и не приписали ли нечаянно к телефонным разговорам ещё что-нибудь.
Komzpa
+3
А можно увидеть ваши исходные данные, набор трансформаций и нормализованный набор данных где-нибудь на github?
Комментарий из публикации, перенесённой в черновики.
Komzpa
0
Вы так говорите, как будто воровство с кредиток хуже, чем вмешательство в личную жизнь с идеологическими целями.