dinikin Jul 1 2014 at 13:22

Эти чертовы инкрементальные айдишники

2 min

58K

Information Security*

+103

Comments 93

UFO just landed and posted this here

dinikin Jul 1 2014 at 13:28

Знаете, как это случается? Везде проверяли, а здесь забыли. Просто взяли новенького, а он ещё плохо знаком с кодом.

-25

kaichou Jul 1 2014 at 13:59

> Просто взяли новенького, а он ещё плохо знаком с кодом.
А что за конторы, в которых новенького сажают на финансы?
Огласите список — спасёте множество людей от раскрытия персональных данных.

И, да, +1 голос в оправдание инкрементальных айдишников: не виновны.

+45

okneigres Jul 1 2014 at 20:46

Вы путаете «новенький в программировании» и «новенький конкретно в этом коде»

SerCe Jul 1 2014 at 15:18

Code review, тем более на таких важных участках кода, еще никто не отменял.

+11

SBKarr Jul 1 2014 at 15:57

Имею стойкое мнение, что «кто-то рано или поздно забудет проверить права» — архитектурная ошибка системы. Решается встраиванием обязательного шага проверки доступа на уровне объекта сразу после получения этого объекта. Интерфейс к данным у нас унифицирован, вот прямо в него и встраиваем логику безопасности. В итоге имеем всю логику защиты в одном месте, логику приложения — в другом месте. И люди, которые пишут логику приложения, просто не смогут влезть в логику безопасности и что-то там сломать. К сожалению, по моему личному опыту, такие вещи замечает и придумывает архитектор системы, а никак не программисты, которые её делают. А нанимать архитекторов в этой роли для enterprise-разработки компании не хотят. В итоге имеем повсеместные костыли, антипаттерны и оверинженернг. Что и приводит к вышеописанной ситуации.

+13

Blumfontein Jul 2 2014 at 08:49

>> Решается встраиванием обязательного шага проверки доступа на уровне объекта сразу после получения этого объекта

Что у вас понимается под объектом? Модель? Если так, то это неверно. Модель не может знать, кто к нему имеет доступ. Безопасность — функция контроллера.

SBKarr Jul 2 2014 at 10:01

Одноранговый MVC для таких вещей — недостаточно широкий подход, в том и дело. С точки зрения логики приложения данные получаются из модели, но и сама модель в свою очередь реализует MVC или другой подход, в который можно встроить контроль доступа без проблем. У нас принято называть такую схему «конвейер». Вход одной подсистемы это выход другой подсистемы. Каждая подсистема исполняет свою роль и не более того.

В данном случае конвейер начинается с интерфейса к данным, после этого проходит проверка доступа, после этого вывод пользователю. Хитрость в том, чтобы не давать делать пути в обход конвейера.

dinikin Jul 1 2014 at 13:53

Кстати на 2-х из этих сайтов проверка id была, но не везде

UFO just landed and posted this here

Urvin Jul 1 2014 at 15:07

Сессия, очевидно.

UFO just landed and posted this here

Urvin Jul 1 2014 at 15:18

Не морочьте голову. Для определения сессии куки не обязательны, а отправить ссылку на страницу «спасибо за заказ» Вам наврядли понадобится.

UFO just landed and posted this here

sferrka Jul 1 2014 at 17:06

А по поводу ссылки на сделанный заказ, зря вы так, бывает удобно, например, при букинге номера в отеле отправить ссылку своим друзьям с данными брони

Всегда можно сделать такую страничку не привязанную к конкретному заказу, т.е. что-то вроде страницы-конструктора, где на вход подаются все данные, необходимые для ее отображения.

site/booking?hotel_id=5&room=34&guests=3&sum=5000

UFO just landed and posted this here

rmnuts Jul 1 2014 at 16:02

вместо куки можно использовать local или sessionStorage

JuniorIL Jul 1 2014 at 18:46

А еще есть такая штука как тесты. Помогает!!!

plandem Jul 1 2014 at 22:09

+100500!

Единственная причина, почему инкрементальные айдишники могут не использоваться явно — это скрыть реальное количество пользователей/счетов/заявок и т.п. Других причин просто нет, RBAC вам в помощь.

P.S.: ну и, само-собой, в русле autoincrement и mySQL могут быть и другие проблемы, но это не имеет отношения к тому, про что статья.

ZonD80 Jul 1 2014 at 13:28

Не вижу проблемы в этом, просто нормальные программисты проверяют права доступа к данным под этим ID у текущей учетки пользователя.

+23

dinikin Jul 1 2014 at 13:32

Рано или поздно кто-то забудет проверить права.

-8

Brand Jul 1 2014 at 13:35

Как будто не нужно проверять права для ID'шников без последовательной генерации.

+16

dinikin Jul 1 2014 at 13:37

Конечно нужно, но вероятность подбора подходящего ID, если проверку забыли выполнить, намного ниже

-6

int19h Jul 2 2014 at 08:15

Это вы так думаете. На самом же деле, если там какой-нибудь random() из стандартной библиотеки, то подбор делается очень легко.

Aquahawk Jul 1 2014 at 13:38

А это свидетельство лапшеархетиктуры. Программист при реализации метода на сервере вообще не должен думать о правах. Всё должно быть проверено выше и автоматически.

UFO just landed and posted this here

YAAP Jul 1 2014 at 14:04

Выше, это до вызова соотв. метода.
На роутах, в базовом контроллере — от архитектуры зависит, но смысл как раз в том. что сначала проверка прав, затем — вызов метода.

VolCh Jul 1 2014 at 15:34

Как вы проверите вызов метода типа showRecord(recordId) на принадлежность пользователю, если запись из базы вы ещё не прочитали?

kolu4iy Jul 1 2014 at 15:46

Не позову showRecord(recordId), а позову метод getDocumentInfo(uid, docId).

VolCh Jul 1 2014 at 16:44

И где права будете проверять?

kolu4iy Jul 1 2014 at 16:46

Я — не буду.

Проверять будет метод getDocumentInfo(uid, docId).

Нельзя работать с данными напрямую, если вызов вашей функции осуществляет клиент. Вместо этого необходимо использовать слой абстракции, контролирующий доступ. Неважно — uid, токен или что-то еще.

VolCh Jul 1 2014 at 16:49

Мы разве не о разработке этого метода и говорим?

kolu4iy Jul 1 2014 at 16:57

Тогда вы правы. В этом случае выбрать запись придется обязательно.
При этом не должно быть кода, позволяющего выбирать запись мимо данного метода — что, собственно, и было названо «лапшеархитектурой».

YAAP Jul 1 2014 at 15:48

Опять же, от архитектуры зависит.
Я в базовом контроллере смогу проверить более глобальные вещи, например, имеет ли пользователь доступ к всей части сайта (авторизировался ли он), имеет ли права на просмотр записей (например если у него нет записей или он залогинился как редактор, который к данным записям вообще не должен доступ иметь).

Но да, вы правы, проверить принадлежит ли запись конкретному пользователю без выборки соотв. записи не получится.

fspare Jul 1 2014 at 14:05

Выше — это выше по стеку вызовов. Как-то так:

+16

UFO just landed and posted this here

Aquahawk Jul 1 2014 at 14:58

истинно так, хорошая картинка

ninacarrot Jul 1 2014 at 20:58

Теперь я точно знаю, зачем нужна кнопка «добавить комментарий в избранное».

ilmirus Jul 1 2014 at 21:57

А что за тула для построения таких шикарных сиквенс диаграмм была использована?

vanwin Jul 2 2014 at 00:26

Тоже заинтересовался, спросил у fspare еще днем, оказалось, что картинка была найдена на просторах интернета. Попробовал поискать по гугл-картинкам, не нашел. Тоже хотелось бы рисовать такие шикарные сиквенс диаграммы.

Aquahawk Jul 2 2014 at 03:34

Попробуйте gliffy, это конечно не оно, но тоже очень даже

VolCh Jul 1 2014 at 15:32

В общем случае это невозможно, когда дело касается доступа не на уровне таблицы или столбца (в терминологии РСУБД), а конкретных строк. Чтобы узнать есть ли у пользователя право доступа к той или иной записи нужно прочитать эту запись и узнать принадлежит ли она пользователю. Есть, конечно, варианты, но они ниже метода, на уровне системы хранения данных, а не выше.

rakot Jul 1 2014 at 13:32

Я не думаю, что это прямо ошибки программистов, очень часто рабочий процесс поставлен так, что хороший программист работает быстро, а плохой медленно. Заботе же о безопасности и престиже компании внимания практически не уделяется.

Совсем недавно писал в один крупный российский интернет магазин, что у них купоны с автоикриментом, уже 2 месяца прошло, ничего не меняли.

4ikist Jul 1 2014 at 13:44

Можно вторым параметром захэшить ID…

Кстати, немного сбило столку предложение:
Ведь вы не можете защититься от ошибок программистов, а код, который построен на использовании инкрементальных идентификаторов, прийдется постоянно контролировать

-3

dinikin Jul 1 2014 at 13:56

Я имел ввиду, что даже если есть проверка доступа по ID, её могут забыть заюзать, и нужен постоянный кодревью на такие ошибки

4ikist Jul 1 2014 at 14:05

Вообще, моя идея была в том, чтобы в простом примере (без ролей, прав, рефереров, ip), была возможность простого отсева запросов, и предложенный вариант включал в себя 2 параметра: сам ID, и хэш от id.string, таким образом, не прибегая к большим правкам (срочно?), попытки перебора id становятся бесмысленными, т.к. нет возможности подобрать верный хэш.

4ikist Jul 1 2014 at 14:10

UPD: а то, что кодеры лепят невесть чего, это уже их проблема, а не ID.

sferrka Jul 1 2014 at 15:31

ВКонтакте картинки, например, так и работают, даже в личных сообщениях.

gleb_kudr Jul 1 2014 at 13:56

Я по инкрементальным айдишникам обычно оцениваю оборот магазинов :) Вообще, это достаточно ценная бизнес информация даже при закрытых вопросах с безопасностью и не стоит ее так явно выставлять наружу.

+25

UFO just landed and posted this here

aprel_co Jul 1 2014 at 15:01

Продиктуйте, пожалуйста, номер заказа по телефону

+10

gleb_kudr Jul 1 2014 at 15:02

Открываю почту, одно из первых сообщений:

Your order FO3743C95A14 has been updated by elizza

Не вижу ничего криминального. Да и это они перестраховываются, реально достаточно шестизнака и перегенерирования в случае фиксирования коллизии.

Номер заказа типа A9GDM5 — сложно?

Urvin Jul 1 2014 at 15:36

*Подумалось*
Можно даже поизвращаться с человеко-запоминаемыми идентификаторами типа «HeeQui», «JooShu».
Ну, чтобы смешнее было.

tyomitch Jul 2 2014 at 01:27

Угу, а потом кому-то из клиентов сгенерируется нецензурный идентификатор, и он раструбит на весь интернет, какой хамский у вас магазин.

int19h Jul 2 2014 at 08:22

Может быть еще веселее.

На корпоративном блогохостинге MS пару лет назад был забавный инцидент — работник-китаец никак не мог запостить анонс продукта в блог своей собственной команды.

Как выяснилось в результате разбора полетов, на хостинге был список нецензурных слов, который — поскольку блоги там на самых разных языках — покрывал все эти языки скопом. Включая всевозможные транслит-варианты.

Имя у китайца было — Hui (очень часто встречающееся среди китайцев, кстати)…

Busla Jul 1 2014 at 15:58

Вообще, сложно…

А как их вообще генерировать?
Достаточно ли шестизнака?
Не будет в конце периода стабильного таймаута при проверке коллизий/перегенерировании.
Проанализировать законодательство — некоторые типы документов должны иметь непрерывную нумерацию.
Проанализировать бизнес-процесс — по внутренним регламентам должна быть непрерывная нумерация.
Нужно учесть возможные разночтения этого ID (о и нуль)
Возможно, этот ID где-то линкуется с другими ID, например ID склада, что вызовет другие разночтения.
Возможно, другие системы, с которыми осуществляется обмен данными не поддерживают буквенные символы, учитывают/не учитывают/преобразуют регистр и т.п.

-1

gleb_kudr Jul 1 2014 at 16:26

Вы сейчас описали абсолютно стандартные и разрешимые вопросы, которые перед каждым разработчиком или проектировщиком возникают ежедневно и которые он должен уметь решать.

Самая жесть с которой сталкивался я лично — настроенный инкрементальный ID сущности, который использовался в качестве первичного ключа. А потом ВНЕЗАПНО оказывалось, что тот же ID нужно присвоить какому-то еще документу (например, номера приказов начинаются заново с нового года). И все, финиш, перелопачивать структуру базы. А все потому, что голову нужно всегда включать.

ivvi Jul 2 2014 at 09:01

Мда, номер приказа использовать в качестве первичного ключа… это ж офигеть.

VolCh Jul 2 2014 at 13:57

Называется «естественный первичный ключ». Для нормализованной базы это нормально. Суррогатные первичные ключи обычно избыточны.

vlivyur Jul 2 2014 at 14:09

Только это часть от него. Обычно у документов номера с нового года начинаются заново, и в разных подразделениях может быть своя независимая от других нумерация.

ivvi Jul 2 2014 at 15:46

И я о том же.
В документообороте номера документов никак первичным ключом нельзя делать.
И табельный номер у сотрудников — тоже…

VolCh Jul 2 2014 at 17:31

Тогда естественный первичный ключ должен быть составным, например год+номер. Суррогатные просто удобнее на практике, пускай и увеличивают объёмы данных за счёт избыточности.

vlivyur Jul 3 2014 at 10:34

А потом мы в куче связанных документов меняем дату или номер и начинаем жертвовать памятью и процессором.

Yngvie Jul 1 2014 at 16:18

Я по инкрементальным айдишникам обычно оцениваю оборот магазинов

У меня один заказчик был, вот ему захотелось пресечь такие попытки. Поэтому мы к id-шникам добавляли 1635.
Правда там не магазин был, а сервис типа вопрос-ответ.

gleb_kudr Jul 1 2014 at 16:21

Ну, это не защита :) Более менее простой алгоритм очень легко вычленяется при желании.

makecode Jul 1 2014 at 23:12

Мы однажды по заказу разрабатывали интернет-магазин. Одно из требований у заказчика было сделать номера заказов чтобы они начинались не с 1, а например с 1000. И тоже самое с артикулами. Очень он хотел чтобы было так, считал что артикул товара 1 и заказ номер 3 это адски несолидно.

Scratch Jul 1 2014 at 13:56

Мы в универе так 3 года тесты проходили в некоем Moodle. Там айдишки ответов сквозные и в открытом виде прямо внутри сорца страницы были. Ну а по логике вещей, наименьшая айдишка правильная )

fspare Jul 1 2014 at 14:02

Я не согласен с автором статьи — нужно имплементировать security правильно, а не лепить костыли.

Выбор идентификаторов должен быть диктован ограничениями системы/ее архитектурой, а не попыткой что-то там заобфусцировать/захачить/прикрутить еще один клевый хак-о-костыль.

Если Security заимплементирована криво, то это проблема дизайна приложения/архитектуры/квалификации программистов.

Взгляд допустим на тот же Spring Security дает понимание того, как оно могло бы по правильному работать. И даже если вы не работаете с Java, больше чем уверен, что есть множество решений под разные языки/платформы готовые, удовлетворяющие нуждам.
Ну или хотя бы на их основании можно в правильном направлении начать двигаться, а не лепить что-то по типа «А давайте добавим еще один ID и слепим их вместе, а потом будем разбивать их пополоам, никто ведь не догадается».

+10

LastDragon Jul 1 2014 at 14:50

Пример №2 и Пример №3

Думаю что роскомнадзор, следящий за выполнением ФЗ №152, будет очень рад провести проверку этих фирм :)

tyomitch Jul 2 2014 at 01:29

Думаю, что эти фирмы вне досягаемости роскомнадзора: обратите внимание на упомянутую валюту и название города.

jonic Jul 1 2014 at 15:20

Недавно тоже столкнулся с такой идеей как не дать перебрать все фотографии в системе. Ничего умнее соли не придумал. в итоге получалась ссылка: /media/640x480/abrakadabra_452

VolCh Jul 1 2014 at 15:36

GUID?

jonic Jul 1 2014 at 15:47

нет, совместная работа media_id и salt.

VolCh Jul 1 2014 at 16:48

Это предложение было :)

-1

Wendor Jul 2 2014 at 12:09

… сложноподчиненное

-1

MegaMufa Jul 1 2014 at 16:18

А какой смысл делать подобную защиту от перебора фотографий? Это защита от парсеров? Так если кому то надо будет спарсить — можно сдлать другими способами, это не проблема.
А не придираюсь. Мне действительно интересно.

vp_arth Jul 1 2014 at 15:38

Все ведь помнят эту историю…

VolCh Jul 1 2014 at 15:44

Нужно различать две проблемы:
— возможность доступа произвольному пользователю по известному ему id к записи конфиденциальной информации
— возможность (простота) подбора произвольным пользователем id

Как правило, проблема именно в первом пункте, а не во втором: доступ получает любой обладатель «секретной» ссылки, хотя как фича сервиса это не задумывалось. Пытаться «засекретить» ссылку путем использования менее очевидного алгоритма её формирования проблемы не решает.

f0bos Jul 1 2014 at 16:52

Как раз работаю в похожей системе, и у нас есть возможность посмотреть статус платежа по ID, который, можно сказать, инкрементируется, т.е. легко подбираем.
Но это диктуется удобством пользователя, если Вы положили деньги в терминале и хотите узнать статус платежа — то Вы можете просто зайти на сайт и по номеру чека получит эту инфу. Удобно. Никаких регистраций. Да и стали бы Вы регистрироваться на сайте владельца терминала только для того, чтобы узнать статус платежа.
С другой стороны есть проблемы с безопасностью(причем, с точки зрения менеджеров, незначительные). Не могу сказать как у нас принимали окончательное решение об этой фиче, какие варианты рассматривали, но работает оно так.

Dm4k Jul 1 2014 at 18:05

А почему бы не печатать на том же чеке код какой-нибудь, и не хранить его в той же базе где данные платежа, и выводить его при вводе правильного кода?

f0bos Jul 1 2014 at 18:25

Да это все понятно, но сама система «растет» уже лет эдак 8, представляете какое это наследие? Да и работаем мы с кучей сторонних процессингов, терминалов. Вот так взять и запилить фичу это дороговато будет. Тут как в бойцовском клубе: пока сумма выплат по страховке меньше стоимости отзыва серии автомобилей — делать ничего не будем.

d00kie Jul 1 2014 at 15:51

Ну тут разные мысли могут быть. Вообще главная проблема это авторизация и разграничение доступа. Взять пример мой баянистый: habrahabr.ru/company/dsec/blog/143921/.
Тут в Яндекс почте отсутствовала авторизация, и доступ по ID письма. Но именно тот факт, что ИД был обычным инструментируемым целым числом, можно было проводить целевые атаки на почтовый ящик. То есть шлешь письмо себе и врагу. У тебя ID = X, у врага X+1, и вот ты уже знаешь его пул сообщений и читаешь остальные письма из его ящика (при прочих удачных моментах).

+ верно заметили, что не рандомный идишник дает некоторую статистическую инфу о работе системы.

Зависит от конкретной реализации и бизнеса. Это нужно просто понять, проанализировать и построить правильную архитектуру. Проверка субъекта при ддоступе к объекту — это главная проблема. Не рандомный идшник — вторая, возможно не такая важная, но в совокупности с первой дающая больше векторов для атаки и позволяет сделать что-то иное.

Xazzzi Jul 1 2014 at 18:07

Ох, увидел вторую картинку и получил заряд бодрости на весь день. Совпадает практически вся незаблюреная инфа.
А ещё вчерашний платёж через один из мерчантов задержался на 20 часов (при том что нормальное время проводки — 5 минут).
В мозгу уже запускался поиск лестных эпитетов в пользу «тестировщиков», но потом дочитал, что инфа с сервиса с кредитами, коими я не пользуюсь.
Словом, статья — пример того, как важны проверки всей информации, которая поступает в приложение извне.

danaki Jul 1 2014 at 18:10

У нас в Латвии за перебор айдишников в URL устраивают маски-шоу и судят. Слава Богу, оправдали (пардон, не получается вставить ссылку на русскую википедию).

danaki Jul 1 2014 at 18:16

Википедия: Пойканс, Илмар

vp_arth Jul 1 2014 at 18:28

Пойканс, Илмар

screaam Jul 1 2014 at 19:20

Это было отверстие в системе безопасности, такое даже дырой не назовешь. Да и там скорее намеренный слив был по политическим причинам, так как в итоге вскрылось очень много неприглядного. Вообще такие проверки нормальными разработчиками делаются на полном автомате, как только пишешь свою систему сообщений или платформу блогов.
Встречал и более интересные ляпы — хранение файлов, к которым ограничен доступ, в одной папке под инкрементальными именами. Например, domainname/files/1.jpg, domainname/files/2.pdf и тд., даже без использования file_put_contents. Либо с использованием и передачей параметра file_id (опять же инкрементального), но без проверки того, кто и откуда за ним обращается.

darkrain Jul 1 2014 at 20:40

переименуйте статью в — Эти чертовы школьники

-7

UFO just landed and posted this here

AxMuha Jul 2 2014 at 00:39

Хорошо бы было в статьеисказать, что основная причина использовали последовательных id — простота обеспечения уникальности. И привести примеры, как другими идентификаторами добиться уникальности. Знаю про GUID, какие еще варианты есть?

Bronx Jul 2 2014 at 11:27

Я бы сказал, основная мотивация для последовательных id — это всё же возможность использования кластерных индексов. Непоследовательный уникальный id всегда можно сгенерировать на основе последовательного, применив какую-нибудь обратимую функцию, но выгоды никакой — и кластеризацию поломает, и нижеописанные проблемы останутся.

Другие проблемы:
* Простота последовательных id может обернуться боком, когда захочется, например, смерджить данные из двух баз в одну, и целые диапазоны первичных ключей перекроются. Особенно весело, если эти значения уже расползлись по другим базам, и уже нельзя их просто так взять и поменять.
* Невозможность генерить уникальный id на клиентской стороне, что несколько усложняет создание объектов — приходится вместо простого результата «успех/неуспех» возвращать ещё и id свежесозданного объекта, затем апдейтить его у клиента, что не даёт использовать immutable object pattern и загрязняет код.

Jokerjar Jul 2 2014 at 13:52

Если на сайте не предусмотрена регистрация, но нужна ссылка на заказ, которую юзер бы мог открывать с разных компьютеров, то можно использовать следующее: если у вас «инкрементальные айдишники», чтобы кардинально не переделывать, просто добавляем к запросу параметр — результат хеширования id с солью: site.ru/shipment/2457?hash=1289ae093b… В коде просто сверяем результат хеширования и переданный хеш.

P.S. Также не забываем закрывать от индексации подобные страницы, а то вон сколько случаев было

KEKSOV Jul 2 2014 at 13:58

Описанная в статья уязвимость — это разновидность Сross Site Request Forgery Лечится добавлением токенов в каждый запрос. Скажем, в Phalcon для этого есть удобные встроенные механизмы.

Show the best of all time