catap
0
Т.е. файл мы отдадим, только если он был залит с этим письмом, или не отдадим ничего.


Ого.
catap
0
да, это было бы очень полезно и сняло бы вопросы подобные моим, просто сейчас создается ложное впечатление что тут большие проблемы.

Т.е. лучше просто дописать что уникальность обеспечивается не только sha1 хешем, но еще тем-то и тем-то и вероятность коллизий есть, но она теоретическая и вообще она вот-такая (и цифру какая она маленькая), а исходя из ограничение на максимальный размер письма/аттача она получается таки равна нулю :)
catap
0
Спасибо за корректный ответ, просто из статьи сложилось впечатление что вы проверяете только хеш.
catap
–2
Давай я тебе лучше ссылку дам где находят коллизию для SHA1 за 76 шагов: https://marc-stevens.nl/research/sha1freestart/

:)

Но я согласен что если начать считать стоимость нахождения этой коллизии то это на amazon ec2, то это будет пара сотен тысяч долларов.
catap
0
в сложном документе, например PDF или картинке, где лишние байты будут игнорироваться :) можно совершить атаку и подобрать мусор что бы два разных (по содержанию отображаемому пользователю) документа имели одинаковый хеш.

Мне кажется правильным как минимум держать размер (в байтах) файла, а лучше использовать две хеш функции для и размер, тем самым сводя вероятность коллизий совсем до минимума.

Например для md5 я с ходу нашел такую очень старую (~10 лет) работу: http://cryptography.hyperlink.cz/md5/MD5_collisions.pdf
catap
0
Макс, зачем для этого возвращаться? :)

В любом случае мой email ты знаешь ;)
catap
0
Может люди такие там и есть, не знаю. Но я не там уже более 5 лет :)
catap
0
зачем делать grep если можно добавить ключ l?
catap
0
зачем nmap когда можно сказать netstat -npl и увилить кто какой порт слушает, прям с pid?
catap
0
В случае Data Mining Hub команде не раскрываются все данные и затачиваться она сможет только под известный ей dataset.

Второй dataset схожего размера будет использоваться для оценки качества алгоритма, т.к. в отличии от kaggle код не раскрывается и остается вашей интеллектуальной собственностью.
catap
0
Спасибо!

Дизайн и навигация, как и весь UI, будет перерабатываться.
catap
0
Да, вы можете зайти в набор данных задачи и все-все-все скачать.
catap
0
В этом плане опыт Kaggle показывает что люди готовы :)

Мы подошли к вопросу баланса прав между учеными и заказчиками с позиции защиты прав ученых.
catap
0
погрешности не было, так что должны были проверить либо все логины-пароли, либо выбрать какое-то подмножество случайным образом (тут не описано почему человек считает что его выборка достаточно случайна и случайна ли) и проверить на нем.

В текущей постановке фразы скорее всего проверили, если проверили, 10 логинов-паролей с верху, пару-тройку помотав куда-то и сделали вывод.
catap
0
Есть Google Wallet. К нему можно привязать через google checkout любую карту. Используя всякие HCE можно держать карту в облаке и не тратиться на security element а спрашивать необходимое у эммитента.

Выглядит очень красиво и радужно.

Но ломается, как только мы вспоминаем что любая транзакция с карты стоит денег. Пускай даже 0.5% но это расходы. Строить модель которая работает когда есть кто-то большой кто дает деньги, это очень романтично, но в один прекрасный момент халява закончится :) В общем не просто так google wallet работает только в одной стране на паре телефонов ;)
Комментарий из публикации, перенесённой в черновики.
catap
0
Сложный вопрос.

Например балансирующий прокси-серер haproxy не умел https раньше, но, зато, используя внешние слои утилиты, можно было делать ssl ;)
catap
0
Тогда я не совсем понимаю почему в случае I2P вы рассказали про их альтернативный интернет, а в случае tor — нет.
catap
0
В случае tor не раскрыты onion сайты :(
catap
0
никакие протоколы прокси НЕ поддерживают шифрование между HTTP/SOCKS/Elite/Anonymous-прокси и клиентом. А SSL-прокси означает лишь то, что клиент может работать с https-ресурсами;


Никто не мешает на 5 уровне сделать прозрачный для proxy сервера SSL тунель.
catap
0
тут, случайно, было следующий коммент
catap
0
Протокол SOCKS находится на сеансовом уровне модели OSI, этим достигается независимость от высокоуровневых протоколов


Вообще SOCKS это прикладной (application) уровень. А независимость достигается инкапсуляцией данных.
catap
+4
Плохо, однопоточно, надо сделать после принятия соеденения fork для вызова mysql :)
catap
0
сдают :)
catap
0
а оно 3 года проживет?
catap
+1
Т.к. у нас TCP нам нужно держать буфер пока не придет ACK.

4кб расходы системы на буфер (на самом деле их несколько, просто тут не секундная летенси и получается как будто 4кб, в реальности будет где-то 12-16).

Если у нас идет поток 10,000 запросов в секунду, то мы будем потреблять как минимум буфера на эти соеденения + дельту на передачу данных. Если буфер передается за 1 секунду до клиента, то нам нужно ~100 мегабайт памяти. Если начинаются потери и идут всякие ретрансмиты, то у нас требования по памяти вырастают.

Я не говорю что невозможно сделать 1М соединений с сервером. У меня пока рекорд около 4,5М на amazon :), тут просто надо понимать, что есть ограничения другого уровня и их тоже надо учитывать.
catap
0
Там счастья нет. Надо смотреть что у вас за траффик, какой процент людей и чем вы готовы жертвовать ради достижения какого-то счастья.
catap
0
Тогда тут мой пардон, я не смог интерпретировать Total Netto как ядерную память.

Да, 4kb современный линукс выделяет на одно соединение, это правда.

Если данное решение ориентировано на сервис, у которого 80% пользователей будут иметь стабильное (тут скорее вопрос не в latency, а именно в bandwish) соединение с сервером — то вопросов нет.

Если там будут мобильные клиенты, то я бы закладывался что total netto будет выше.

Так же я бы закладывался что total netto будет выше, в случае если вы будете посылать более большие ответы.
catap
0
Под медленными клиентами, я понимал в первую очередь людей у которых плохой или ненадежный интернет.

Как работает ваш асинхронный сервер — вы сказали send и отправили буфер (фактически скопировали память с userspace в память которая уйдет уже в сокет). Интересный факт в том, что если вы оправляете большой ответ, скажем два пакета, пока не придет два подтверждения от клиента. Т.е. если у вас много медленных клиентов, то ядро своими буферами с ответами съест какую-то память.

Далее, вы в примере используете ip conntrack, судя по настройкам в тесте, что увеличит время в пессимистичном раскладе которое будет использоваться больший объем памяти.

Т.е. в этих тестах вы совершенно не следили за памятью ядра — а она тоже будет расходоваться.
catap
+2
А что будет если появятся медленные соединения?
catap
0
Я сколько видел компаний, достаточно больших — так везде ад поиска кто где сидит, всякие пересадки… ;)
catap
0
А вы с AD интегрироваться умеете? А поиск по объектам (сотрудникам) на карте есть?.. А ссылка на объект?
catap
0
ко мне приходили уже 4 раза с предложением написать SPDY поддержку в nginx или сделать просто http-spdy прокси.

Что интересно, никто не согласился :)
catap
0
у меня нет iphone и нет вообще ничего от apple
catap
+2
Ценой, да, выстрелил. А вот про остальное можно спорить.

Хотя вокруг меня iOS девайсы таки доминируют :)
catap
+9
Хорошо, в следующий раз буду выделять цветом иронию.

Я хотел сказать о проблеме, что людям нужна внятная аргументация для перехода на это новое и модное.

Пример, кстати тоже от google — SPDY. Протокол, замена http. Дает ускорение на 10% случаев. На некоторых кейсах больше чем 10%, окей. Анонс был в 2009 году. Сейчас 2011 год. Кроме google.com и google chrome его не умеет никто. При этом существует три разных драфта этого протокола, не совместимые между собой.

Спросите почему? Отвечаю. Разработать поддержку это протокола стоит (вилами по воде, да) ~6 человеко-месяцев. Т.е. $50K. Зачем кому-то вкладываться в это? Гугл мог бы начать разрабатывать поддержку этого протокола для браузеров-серверов сам, но почему-то тормозит. Парадокс, однако.

Тоже самое и с dart. Если вам будет нужен сайт который будет показываться не только в google chrome и будет худо-бедно работать на всяких старых телефонах, где браузер не обновляется, то выбор будет js. Не вижу я предпосылок что dart займет какую-то ощутимую долю.

Интересно, а статистику по используемым языкам в app engine гугл не показывает? Мне бы хотелось увидеть какой процент от программ написан на их Go и какой процент траффика приходиться на программы написанные на Go.
catap
+11
Скажите, только мне кажется что гугл набрал кучу молодых студентов которые решили изменить весь мир и с заядлой периодичностью предлагают что-то новое, вместо текущего, аргументируя что это стильно, модно современно.
catap
0
у меня был случай когда я получал больше чем мой начальник. Бобук, кстати, неоднократно говорил, что у него есть подчиненные которые получают больше него.

Почему, если ты начлаьник, ты должен получать больше? :)
catap
0
А как вы можете угадать сколько, например я получаю?