• Root хуже Михалкова
    0
    Вы пропускаете важный момент — когда OOM Killer приходит кого-то убить он считает что root-процессы важнее и стремиться их не трогать!
  • Эффективное хранение: как мы из 50 Пб сделали 32 Пб
    0
    Т.е. файл мы отдадим, только если он был залит с этим письмом, или не отдадим ничего.


    Ого.
  • Эффективное хранение: как мы из 50 Пб сделали 32 Пб
    0
    да, это было бы очень полезно и сняло бы вопросы подобные моим, просто сейчас создается ложное впечатление что тут большие проблемы.

    Т.е. лучше просто дописать что уникальность обеспечивается не только sha1 хешем, но еще тем-то и тем-то и вероятность коллизий есть, но она теоретическая и вообще она вот-такая (и цифру какая она маленькая), а исходя из ограничение на максимальный размер письма/аттача она получается таки равна нулю :)
  • Эффективное хранение: как мы из 50 Пб сделали 32 Пб
    0
    Спасибо за корректный ответ, просто из статьи сложилось впечатление что вы проверяете только хеш.
  • Эффективное хранение: как мы из 50 Пб сделали 32 Пб
    –2
    Давай я тебе лучше ссылку дам где находят коллизию для SHA1 за 76 шагов: https://marc-stevens.nl/research/sha1freestart/

    :)

    Но я согласен что если начать считать стоимость нахождения этой коллизии то это на amazon ec2, то это будет пара сотен тысяч долларов.
  • Эффективное хранение: как мы из 50 Пб сделали 32 Пб
    0
    в сложном документе, например PDF или картинке, где лишние байты будут игнорироваться :) можно совершить атаку и подобрать мусор что бы два разных (по содержанию отображаемому пользователю) документа имели одинаковый хеш.

    Мне кажется правильным как минимум держать размер (в байтах) файла, а лучше использовать две хеш функции для и размер, тем самым сводя вероятность коллизий совсем до минимума.

    Например для md5 я с ходу нашел такую очень старую (~10 лет) работу: http://cryptography.hyperlink.cz/md5/MD5_collisions.pdf
  • Видео в формате 24*365*8: история видеосервиса Моего Мира Mail.Ru
    0
    Макс, зачем для этого возвращаться? :)

    В любом случае мой email ты знаешь ;)
  • Видео в формате 24*365*8: история видеосервиса Моего Мира Mail.Ru
    0
    Может люди такие там и есть, не знаю. Но я не там уже более 5 лет :)
  • Реанимация серверов Ubuntu на Hetzner или немного полезных команд
    0
    зачем делать grep если можно добавить ключ l?
  • Реанимация серверов Ubuntu на Hetzner или немного полезных команд
    0
    зачем nmap когда можно сказать netstat -npl и увилить кто какой порт слушает, прям с pid?
  • Data Mining Hub, глазами ученых
    0
    В случае Data Mining Hub команде не раскрываются все данные и затачиваться она сможет только под известный ей dataset.

    Второй dataset схожего размера будет использоваться для оценки качества алгоритма, т.к. в отличии от kaggle код не раскрывается и остается вашей интеллектуальной собственностью.
  • Data Mining Hub, глазами ученых
    0
    Спасибо!

    Дизайн и навигация, как и весь UI, будет перерабатываться.
  • Data Mining Hub, глазами ученых
    0
    Да, вы можете зайти в набор данных задачи и все-все-все скачать.
  • Data Mining Hub, глазами ученых
    0
    В этом плане опыт Kaggle показывает что люди готовы :)

    Мы подошли к вопросу баланса прав между учеными и заказчиками с позиции защиты прав ученых.
  • 1000000 паролей от почтовых ящиков Яндекса утекли в сеть
    0
    погрешности не было, так что должны были проверить либо все логины-пароли, либо выбрать какое-то подмножество случайным образом (тут не описано почему человек считает что его выборка достаточно случайна и случайна ли) и проверить на нем.

    В текущей постановке фразы скорее всего проверили, если проверили, 10 логинов-паролей с верху, пару-тройку помотав куда-то и сделали вывод.
  • 1000000 паролей от почтовых ящиков Яндекса утекли в сеть
    0
    1 милион раз?!
  • Как мы превратили телефон в банковскую карту
    0
    Есть Google Wallet. К нему можно привязать через google checkout любую карту. Используя всякие HCE можно держать карту в облаке и не тратиться на security element а спрашивать необходимое у эммитента.

    Выглядит очень красиво и радужно.

    Но ломается, как только мы вспоминаем что любая транзакция с карты стоит денег. Пускай даже 0.5% но это расходы. Строить модель которая работает когда есть кто-то большой кто дает деньги, это очень романтично, но в один прекрасный момент халява закончится :) В общем не просто так google wallet работает только в одной стране на паре телефонов ;)
  • Комментарий из публикации, перенесённой в черновики.
  • Методы анонимности в сети. Часть 1. Просто о сложном
    0
    Сложный вопрос.

    Например балансирующий прокси-серер haproxy не умел https раньше, но, зато, используя внешние слои утилиты, можно было делать ssl ;)
  • Методы анонимности в сети. Часть 1. Просто о сложном
    0
    Тогда я не совсем понимаю почему в случае I2P вы рассказали про их альтернативный интернет, а в случае tor — нет.
  • Методы анонимности в сети. Часть 1. Просто о сложном
    0
    В случае tor не раскрыты onion сайты :(
  • Методы анонимности в сети. Часть 1. Просто о сложном
    0
    никакие протоколы прокси НЕ поддерживают шифрование между HTTP/SOCKS/Elite/Anonymous-прокси и клиентом. А SSL-прокси означает лишь то, что клиент может работать с https-ресурсами;


    Никто не мешает на 5 уровне сделать прозрачный для proxy сервера SSL тунель.
  • Методы анонимности в сети. Часть 1. Просто о сложном
    0
    тут, случайно, было следующий коммент
  • Методы анонимности в сети. Часть 1. Просто о сложном
    0
    Протокол SOCKS находится на сеансовом уровне модели OSI, этим достигается независимость от высокоуровневых протоколов


    Вообще SOCKS это прикладной (application) уровень. А независимость достигается инкапсуляцией данных.
  • DBSlayer прокси на BASH за 5 минут или еще один способ отдать JSON из MySQL
    +4
    Плохо, однопоточно, надо сделать после принятия соеденения fork для вызова mysql :)
  • Свое облако, в 10-15 раз дешевле Amazon EC2
    0
    сдают :)
  • Свое облако, в 10-15 раз дешевле Amazon EC2
    0
    а оно 3 года проживет?
  • Миллион одновременных соединений на Node.js
    +1
    Т.к. у нас TCP нам нужно держать буфер пока не придет ACK.

    4кб расходы системы на буфер (на самом деле их несколько, просто тут не секундная летенси и получается как будто 4кб, в реальности будет где-то 12-16).

    Если у нас идет поток 10,000 запросов в секунду, то мы будем потреблять как минимум буфера на эти соеденения + дельту на передачу данных. Если буфер передается за 1 секунду до клиента, то нам нужно ~100 мегабайт памяти. Если начинаются потери и идут всякие ретрансмиты, то у нас требования по памяти вырастают.

    Я не говорю что невозможно сделать 1М соединений с сервером. У меня пока рекорд около 4,5М на amazon :), тут просто надо понимать, что есть ограничения другого уровня и их тоже надо учитывать.
  • Миллион одновременных соединений на Node.js
    0
    Там счастья нет. Надо смотреть что у вас за траффик, какой процент людей и чем вы готовы жертвовать ради достижения какого-то счастья.
  • Миллион одновременных соединений на Node.js
    0
    Тогда тут мой пардон, я не смог интерпретировать Total Netto как ядерную память.

    Да, 4kb современный линукс выделяет на одно соединение, это правда.

    Если данное решение ориентировано на сервис, у которого 80% пользователей будут иметь стабильное (тут скорее вопрос не в latency, а именно в bandwish) соединение с сервером — то вопросов нет.

    Если там будут мобильные клиенты, то я бы закладывался что total netto будет выше.

    Так же я бы закладывался что total netto будет выше, в случае если вы будете посылать более большие ответы.
  • Миллион одновременных соединений на Node.js
    0
    Под медленными клиентами, я понимал в первую очередь людей у которых плохой или ненадежный интернет.

    Как работает ваш асинхронный сервер — вы сказали send и отправили буфер (фактически скопировали память с userspace в память которая уйдет уже в сокет). Интересный факт в том, что если вы оправляете большой ответ, скажем два пакета, пока не придет два подтверждения от клиента. Т.е. если у вас много медленных клиентов, то ядро своими буферами с ответами съест какую-то память.

    Далее, вы в примере используете ip conntrack, судя по настройкам в тесте, что увеличит время в пессимистичном раскладе которое будет использоваться больший объем памяти.

    Т.е. в этих тестах вы совершенно не следили за памятью ядра — а она тоже будет расходоваться.
  • Миллион одновременных соединений на Node.js
    +2
    А что будет если появятся медленные соединения?
  • Создание интерактивной карты офиса
    0
    Я сколько видел компаний, достаточно больших — так везде ад поиска кто где сидит, всякие пересадки… ;)
  • Создание интерактивной карты офиса
    0
    А вы с AD интегрироваться умеете? А поиск по объектам (сотрудникам) на карте есть?.. А ссылка на объект?
  • Google запустила сайт для разработчиков: JavaScript vs. Dart
    0
    ко мне приходили уже 4 раза с предложением написать SPDY поддержку в nginx или сделать просто http-spdy прокси.

    Что интересно, никто не согласился :)
  • Google запустила сайт для разработчиков: JavaScript vs. Dart
    0
    у меня нет iphone и нет вообще ничего от apple
  • Google запустила сайт для разработчиков: JavaScript vs. Dart
    +2
    Ценой, да, выстрелил. А вот про остальное можно спорить.

    Хотя вокруг меня iOS девайсы таки доминируют :)
  • Google запустила сайт для разработчиков: JavaScript vs. Dart
    +9
    Хорошо, в следующий раз буду выделять цветом иронию.

    Я хотел сказать о проблеме, что людям нужна внятная аргументация для перехода на это новое и модное.

    Пример, кстати тоже от google — SPDY. Протокол, замена http. Дает ускорение на 10% случаев. На некоторых кейсах больше чем 10%, окей. Анонс был в 2009 году. Сейчас 2011 год. Кроме google.com и google chrome его не умеет никто. При этом существует три разных драфта этого протокола, не совместимые между собой.

    Спросите почему? Отвечаю. Разработать поддержку это протокола стоит (вилами по воде, да) ~6 человеко-месяцев. Т.е. $50K. Зачем кому-то вкладываться в это? Гугл мог бы начать разрабатывать поддержку этого протокола для браузеров-серверов сам, но почему-то тормозит. Парадокс, однако.

    Тоже самое и с dart. Если вам будет нужен сайт который будет показываться не только в google chrome и будет худо-бедно работать на всяких старых телефонах, где браузер не обновляется, то выбор будет js. Не вижу я предпосылок что dart займет какую-то ощутимую долю.

    Интересно, а статистику по используемым языкам в app engine гугл не показывает? Мне бы хотелось увидеть какой процент от программ написан на их Go и какой процент траффика приходиться на программы написанные на Go.
  • Google запустила сайт для разработчиков: JavaScript vs. Dart
    +11
    Скажите, только мне кажется что гугл набрал кучу молодых студентов которые решили изменить весь мир и с заядлой периодичностью предлагают что-то новое, вместо текущего, аргументируя что это стильно, модно современно.
  • В вашей компании публично известны суммы выплат и бонусов?
    0
    у меня был случай когда я получал больше чем мой начальник. Бобук, кстати, неоднократно говорил, что у него есть подчиненные которые получают больше него.

    Почему, если ты начлаьник, ты должен получать больше? :)