Pull to refresh
513
0
Слава Вишняков @yoihj

Нагруженные бэкэнды

Send message
1. Про innerHTML я думал, но будет медленнее мне кажется. Есть какие-то аргументы в пользу?
2. Верно — надо бы, сделаю.
И BumpTop тоже…
Да, такая штука по умолчанию у меня в HTC Desire. Честно сказать — Swype ее кушает на завтрак по скорости и точности. Так что Гуглу Свайп следовало бы покупать.
Зря Вы человека заминусовали — поищите историю стартапа DodgeBall, чтобы понять о чем он.
Не, я конечно в восторге — роботы и все такое, но они в такие здоровые дырки и так медленно паркуются, что честно говоря, выгоды для любого, кто хотя бы год за рулем отсидел — не вижу.
упс:
print 1. * len(critic_1 & critic_2) / len(critic_1 | critic_2)

там "|" должно быть в знаменателе
"-c" в знаменателе там явно лишнее, да и делается подобный расчет куда проще с помощью setов.

  critic_1 = set(['Film A', 'Film B'])
  critic_2 = set(['Film A'])
  print 1. * len(critic_1 & critic_2) / len(critic_1 & critic_2)

"1." там для того, чтобы в float расчет шел.
Споры относительно семантики (определения что понимать под словом) являются одними из тех споров, в которых не рождается истина. И в них никто ничего не выигрывает.
Добавил в топик, спасибо за важную находку — в самой оригинальной статье про это ни слова.
Добавил в статью, но откуда информация?
Вам не нужны. А тем, кто хочет следить за своими пользователями — нужны. Кроссбраузерность — это так больше — (не)приятная дополнительная плюшка.
Собственно я о том, что гиганты наверняка уже используют подобные системы in-house, так что им покупать это нафиг не надо, у них своих систем слежения хватает.
… вспоминая (уже потертый) топик о Steven Rambam «The next HOPE»…
Вы серьезно думаете, что он — первый кто до этого додумался?
Автор, а чем Вас не устроили распределенные базы данных ключ-значение (thepiratebay.org-xxx.xxx.xxx.xx) тот же Византийский Паксос (Byzantine Paxos), например, устойчив к лжи и подлогу внутри сети, отказам части сети и т.п…

Проблема тут будет в том, что сквоттеры уже через час будут владеть всеми доменами, которые только хоть как-то осмысленны. Сейчас их останавливает только то, что за домены надо платить хоть сколько-то. А в такой сети какой ограниченный ресурс будет использоваться для сдерживания?
200млн / 100 = 2 млн строк? Ваш вопрос я так понял — куда на современном компьютере можно сохранить 20-100 мегабайт данных?
«А если 100 [компьютеров] станет мало?»

100 компьютеров позволят Вам обрабатывать примерно 170 миллионов страниц в месяц по самой консервативной оценке. Куда Вам столько? Одного VPS для Ваших целей с ушами.

У меня вон проект есть — сканирует 20000 ресурсов ежедневно (в сумме 500 000 страниц в день — ограничение искусственное, чтобы не выходить за 200 ГБ траффика в месяц, а процессор позволяет где-то в 20 раз больше делать) — ничего на одном VPS за $20 живет.

Скажите сколько Вам нужно будет посетителей привлечь, чтобы проанализировать 15 млн страниц за месяц?

«Посетители не стоят ничего.»

Кстати не продадите миллионов десять посетителей за «ничего»?
Вот ровно те же мысли возникли при чтении — интересно, но не понятно ничего.

И главный вопрос, который меня мучает — а где это все применяется-то вообще и как связано с тематикой Хабра?

Насколько я помню вейвлеты в SURF применяются для анализа изображения, а тут речь про сигналы, частоты

Кажется они еще в распознавании лиц могут применяться, но вот глядя на вышесказанное как-то связать не могу это все.

Information

Rating
Does not participate
Location
Москва и Московская обл., Россия
Date of birth
Registered
Activity