Pull to refresh
49
0

User

Send message
>>определена только для непрерывных случайных переменных
p вероятность «орла» непрерывна, бета распределение тоже непрерывно.

Мы говорим «плотность» поскольку все точечные вероятности бесконечно малы.

>>Во-вторых, ни одна, ни другая функция не сама по себе ничего не говорит об evidence (число орлов и решек в сэмпле) или условных вероятностей.
Я не понял вас.
Если писать на си в памяти, то поможет. В нашей ситуации больше времени занимает считывание диска.
Она значительно медленнее. Но в ней есть леммы (падеж, род, число и прочее). Мне леммы не нужны.
Они нужны для синтаксического разбора или для других задач. Например, подчеркивания зеленой волнистой линией ошибок словоупотребления.
Почему парадокс дней рождения возникает? Поскольку если в группе N элементов, у них N * (N-1) комбинаций и вероятность того, что в одной из комбинаций выстрелит событие возрастает. Здесь нет пар.
Я это проверял, скорость при первом обращении не сильно ниже, чем при последующих.
В кеш ОС попадает, если файл целиком читать, а если кусочками, то он может лечь в кеш диска. Но он весит 50 мб, а у меня кеш на диске 8 мб. Т.е. полностью он не может лечь на диск.
Я это знаю. В этом случае не влияет на вероятность.
P.S. База маленькая, так что если написать грамотную реализацию на С++ с использованием Perfect Hash (гуглить gpref) и поднять всё это как демон — будет вообще ураган.

Мне пока скорости хватает. В этой статье 1.5 к слов, т.е. он может 33 таких статьи разбирать в секунду. Без кеширования, на обычном НМДЖ.
CRC короче. CRC позволяет экономить место и поиск чуть быстрее. Во вторых у разных словоформ разная длина от 1 до 35 символов. Поэтому, если не использовать CRC32 нужно создавать еще один файл, в котором находятся позиция словоформы во втором файле. Это дополнительный код, место и задержки.
Вероятность ошибки всегда есть. Как минимум из-за того, что появляются новые слова неологизмы и их нет в базе. CRC32 увеличивает вероятность ошибки незначительно.

>>Запускайте профилировщик запроса, пробуйте хэш-индексы и innodb, которая не блокирует всю таблицу.
Я пробовал почти все. Блокировка все равно. У нас только чтение.
Для ноды логичнее их в память закинуть. Для PHP поскольку потоков сразу несколько и нужно при каждом запросе их грузить в память, лучше закинуть на диск. В идеале на виртуальный (который в памяти находится). Всякие мем-кешед предназначены не для этого.
С этой бумагой можно абузить в Гугл, чтобы он исключил из выдачи страницы с пиратскими версиям. С Гуглом пробовал — работает, с Яндексом не пробовал.
Можно абузить в хостинг, но это реже работает.
Имел несчастье работать с Гугл по совсем другому вопросу.

То, что у них написано в полиси не значит, что тоже самое написано в инструкции для модеров. Был случай, когда тыкаешь их в опубликованный полиси и ГК РФ, а они разводят руками.

Т.е. есть список пунктов за который модеры могут банить, если пункта какого-то в нем нет, то даже менеджер модеров не может за него забанить. Даже не факт, что такие полномочия есть у руководителя проекта. А у него куча головной боли кроме этого. Поэтому, я уверен, что вам ничего не ответят. Можете смело переводить на другие языки.
Интересная статья. Но есть несколько замечаний:

1. Сайт
1.а. Вы как-то обзовите тип сервиса. Вроде «Система управления тех. поддержкой». Люди мыслят словами и им удобнее чтобы что-то имело название.
1.б. Тексты лучше отдать на редактирование. Их мало обойдется в пару десятков баксов.
1.в. Людям не нужны кровати им нужен хороший сон. Опишите что конкретно даст пользователям.
1.г. В форме регистрации слишком много полей. Зачем вам мое ФИО?
1.д. Левая кнопка выглядет плохо. Замените ее ссылкой. А лучше вообще уберите.

2. Продвижение.
2.а. Будет ли контекстная реклама работать можно понять из wordstat.yandex.ru, если запросов мало — значит не будет.
2.б. На новых рынках контекст плохо работает. Дело не в Б2Б.
2.в отключать контекст не нужно — выставьте низкую ставку. Будет приносить мало подписчиков, но зато дешево.
2.г. По контексту приведите запросы и данные по CTR.
2.д. Банеры не приносят прямые продажи. Банеры повышают узнаваемость бренда. В вашем случае это полезно, если сможете их сфокусировать на вашу ЦА.
2.е. Попробуйте писать статьи на тематические сайты. Описывающие, что почему нужно пользоваться подобными системами и что они дают.
2.ё. Можно также попробовать написать статью с обзором вашего сервиса и конкурентов, их возможностями в табличке.
2.з. Попробуйте блогерам написать и попросить обзор. Если есть тематические блогеры.

Вам нужно не захватывать рынок, а его создавать. Контекст и SEO в этом вам плохо поможет.
Насчет гибкости то есть фильтры: Вот вам стилус:
    var stylus= require('stylus');
    fastStatic.addFilter({
        exts:'stylus,styl',
        ext:'css',
        order:100,
        fun:function(data,filename, ext, cb){
            stylus.render(data,{},cb);
        }
    });


Для статика кроме фильторв единственный полезный middleware это gzip, которые идет в комплекте с кешированием.
Если его не делать ссылкой, то стили к нему не апрувятся придется заворачиваться с CSS. А если вы используете например, бутсрап то проблем такое решение прибавит.
Ну необязательно Express у многих фреймворков ноды совместимость middleware
сравните синтаксис. Какой более чистый у USE тега или у кучи script/style да и еще и с комментами? Какой проще использовать?
сколько времени нужно настраивать и устанавливать плагины?
Лишний гембель — у меня все это идет из коробки.
grunt-urlrevs это только для картинок
к урлу хтмл-файлов хеш не добавишь.

В общем можно сделать все что угодно на чем угодно даже на си++. Вопрос в том насколько сложно.

Hash к урлам добавляет грунт, а вот max-age должен отправлять ваш код. Т.е. этот пример хорошо иллюстрирует почему решение сборщик+стат-мидлеваре в одном флаконе лучше.

Реализовал в последней версии эту фичу. Из коробки идет по умолчанию.

Information

Rating
Does not participate
Location
Одесса, Одесская обл., Украина
Date of birth
Registered
Activity