Pull to refresh
27
0
Send message
ух-ты спасибо! Утащил продолжительность чтения и «Оценку понятности и удобочитаемости» в план развития
Списки стоп-слов постоянно пополняются. Я стараюсь в день редактировать по тексту и вручную проверять алгоритм.

Подскажите, что выделить в вашем примере?
Открою вам секрет. Хороший текст редактируется три-четыре раза с перерывом в пару часов. Итого целый день.
Я не успеваю довести до идеала все тексты :(
Я понял, что без подкола. Предупредил, что качество текста считается из головы и не всегда корректно работает.

Если стоп-слов в тексте 15% я его считаю ужасным на 0% качества. О и скобочку забыл (1 — metrics['stop_words']/metrics['words']*100/15.0)*100

С исходным текстом все непросто: это посредственный перевод, посредственной статьи на английском. Более того в паре мест автор оригинальной статьи пишет бред.

’except perhaps for the team's invocation of BBM's popularity as a global social messaging platform. The original launch for iOS and Android didn't exactly go according to plan — it's been some three weeks since those apps first started popping up in their respective app stores, and there's still no firm word on when BlackBerry will open the floodgates again’

На мой взгляд, правильный вариант — перевести другую статью или написать свои мысли по поводу открытого письма с цитатами зарубежных авторов.

Вы — молодец, все верно, механическое убирание стоп-слов тексту не поможет, думать нужно.
К сожалению, для качества текста не придумал достойного алгоритма, сейчас 1 — metrics['stop_words']/metrics['words']*100/15.0*100.

Может у кого есть идеи как улучшить?
Спасибо за идею, классная, занес в to-do.
Ни информационный, ни Test The Text не применимы к художественным произведениям. Они для реальной жизни.
«В двух словах» это клише. Клише следует избегать в текстах :)
Поделитесь ссылками на российские учебники?
Отглагольные существительные, пассивный залог и причастные обороты делают текст сложнее для чтения.

Модальные глаголы делают текст слабым и неуверенным. Могут или не могут? Кому должны?

Правильно учат американских школьников, да :)
Вы правы. Как я упоминул инфо стиль не подходит для постов на хабр
Да, если это например документация к API, странно в ней выражать эмоции. Или новости.
это бага pymorphy, он рассматривает слова по одиночке, без контекста. И считает «открытое» причастным оборотом, хотя очевидно, что это прилагательное.

Пока думаю что делать, переключиться на другой анализатор или написать свой.
Пока нет, есть в планах
будет отдельным постом. В двух словах: Django, pystemmer, pymorphy

Information

Rating
Does not participate
Registered
Activity