Определение части речи слов в русском тексте (POS-tagging) на Python 3

Пусть, дано предложение “Съешьте еще этих мягких французских булок, да выпейте чаю.”, в котором нам нужно определить часть речи для каждого слова: [('съешьте', 'глаг.'), ('еще', 'нареч.'), ('этих ...
+80
10 августа 2011, 00:28
144
Irokez 56,7

Нормализация слов для русского, английского и немецкого языков (iOS и Mac OS X)

Нормализация слова – это приведение слова к нормальной форме. Есть задачи, где полноценный морфологический анализ не нужен (нахождения всех форм слова и грамматической информации). А нужно лишь ...
+25
4 июля 2011, 11:11
37
Kyrie1965 55,6

Анализатор морфологии на автоматах

Периодически на хабре проскакивают статьи о том, как написать программу для анализа морфологии. В основном авторы пользуются базами данных, либо стандартными структурами, такими как словари. Но это ...
+25
11 декабря 2010, 13:54
23

Сумбурные заметки про python и django

Накопилось несколько маленьких заметок/советов про python и django, которые на отдельные топики не тянут, поэтому публикую все сразу. Под катом: как упростить код вьюх ровно в 2 раза легкий ...
+147
6 октября 2010, 12:55
408
kmike 129,9

Семинар Natural Language Processing — открытие сезона 2010/11

В субботу 25-ого сентября 2010 в 17.00 мы открываем новый сезон семинара по автоматической обработке естественного языка. На первом заcедании этого учебного года выступит Эдуард Клышинский ( ...
+36
20 сентября 2010, 14:30
19
tlando 13,1

Zend_Search_Lucene + PHPMorphy — это просто

Когда-то смотрел документацию по Zend_Search_Lucene. Все хорошо, все понятно. Бери и встраивай в свой сайт. Только вот ни слова там нету про то, каким образом прикрутить стеммер или морфологический ...
+9
10 апреля 2010, 18:33
19
m00t 22,6

Гибридная реализация русской морфологии

При создание поисковых решение одним из первых с чем приходиться сталкивать разработчику это предварительная обработка текста. Разбивка на термины, фильтрация стоп слов. Важной операцией влияющей на ...
+13
8 августа 2009, 17:14
14
akuznetsov 11,4

Кузявые ли бутявки, т.е. пишем морфологический анализатор на Python

Морфологический анализатор для русского языка — это что-то заумное? Программа, которая приводит слово к начальной форме, определяет падеж, находит словоформы — непонятно, как и подступиться? А на ...
+103
18 января 2009, 07:21
160
kmike 129,9

Live Search заговорил по-русски

Поисковик Microsoft Live Search научился работать с морфологией русского языка и исправлять запросы, набранные в неправильной раскладке клавиатуры и с грамматическими ошибками. В этом начинании ...
+15
10 октября 2008, 22:37
3
Tigger 70,1

Морфологический поиск

Точный поиск, реализуемый в базах данных это очень хорошо, когда дело касается точных фраз. Но что делать, когда среди документов есть Киевская карта но нету Карты Киева? В дело включаются языковые ...
+18
24 февраля 2008, 00:27
40
tot_ra 22,7