<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0">
<channel>
	<title>Хабрахабр / Комментарии к посту «Триграммный индекс или «Поиск с опечатками»» в блоге «PostgreSQL»</title>
	<link>http://habrahabr.ru/rss/post/78566/</link>
	<description><![CDATA[Новые комментарии к посту «Триграммный индекс или «Поиск с опечатками»» в блоге «PostgreSQL»]]></description>
	<language>ru</language>
	<managingEditor>editor@habrahabr.ru</managingEditor>
	<generator>habrahabr.ru</generator>
	<pubDate>Sat, 11 Feb 2012 18:25:07 GMT</pubDate>
	<lastBuildDate></lastBuildDate>
	<image>
		<link>http://habrahabr.ru/</link>
		<url>http://habrahabr.ru/i/logo.gif</url>
		<title>Хабрахабр</title>
	</image>
	

	
	
	
	
	
		
	
		<item>
			<title>16.02.2010 20:51:19 13i</title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/postgresql/78566/#comment_2520616</guid>
			<link>http://habrahabr.ru/blogs/postgresql/78566/#comment_2520616</link>
			<description><![CDATA[Несмотря на быстродопущенные ляпы (например 650 надо умножать на 4, т.к. еще разделитель нужен), результат примерно остается таким же — 100 Мбайт, а если применить описанное выше сжатие — около 60 Мбайт.]]></description>
			<pubDate>Tue, 16 Feb 2010 20:51:19 GMT</pubDate>
			<author>13i</author>
		</item>
	

	
		<item>
			<title>16.02.2010 20:47:25 13i</title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/postgresql/78566/#comment_2520604</guid>
			<link>http://habrahabr.ru/blogs/postgresql/78566/#comment_2520604</link>
			<description><![CDATA[Предположим, на сайте 1000 страниц.<br/>
Номера в основном трехзначные, т.е. 3 байта.<br/>
В среднем предположим, что под запись во вторую ячейку будут попадать 65% страниц, т.е. 650.<br/>
Умножим 650 на 3 = 1950, округлим до 2000 байт.<br/>
Умножим кол-во строк 40 тысяч на размер одной строки 2000 байт = 80 000 000 байт = 78125 Кбайт ≈ 76 Мбайт.<br/>
<br/>
Округлим до максимума — 100 Мбайт с каждой тысячи страниц ради поиска с опечатками.<br/>
Стоит ли это результата? Думаю, стоит!]]></description>
			<pubDate>Tue, 16 Feb 2010 20:47:25 GMT</pubDate>
			<author>13i</author>
		</item>
	

	
		<item>
			<title>16.02.2010 20:38:35 13i</title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/postgresql/78566/#comment_2520576</guid>
			<link>http://habrahabr.ru/blogs/postgresql/78566/#comment_2520576</link>
			<description><![CDATA[1. Точнее 34^2…<br/>
<br/>
2. Проверил. Действительно почти в любом мало-мальски нормальном тексте (1-2 «страницы»).<br/>
<br/>
3. Пришлось нехотя согласиться с тремя буквами, хоть это и получается 34 в третьей степени (добавляется символ «пробел» или заменяющее его «подчеркивание»). В общем около 40 тысяч строк получится в таблице. Первая ячейка — varchar (3), вторая — text.<br/>
<br/>
4. Для экономии места стоит ли автоматически сокращать запись во второй ячейке при перечислении номеров страниц типа «34,35,36,37,38,39» до «34-39»?<br/>
<br/>
5. Для ускорения работы поиска можно сначала поискать обычным методом (полнотекстовый поиск) и если результат будет равен 0 — искать с опечатками, а если результат будет положительным — предложить пользователю также возможность поискать с опечатками… Это спорный вопрос, готов выслушать ваше мнение.]]></description>
			<pubDate>Tue, 16 Feb 2010 20:38:35 GMT</pubDate>
			<author>13i</author>
		</item>
	

	
		<item>
			<title>16.02.2010 20:16:01 sel</title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/postgresql/78566/#comment_2520495</guid>
			<link>http://habrahabr.ru/blogs/postgresql/78566/#comment_2520495</link>
			<description><![CDATA[Ну здесь несколько моментов:<br/>
1. Комбинаций по 2 буквы вообще не много, собственно примерно 33^2, можно и сразу заполнить.<br/>
2. Все-таки искать сразу в тексте ничего не даст. В любом случае надо сначала искать слова/фразы. То есть набор «стереограмм» или «триграмм» надо искать в пределах одного слова/фразы, а потом ссылать на статью. Во-первых, надо же показать правильное слово, а второе — уверен, что любой набор из 2-х букв будет встречаться практически в любом тексте. Если не все стереограммы, то большая часть из набора.<br/>
3. 3 буквы, а не 2, используются для того, чтобы была большая определенность, больший процент вероятности совпадения. Мне кажется, лучше пробовать с 3-мя.<br/>
<br/>
Интересно, что получилось в результате? Или это еще пока идея?]]></description>
			<pubDate>Tue, 16 Feb 2010 20:16:01 GMT</pubDate>
			<author>sel</author>
		</item>
	

	
		<item>
			<title>16.02.2010 18:28:01 13i</title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/postgresql/78566/#comment_2520076</guid>
			<link>http://habrahabr.ru/blogs/postgresql/78566/#comment_2520076</link>
			<description><![CDATA[Прошло почти 2 месяца…<br/>
Продолжил измышления. Прошу поправить, если я ошибаюсь.<br/>
<br/>
Составим индекс. Если составлять его из триграмм — получится довольно большой индекс, т.к. кол-во вариаций с тремя символами в любом случае больше, чем с двумя. Поэтому решено сделать «стереограммы». Каждая статья разбивается на слова (за счет пробелов), а каждое слово — на стереограммы, которые прописываются в таблицу стереограмм в базе данных. Каждая статья имеет свой номер.<br/>
<br/>
Пример таблицы:<br/>
_а — 234, 567, 234<br/>
_б — 432, 322, 234<br/>
пи — 324, 343, 244<br/>
<br/>
Очевидные условия: <br/>
 — при заполнении индекса — если стереограмма слова со страницы уже присутствует в таблице стереограмм — повторно не заносить, не дублировать<br/>
<br/>
Далее — сам поиск.<br/>
Возьмем слово «Пужкин», разобъем его на стереограммы:<br/>
_п, пу, уж, жк, ки, ин, н_<br/>
ищем каждую стереограмму в таблице по отдельности, получая список номеров страниц, где она встречается.<br/>
На основании сравнения общих совпадений выдаем список страниц по рейтингу двух типов совпадений: полное и частичное (без одной стереограммы).<br/>
<br/>
Идея не совсем полноценная, т.к. есть вероятность нахождения подобных стереограмм в тексте, в котором вообще нет ничего похожего на Пушкина. Но идею можно дополнить полнотекстовым поиском сочетаниц стереограмм по отобранным статьям, сначала из полного совпадения и, при нулевом результате — из частичного совпадения.<br/>
<br/>
Надеюсь, что изложил доступно.]]></description>
			<pubDate>Tue, 16 Feb 2010 18:28:01 GMT</pubDate>
			<author>13i</author>
		</item>
	

	
		<item>
			<title>20.12.2009 13:45:27 sel</title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/postgresql/78566/#comment_2301537</guid>
			<link>http://habrahabr.ru/blogs/postgresql/78566/#comment_2301537</link>
			<description><![CDATA[Ну чисто теоретически наверно можно, но много сложностей. Например, вы же не знаете, какие триграммы будут в поле, какие нет — придется искать по условию «или», а в этом случае будет будет слишком много результатов даже на небольшой фразе. <br/>
Следующая проблема — рейтинг, придется писать какую-то функцию в MySql, которая будет считать количество вхождений, чтобы потом сортировать по ее результату.<br/>
И самое главное — производительность. Непонятно, насколько быстро это будет работать.<br/>
<br/>
Хотя, если создать отдельное поле, сразу заполнить его триграммами и повесить полнотекстовый индекс, то можно попробовать) Если вдруг решитесь, напишите о результатах, интересно)]]></description>
			<pubDate>Sun, 20 Dec 2009 13:45:27 GMT</pubDate>
			<author>sel</author>
		</item>
	

	
		<item>
			<title>19.12.2009 16:50:33 13i</title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/postgresql/78566/#comment_2299506</guid>
			<link>http://habrahabr.ru/blogs/postgresql/78566/#comment_2299506</link>
			<description><![CDATA[а что мешает использовать второй способ — с триграммами?<br/>
разбить слово при помощи PHP на трехбуквенные кусочки и поискать их в мускуле…<br/>
<br/>
или я ошибаюсь и второй вариант работает совсем по-другому?]]></description>
			<pubDate>Sat, 19 Dec 2009 16:50:33 GMT</pubDate>
			<author>13i</author>
		</item>
	

	
		<item>
			<title>19.12.2009 10:47:13 sel</title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/postgresql/78566/#comment_2298753</guid>
			<link>http://habrahabr.ru/blogs/postgresql/78566/#comment_2298753</link>
			<description><![CDATA[Вполне вероятно, что для MySql есть подобные модули, но я не встречал. Поверхностный поиск в сети тоже ничего не дал, хотя может нужно поискать тщательней.]]></description>
			<pubDate>Sat, 19 Dec 2009 10:47:13 GMT</pubDate>
			<author>sel</author>
		</item>
	

	
		<item>
			<title>19.12.2009 10:41:38 sel</title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/postgresql/78566/#comment_2298742</guid>
			<link>http://habrahabr.ru/blogs/postgresql/78566/#comment_2298742</link>
			<description><![CDATA[Перевод в другую раскладку используем.<br/>
<a href="http://read.ru/search/geirby/">read.ru/search/geirby/</a><br/>
<br/>
По поводу словарей, тоже так и делали. В посте было — словари, плюс собственная база, разбитая по словам.]]></description>
			<pubDate>Sat, 19 Dec 2009 10:41:38 GMT</pubDate>
			<author>sel</author>
		</item>
	

	
		<item>
			<title>19.12.2009 09:49:23 TravisBickle</title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/postgresql/78566/#comment_2298621</guid>
			<link>http://habrahabr.ru/blogs/postgresql/78566/#comment_2298621</link>
			<description><![CDATA[Это конечно всё хорошо, но, думаю, надо еще отдать приоритет согласным и первым-последним буквам, т.к. их расположение является определяющим. Еще стоит учитывать раскладку клавиатуры и учитывать в первую очередь наиболее вероятные опечатки, ну и переводить в другую раскладку автоматически при необходимости, a-la Punto Switcher. Это решается более продвинутым индексом, который складывает очки для каждого варианта. То есть, для каждого слова генерируется набор условий и очки, а затем выполняется поиск и вычисление наиболее подходящих вариантов. Надо еще подумать о фразах, поскольку наиболее подходящий вариант можно подобрать по контексту.<br/>
Кстати говоря, зачем использовать толстые словари? Можно в качестве словаря использовать множество слов в собственной базе]]></description>
			<pubDate>Sat, 19 Dec 2009 09:49:23 GMT</pubDate>
			<author>TravisBickle</author>
		</item>
	

	
		<item>
			<title>19.12.2009 09:17:22 13i</title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/postgresql/78566/#comment_2298545</guid>
			<link>http://habrahabr.ru/blogs/postgresql/78566/#comment_2298545</link>
			<description><![CDATA[А к MySQL это всё применимо? Или хотя бы второй вариант???]]></description>
			<pubDate>Sat, 19 Dec 2009 09:17:22 GMT</pubDate>
			<author>13i</author>
		</item>
	

	
		<item>
			<title>18.12.2009 14:09:57 el777</title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/postgresql/78566/#comment_2297252</guid>
			<link>http://habrahabr.ru/blogs/postgresql/78566/#comment_2297252</link>
			<description><![CDATA[Я в итоге перешел на расстояние Левеншейна. <br/>
Но опять же его реализация в PG оставляла желать лучшего. При работе с русскими буквами в UTF-8 он их считал за 2 буквы, поэтому расстояние иногда удваивалось, а иногда нет.<br/>
Пришлось написать такую функцию на plpgsql — она корректно работала. Хотя и существенно медленнее.]]></description>
			<pubDate>Fri, 18 Dec 2009 14:09:57 GMT</pubDate>
			<author>el777</author>
		</item>
	

	
		<item>
			<title>18.12.2009 13:22:41 el777</title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/postgresql/78566/#comment_2297147</guid>
			<link>http://habrahabr.ru/blogs/postgresql/78566/#comment_2297147</link>
			<description><![CDATA[Я в конечном итоге перешел на расстояние Левеншейна.]]></description>
			<pubDate>Fri, 18 Dec 2009 13:22:41 GMT</pubDate>
			<author>el777</author>
		</item>
	

	
		<item>
			<title>18.12.2009 13:17:37 Nicolette</title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/postgresql/78566/#comment_2297129</guid>
			<link>http://habrahabr.ru/blogs/postgresql/78566/#comment_2297129</link>
			<description><![CDATA[Когда-то писала бакалаврскую по сравнению методов нечеткого поиска, и у меня получилось, что как раз триграммный метод для русского и украинского языков дает далеко не лучшие результаты, да и SoundEx тоже — лучшими были «максимальная общая подстрока» и «расстояние Левенштейна». Приятно видеть, что где-то он все-таки используется.]]></description>
			<pubDate>Fri, 18 Dec 2009 13:17:37 GMT</pubDate>
			<author>Nicolette</author>
		</item>
	

	
		<item>
			<title>18.12.2009 10:44:52 sel</title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/postgresql/78566/#comment_2296514</guid>
			<link>http://habrahabr.ru/blogs/postgresql/78566/#comment_2296514</link>
			<description><![CDATA[<a href="http://read.ru/search/ушкин/">read.ru/search/ушкин/</a><br/>
<br/>
Тут уже нашлась книга, поэтому подсказок не выдаем. Пробовали разные значения, меньше 5-ти, меньше 10-ти найденных. Часто люди ищут по полному названию с автором, подсказки в этом случае бывают лишними.]]></description>
			<pubDate>Fri, 18 Dec 2009 10:44:52 GMT</pubDate>
			<author>sel</author>
		</item>
	

	
		<item>
			<title>18.12.2009 10:20:36 cat_crash</title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/postgresql/78566/#comment_2296396</guid>
			<link>http://habrahabr.ru/blogs/postgresql/78566/#comment_2296396</link>
			<description><![CDATA[Когда то пытался решить похожую проблему через soundex функции. Смысл заключался в следующем: брался словарь русских слов и отдельной колонкой записывался SOUNDEX слов. <br/>
Далее если ispell говорил что слово неверно написано я сравнивал слово с похожими по произношению и пытался найти слова схожие по произношению. <br/>
Увы метод тоже оказался с весьма большой погрешностью. ]]></description>
			<pubDate>Fri, 18 Dec 2009 10:20:36 GMT</pubDate>
			<author>cat_crash</author>
		</item>
	

	
		<item>
			<title>18.12.2009 05:19:25 JackFrost</title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/postgresql/78566/#comment_2295451</guid>
			<link>http://habrahabr.ru/blogs/postgresql/78566/#comment_2295451</link>
			<description><![CDATA[почему по ссылке _тут_(read.ru/id/442820/) «ушкин» не нашел «пушкин»?]]></description>
			<pubDate>Fri, 18 Dec 2009 05:19:25 GMT</pubDate>
			<author>JackFrost</author>
		</item>
	

	
		<item>
			<title>17.12.2009 21:18:00 sel</title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/postgresql/78566/#comment_2294928</guid>
			<link>http://habrahabr.ru/blogs/postgresql/78566/#comment_2294928</link>
			<description><![CDATA[Это вопрос целесообразности. Никто не спорит о громадном преимуществе текстового поиска гугла, но искать товары в каталоге лучше по определенным параметрам, и те вещи, которые у нас есть в расширенном поиске, например, при всем желании не прикрутить к поиску гугла.<br/>
<br/>
К тому же полнотекстовый поиск в базах данных — абсолютно нормальная вещь и используется повсеместно. Вас же не смущает что в углу страницы хабра есть поле поиска по сайту и реализован он не с помощью стороннего api, а с использованием sphinx))<br/>
<br/>
А уж по поводу «сделанного по-быстрому» вообще нечего сказать. Если статья читается за 5 минут, это не значит, что придумывается и реализовывается все за то же время)]]></description>
			<pubDate>Thu, 17 Dec 2009 21:18:00 GMT</pubDate>
			<author>sel</author>
		</item>
	

	
		<item>
			<title>17.12.2009 20:32:33 Marsikus</title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/postgresql/78566/#comment_2294826</guid>
			<link>http://habrahabr.ru/blogs/postgresql/78566/#comment_2294826</link>
			<description><![CDATA[&gt;&gt;&gt;ибо время до чужого сервера и назад, да и в целом не очень хорошо. <br/>
<br/>
Тяга к техническому творчеству это хорошо, но на пользу ли это вашему проекту?<br/>
Не знаю какое получится время до чужого сервера, а вот пользователю сайта больше понравится результат сильного алгоритма автоисправления, например если вы воспользуетесь гугловским (или еще чьим проверенным) поиском внутри сайта, нежели результат от сделанного по-быстрому для «чтобы было своё».]]></description>
			<pubDate>Thu, 17 Dec 2009 20:32:33 GMT</pubDate>
			<author>Marsikus</author>
		</item>
	

	
		<item>
			<title>17.12.2009 18:26:04 sel</title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/postgresql/78566/#comment_2294471</guid>
			<link>http://habrahabr.ru/blogs/postgresql/78566/#comment_2294471</link>
			<description><![CDATA[Ну да, такие веселости встречаются.<br/>
Поиск основан на статистике, ничего не поделаешь, видимо пользователи не ищут «пушкин путин»)<br/>
<br/>
Вот ближайшие варианты, которые искали:<br/>
<br/>
<pre>
phrase			similarity
путин			0,6
путилин			0,384615
плакат путин		0,375
владимир путин		0,315789
без путина		0,3125
</pre>]]></description>
			<pubDate>Thu, 17 Dec 2009 18:26:04 GMT</pubDate>
			<author>sel</author>
		</item>
	

	
		<item>
			<title>17.12.2009 17:56:15 acy</title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/postgresql/78566/#comment_2294376</guid>
			<link>http://habrahabr.ru/blogs/postgresql/78566/#comment_2294376</link>
			<description><![CDATA[пушнин путин -&gt; Возможно, Вы имели в виду «путин»<br/>
<br/>
Всё правильно! ;)]]></description>
			<pubDate>Thu, 17 Dec 2009 17:56:15 GMT</pubDate>
			<author>acy</author>
		</item>
	

	
		<item>
			<title>17.12.2009 16:44:55 sel</title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/postgresql/78566/#comment_2294171</guid>
			<link>http://habrahabr.ru/blogs/postgresql/78566/#comment_2294171</link>
			<description><![CDATA[Да, у нас win.<br/>
<br/>
<pre>
megadb=# SELECT show_trgm('Пушкин');           
show_trgm              
-------------------------------------
 {&quot;ин &quot;,кин,пуш,ушк,шки,&quot; пу&quot;,&quot;  п&quot;}
(1 row)
</pre>]]></description>
			<pubDate>Thu, 17 Dec 2009 16:44:55 GMT</pubDate>
			<author>sel</author>
		</item>
	

	
		<item>
			<title>17.12.2009 16:14:17 el777</title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/postgresql/78566/#comment_2294097</guid>
			<link>http://habrahabr.ru/blogs/postgresql/78566/#comment_2294097</link>
			<description><![CDATA[Да, триграммы вещь хорошая.<br/>
Скажите у вас в какой кодировке база? windows-1251?<br/>
Я когда-то давно пытался их использовать с UTF-8. Латиница обрабатывалась отлично, а вот с русскими символами были проблемы. Дело в том, что триграмма рубит слово не по буквам, а по байтам! Поэтому на выходе были обрубки букв:<br/>
<br/>
<code>postgres=# SELECT show_trgm('Pushkin');<br/>
 show_trgm <br/>
-----------------------------------------<br/>
 {&quot; p&quot;,&quot; pu&quot;,hki,&quot;in &quot;,kin,pus,shk,ush}<br/>
(1 row)<br/>
<br/>
postgres=# SELECT show_trgm('Пушкин');<br/>
 show_trgm <br/>
------------------------------------------------------------------<br/>
 {0x8eb714,0x9092a3,0x922332,0xd19d23,0xfa46f0,0x38e3ee,0x5c1f41}<br/>
(1 row)<br/>
<br/>
postgres=# SELECT show_trgm('Мушкин');<br/>
 show_trgm <br/>
------------------------------------------------------------------<br/>
 {0x9092a3,0x922332,0xd19d23,0xffb97c,0x34e61d,0x38e3ee,0x7c7c68}<br/>
(1 row)<br/>
</code><br/>
Теретически, искать по такому можно — т.к. похожие байты все равно встречаются. Но качество такого поиска мне не понравилось.]]></description>
			<pubDate>Thu, 17 Dec 2009 16:14:17 GMT</pubDate>
			<author>el777</author>
		</item>
	

	
		<item>
			<title>17.12.2009 15:12:14 habraname</title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/postgresql/78566/#comment_2293873</guid>
			<link>http://habrahabr.ru/blogs/postgresql/78566/#comment_2293873</link>
			<description><![CDATA[суперска ,)<br/>
/me записал в книжечку ещё один модуль пг]]></description>
			<pubDate>Thu, 17 Dec 2009 15:12:14 GMT</pubDate>
			<author>habraname</author>
		</item>
	

	
		<item>
			<title>17.12.2009 14:15:31 sel</title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/postgresql/78566/#comment_2293681</guid>
			<link>http://habrahabr.ru/blogs/postgresql/78566/#comment_2293681</link>
			<description><![CDATA[Да, все верно. Результаты также бывают не очень, при пропущенной букве в маленьком слове.<br/>
Поэтому используем проверку по целым фразам, а не отдельно по словам. Вероятность получить глупую подсказку гораздо меньше.<br/>
<br/>
Плюс значение имеет по какому принципу определяется верное слово. В нашем случае берем 5 самых схожих фраз — по какой из них нашлось больше упоминаний, там в большинстве случаев и оказывается верной.]]></description>
			<pubDate>Thu, 17 Dec 2009 14:15:31 GMT</pubDate>
			<author>sel</author>
		</item>
	

	
		<item>
			<title>17.12.2009 14:06:00 deleted-user-afh</title>
			<guid isPermaLink="true">#comment_2293644</guid>
			<link>#comment_2293644</link>
			<description><![CDATA[Эх, вспоминаю давние времена, когда пытался при помощи триграмм определять язык на котором написан текст :-) Триграммы вообще полезная вещь.]]></description>
			<pubDate>Thu, 17 Dec 2009 14:06:00 GMT</pubDate>
			<author>deleted-user-afh</author>
		</item>
	

	
		<item>
			<title>17.12.2009 13:46:05 coldFlame</title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/postgresql/78566/#comment_2293596</guid>
			<link>http://habrahabr.ru/blogs/postgresql/78566/#comment_2293596</link>
			<description><![CDATA[Большой минус триграмм — на коротких словах (5 символов) они работают неадекватно при такой популярной опечатке, как перепутанные символы, например: <code>'table' % 'tbale' = 0.2</code>. <br/>
<br/>
Обычно в словаре находятся совершенно посторонние слова с большей сходимостью.<br/>
]]></description>
			<pubDate>Thu, 17 Dec 2009 13:46:05 GMT</pubDate>
			<author>coldFlame</author>
		</item>
	

	
		<item>
			<title>17.12.2009 13:37:27 galkin</title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/postgresql/78566/#comment_2293569</guid>
			<link>http://habrahabr.ru/blogs/postgresql/78566/#comment_2293569</link>
			<description><![CDATA[Не знаю, на сколько это все очевидно и банальные весчи, но прочитал с удовольствием. Я хоть PostgreSQL не знаю, но наслышан ее мощью. Спасибо. Держите плюс.]]></description>
			<pubDate>Thu, 17 Dec 2009 13:37:27 GMT</pubDate>
			<author>galkin</author>
		</item>
	

	
</channel>
</rss>

