Pull to refresh
4
0

User

Send message

Определение нечетких дубликатов для коротких документов

Reading time3 min
Views7.3K
Хочу поделиться простым, но эффективным алгоритмом определения нечетких копий документов. Есть много статей об использовании для этой цели алгоритма шинглов. Ходят слухи, что большие поисковые системы используют очень похожий алгоритм у себя. Однако, все признают, что шинглы плохо подходят для коротких (3-5 предложений) документов. А в моей задаче надо было работать именно с такими документами. В качестве решения предлагают закольцовывать текст, чтобы как бы сделать из него длинный, но мне кажется, что это не очень правильное решение, точность распознавания дублей все равно будет низкая.

Итак, описание алгоритма, который я использовал:
Читать дальше →
Total votes 64: ↑60 and ↓4+56
Comments42

20 «НЕ» для веб-дизайнеров

Reading time6 min
Views12K

У каждого дизайнера есть ряд правил, которыми он руководствуется в своей работе. И нередко памятки, составленные из таких правил от опытных дизайнеров служат хорошим подспорьем для начинающих. Некоторое количество таких правил у меня есть тоже. Правда, они касаются того, чего НЕ следует делать при изготовлении макета. Некоторые могут показаться банальными и очевидными, другие даже вызовут у кого-то недоумение. Но мне они очень помогают и, я надеюсь, какие-то из них так же будут полезны тем, кто занимается веб-дизайном или желает приобщиться к этой области разработки сайтов.
Читать дальше →
Total votes 196: ↑152 and ↓44+108
Comments178

Анализ креш-дампов памяти Windows

Reading time2 min
Views303K
Как часто Вам приходится лицезреть экран смерти Windows (BSoD)? BSoD может возникать в разных случаях: как уже при работе с системой, так и в процессе загрузки операционной системы. Как же определить, чем вызвано появление BSoD и устранить эту проблему? Операционная система Windows способна сохранять дамп памяти при появлении ошибки, чтобы системный администратор мог проанализировать данные дампа и найти причину возникновения BSoD.
Читать дальше →
Total votes 43: ↑40 and ↓3+37
Comments26

JavaScript, AJAX, Socket и Flash/ActionScript — исследуем вопрос передачи данных в AJAX-приложениях

Reading time8 min
Views5.5K
socket_1667_128Как то в последнее время я начал активно повышать свои навыки и знакомиться не только и не столько с новыми технологиями. Например, я уже более-менее освоил Java, а именно — занимаюсь сетевыми сервисами. Также начал работать с ActionScript 3, хотя мое мнение относительно применимости в AJAX-приложениях Flash-компонентов не изменилось — их надо использовать там, где они дают максимальное преимущество, а вот вся «обвязка», например, интерфейс пользователя, можно сделать при помощи стандартных технологий. При разработке AJAX-приложений у разработчика есть достаточно большой выбор для решения задачи обмена данными с сервером. В основном, общение с сервером заключается в…
Читать дальше →
Total votes 52: ↑47 and ↓5+42
Comments44

Оптимизации системы разделения прав доступа в веб-приложении

Reading time19 min
Views7.4K
После написания прошлой статьи про реализацию системы разделения прав доступа в веб-приложении, появилось множество интересных комментариев. В них в основном велись споры о том, что можно сделать её ещё лучше.

В действительности, система сейчас не является оптимизированной и не может использоваться на серверах с высокой посещаемостью (так как, прошлая статья писалась больше для ознакомления).
Давайте попробуем это исправить.

В этой статье я рассмотрю:
  1. Битовые поля, оптимизация
  2. Serialize с денормализацией таблиц БД
  3. Вы узнаете, как работает система, подобная Zend ACL

Читать дальше →
Total votes 38: ↑30 and ↓8+22
Comments47

Создаем свой SVN сервер: 3$ и 30 минут

Reading time4 min
Views13K
Многих хабрачитателей иногда волнует вопрос хостинга SVN. В интернете полно вариантов захостить SVN репозиторий, с ценой порядка 10-15уе в месяц, но смущает одно: хостинг репозитория — намного более ответственное дело, нежели хостинг сайта. В коде — ваши «сверхценные идеи», от аптайма сервера и надежности бэкапов напрямую зависит работа вашего бизнеса. Некоторые выбирают все же хостить SVN в серьёзных компаниях. Хорошее сравнение по параметрам тут: http://www.svnhostingcomparison.com/, open-source кстати можно захостить в неплохом месте на букву G ;-).

Другие же, как и я, решают хостить SVN на своём VDS / Dedicated сервере. На этом вопросе я и остановлюсь, рассказав заодно немного о вариантах запуска/настройки svn сервера (в том числе относительно новых — шифрование/аутентификация SASL и хранение в FS). Выльеться все это вам в 3-4$/месяц, в полный контроль за бэкапами и доступом к серверу. Пожертвовать придется 30 минут драгоценного времени на настройку.

Целевая аудитория: начальный — средний уровень опыта работы с Linux.
PS. Я в курсе что FreeBSD is not Linux ;-)
Читать дальше →
Total votes 79: ↑73 and ↓6+67
Comments78

jQuery для начинающих. Часть 4. Селекторы

Reading time11 min
Views215K


Последнее время мне всё чаще задают вопрос как выбрать тот или иной элемент в DOM'е, и данный пост будет сплошь посвящен селекторам в jQuery, возможно большинство из них Вы видели в различных источниках, но собрать их воедино все же стоит…
Читать дальше →
Total votes 83: ↑79 and ↓4+75
Comments30

Vse10.ru — онлайновый клавиатурный тренажер

Reading time1 min
Views21K
image

vse10.ru — новый интернет-проект, который позволяет улучшить скорость набора на клавиатуре в любом месте, где есть интернет.

Больше ничего не нужно скачивать и устанавливать — учиться теперь просто и удобно. Кроме обучения можно также проверить свою скорость набора, получить соответствующий сертификат, а также посоревноваться в рейтинге с другими посетителями сайта.

Мы постарались сделать проект максимально простым и удобным, по принципу «ничего лишнего».
Total votes 107: ↑99 and ↓8+91
Comments155

Документация API Карт Google теперь на русском языке!

Reading time1 min
Views4.5K
Том Маншрэк, команда API Карт Google

За последний год мы перевели документацию по API Карт на большое количество языков, и разработчикам по всему миру стало легче использовать Карты Google на своих сайтах. В начале 2008 года мы выпустили, а недавно обновили, переводы на японский и упрощённый китайский языки.

За несколько последних месяцев мы тихо и незаметно выпустили ещё несколько переводов документации по API карт. В сентябре появились немецкий и испанский переводы, а совсем недавно вышли переводы на бразильский, португальский и русский языки. Эти переводы можно найти здесь:
Вы можете переключиться на переведённую документацию, выбрав язык из выпадающего списка в правом верхнем углу страниц сайта code.google.com. Если перевод текста страницы для для выбранного языка существует, то он будет показан (если его нет, то будет показан текст на английском).

Мы выбрали именно эти языки, потому что большинство неанглоязычных читателей документации API Карт говорит именно на них. Надеемся, что переводы подтолкнут новых разработчиков к использованию API Карт Google.

Замечание: мы стараемся поддерживать переведённую документацию в актуальном состоянии, но часто англоязычная документация содержит наиболее свежую информацию. Всем разработчикам следует время от времени заглядывать в англоязычный справочник по API Карт, который обновляется раз в несколько недель.
Total votes 32: ↑24 and ↓8+16
Comments3

Ограничение скорости скачивания файлов средствами PHP

Reading time3 min
Views17K
Иногда появляется необходимость ограничивать скорость скачивания файлов пользователями. Причин тому может быть множество (бесплатный и платный режимы, регистрация пользователя и т.д.), однако не всегда есть возможность приобрести сервер или настроить его должным образом. В данном топике предлагаю переложить задачу на плечи чистый PHP.
Читать дальше →
Total votes 30: ↑26 and ↓4+22
Comments30

Пуленепробиваемый HTML: 37 шагов к идеальной разметке

Reading time11 min
Views19K
Примечание: это не полный перевод статьи. Я выбрал только самые интересные лично для себя пункты. Статья не претендует на свежесть, но возможно даже люди хорошо знакомые с версткой найдут для себя что-то интересное. Статья затрагивает некоторые аспекты семантики верстки с конкретными примерами.

Под катом много букв! Чтоб не потеряться в их обилии все пункты выделены заголовками.
Читать
Total votes 144: ↑135 and ↓9+126
Comments83

Управление потоком в CSS: создаём контекст форматирования

Reading time4 min
Views5.2K
Управлять потоком можно не только свойствами clear или overflow. Возможно, вы найдёте полезным для себя использование display:inline-block или display:table-cell, способных полностью заменить вам упомянутый overflow, избавляя вас от опасности указания размеров элемента, а также предоставляя дополнительные возможности.

Статья не содержит универсальных решений, но открывает вашему взору дополнительный инструментарий для управления потоком.
Читать дальше →
Total votes 66: ↑63 and ↓3+60
Comments34

Инструкция по воплощению

Reading time6 min
Views851
Полезная статья в журнале «Деньги» о том, «можно ли создать универсальный рецепт извлечения денег из идей?». Особенна полезна, как информация к размышлению тем, кто, как говорится, берется за дело, чтобы понять сколько и на каких усливиях можно за него получить.

Полная версия доступна здесь.
Читать дальше →
Total votes 40: ↑27 and ↓13+14
Comments16

ICQ-маскарад как универсальное решение проблем с изменениями протокола ICQ

Reading time2 min
Views1.3K
Это мой первый пост на хабре, поэтому любые пожелания к стилю написания приветствуются.

В связи с периодическими изменениями протокола ICQ, не все сторонние клиенты успевают за ними, поэтому появилась необходимость в прослойке между сервером и клиентом, которую можно достаточно быстро подстраивать.

В данной статье я расскажу об реализации такой прослойки, в виде специализированного прокси — ICQGATE или ICQ-маскарад.
Читать дальше →
Total votes 97: ↑79 and ↓18+61
Comments155

Сайт как инструмент

Reading time4 min
Views4.2K
Один из стандартных вопросов, который задает (или по идее должна задавать) веб-студия на первой встрече с клиентом – зачем вам нужен сайт? Зачастую клиент с готовностью отвечает «нам нужен сайт как инструмент». Но, как показывает опыт, иногда это примерно то же самое, что прийти в магазин и купить дрель, чтобы была. Чтобы в доме был инструмент.

Вспомним классический пример, что покупая дрель, по сути человек покупает дырки, которые можно сделать с помощью этой дрели. Для того чтобы эти дырки появились, инструментом надо пользоваться, надо уметь с ним обращаться и работать. Сама по себе дрель (как и сам по себе сайт) особого смысла не имеют.

С учетом того, что создание сайта – удовольствие чаще всего не дешевое, что же нужно сделать, чтобы инструмент не лежал на полке, а использовался по своему прямому назначению? Декларируя, что мы заказываем сайт-инструмент, надо понимать, какие именно «дырки» мы хотим получить в результате.

Давайте рассмотрим постановку задачи на примере.
Читать дальше →
Total votes 47: ↑41 and ↓6+35
Comments111

MVC Framework: большое введение для начинающих

Reading time16 min
Views80K
Необходимое отступление: не так давно я разместил статью предназначавшуюся для печатного издания. Приведенная ниже статья имеет ту же самую судьбу: она не попала в печать в связи с тяжелым положением журнала. Как и в прошлый раз, я решил опубликовать статью на Хабре, благо тематика попадает под формат. Необходимо заметить, что статья оформлена и содержит текст для журнала, если бы она готовилась для Хабра, то некоторые часть могли бы быть изменены. Надеюсь, статья вам понравится.

В последнее время заметно, что компания Microsoft уделяет повышенное внимание развитию своих средств разработки, новым инструментам и механизмам разработки программ на своей платформе .net. Быстро развивается язык C#, четвертая версия которого не за горами. Представлен и активно продвигается новый язык F#. Для разработчиков баз данных разработан Entity Framework, который уже доступен в виде финальной версии в первом сервиспаке к .Net Framework 3.5 и Visual Studio 2008. Microsoft активно занялась и клиентской частью разработки web-проектов. Для нашего внимания предложен путь развития Ajax.Net 4.0. Internet Explorer 8 все больше соответствует стандартам и становится привлекательным инструментом для web-программистов, так например, его вкладка Developer Tools включает в себя профайлер JavaScript. Очень хорошей новостью стало недавно объявление о полной поддержке и включении JavaScript-библиотеки jQuery в следующее обновление Visual Studio. В этом свете возникает вопрос, что же предложено разработчикам ASP.NET? Ответ — MVC Framework. Целью данной статьи рассмотреть некоторые общие проблемы, с которыми могут столкнуться программисты, решившие использовать MVC Framework для своих web-проектов, и их решения.
Читать дальше →
Total votes 65: ↑59 and ↓6+53
Comments71

Наблюдаем за пользователем

Reading time1 min
Views1.1K
image Сервис userfly даёт возможность визуально посмотреть, что и как делал пользователь на вашей странице.
Пока все это в разработке и видимо еще много чего нужно сделать, но основу уже можно попробывать

После регистрации userfly генерирует небольшой Яваскрипт, который нужно вставить в header страниц. После этого все передвижения пользователей будут записыватся, а вы вскоре сможете посмотреть, как небольшой видеоролик, что-же делают посетители на вашей странице, что ищут, какие функции используют чаще и т.д.
Читать дальше →
Total votes 65: ↑61 and ↓4+57
Comments70

Файловый менеджер для FCKeditor — FCKfsys 2.0 (PHP)

Reading time2 min
Views2.6K
Эта статья продолжение первого варианта файлового менеджера.

FCKfsys — файловый менеджер для визуального редактора для web FCKeditor. Мне в FCKeditor все нравится, кроме файлового менеджера. Так что надо както исправлять это самому.
Подробная информация о плагине на моем сайте и там же можете посмотреть пример работы.

Выглядит файловый менеджер с превьюшками:

Вид FCKfsys 2.0

UPD: Доработки сделаны, теперь надо над интерфейсом поработать. По моему ориентир должен быть на Windows-проводник, чтобы было привычно. То есть немного причесать надо.
Читать дальше →
Total votes 57: ↑48 and ↓9+39
Comments51

Еще один способ установки плагинов для Eclipse

Reading time1 min
Views18K
Обычно плагины для Eclipse устанавливаются просто – копируются в папку с Eclipse. Но этот способ является не очень удобным, т.к. не очень просто управлять версиями плагинов. Да и захламляется папка при установки новой версии. Итак, предлагаю следующий способ на основе ссылок (links).
Читать дальше →
Total votes 7: ↑4 and ↓3+1
Comments12

Information

Rating
Does not participate
Location
Россия
Date of birth
Registered
Activity