• Определение части речи слов в русском тексте (POS-tagging) на Python 3

      Пусть, дано предложение “Съешьте еще этих мягких французских булок, да выпейте чаю.”, в котором нам нужно определить часть речи для каждого слова:

      [('съешьте', 'глаг.'), ('еще', 'нареч.'), ('этих', 'местоим. прил.'), ('мягких', 'прил.'), ('французских', 'прил.'), ('булок', 'сущ.'), ('да', 'союз'), ('выпейте', 'глаг.'), ('чаю', 'сущ.')]

      Зачем это нужно? Например, для автоматического определения тегов для блог-поста (для отбора существительных). Морфологическая разметка является одним из первых этапов компьютерного анализа текста.
      Узнать, как это реализовать на Python 3
    • Новостная интернет-журналистика

        Новостная интернет-журналистика
        Краткое руководство по написанию новостей и статей в интернет-издании. Структура новостей, составление заголовков, использование источников, стиль, работа с пиарщиками и многое другое.
        PDF-версия — удобно распечатать и читать.
        P.S Ну очень полезное издание. Обсудим?
      • Почему Баллмер так и не показал код

          Многие наверное помнят, как в конце февраля сообщество Open Source, и за ней большинство мировых технических СМИ, всколыхнул громкий ультиматум Стиву Баллмеру, требующий, чтобы тот показал те куски исходного кода в открытом ПО, которые по его словам нарушают патенты, принадлежащие Microsoft. Напомню, что по условиям ультиматума с нехитрым названием Show Us The Code, Баллмер должен был оформить свои претензии до 1 мая или, говоря прямо, идти к черту. И если со вторым, как наделся автор манифеста, второй человек в Редмонде справился бы сам, в первом ему должны были помочь тысячи добровольцев со всего мира, общими усилиями отыскав нужные фрагменты. Что же пошло не так?
          Читать дальше →