Пользователь
0,0
рейтинг
12 октября 2011 в 14:12

Разное → Новинки на сайте Государственной Думы: выступления депутатов стали доступнее

Обновленный поиск в информационных системах, мобильные версии сайтов и поддержка «Маши» — утилиты для выделения фрагментов текста, недавно внедренной на kremlin.ru.

В январе этого года был запущена новая версия сайта Государственной Думы, в которую вошло огромное количество изменений и улучшений. Не далее как вчера он возглавил независимый рейтинг государственных сайтов, подготовленный активистами «Пиратской партии России», что не может не радовать.

Этот пост является началом серии статей, освещающих нововведения на сайте Госдумы, результаты совместных усилий Аппарата Государственной Думы и Интаро Софт.

Сегодняшние изменения затронули две информационные системы: База данных «Стенограммы заседаний Государственной Думы» и Информационно-аналитические материалы. Первая система обеспечивает доступ к стенограммам выступлений депутатов и хроникам всех заседаний, а во второй хранится аналитическая информация: бюллетени, аналитические обзоры, материалы для работы депутатов с избирателями и многое другое.

Полнотекстовый поиск в БД «Стенограммы заседаний ГД»


Обновлен и усовершенствован поиск в БД «Стенограммы заседаний ГД». Форма поиска упростилась до 4-х необходимых полей, при этом поиск стал полнотекстовым с учетом морфологии.

Поиск работает на базе отечественной разработки, высокопроизводительной поисковой системы Sphinx. Помимо того, что она гарантирует быстрый и качественный поиск, ее использование обеспечит реализацию единого поиска по всем информационным системам Госдумы, который будет внедрен на центральном сайте в скором времени.



Навигация по искомым словам в тексте стенограммы


Одна из проблем при поиске по тексту стенограмм — это поиск места, где встречается искомая фраза. Средний размер стенограммы составляет 300–500 Кб (100–200 страниц формата А4), что несколько затрудняет навигацию по ее тексту. Теперь при переходе с результатов поиска к тексту стенограммы появляются вспомогательные навигационные инструменты, которые позволяют перемещаться между найденными фразами.



MaSha — утилита выделения фрагментов текста


Недавно выпущенная нашими коллегами по цеху свободно распространяемая утилита mashajs позволяет выделять фрагменты текста и формировать для них уникальную ссылку, которую потом можно отправить другому человеку. Утилита на данный момент активно развивается и уже внедрена на таких сайтах, как kremlin.ru, НТВ, конференции 404.

Со стороны Аппарата Государственной Думы предложения ввести подобную функцию в текстах стенограмм заседаний поступили еще в июне. Мы посчитали правильным «не изобретать велосипед» и использовать существующее успешно работающее решение в виде «Маши».

Утилита была нами слегка расширена, и теперь позволяет в 2 клика опубликовать ссылку на фрагменты текста стенограммы в популярных социальных сетях.





Мобильные версии информационных систем


Были разработаны и введены в действие мобильные версии обеих информационных систем. Как и на основном сайте Госдумы, присутствует поддержка автоматического определения веб-клиента и перенаправления мобильных клиентов на соответствующую версию сайта.




Наша работа на этом не закончена. В скором времени будет запущен открытый API поиска по законопроектам, который позволит использовать сервис в своих приложениях и встраивать в веб-сайты; единый поиск по всем информационным системам Госдумы; система общественного обсуждения законопроектов; и многое другое.

Обо всем этом мы расскажем в следующих статьях.
Салихов Ильяс @muxx
карма
61,3
рейтинг 0,0
Реклама помогает поддерживать и развивать наши сервисы

Подробнее
Реклама

Самое читаемое Разное

Комментарии (35)

  • +22
    Какой у вас длинный Iphone.
    • +19
      это президентская модель
    • +4
      iphone 5s)))
      • +9
        iPhone 5 XXL
        • +8
          En1a_rge yOur iPhon 0n!y f()r 15$. 2-3 1№ch!!! 100% gurA_ntee
      • +6
        Чую, эти айфоны будут главной темой обсуждения.
    • 0
      Слева iPhone ракушка-раскладушка?
  • 0
    За неотключаемую «машу» надо сжигать на кострах.
    • +1
      я вот тоже уже подумал давно что это правильно :) но сначала надо людям ее показать т.к. такого еще не было в интернетах. А чуть позже и мы отключим и думаю дума отключит.
      • 0
        точнее сделаем отключаемой :)
        • 0
          на самом деле таких вещей много, начиная от «Выделите текст что бы он вставился в форму быстрого ответа» заканчивая «Выделите и нажмите что бы отправить нам ошибку», вот только вы не учитываете, что многие пользователи при чтении с экрана автоматически выделяют куски текста и появление картинки высотой в 2,5 строки начаняет напрягать.

          P.S. она позволяет выделать несколько кусков текста на странице, а прокручивает все равно к первому, как то не правильно.
          http://www.kremlin.ru/news/8147#sel=1:1,1:2;12:5,12:21;10:38,10:42
          • 0
            А к какому правильно?
            • 0
              имхо, правильно, что бы не давал выделять больше одного куска текста, так как перекинуть может только к нему, просто сделайте, что б при очередном выделении текста, остальные снимались, но опять же это имхо.
              • 0
                мне так не кажется ) но спасибо за имхо
  • –3
    формы в порядок приведите и навигацию и операторов научите работать для начала. и формы связи с последним обрабатывающим оператором снабдите кнопкой «написать ему»! и не допускайте «закрыть задачу» если она не закрыта! у меня загран повис из вас! а то что касается разделов КУГИ там вообще черт ногу сломит! и не возможность сменить логин — уродство! а вы Машу тут запускаете ублюдочную!
    • 0
      Уважаемый, Вы явно ошиблись топиком.
  • 0
    ссылки на машу не было в топике по этому дам, вот :)

    • 0
      Ссылочка в посте есть, смотрите в разделе про Машу
      • 0
        вижу только хештег
        • +1
          Да есть, есть ссылка)
    • 0
      Теперь я знаю как называется эта штука ))
  • +9
    Вначале прочитал была запущена новая версия Государственной Думы, в которую вошло огромное количество изменений и улучшений и обрадовался.
  • +3
    О боже www в 6 уровне домена. Но проверив ссылку убедился что она не рабочая, зато без www работает отлично. Видимо просто макет был такой только :)
  • +3
    Не хватает открытого API для доступа к данным.
    • 0
      API будет обязательно, в декабре выложим документацию и здесь проинформируем
  • +3
    Ребята, вы молодцы. Чего только стоит написать такой развернутый пост о проделанной работе. У нас (да и не только у нас) с этим туго… Теперь есть с кого брать пример )
  • +2
    Молодцы! Рад, что есть качественное исполнение хоть каких-то гос проектов.
  • 0
    А вы принимаете тут юзабилити реквесты? Поставьте пожалуйста sphinx match mode = SPH_MATCH_PHRASE, чтобы на запрос «информационные технологии» находились именно «информационные технологии», а не то, что у вас на скриншоте.
    • 0
      Поправлюсь: на скриншоте как раз присутствует то, что запрашивали, а в реальности — куча лишних резульатов из-за того, что поиск срабатывает на вхождение любого из слов
      • 0
        Сейчас используется SPH_MATCH_EXTENDED2 с ранком SPH_RANK_PROXIMITY_BM25. В начало списка выходят те стенограммы, где встречается фраза, а далее те, в которых присутствует просто вхождение слов. В примере с информационными технологиями это видно – в первых 2-х документах есть вхождение фразы, в остальных – просто вхождение слов.
        • 0
          Спасибо за разъяснения. Было бы совсем хорошо, если бы можно было как-то проще найти точную фразу в документе. Так как виджет, который подсвечивает результаты не может различать вхождения точной фразы от вхождения одного слова — сейчас это занимает немало времени. Может было бы проще добавить опцию поиска — «точная фраза» чтобы выдавались результаты поиска с mode = SPH_MATCH_PHRASE? (это в случае, если виджет подсветки дорабатывать сложней или не очень хочется усложнять его интерфейс)
          • 0
            Точная фраза сейчас подсвечивается, если таковая присутствует. В выдаче если перейти к первой стенограмме, то подсветка первым выделит вхождение целой фразы.
            • +1
              Дело в том, что виджет так не подсвечивает морфологические вариации фразы — они не выносятся в начало в списке подсвечиваемых (например вот «информационных технологий». transcript.duma.gov.ru/node/3492/#sel=393:7,393:10 ). Я правильно понимаю, что вынесение точной фразы в начало подсвечиваемых осуществляется выборкой без учета морфологии среди всех результатовб выданных Sphinx'ом? Именно это я хотел сказать, фразой «виджет подсветки дорабатывать сложней» — он не понимает морфологию русского языка, и научить его это делать куда сложней, чем добавить опцию «точная фраза» в диалог поиска.
  • +1
    А вы молодцы.
    Раньше сайт Гос.Думы был просто страшным и убогим унылым говном. Причём местами (в частности в разделе поиска законопроектов) работал только под IE.
    А сейчас смотрится вполне симпатично, юзабельно и даже кроссбраузерно.

Только зарегистрированные пользователи могут оставлять комментарии. Войдите, пожалуйста.