Pull to refresh
26
0
Send message

Почему Kaldi хорош для распознавания речи? (обновлено 25.12.2019)

Reading time7 min
Views31K


Почему мне (и, надеюсь, вам) интересно распознавание речи? Во-первых, это направление является одним из самых популярных по сравнению с другими задачами компьютерной лингвистики, поскольку технология распознавания речи сейчас используется почти повсеместно – от распознавания простого «да/нет» в автоматическом колл-центре банка до способности поддерживать «светскую беседу» в «умной колонке» типа «Алисы». Во-вторых, чтобы система распознавания речи была качественным, необходимо найти самые эффективные средства для создания и настройки такой системы (одному из подобных средств и посвящена эта статья). Наконец, несомненным «плюсом» выбора специализации в области распознавания речи лично для меня является то, что для исследований в этой области необходимо владеть как программистскими, так и лингвистическими навыками. Это весьма стимулирует, заставляя приобретать знания в разных дисциплинах.
Читать дальше →
Total votes 26: ↑24 and ↓2+22
Comments34

Визуализация результатов выборов в Москве на карте в Jupyter Notebook

Reading time11 min
Views39K


Всем привет!


Сегодня мы поговорим о визуализации геоданных. Имея на руках статистику, явно имеющую пространственную привязку, всегда хочется сделать красивую карту. Желательно, с навигацией да инфоокнами В тетрадках. И, конечно же, чтоб потом можно было показать всему интернету свои успехи в визуализации!


В качестве примера возьмем недавно отгремевшие муниципальные выборы в Москве. Сами данные можно взять с сайта мосгоризбиркома, в можно просто забрать датасеты с https://gudkov.ru/. Там даже есть какая-никакая визуализация, но мы пойдем глубже. Итак, что же у нас в итоге должно получиться?

Читать дальше →
Total votes 61: ↑59 and ↓2+57
Comments45

Лекции Технопарка. Базы данных (весна 2017)

Reading time3 min
Views48K


Всем жаждущим знаний предлагаем ознакомиться с новыми лекциями Технопарка, посвящённым базам данных. Курс ведёт Артём Навроцкий, ведущий программист в Allods Team.


Список лекций:


  1. Введение
  2. Модификация и выборка данных
  3. Выборка данных (продолжение)
  4. Транзакции. Триггеры и хранимые процедуры
  5. Индексы и производительность
  6. Оптимизация запросов. Оптимизация структуры данных
  7. Репликация, полнотекстовый поиск, JSON
  8. Сохранность данных
Total votes 44: ↑44 and ↓0+44
Comments6

GeekUniversity — первый в России онлайн-университет с гарантированным трудоустройством

Reading time2 min
Views28K


Новость для тех, кто мечтает заниматься разработкой сайтов, веб- или мобильных приложений. Образовательный IT-портал GeekBrains и Mail.Ru Group запустили совместный проект — первый в России онлайн-университет, готовящий веб-разработчиков, Android- и iOS-программистов. Студенты GeekUniversity смогут пройти путь от новичка до middle-разработчика всего за год.
Читать дальше →
Total votes 39: ↑27 and ↓12+15
Comments14

Анализ наборов данных с портала открытых данных data.gov.ru

Reading time4 min
Views14K
В прошлый раз [Загрузка данных с сайта открытых данных data.gov.ru] мне не без проблем удалось научиться загружать данные с портала открытых данных России. Портал открытых данных должен предоставлять наиболее актуальные сведения об открытых данных федеральных органов власти, органов региональной власти и иных организаций (цитата с сайта data.gov.ru). Посмотрим, какие данные на портале, насколько они актуальны и в каком виде размещаются.
Читать дальше →
Total votes 23: ↑22 and ↓1+21
Comments4

ЛСД и его влияние на мозг человека. Несколько интересных фактов

Reading time6 min
Views613K


Наверное, на Geektimes нет таких читателей, кто бы не слышал об диэтиламиде d-лизергиновой кислоты (ЛСД). Его синтезировали достаточно давно, но механизм влияния на сознание раскрыт недостаточно. Правда, в последнее время загадки этого химического соединения постепенно раскрываются человеком. В частности, ученые из Университета Северной Каролины опубликовали информацию о биохимических процессах, происходящих в организме человека после попадания туда этого соединения, химическая формула которого — C20H25N3O.

Есть и другие работы, кроме этой. Например, исследователи, опубликовавшие статью об ЛСД в Current Biology, долгое время изучали мозг добровольцев, которым вводили это вещество. Мозг добровольцев ученые сканировали при помощи МРТ и других систем во время прослушивания участниками испытаний мелодий, которые важны для них и мелодий, которые им безразличны. Во время прослушивания добровольцы находились под влиянием психоделика.
Читать дальше →
Total votes 46: ↑32 and ↓14+18
Comments98

NooLite: убиваем двух зайцев эргономики одновременно (монтаж, мнение, развитие)

Reading time5 min
Views20K

Нет, это не 10001 описание «умного дома» (!)

В посте я хочу рассказать о двух вещах:
1) Решение проблемы «Выключатель верхнего света в комнате при входе, а хочется еще и у кровати»
2) Хочется регулировать яркость освещения
И как не странно, обе эти проблемы можно решить одним махом.

А так же я попытаюсь классифицировать типы автоматизации (умного) дома
Total votes 20: ↑18 and ↓2+16
Comments56

Корреляция, ковариация и девиация (часть 3)

Reading time5 min
Views44K


В первой части показано, как на основе матрицы расстояний между элементами получить матрицу Грина. Ее спектр образует собственную систему координат множества, центром которой является центроид набора. Во второй рассмотрены спектры простых геометрических наборов.

В данной статье покажем, что матрица Грина и матрица корреляции — суть одно и то же.
Читать дальше →
Total votes 23: ↑21 and ↓2+19
Comments1

Как Яндекс распознаёт музыку с микрофона

Reading time10 min
Views159K
Поиск по каталогу музыки — это задача, которую можно решать разными путями, как с точки зрения пользователя, так и технологически. Яндекс уже довольно давно научился искать и по названиям композиций, и по текстам песен. На сказанные голосом запросы про музыку мы тоже умеем отвечать в Яндекс.Поиске под iOS и Android, сегодня же речь пойдёт о поиске по аудиосигналу, а если конкретно — по записанному с микрофона фрагменту музыкального произведения. Именно такая функция встроена в мобильное приложение Яндекс.Музыки:

image

В мире есть всего несколько специализированных компаний, которые профессионально занимаются распознаванием музыкальных треков. Насколько нам известно, из поисковых компаний Яндекс стал первым, кто стал помогать российскому пользователю в решении этой задачи. Несмотря на то, что нам предстоит ещё немало сделать, качество распознавания уже сопоставимо с лидерами в этой области. К тому же поиск музыки по аудиофрагменту не самая тривиальная и освещённая в Рунете тема; надеемся, что многим будет любопытно узнать подробности.
Читать дальше →
Total votes 321: ↑313 and ↓8+305
Comments113

Особенности Jupyter Notebook, о которых вы (может быть) не слышали

Reading time10 min
Views356K
Jupyter Notebook – это крайне удобный инструмент для создания красивых аналитических отчетов, так как он позволяет хранить вместе код, изображения, комментарии, формулы и графики:



Ниже мы расскажем о некоторых фишках, которые делают Jupyter очень крутым. О них можно прочитать и в других местах, но если специально не задаваться этим вопросом, то никогда и не прочитаешь.
Читать дальше →
Total votes 49: ↑45 and ↓4+41
Comments14

Защита от протечек с блекджеком и счетчиками

Reading time18 min
Views56K
Приветствую. Есть такая штука — гидролок\нептун\авквасторож — системы перекрытия подачи воды, если происходит не контролируемая утечка. Принцип простой — датчик воды + автоматика + пара кранов с электроприводами. Но дьявол как обычно в деталях: как устроены краны, как устроены датчики протечки и почему один стоит 50 рублей, а другой 500р. На все это дело навернут килограм макетингового булшита, упаковка вырви глаз и т.д.

В рассказе пройдусь по кирпичикам системы, чем руководствовался в выборе. Вся система строится на заводских датчиках и самодельном контроллере на базе Particle (ex.Spark) Photon (такая esp8266 у которой облачная IDE на wiring из коробки), база девайса stm контроллер + wifi модуль от броадкома. Все это завязано на openhab сервер на Orange Pi One.


Читать дальше →
Total votes 68: ↑66 and ↓2+64
Comments118

Pico8 — несуществующая игровая консоль

Reading time1 min
Views36K
Второй день умираю от умиления и решил поделиться с хабрасообществом. По большому счёту, достаточно просто дать ссылку, но тогда это вроде как не статья получается, поэтому расскажу немножко.

image
Читать дальше →
Total votes 85: ↑83 and ↓2+81
Comments33

Разработка IoT устройств с использованием Bluetooth LE

Reading time18 min
Views60K


Технология Bluetooth энергично пробивает себе место в сфере интернета вещей. Часть этой технологии, именуемая Bluetooth LE (Bluetooth Low Energy, она же Bluetooth Smart, она же BLE) прямо позиционирует себя как идеальный выбор для IoT (Internet of things). Трудно не согласится. BLE уже умеет маршрутизировать Internеt трафик, определять координаты в помещениях, подключать промышленные программируемые логические контроллеры, поддерживать WEB серверы, подключать весы, термометры, пульсометры, оксиметры, тонометры и массу других вещей. C BLE автоматически решается множество проблем присущих решениям с использованием Wi-Fi. Недолго осталось до момента, когда устройства с BLE смогут организовываться в MESH сети, по технологии схожей с ZigBee. Это уже отражено в спецификации Bluetooth 5.0
Читать дальше →
Total votes 31: ↑31 and ↓0+31
Comments27

Искусство написания простых и коротких функций

Reading time10 min
Views26K

Софт постоянно усложняется. Стабильность и простота расширения приложения напрямую зависят от качества кода.


К сожалению, почти каждый разработчик, и я в том числе, в своей работе сталкивается с кодом плохого качества. И это — болото. У такого кода есть токсичные признаки:


  • Функции слишком длинные, и на них слишком много задач
  • Часто у функций есть побочные эффекты, которые сложно определить, а иногда даже сложно отлаживать
  • Непонятные имена у функций и переменных
  • Хрупкий код: небольшая модификация неожиданно ломает другие компоненты приложения
  • Плохое покрытие кода тестами или вообще его отсутствие

Всем знакомы высказывания «я не понимаю, как работает этот код», «бредовый код», «этот код сложно изменить» и другие.


Однажды мой коллега уволился, потому что пытался справиться с REST API на Ruby, который было трудно поддерживать. Он получил этот проект от предыдущей команды разработчиков.


Исправление текущих ошибок создавало новые, добавление новых функций рождало новую серию ошибок, и так далее (хрупкий код). Клиент не хотел перестраивать приложение, делать ему удобную структуру, и разработчик принял правильное решение — уволиться.



Такие ситуации случаются часто, и это печально. Но что делать?

Читать дальше →
Total votes 41: ↑37 and ↓4+33
Comments51

Неожиданная история микропроцессоров

Reading time10 min
Views30K

Вы думаете, что всё началось с Intel 4004, но всё не так просто




Intel 4-битный 4004

Транзисторы, электронные усилители и переключатели, находящиеся сейчас в центре всего, от карманного радиоприёмника до суперкомпьютера, были изобретены в 1947 году. Ранние прототипы звались биполярными транзисторами, и они всё ещё в ходу. К 1960-м инженеры придумали, как комбинировать несколько биполярных транзисторов на одной интегральной микросхеме. Но из-за их сложной структуры, на схеме могло быть только небольшое их количество. Поэтому, хотя мини-компьютер, созданный на основе биполярных интегральных микросхем, был гораздо меньше ранних компьютеров, ему требовалось несколько плат с сотнями чипов на них.

В 1960-м был показан новый тип транзисторов: транзистор со структурой металл-окисел-полупроводник, МОП-транзистор. Сначала технология не выглядела многообещающей. Они были медленнее, менее надёжными и более дорогими, чем биполярные. Но к 1964-му интегральные микросхемы на МОП-транзисторах уже могли похвастаться большей плотностью и меньшей стоимостью производства, чем биполярные. Сложность интегральных микросхем росла согласно закону Мура, но технология МОП вырвалась вперёд.
Читать дальше →
Total votes 36: ↑33 and ↓3+30
Comments24

Как дать адекватную оценку времени, когда неопределённость бьёт по башке

Reading time12 min
Views81K
Большинство людей не умеют адекватно оценивать сроки выполнения задач. Ой как это заставляет порой понервничать… Тут и «дэдлайн подкрадывается незаметно». И перестраховка в 500% на всякий случай (все равно не хватает). И отжимание «заведомо раздутых сроков», чтобы исполнитель пообещал чего-то более приемлемого. И невнятные бормотания вместо конкретных цифр.

image

В этой статье собраны и структурированы принципы и методы, с помощью которых можно научить себя и других давать адекватные оценки. В начале — общие принципы и чуть-чуть математики. В конце — конкретика для студий.
Читать дальше →
Total votes 81: ↑68 and ↓13+55
Comments24

Джентельменский набор пакетов R для автоматизации бизнес-задач

Reading time3 min
Views14K

Продолжение предыдущих публикаций «Инструменты DataScience как альтернатива классической интеграции ИТ систем» и
«Экосистема R как инструмент для автоматизации бизнес-задач».
Настоящая статья является ответом на возникшие вопросы по пакетам R, которые полезны для реализации описанных подходов. Я ее рассматриваю исключительно как справочную информацию, и отправную точку для последующего детального изучения заинтересовавшимися, поскольку за каждым пакетом скрывается огромное пространство со своей философией и идеологией, математикой и путями развития.


Как правило, все пакеты (9109 штук на 07.09.2016) находятся в репозитории CRAN. Те, что по тем или иным причинам, пока не опубликованы в репозиторий, могут быть найдены на GitHub. Итак, кратким списком:

Читать дальше →
Total votes 21: ↑21 and ↓0+21
Comments20

Экосистема R как инструмент для автоматизации бизнес-задач

Reading time7 min
Views12K
Настоящая статья является продолжением предыдущей публикации «Инструменты DataScience как альтернатива классической интеграции ИТ систем». Основная цель — заострить внимание как разработчиков, так и руководителей среднего звена, на широком спектре возможностей, которые предоставляют современные инструменты из сферы Data Science за рамками классических задач статистических вычислений и модной нынче темы машинного обучения. В частности, возможности экосистемы R по состоянию на август 2016 года и применение этих возможностей на примере двух задач: одной из прикладной науки, другой – из среднего бизнеса.
Читать дальше →
Total votes 26: ↑26 and ↓0+26
Comments22

Scrapy: собираем данные и сохраняем в базу данных

Reading time5 min
Views69K

Введение


Меня заинтересовал данный фреймворк для сбора информации с сайтов. Здесь были публикации по Scrapy, но поскольку детальной информации на русском языке мало, то я хотел бы рассказать о своем опыте.
Читать дальше →
Total votes 30: ↑23 and ↓7+16
Comments14

Information

Rating
Does not participate
Registered
Activity