Comments / Profile of aledovskiy / Habr

How to become an author

Александр Ледовский @aledovskiy

Analytics/DS Team Lead, Avito

Profile Publications 8Comments 63Bookmarks 11

Распознавание речи для чайников

aledovskiy Jun 14 2014 at 03:37

Спасибо за статью. Хочу добавить зачем вообще нужны MFCC.
Как многие знают, алгоритм распознавания — это черный ящик. Что-то на входе, что-то на выходе. На вход идет вектор свойств (feature vector), а на выходе мы получаем решение алгоритма. И в задачах распознавания сложность состоит не самом алгоритме (как было сказано, алгоритмов много и они хорошо изучены), а именно в формировании вектора свойств. Вектор свойств должен быть некоторой фиксированной длины, поэтому напрямую отсчеты сигнала отправить нельзя. К тому же понятно, что по отсчетам напрямую распознать речь очень сложно — варьируется амплитуда, длительность звуков и т.д. Можно было бы отправить в алгоритм спектр. Но тут тоже возникают сложности — частот очень много, по ним сложно отличать звуки, просто каша получается. Кстати, насколько я знаю, в настоящий момент в распознавании речи распространены методы, основанные на вейвлетах, которые характеризуют сигнал и по частоте и по времени.
В общем, теперь вы можете понять, почему были разработаны кепстральные коэффициенты, как некоторый вектор, способный качественно охарактеризовать речь. Кстати, MFCC это лишь один из многих других вариантов feature vector.

0

Тест Тьюринга пройден (на детском уровне сложности)

aledovskiy Jun 9 2014 at 21:20

Замечания логичны, но прежде чем делать предположения о качестве теста можно было бы перейти по ссылке в посте и прочитать о нем. Что можно было узнать:
— 30 судей
— всего 300 5-минутных переписок
— каждые 5 минут судья общался одновременно с машиной и с человеком
— тест проводился при независимой экспертизе товарища Professor John Barnden, University of Birmingham, formerly head of British AI Society

+4

Об организации кода в django-приложениях или толстые модели – это прекрасно

aledovskiy Feb 27 2014 at 01:37

Вообще про логику в моделях еще в Django Two Scoops (самая крутая книга по джанге на мой взгляд, ссыль) написали, но этож ад!

Приведу пример. Мы разрабатывали CRM, которое обеспечивало все рабочие процессы компании. В кратце, там был прием и обработка заявок со сложной финансовой калькуляцией, а также статистика. Было у нас все «хрестоматийно»: толстые модели с логикой, причем функции логики вызывались прямо из теплейта. Сначала все было ок. Но по мере нарастания функционала начались Содом и Гоморра =)

Во-первых, нельзя передавать параметры в функции в шаблоне (тэги не в счет, они для другого). Во-вторых, постоянный пересчет и вызов этих функций. В-третьих (что оказалось самым страшным), сложная модифицируемость кода — когда нужно было сделать серьезнейшее изменение в калькуляции и формате хранимых данных, дров было наломано неописуемо много!

В итоге, я соглашаюсь с тем, что всю сложную логику нужно выносить в отдельные службы. Ну а в модель выносить то, что касается непосредственно этой модели, вроде get_то, set_се.

+2

Гитхаб скоро запустит текстовый редактор с богатым функционалом

aledovskiy Feb 27 2014 at 00:24

Я всеми руками за, но по-моему это плагиат.

-18

Безопасное резервное копирование с помощью публичных сервисов

aledovskiy Jan 30 2014 at 13:41

Спасибо!

0

Безопасное резервное копирование с помощью публичных сервисов

aledovskiy Jan 30 2014 at 10:02

А можете объяснить как работает шифрование? А то я не очень понял манипуляции с ключом.

0

Четыре метода загрузки изображений с веб-сайта с помощью Python

aledovskiy Jan 25 2014 at 12:21

Я ничего против автора не имею, но хабр тем и ценен, что статьи в нем отличаются от вопросов на stackoverflow. Формат хабра скорее: «Как я написал парсер», или «Используем requests + lxml для парсинга».

+8

Несколько применений Sublime Text 3, которыми Вы могли бы пользоваться

aledovskiy Jan 21 2014 at 18:00

Ах да, посоветую GitGutter. Он помечает строки, которые были изменены, созданы и где были удалены.

+6

Несколько применений Sublime Text 3, которыми Вы могли бы пользоваться

aledovskiy Jan 21 2014 at 17:57

Да да, я полностью согласен. Не обобщал на всех. Java/C# и скриптовые языки — две разных культуры разработчиков.
Тут имеется в виду, неопытный человек использует ide, где все настроено и не требует дополнительных телодвижений. Затем он начинает понимать, что его раздражает, что неоптимально и чего не хватает. И тогда он переходит к текстовым редакторам, чтобы постичь дзен :)

-4

Несколько применений Sublime Text 3, которыми Вы могли бы пользоваться

aledovskiy Jan 21 2014 at 17:50

Я честно говоря консолью пользуюсь.

+2

Несколько применений Sublime Text 3, которыми Вы могли бы пользоваться

aledovskiy Jan 21 2014 at 14:44

github.com/srusskih/SublimeJEDI
github.com/DamnWidget/anaconda

+2

Несколько применений Sublime Text 3, которыми Вы могли бы пользоваться

aledovskiy Jan 21 2014 at 13:45

Именно поэтому я жду, что я рано или поздно перейду на vim ;)

0

Несколько применений Sublime Text 3, которыми Вы могли бы пользоваться

aledovskiy Jan 21 2014 at 13:42

Угу, я его юзаю

0

Несколько применений Sublime Text 3, которыми Вы могли бы пользоваться

aledovskiy Jan 21 2014 at 13:29

emacs и vim — следующая стадия гиковости.
мне кажется, что эволюция часто происходит так: IDE от JetBrains -> Sublime -> vim :)

+6

Практические советы по верстке бланков заявлений в ЛаТеХе

aledovskiy Dec 26 2013 at 12:46

Спасибо! Даешь LaTeX в массы!

+1

Как устроен Meteor изнутри

aledovskiy Dec 14 2013 at 12:02

Почему MongoDB?

+2

Профилирование и отладка Python, переходим к практике

aledovskiy Nov 18 2013 at 09:46

Жаль, похоже каждый свой велосипед пишет(

0

Профилирование и отладка Python, переходим к практике

aledovskiy Nov 15 2013 at 13:38

Так как в итоге обстоит дело с профайлингом SQL запросов?

Дебаг тулбар мощный, но с ajax запросами не работает. Один мой товарищ написал специальную тулзу для дебаг-тулбара, чтобы через торнадо их перехватывать и выводить на отдельной странице, но это совсем жестко) к тому же дебаг тулбар использует свой jQuery что очень плохо.

Из альтернатив только Django-live-profiler? Он решает проблему ajax запросов?

+1

Sublime Text Vintage Mode — справочник по горячим клавишам

aledovskiy Nov 13 2013 at 23:37

У саблайма крутое комьюнити, много активно развивающихся плагинов.
А то, что он стремительно развивается, вполне естественно. Его парадигма — минимум ебли, максимум профита.

А так, настроить под себя можно любой редактор.

0

Визуализация двумерного гауссиана на плоскости

aledovskiy Oct 28 2013 at 10:26

«5% — это же вероятность того, что мы совершим ошибку первого рода.»
А, вы об этом. Ну да, конечно, вероятность ошибки.

0

2