Comments / Profile of lightcaster / Habr

How to become an author

User

Profile Publications 6Comments 380Bookmarks

Искусство Feature Engineering в машинном обучении

lightcaster Jan 18 2015 at 11:09

И давно вам встречались задачи с 20 признаками и линейными паттерннами? Я лет пять занимаюсь ML для разных стартапов — и все задачи были 1) большой размерности 2) с высоко нелинейными паттернами 3) высоким шумом / избыточностью.

+1

Искусство Feature Engineering в машинном обучении

lightcaster Jan 18 2015 at 11:00

По мне, зря человека заминусили. Я не помню чтоб на nips/icml встречал доклады от российских вузов. Правда, русских имен много.
На счет Feature Learning / Deep learning это все очень тесно связано.

За последние два года я работал только с deep learning алгоритмами, а классику использовал только для сравнения.

В широком смысле, текст, изображения и видео — это 90% современного машинного обучения.

Вот список приложений в более узком смысле:
— автоматический перевод
— распознавание речи
— определения жанра музыки
— распознование рукописных символов (именно, handwriting)
— моделирование длинных последовательностей: языковые модели, трейдинг
— автоматическое аннотирование картинок
— IR: поиск картинок, документов
— рекоммендательные системы
— пара приложений от deepmind, которую гугл купил:
— ИИ для простых видеоигр
— neural turing machine: инференс простых алгоритмов, вроде сортировки; но это пока очень экспериментальная штука

+3

Искусство Feature Engineering в машинном обучении

lightcaster Jan 17 2015 at 16:30

Было бы интересно. С word2vec я работал немного.

0

Искусство Feature Engineering в машинном обучении

lightcaster Jan 17 2015 at 15:33

Ну всего понемногу: текст, картинки, видео. Текст больше интересен.

0

Искусство Feature Engineering в машинном обучении

lightcaster Jan 17 2015 at 15:19

Реквестирую статью по feature learning.

+1

Сверхбыстрое распознавание речи без серверов на реальном примере

lightcaster Sep 22 2014 at 18:18

Вы не поверите, насколько сильно одно связано с другим.

-1

Сверхбыстрое распознавание речи без серверов на реальном примере

lightcaster Sep 22 2014 at 07:09

О, заминусили :)

Я имел ввиду что вы говорите довольно «роботизированным» голосом, с четкими паузами и разделениями слов. Более того, короткими командами. Это не очень практично в обычной жизни, где человек говорит бегло.

-1

Сверхбыстрое распознавание речи без серверов на реальном примере

lightcaster Sep 21 2014 at 23:35

«Телефончик, слушай, отправь смсочку Лене и скажи задержусь на пять минут.»

Голосовое управление станет обыденностью если дивайс сможет распозновать подобные вещи, сказанные бегло и без напряжения.

-6

Вычисляемые знания и будущее чистой математики

lightcaster Sep 11 2014 at 16:02

Да, я бы сделал иначе. Гугл, фейсбук разрешает публиковаться своим ученым. Более того, это норма. Если мне потребуется, несмотря на DNA я тоже могу договорится с боссом о публикации. Тем более, работа Кука не ноу-хау для бизнеса. Это — теоретический результат.

0

Вычисляемые знания и будущее чистой математики

lightcaster Sep 11 2014 at 14:34

Да, вы правы. Я напутал. Слил две истории вместе.

Но суть от этого не меняется. Кук доказал правило 110. Стивен через суд заблокировал публикацию.
Да, там был NDA. Но не публиковать важные работы — это странно. Ученый то должен понимать, тем более математик. Вольфрам же подал в суд на собственного работника, чтобы задержать публикацию и перенести ее в свою книгу.

0

Вычисляемые знания и будущее чистой математики

lightcaster Sep 11 2014 at 13:16

Wikipedia — Rule 110

Around 2000, Matthew Cook published a proof that Rule 110 is Turing complete, i.e., capable of universal computation, which Stephen Wolfram had conjectured in 1985. Cook presented his proof at the Santa Fe Institute conference CA98 before the publishing of Wolfram's book, A New Kind of Science. This resulted in a legal affair based on a non-disclosure agreement with Wolfram Research. Wolfram Research blocked publication of Cook's proof for 2 years.[1]

0

Вычисляемые знания и будущее чистой математики

lightcaster Sep 11 2014 at 12:59

Один математик доказал полноту по Тьюрингу правила 110, по конкурсу от Вольфрама. Опубликовал результат, как это принято. Стивен его засудил, и заблокировал публикацию на два года. Это, по вашему, нормально?

0

Обзор наиболее интересных материалов по анализу данных и машинному обучению №7 (28 июля — 4 августа 2014)

lightcaster Aug 4 2014 at 12:47

Кстати о птичках, Байесовскую непараметрику кто-нибудь на практике использовал?

+1

Почему Ваза утонул, а С++ всё ещё на плаву

lightcaster Jun 26 2014 at 07:29

Почему вы не ставите вопрос «почему С не утонул?». Язык и древнее, и топорней. И, судя по графикам, популярней.

+3

Вероятностные модели: сэмплирование

lightcaster Jun 20 2014 at 17:57

Подожду :).

Сергей, отвлеченный вопрос. А откуда такая любов к графическим (графовым) вероятностным моделям? С чисто инженерной точки зрения — это головная боль. Не так много пакетов, которые разботают «из коробки». Простые вещи типа sum-product реализовать можно и самому, но когда начинается что-то более сложное… Вы в surfingbird пишете с нуля, или все же что-то используете?

0

Вероятностные модели: сэмплирование

lightcaster Jun 20 2014 at 16:10

После долгого затишья… Рад что вы вернулись. Сильный цикл статей. Реквистирую непараметрические байесовские методы.

+6

Что скрывают нейронные сети?

lightcaster Jun 4 2014 at 07:06

Откуда столько эмоций? Речь идет о т.н. 'adversarial noise'. Т.е. мы сознательно генерируем шум такого рода, что заставляет классификатор ошибаться. Это применимо, вообще, к любым классификаторам. В статье показано как это делать с нейронной сетью.

На счет автомобилей и т.п. — привожу пример обсуждения на форуме (с участием автора статьи):

Minh Lê 2 июня 2014 г.:

Regarding driverless cars: this finding should not be a problem to them because they examine many samples per second and it is unlikely that «adversarial examples» occur in majority.

Christian Szegedy 2 июня 2014 г.

Agreeing with Minh.

+6

Заочное обучение в ШАД Яндекса: 570 замечательных часов моей жизни

lightcaster May 29 2014 at 09:27

Два вопроса — сильно ли это отличается от онлай курсов Edx или Coursera?
Второй — куда дальше, яндекс?

+1

Конкурс летающих роботов, этап №2: теперь не миллион, а 5 раз по 200 тысяч

lightcaster May 28 2014 at 09:42

А только по камерам кто-нибудь летал?

+1

Почему вам стоит использовать Vim

lightcaster May 27 2014 at 14:58

Пробовал. VisualStudio, Builder, Eclipse, IDEA, Comodo и много других по-меньше. Доктор, что со мной?

+1

3

4 5 ...