Pull to refresh
69
0
Vladimir Larin @borges

Senior Data Scientist

Send message

Добавляем голосовое управление на русском языке в VR-проект

Reading time5 min
Views2.9K

Тема виртуальной, дополненной реальности, метавселенных набирает обороты. Но что это такое, как должно выглядеть, как этим пользоваться, никто толком пока не знает. Однако, как в своё время переход от десктопных приложений к мобильным, миграция в VR принесёт и новые паттерны взаимодействия с пользователем. Да, в виртуальной реальности уже можно «потрогать» предметы, но этого недостаточно для полноценного решения пользовательских задач. Кажется, что голосовое управление в VR станет ещё более актуальным, чем в мобильных устройствах — в виде, например, голосовых команд или ввода текстовых данных. 

Ниже опишу пошагово, как можно добавить голосовое управление на русском языке в VR-проект.

Читать далее
Total votes 6: ↑5 and ↓1+4
Comments1

SymFormer: как мы написали музыку с помощью трансформеров и вариационных автоэнкодеров

Reading time9 min
Views4.2K

Когда вы слышите слово «творчество», какие ассоциации приходят к вам в голову? Скорее всего, не в последнюю очередь вы подумаете о музыке. Зачастую она — прямое выражение глубоких эмоций и переживаний. Как будто из идеального мира Платона к нам проникает свет, который композитор просто записывает в виде нот. Возможно поэтому мы и считаем музыку творчеством в чистом виде. Музыка — проявление глубинных эмоций. Как же ИИ может создавать её, не испытывая эмоций?

В этой статье я расскажу, как наша команда Управления экспериментальных систем машинного обучения SberDevices попыталась формализовать сочинение музыки и научить ему нейронную сеть. Запускайте наш первый генеративный альбом «Thriving Machine» и устраивайтесь поудобнее.

Читать далее
Total votes 19: ↑19 and ↓0+19
Comments6

Визуализация больших графов для самых маленьких

Reading time12 min
Views56K


Что делать, если вам нужно нарисовать граф, но попавшиеся под руку инструменты рисуют какой-то комок волос или вовсе пожирают всю оперативную память и вешают систему? За последние пару лет работы с большими графами (сотни миллионов вершин и рёбер) я испробовал много инструментов и подходов, и почти не находил достойных обзоров. Поэтому теперь пишу такой обзор сам.
Читать дальше →
Total votes 95: ↑94 and ↓1+93
Comments30

Заметки с конференции ACL 2019

Reading time8 min
Views2.7K


Annual Meeting of the Association for Computational Linguistics (ACL) — это главная конференция в области обработки естественного языка. Она организуется с 1962 года. После Канады и Австралии она вернулась в Европу и проходила во Флоренции. Таким образом, в этом году у европейских исследователей она была более популярна, чем похожая на нее EMNLP.

В этом году было опубликовано 660 статей из 2900 присланных. Огромное количество. Вряд ли можно сделать какой-то объективный обзор того, что было на конференции. Поэтому я расскажу своих субъективных ощущениях от этого мероприятия.
Читать дальше →
Total votes 13: ↑13 and ↓0+13
Comments0

XLNet против BERT

Reading time3 min
Views13K


В конце июня коллектив из Carnegie Mellon University показал нам XLNet, сразу выложив публикацию, код и готовую модель (XLNet-Large, Cased: 24-layer, 1024-hidden, 16-heads). Это предобученная модель для решения разных задач обработки естественного языка.

В публикации они сразу же обозначили сравнение своей модели с гугловым BERT-ом. Они пишут, что XLNet превосходит BERT в большом количестве задач. И показывает в 18 задачах state-of-the-art результаты.
Читать дальше →
Total votes 42: ↑41 and ↓1+40
Comments10

Ускоряем написание Selenium-автотестов на Ruby

Reading time3 min
Views16K
Одним из инструментов, позволяющих автоматизировать взаимодействие с браузером, является Selenium Webdriver. В действительности автоматизированные тесты веб-страниц с использованием Selenium Webdriver выглядят довольно громоздко. Вот «небольшой» пример, который параллельно в двух браузерах открывает страницу поисковика Google, заполняет поисковую строку и отправляет форму:


Читать дальше →
Total votes 20: ↑18 and ↓2+16
Comments12

SICP теперь по-русски! Часть третья

Reading time1 min
Views12K
image
Перевод третьей лекции из курса «Структура интерпретация компьютерных программ».

Это самый известный курс по программированию за последние 25 лет; с 1980г читается в MIT, а с недавних пор что-то подобное читается и в Беркли.

Курс сменил преподавателей и даже язык программирования Scheme на Python(на мой взгляд совершенно зря) и тем не менее информация, которая дается в этом курсе остается архи актуальной в любое время. Я бы сравнил этот курс с чем-то очень фундаментальным и важным для программистов, типа математики или теории алгоритмов.

Мне бы очень хотелось, чтобы программирование у нас в стране преподавалось таким вот образом.

Приятного просмотра!
Читать дальше →
Total votes 98: ↑94 and ↓4+90
Comments39

На старт, внимание, N900!

Reading time12 min
Views13K
Здравствуй, уважаемое хабрасообщество. Сегодня, продолжая свой цикл статей о Nokia N900, проведу достаточно нестандартное сравнение трех устройств (почти сравнение пылесоса и холодильника ).
Летом многие бегают и катаются на велосипедах. Некоторые используют для этого специализированные компьютеры. А если такого нет или не хочется покупать? В таком случае можно воспользоваться N900!
Так как я достаточно давно занимаюсь бегом, то у меня есть два беговых компьютера от Garmin. В этой статье я решил описать каким образом N900 можно превратить в беговой компьютер и насколько он хорошо смотрится на фоне профессиональных специализированных инструментов.

Под катом я проведу сравнительный анализ и выяснить, насколько Nokia N900 может заменить специализированные компьютеры от Garmin. И в этом анализе мне помогут два моих других устройства: Garmin FR50 и Garmin FR305.
Читать дальше →
Total votes 61: ↑54 and ↓7+47
Comments48

Эпидемия

Reading time1 min
Views945
На beta.ya.ru эпидемия, с каждой секундой прибывает и прибывает население.
У меня из 225 инвайтов, осталось 200.

Отдам даром :)

PS: уже больше 100 человек воспользовались инвайтами. Спасибо! Значит я рассылал их не зря :)

PSS: больше, к сожалению, инвайтов не имеется :(
Total votes 71: ↑63 and ↓8+55
Comments456

трансляция rit2007 non-stop

Reading time1 min
Views480
Total votes 32: ↑25 and ↓7+18
Comments77

Игровые сообщества — часть нашего будущего

Reading time2 min
Views662
Мы большую часть дня проводим перед экраном монитора, называем друг друга по никам, и многие планы прокучиваем в голове, чтобы продвинуться в игре, как я в Дозорах. Но, несомненно, при этом испытываем потребность дополнить это полноценной реальной жизнью. Поэтому ездим друг другу в гости, пересекая половину континента, собираемся в уже совершенно обычных компаниях за совершенно обычным столом. Что это? С чем это связано, к чему ведет?
Читать дальше →
Total votes 19: ↑16 and ↓3+13
Comments10

7 распространенных заблуждений о «клонировании» Youtube

Reading time3 min
Views1.1K
1. Ниша не занята и, если мы выпустим клон к апрелю, — рынок будет наш.
2. Сделать скрипт а-ля Youtube стоит $100.
3. На первом этапе мы привлечем деньги инвесторов и венчурных фондов.
4. Главное купить этот скрипт за $100, а потом мой проект купят за $1 600 000 000.
5. Даже если не купят проект, мы заработаем на рекламе.
6. Если сделать скрипт стоит $100, значит стартапу достаточно $100 + $N, где N — это моя зарплата.
7. Два человека могут повторить успех YouTube.

Суровая правда жизни...
Total votes 104: ↑88 and ↓16+72
Comments113

Участвуем в выставке. Часть 1: подготовка

Reading time7 min
Views16K
В сети присутствует огромное количество публикаций репортажами с выставок — CES, NAB, CeBIT и других. Но информации, как стать участником, а не посетителем выставки, мало. Когда примерно год назад у нас сформировалась идея об участии на выставке CSTB, информацию пришлось собирать по крупицам. Очевидных вещей вроде «ваш стенд должен быть информативен» было полно, действительно полезной информации — мало. Сейчас, завершая подготовку уже к третьей выставке, хочу поделиться опытом участия с практической стороны с теми, кто думает об участии первый раз.
Читать дальше →
Total votes 7: ↑5 and ↓2+3
Comments2

Опыт применения Google Apps for Business

Reading time4 min
Views63K
Каждая компания на определенном этапе развития становится перед вопросом организации и последующей автоматизации своего документооборота. Хотим поделиться нашим опытом использования решений Google — Drive (Docs), Calendar и Contacts.

image
Читать дальше →
Total votes 36: ↑31 and ↓5+26
Comments39

Сравнение алгоритмов распознавания аудио для Second Screen

Reading time6 min
Views8.6K

Введение


На сегодняшний день существует множество методов распознавания звука. В самом общем виде большинство методов состоят из алгоритма построения сигнатуры (fingerprints) сигнала (максимально компактного и при этом наиболее точно описывающего трек набора признаков), алгоритма ее поиска в базе данных и алгоритма отсечения ложных срабатываний. Перед нами стояла задача выбора технологии для построения second screen приложений.

При этом сравнение алгоритмов распознавания на основе известных точностных характеристик является довольно условным, поскольку эти характеристики получены на разных тестовых данных и при разных ошибках первого рода (false positives). Также, исходя из контекста задачи, нас интересовала эффективность алгоритма применительно к распознаванию аудиосигнала телеэфира, при искажениях обусловленных параметрами микрофонов современных мобильных устройств.

Поскольку в открытых источниках сравнительных данных, удовлетворяющих нашим требованиям, найдено не было, было решено провести собственное исследование алгоритмов распознавания звука, с учетом специфики аудиопотока и искажений. В качестве потенциальных кандидатов мы остановили свой выбор на алгоритмах J. Haitsma и A. Wang. Оба широко известны и основаны на анализе частотно-временных признаков, полученных с помощью оконного преобразования Фурье.
Читать дальше →
Total votes 20: ↑20 and ↓0+20
Comments5

Текстурирование спрайтов с помощью (dis)placement map

Reading time3 min
Views5K

Недавно, ковыряя с целью исследования один чужой проект, наткнулся на весьма любопытную и в то же время — очень простую технологию. Сразу скажу, что ковырял я флэшку, но данная технология может быть использована не только во флэше, а вообще — где угодно.

Если коротко, то технология позволяет иметь одну отрендеренную анимацию и накладывать на нее разнообразные скины, тем самым получая внешне различные объекты.

Суть в том, что в изучаемой мной игре есть большое количество анимированных спрайтов человечков (как я изначально считал — заранее отрендеренных). Человечки разные (по-разному одетые, разных цветов и т.п.).
Читать дальше →
Total votes 183: ↑181.5 and ↓1.5+180
Comments63

Licenzero: ищем порно по цвету кожи

Reading time3 min
Views9.6K
Маска по цвету кожиПродолжаем описание классификатора порнографического видеоконтента, разработанного компанией Inventos (Licenzero, присутствующее в заголовке это не отдельная компания, а подразделение в компании Инвентос).

Детектор цвета кожи является одним из детекторов, при помощи которых мы классифицируем видео. Он не такой сложный, как детектор движения, или детектор фрагментов, можно даже сказать совсем простой. Вначале у нас была куча идей, связанных с цветом кожи в видео. Но попробовав самый простой подход к классификации, мы решили (возможно временно) на нем остановиться, поскольку полученные результаты нас вполне устроили. Итак.
Читать дальше →
Total votes 125: ↑118 and ↓7+111
Comments118

Свет и освещение

Reading time7 min
Views165K
Часто (в том числе и на хабре) всплывает вопрос освещения, особенно «нанотехнологиченого» светодиодного и зачастую говны священных войн «светодиод» против люминисцентных ламп начинают подбурливать. Больше года я уже собирался написать статью о свете, и оно наконец свершилось.
Из этой статьи вы узнаете почему в фотостудиях не снимают с люминесцентными лампами, почему светодиоды до сих пор не захватили мир и стоит ли ими освещать улицы. Поехали!
Читать дальше →
Total votes 302: ↑297 and ↓5+292
Comments208

Licenzero: простые движения

Reading time6 min
Views7.2K
Двустороннее движениеЭтим постом мы продолжаем цикл статей о том, как мы делали порнофильтр. Сейчас речь пойдет о попытке классифицировать порнографический контент по характерным движениям в кадре.

Началось это все как просто шутка из разговора. Ведь классифицировать порнографические движения довольно непросто — они слишком разные, чтобы найти в них что-то общее. Но мы попробовали, результат нас вполне устроил, и детектор движения занял свое место в общем классификаторе порнографического видеоконтента.
Читать дальше →
Total votes 80: ↑73 and ↓7+66
Comments38

Построение систем доставки видео на основе HTTP Dynamic Streaming от Adobe и OpenSource

Reading time8 min
Views21K
В рамках проекта для одного из наших заказчиков в очередной раз встала задача построить систему конвертации/ хранения/ доставки видео в интернет. Типичная такая задача создания своего маленького (или не очень маленького) “Тьюба” только с профессиональным, а не UGC-контентом.

С момента создания первых “Тьюбов” технологии видео в интернете прошли некоторый путь развития, позволяют сейчас делать намного больше, да и требования к современному видео-сайту стали несколько иными.

Наиболее интересными трендами последнего времени, на наш взгляд, являются:
  • возможность смотреть один видео-сайт с разных устройств,
  • технология адаптивного HTTP стриминга

Читать дальше →
Total votes 55: ↑53 and ↓2+51
Comments55
1

Information

Rating
Does not participate
Location
Орел, Орловская обл., Россия
Works in
Date of birth
Registered
Activity