Продолжаем разговор. Прошлая статья была переходной от предыдущего цикла о графических моделях вообще (часть 1, часть 2, часть 3, часть 4) к новому мини-циклу о тематическом моделировании: мы поговорили о сэмплировании как методе вывода в графических моделях. А теперь мы начинаем путь к модели латентного размещения Дирихле (latent Dirichlet allocation) и к тому, как все эти чудесные алгоритмы сэмплирования применяются на практике. Сегодня – часть первая, в которой мы поймём, куда есть смысл обобщать наивный байесовский классификатор, и заодно немного поговорим о кластеризации.
Скакунов Александр @alex4
Пользователь
Как заставить работать бинарный классификатор чуточку лучше
6 min
47KDisclaimer: пост написан по мотивам данного. Я подозреваю, что большинство читателей прекрасно знает, как работает Наивный Байесовский классификатор, поэтому предлагаю лишь мельком хотя бы глянуть на то, о чём там говорится, перед тем как переходить под кат.
Решение задач с помощью алгоритмов машинного обучения давно и прочно вошло в нашу жизнь. Это произошло по всем понятным и объективным причинам: дешевле, проще, быстрее, чем явно кодить алгоритм решения каждой отдельной задачи. До нас, обычно, доходят «черные ящики» классификаторов (вряд ли тот же ВК предложит вам свой корпус размеченных имен), что не позволяет ими управлять в полной мере.
Здесь я бы хотел рассказать о том, как попробовать добиться «лучших» результатов работы бинарного классификатора, о том какие характеристики бинарный классификатор имеет, как их измерять, и как определить, что результат работы стал «лучше».
+16
Передача энергии по воде и однопроводная передача
2 min
91KПривет хабр. Сегодня я хочу рассказать о необычном явлении, которое я наблюдал в результате эксперимента. Скажу сразу ничего общего с ИТ и объяснений с научной точки зрения не будет.
А будет «качер», ёмкость с водой, испорченные лампочки и любопытство познать новое! Кому стало интересно – прошу, заходите, будет весело.
+13
Чего никто не говорит новичкам
2 min
60KTranslation
Это краткий пересказ лекции Айры Гласса – ведущего и продюсера национального радио-шоу «This American Life» (Эта американская жизнь). Посвящается Данилу.
Никто не говорит это новичкам и было бы здорово, если бы кто-то в начале сказал это мне: все мы – люди, которые начинают заниматься творческой работой – мы начинаем заниматься ею, потому что у нас хороший вкус. Но результат совсем не соответствует тому, что говорит тебе твой вкус. Первые несколько лет ты работаешь, но результат не особо хорош. Он как бы пытается быть хорошим, у него есть к тому потенциал, но он не так уж хорош; совсем нехорош. Но твой вкус, который заставил тебя этим заняться, всё равно великолепен. Он достаточно хорош, чтобы ты увидел, что твоя работа не дотягивает; он позволяет тебе увидеть, что она паршива. Многие люди не проходят эту фазу, многие люди на этом всё бросают.
Никто не говорит это новичкам и было бы здорово, если бы кто-то в начале сказал это мне: все мы – люди, которые начинают заниматься творческой работой – мы начинаем заниматься ею, потому что у нас хороший вкус. Но результат совсем не соответствует тому, что говорит тебе твой вкус. Первые несколько лет ты работаешь, но результат не особо хорош. Он как бы пытается быть хорошим, у него есть к тому потенциал, но он не так уж хорош; совсем нехорош. Но твой вкус, который заставил тебя этим заняться, всё равно великолепен. Он достаточно хорош, чтобы ты увидел, что твоя работа не дотягивает; он позволяет тебе увидеть, что она паршива. Многие люди не проходят эту фазу, многие люди на этом всё бросают.
+22
Контроллер умного дома (с Ethernet, WiFi, USB, блэкджеком и плюшками) за $20?
7 min
217KНекоторое время назад к нам обратился один потенциальный заказчик со своей идеей проекта «умного дома». Мы заказчикам всегда рады, особенно если у них есть более-менее внятная идея и достаточно денег для ее воплощения (сразу скажу — этот заказчик пока что является идеалом сферического заказчика в вакууме, повезло нам с ним). Так что после пары встреч родилось общее описание проекта, и мы приступили к поиску вариантов технической реализации. Нужен был недорогой контроллер с поддержкой WiFi и USB, небольшим энергопотреблением и, главное, с достаточно открытой архитектурой, чтобы мы могли сделать на его базе собственное кастомизированное решение.
И тут очень удачно попалась нам на глаза статья. Ух ты, какие штуки бывают, оказывается! У меня самого в качестве передвижной точки доступа для поездок по Китаю (где до сих пор RJ-45 розетка в номере при отсутствии WiFi — довольно частое явление) давно уже используется мини-роутер TP-LINK TL-WR702N, купленный рублей за 700, но тот факт, что внутри живет вполне приличный одноплатный компьютер с кучей дополнительных возможностей, стал для меня приятным сюрпризом. А поскольку мы по своему основному бизнесу плотно завязаны с Китаем (и китайскими производителями электроники в частности), стало нам интересно — во сколько же нам обойдется собственная плата на базе SoC AR9331, если целое законченное решение в корпусе, в коробке, с проводами и блоком питания, стоит в России 700р (на то время — $22) в рознице?
И тут очень удачно попалась нам на глаза статья. Ух ты, какие штуки бывают, оказывается! У меня самого в качестве передвижной точки доступа для поездок по Китаю (где до сих пор RJ-45 розетка в номере при отсутствии WiFi — довольно частое явление) давно уже используется мини-роутер TP-LINK TL-WR702N, купленный рублей за 700, но тот факт, что внутри живет вполне приличный одноплатный компьютер с кучей дополнительных возможностей, стал для меня приятным сюрпризом. А поскольку мы по своему основному бизнесу плотно завязаны с Китаем (и китайскими производителями электроники в частности), стало нам интересно — во сколько же нам обойдется собственная плата на базе SoC AR9331, если целое законченное решение в корпусе, в коробке, с проводами и блоком питания, стоит в России 700р (на то время — $22) в рознице?
+53
Музыка в ванной своими руками
5 min
291KДоброго дня.
Весной наконец-то дошли руки до ремонта в ванной комнате. При сборе требований к будущему функционалу родилась мысль, а не добавить ли в ванну возможность слушать музыку? Например, проигрывать медиаконтент с домашнего NAS. Сама идея «музыки в ванной» мне понравилась, и я пошел в гугл смотреть, какие решения существуют.
По итогам всего мероприятия решил поделиться информацией и результатами своего труда.
Весной наконец-то дошли руки до ремонта в ванной комнате. При сборе требований к будущему функционалу родилась мысль, а не добавить ли в ванну возможность слушать музыку? Например, проигрывать медиаконтент с домашнего NAS. Сама идея «музыки в ванной» мне понравилась, и я пошел в гугл смотреть, какие решения существуют.
По итогам всего мероприятия решил поделиться информацией и результатами своего труда.
+109
Продвижение непопсового приложения в Google Play
4 min
13KПоследние 3 или даже 4 месяца я долго и упорно писал IDE/редактор кода для веб-программистов под Android. Так получилось, что 2.5 года назад я уже писал в паре с товарищем аналогичную программу, и каким-то чудом она была достаточно успешной, несмотря на то, что это был практически первый опыт создания чего-либо, кроме университетских лабораторных работ.
По истечению этих лет, набравшись опыта, я решил, что смогу написать программу на порядок лучше и успешнее, чем наша первая попытка. Под катом будут графики, информация о заработке и какие-никакие советы по продвижению такого рода приложений.
+49
ShotSpotter: система акустического наблюдения в Washington, DC локализовала 39000 выстрелов с 2006 года
2 min
23KНа Хабре не так давно описывались системы акустического наблюдения, некоторые из которых используются полицией США и других стран для обнаружения звука выстрела и последующим выездом полицейского патруля на место, где произошел выстрел. В полиции утверждают, что далеко не всегда люди звонят в полицию, когда где-то стреляют. Если же и звонят, то может пройти достаточно много времени, пока человек решится позвонить, плюс полиция приедет на место. В качестве решения проблемы используется система акустического наблюдения в режиме реального времени, ShotSpotter.
+40
Как устроить фестиваль?
7 min
12KВообще я работаю дизайнером и обычно делаю доклады про дизайн или про UX. Но этот доклад особенный, я хочу рассказать про то, как сделать своё собственное роскошное it-мероприятие. Доклад основан на реальных событиях и личном опыте организации Фестиваля 404.
Изначально, это был восторженный доклад как все здорово, легко и просто. Что-то вроде того: выйдите в чистое поле, воткните в землю лопату, на следующий день из черенка вырастит красивый большой дуб. Так же и с конференциями — все получается легко и просто. Но! Весной этого года, мы попробовали сделать в Самаре конференцию про электронную торговлю ProfitFest и полностью провалились. Я буду вспоминать и этот опыт, поэтому доклад стал в два раза полезнее.
Изначально, это был восторженный доклад как все здорово, легко и просто. Что-то вроде того: выйдите в чистое поле, воткните в землю лопату, на следующий день из черенка вырастит красивый большой дуб. Так же и с конференциями — все получается легко и просто. Но! Весной этого года, мы попробовали сделать в Самаре конференцию про электронную торговлю ProfitFest и полностью провалились. Я буду вспоминать и этот опыт, поэтому доклад стал в два раза полезнее.
+42
Выходят бесплатные курсы от Iversity
2 min
26KКак уже писал Tutufa, компания Iversity обещала выдать 10 грантов по €25000 на создание Массовых Открытых Онлайн Курсов (MOOC).
Сказано — сделано. Одни курсы вышли на английском, другие на немецком.
Выбор неплохой, хотя технических тем не так уж много.
Сказано — сделано. Одни курсы вышли на английском, другие на немецком.
Выбор неплохой, хотя технических тем не так уж много.
+20
Онлайн-редактор музыки
3 min
7.9KПовествование пойдёт про ненастоящий стартап. Ненастоящий — в основном из-за того, что на создание ушло 7 лет (с перерывами и творческими кризисами). И, прежде чем уйти в ностальгию, сразу ссылка на демо песню.
+41
Коктейли ко дню программиста
5 min
188K Здравствуй, Хабр!
Осталось несколько дней до дня программиста и, конечно, в эту 13-ю пятницу, многие из пользователей хабра буду отмечать этот праздник. Буду отмечать и я.
По случаю профессионального праздника, мне бы хотелось поделиться с хабравчанами рассказом о своём небольшом кулинарном проекте, который удалось реализовать буквально накануне. Думаю из названия поста уже стало понятно, что это — коктейли для программиста. Кажется, до этого момента IT и миксологию еще никто не пытался объединить, а потому у меня есть некоторая надежда на успех моего начинания.
Все началось вот с чего: моя супруга увлекается кулинарией и ведет небольшой кулинарный блог. В прошлом году на мой день рождения она пригласила к нам в гости на кухню настоящего бармена из барного startup-проекта БАРаДОМа.нет. С момента знакомства с Артёмом (барменом который превратил мой день рождения в домашнюю барную вечеринку), у меня появилась идея: найти рецепты (или придумать самим) коктейлей, которые бы вписались в IT-тематику.
Итогом нескольких дней активной переписки с Артёмом стала вот такая небольшая коктейльная карта:
Под катом рецепты и фото коктейлей, которые мы сделали на нашей кухне. И, да, я не без причины публикую этот пост не в пятницу, а немного раньше.
Осталось несколько дней до дня программиста и, конечно, в эту 13-ю пятницу, многие из пользователей хабра буду отмечать этот праздник. Буду отмечать и я.
По случаю профессионального праздника, мне бы хотелось поделиться с хабравчанами рассказом о своём небольшом кулинарном проекте, который удалось реализовать буквально накануне. Думаю из названия поста уже стало понятно, что это — коктейли для программиста. Кажется, до этого момента IT и миксологию еще никто не пытался объединить, а потому у меня есть некоторая надежда на успех моего начинания.
Все началось вот с чего: моя супруга увлекается кулинарией и ведет небольшой кулинарный блог. В прошлом году на мой день рождения она пригласила к нам в гости на кухню настоящего бармена из барного startup-проекта БАРаДОМа.нет. С момента знакомства с Артёмом (барменом который превратил мой день рождения в домашнюю барную вечеринку), у меня появилась идея: найти рецепты (или придумать самим) коктейлей, которые бы вписались в IT-тематику.
Итогом нескольких дней активной переписки с Артёмом стала вот такая небольшая коктейльная карта:
- Ruby
- Python
- Суровый Perl
- JMP (aka Assembler)
- Profit!
- Epic fail
- Memory leak
Под катом рецепты и фото коктейлей, которые мы сделали на нашей кухне. И, да, я не без причины публикую этот пост не в пятницу, а немного раньше.
+194
Eleven for Skype: теперь не надо ничего записывать
2 min
15KВ погоне за новыми альтернативными способами управления техникой (сенсорные экраны, датчики движений, распознавание эмоций), мы почему-то забыли о таком естественном для человека инструменте как голос. И если мы ещё не дошли до того, чтобы привычно отдавать голосовые команды своим девайсам, сейчас мы легко можем надиктовывать списки задач для собственной работы.
Почему-то у нас нет сил сделать всё хорошо сразу, но мы их находим, чтобы потом всё переделать
Мы, фрилансеры, часто говорим по скайпу, но из-за большой загруженности мозга после разговора в памяти остаётся не более трёх вещей. А мы не хотим тратить время на пустые разговоры и тем более на выполнение ненужной работы. Очень обидно обнаружить, что силы и время потрачены на выполнение задач, результаты которых бесполезны. За это время можно было бы сделать действительно профитабельные вещи! Чтобы решить эту проблему, мы создали Eleven — сервис распознавания речи в реальном времени.
Почему-то у нас нет сил сделать всё хорошо сразу, но мы их находим, чтобы потом всё переделать
Мы, фрилансеры, часто говорим по скайпу, но из-за большой загруженности мозга после разговора в памяти остаётся не более трёх вещей. А мы не хотим тратить время на пустые разговоры и тем более на выполнение ненужной работы. Очень обидно обнаружить, что силы и время потрачены на выполнение задач, результаты которых бесполезны. За это время можно было бы сделать действительно профитабельные вещи! Чтобы решить эту проблему, мы создали Eleven — сервис распознавания речи в реальном времени.
+37
Система обучения в американском университете на специальность Computer Science
5 min
104KНедавно я поступил в американский ВУЗ (Worcester Polytechnic Institute) и в связи с этим хочу поделиться своим первым опытом. Я не буду писать о том, как тут классно, круто и так далее. Напишу более конкретно о системе образования, поскольку я три года изучал ее, но тем не менее многое не понимал. Пост довольно большой, поэтому не стесняйтесь начинать читать с интереснейшего на ваш взгляд параграфа. Однако, рекомендую прочесть все, это реальный опыт реального студента из бывшего СНГ, поступившего в топовый ВУЗ США. Почему я думаю, что это будет интересно IТ-шникам? Потому что моя специальность здесь – Computer Science, а в США самые авторитетные IT ВУЗы. Если кто-то из хабровцев захочет отправить ребенка навстречу светлому IT будущему, то и ему, и ребенку будет полезно почитать эту статью.
Не секрет, что ВУЗы США лучшие в своей области. Из сотни влиятельных университетов мира, порядка 70% – американские, а тройка Harvard, Stanford, MIT не сходит с первых мест международных рейтингов. Так как же работает эта система? Сразу должен сказать, что речь будет идти конкретно про ВУЗ, в котором я учусь. Системы могут немного отличаться в зависимости от университета. Расскажу все по порядку.
Не секрет, что ВУЗы США лучшие в своей области. Из сотни влиятельных университетов мира, порядка 70% – американские, а тройка Harvard, Stanford, MIT не сходит с первых мест международных рейтингов. Так как же работает эта система? Сразу должен сказать, что речь будет идти конкретно про ВУЗ, в котором я учусь. Системы могут немного отличаться в зависимости от университета. Расскажу все по порядку.
+77
7 советов, как улучшить интерфейс вашего приложения
4 min
44KБудучи дизайнером интерфейсов, до сих пор часто вижу ситуацию, когда проектировать интерфейсы приходится разработчикам или кому-то еще из команды.
Конечно, лучше, когда дизайнер в команде есть, но что делать, если его нет?
Когда-то я собрала набор простых правил, которые помогают избежать 80% самых распространенных ошибок, касающихся построения интерфейсов. Решила расшарить их для хабрасообщества.
Кому интересно — добро пожаловать под кат.
Конечно, лучше, когда дизайнер в команде есть, но что делать, если его нет?
Когда-то я собрала набор простых правил, которые помогают избежать 80% самых распространенных ошибок, касающихся построения интерфейсов. Решила расшарить их для хабрасообщества.
Кому интересно — добро пожаловать под кат.
+36
О регистрации на сайтах
6 min
76KTutorial
Мы часто выполняем на многих сайтах действие, которое постоянно эволюционирует и улучшается (а иногда наоборот). Это регистрация. Именно о разных способах и особенностях регистраций на сайтах я бы хотел с вами поговорить. Это не громоздкое исследование, а просто небольшие и (надеюсь) полезные выдержки из моего опыта дизайнера интерфейсов.
Пример удачной регистрации на сайте Tumblr.
Начну с определения самого понятия «регистрация», с ним всё не так просто, как может казаться. В результате полевых исследований нашей компании оказалось, что разные люди (клиенты, посетители и мы сами) нередко воспринимают это слово по-разному. Для того, чтобы избежать непонимания, опишу то, как я сам вижу регистрацию.
Пример удачной регистрации на сайте Tumblr.
Начну с определения самого понятия «регистрация», с ним всё не так просто, как может казаться. В результате полевых исследований нашей компании оказалось, что разные люди (клиенты, посетители и мы сами) нередко воспринимают это слово по-разному. Для того, чтобы избежать непонимания, опишу то, как я сам вижу регистрацию.
+122
Список Javascript библиотек для рисования графиков и диаграмм 2
2 min
37KПродолжаем тему визуализации данных в интернете.
Предыдущие топики:
Предыдущие топики:
- Изумительные диаграммы с новым Chart контролом
- Визуализация направленных графов в вебе
- Список Javascript библиотек для рисования графиков и диаграмм — habrahabr.ru/blogs/javascript/79960 (публикация в блоге — msug.vn.ua/blogs/akrakovetsky/archive/2010/01/04/javascript-charting-libraries.aspx)
+42
В Австралии борются с невнимательностью водителей с помощью воды и проектора
1 min
46KУсталый дальнобойщик, не замечающий знаков и сигналов, предупреждающих о низком мосте или туннеле, способен наделать много бед — иногда фура буквально вклинивается между перекрытием туннеля и дорогой, надолго блокируя движение и принося многомиллионный ущерб. В Сиднее придумали футуристический способ предупреждать зазевавшихся водителей грузовиков на въезде в туннель. Если водитель упорно игнорирует многочисленные предупреждения, включается водяная завеса, на которую проецируется огромный двухметровый знак «стоп». Так как знак появляется непосредственно на проезжей части, прямо перед автомобилем, проигнорировать его практически невозможно. Видео, демонстрирующее работу знака, напоминает кадры из фантастического фильма. Хотя такой знак обходится намного дороже обычных, один единственный ремонт туннеля стоит гораздо больше.
+117
Принципы анимации: как сделать хороший скринкаст программного продукта
3 min
18KTutorial
Жизнь – как вождение велосипеда. Чтобы сохранить равновесие, ты должен двигаться.
А.Эйнштейн
Преамбула: в Alconost мы делаем продающие видеоролики для программных продуктов, веб сайтов, онлайн сервисов, мобильных приложений. Ключевая роль в таких роликах отводится скринкастам — показу действий пользователя в программе/сервисе/на сайте. Скринкаст — это показ товара “лицом”. Если скринкаст сделан убого — у зрителя останется ощущение убогого продукта и задача “мотивировать попробовать продукт” будет провалена.
Мы задумались над тем, почему иногда скринкасты выглядят неестественно и негармонично и как сделать так, чтобы скринкасты всегда получались хорошо. Оказывается, существуют 12 принципов анимации Диснея и если следовать им — любое действие на экране будет выглядеть красивым и гармоничным. Мы чуть-чуть поработали над этими принципами: убрали то, что не относится к скринкастам, а остальное адаптировали под специфику видеороликов о программных продуктах. В итоге у нас получилась памятка-руководство для видеодизайнеров, которой мы и хотим поделиться.
Итак, если вы заказали видеоролик, и вам раз за разом присылают промежуточные версии с отстойными скринкастами — покажите вашим «видеоменам» вот этот ролик:
Видео предназначено для людей, близких к видеодизайну, поэтому если вам нужно более подробное описание каждого принципа — добро пожаловать под кат.
А.Эйнштейн
Преамбула: в Alconost мы делаем продающие видеоролики для программных продуктов, веб сайтов, онлайн сервисов, мобильных приложений. Ключевая роль в таких роликах отводится скринкастам — показу действий пользователя в программе/сервисе/на сайте. Скринкаст — это показ товара “лицом”. Если скринкаст сделан убого — у зрителя останется ощущение убогого продукта и задача “мотивировать попробовать продукт” будет провалена.
Мы задумались над тем, почему иногда скринкасты выглядят неестественно и негармонично и как сделать так, чтобы скринкасты всегда получались хорошо. Оказывается, существуют 12 принципов анимации Диснея и если следовать им — любое действие на экране будет выглядеть красивым и гармоничным. Мы чуть-чуть поработали над этими принципами: убрали то, что не относится к скринкастам, а остальное адаптировали под специфику видеороликов о программных продуктах. В итоге у нас получилась памятка-руководство для видеодизайнеров, которой мы и хотим поделиться.
Итак, если вы заказали видеоролик, и вам раз за разом присылают промежуточные версии с отстойными скринкастами — покажите вашим «видеоменам» вот этот ролик:
Видео предназначено для людей, близких к видеодизайну, поэтому если вам нужно более подробное описание каждого принципа — добро пожаловать под кат.
+9
Классификация русского текста с помощью библиотеки Natural на NodeJS
3 min
17KПреамбула
Я никого не удивлю, если скажу, что современный человек, а, в особенности, программист, каждый день получает огромное информации. К примеру, мой RSS-клиент выдает мне в неделю около 500 статей. И, конечно же, это далеко не единственный источник информации.
Я задумался над тем, чтобы сделать для себя RSS-клиент с обучаемым фильтром статей на NodeJS. В принципе, под ноду есть готовые RSS ридеры, есть готовые нейронные сети с классификаторами, так что написать какой-то прототип мне показалось не особенно сложной задачей.
Я решил начать с тестирования подвернувшихся под руку нейронных сетей. Я взял небольшое количество входных данных. Позитивные данные я скопировал из статей по nodejs с хабра. Негативные данные я нашел на «ленте.ру». Задача классификатора заключалась в том, чтобы отсортировать статьи о программировании и nodejs от обычных, безынтересных для моего развития, новостей.
Результаты работы с Brain и Fann я показывать не хочу — я не считаю, что я обладаю достаточной экспертизой для того, чтобы судить о них. Скажу только что из коробки они меня не устроили совершенно — на моих входных данных они не давали адекватного количества правильных ответов. А вот библиотека Natural меня очень впечатлила.
Далее я покажу как я обучал классификатор, проверял его работу и заставлял понимать русский язык.
+17
Information
- Rating
- Does not participate
- Location
- Севастополь, Республика Крым, Россия
- Registered
- Activity