Articles / Bookmarks / Profile of AliceWoodless / Habr

How to become an author

Олеся @AliceWoodless

Старший аналитик биотехнической компании

Profile Publications Comments Bookmarks 16

art_pro May 15 2018 at 11:01

Женские сети: кто делает за нас выбор?

10 min

27K

Data Mining*Big Data*Machine learning*ГК ЛАНИТ corporate blog

Взлет интереса к машинному обучению во многом связан с тем, что модели способны дать ощутимый прирост прибыли в областях, связанных с предсказанием поведения сложных систем. В частности, той сложной системой, чье поведение предсказывать выгодно, является человек. Обнаружить мошенничество на ранней стадии, выявить склонность клиентов к оттоку – эти задачи возникают регулярно и уже стали классическими в Data Science. Безусловно, их можно решать различными методами, в зависимости от пристрастий конкретного специалиста и от требований бизнеса.

У нас была возможность использовать нейронные сети для решения задачи по предсказанию поведения людей, а специфика области применения была связана с индустрией красоты. Основной аудиторией для “опытов” стали женщины. Мы по сути пришли к вопросу: может ли искусственная нейронная сеть понять настоящую нейронную сеть (человека) в той области, в которой даже сам человек еще не осознал своего поведения. Как мы ответили на этот вопрос и что у нас получилось в итоге, можно узнать далее.

Читать дальше →

+50

ogurtsov May 10 2018 at 13:00

Глубокое обучение с использованием R и mxnet. Часть 1. Основы работы

14 min

9.6K

Open source*Programming*R*Machine learning*Open Data Science corporate blog

Tutorial

Привет, Хабр!

Эта статья является первой частью руководства по приготовления нейронных сетей с использованием библиотеки mxnet на языке R. Источником вдохновения послужила онлайн-книга Deep Learning — The Straight Dope, объема которой достаточно для осознанного использования mxnet на Питоне. Примеры оттуда будут воспроизводиться с поправкой на отсутствие реализации интерфейса Gluon для R. В первой части рассмотрим установку библиотеки и общие принципы работы, а также реализуем простую линейную модель для решения задачи регрессии.

Читать дальше →

+31

sahsAGU Jul 6 2018 at 09:54

Откуда взялись нейросети и что происходит сейчас

6 min

17K

Microsoft corporate blogBig Data*Machine learning*Artificial IntelligenceAR and VR

В последние несколько лет тема искусственного интеллекта активно обсуждается, так как один из подходов к ее изучению активно набирает обороты среди крупных корпораций. Этот подход – нейросети. Еще недавно, около года назад, это слово можно было услышать отовсюду. Сегодня рассмотрим историю изучения искусственного интеллекта человечеством (оказывается, ему уже около 2000 лет) и сегодняшние реалии.

Читать дальше →

-2

Errat1c Jun 17 2018 at 17:21

Нейронный машинный перевод Google

11 min

19K

Big Data*Machine learning*

Отчет написан в декабре 2017.

It's not who has the best algorithm that wins. It's who has the most data. Побеждает не тот, у кого лучше алгоритм, а тот, у кого больше данных. Эндрю Нг, преподаватель курса по машинному обучению на Coursera.

If you scale up both the size of the model and the amount of data you train it with, you can learn finer distinctions or more complex features. …These models can typically take a lot more context. Jeff Dean, an engineer helping lead the research at Google. Если увеличить размер модели и дать ей больше данных для обучения, она начнет различать более тонкие и сложные особенности. …Эти модели обычно воспринимают более широкий контекст. Джеф Дин, инженер, помогающий в управлении исследованиями в Google.

Я тестировала Google Translate на одних и тех же текстах в марте и декабре 2011, январе 2016 и декабре 2017 года. Брала одни и те же отрывки на английском, русском, немецком, французском, украинском и польском языках и переводила каждый на остальные пять языков из выборки. Кроме того, в декабре 2017 дополнительно взяла новые тексты и протестировала во всех направлениях перевода. Результаты cross-verification в целом совпали с тенденциями в первоначальной выборке. В итоге получился срез работы переводчика Google за 2011 — 2017 годы, и на основе этих материалов можно сделать выводы об эволюции сервиса и прокомментировать маркетинговые заявления компании (цитаты планируется опубликовать отдельно).

Читать дальше →

+18

dvorkjoker Jul 3 2018 at 09:31

Как Яндекс применил технологии искусственного интеллекта для перевода веб-страниц

8 min

21K

Яндекс corporate blogBrowsersMachine learning*SoftwareArtificial Intelligence

В современном интернете более 630 миллионов сайтов, но лишь 6% из них содержат русскоязычный контент. Языковой барьер – главная проблема распространения знаний между пользователями сети, и мы верим, что решать её нужно не только обучением иностранным языкам, но и с помощью автоматического машинного перевода в браузере.

Сегодня мы расскажем читателям Хабра о двух важных технологических изменениях в переводчике Яндекс.Браузера. Во-первых, перевод выделенных слов и фраз теперь использует гибридную модель, и мы напомним, чем этот подход отличается от применения исключительно нейросетей. Во-вторых, нейронные сети переводчика теперь учитывают структуру веб-страниц, об особенностях которой мы также расскажем под катом.

Читать дальше →

+59

kdenisk Feb 22 2017 at 20:29

Нейронные сети в картинках: от одного нейрона до глубоких архитектур

7 min

96K

Machine learning*

Многие материалы по нейронным сетям сразу начинаются с демонстрации довольно сложных архитектур. При этом самые базовые вещи, касающиеся функций активаций, инициализации весов, выбора количества слоёв в сети и т.д. если и рассматриваются, то вскользь. Получается начинающему практику нейронных сетей приходится брать типовые конфигурации и работать с ними фактически вслепую.

В статье мы пойдём по другому пути. Начнём с самой простой конфигурации — одного нейрона с одним входом и одним выходом, без активации. Далее будем маленькими итерациями усложнять конфигурацию сети и попробуем выжать из каждой из них разумный максимум. Это позволит подёргать сети за ниточки и наработать практическую интуицию в построении архитектур нейросетей, которая на практике оказывается очень ценным активом.

Читать дальше →

+57

Promwad Jan 31 2017 at 14:23

«Байкал-T1»: знакомство с платой на первом в России 28-нм процессоре

3 min

58K

Programming*System Analysis and Design*Development for Linux*Programming microcontrollers*Manufacture and development of electronics*

В нашу инженерную лабораторию попала демоплата Baikal BFK Rev 1.6 на основе первого российского процессора для коммерческих разработок — SOM Baikal-T1 MIPS.

Двухъядерный процессор «Байкал-Т1» на архитектуре MIPS Warrior P-class P5600 MIPS 32 был анонсирован еще в 2015 году в рамках программы по импортозамещению, его разработчик — российская фаблес-компания «Байкал Электроникс». Эта система на кристалле была создана для проектирования промышленных и потребительских устройств: маршрутизаторов и сетевых накопителей, тонких клиентов, мультимедийных центров, систем ЧПУ и т.п.

Откроем коробку и посмотрим, как работает стандартный пакет поддержки платформы (BSP) на тестовой плате:

Читать дальше →

+86

it_man Jan 31 2017 at 23:00

«Работает — не трогай»: Старый код и компьютеры, которые до сих пор функционируют

6 min

41K

Information Security*Programming*System Analysis and Design*MWS corporate blogDevelopment for e-commerce*

В современном мире, в котором двухлетний смартфон кажется устаревшей технологией, удивительным остается факт, что многие бизнесы и государственные компании ежедневно используют программы, не обновлявшиеся на протяжении десятков лет.

Согласно исследованию, проведенному правительственными структурами США, Секретная служба до сих пор пользуется компьютерной системой, созданной в 80-х годах прошлого века. Подобные «старые» решения также стоят на вооружении многих стран мира и применяются для управления баллистическими комплексами, системами подлодок и самолетов.

Поэтому сегодня мы бы хотели рассказать несколько историй о компьютерах и программах, позабытых временем, но не забытых упрямыми людьми.

Читать дальше →

+43

32bit_me Jan 26 2017 at 04:54

Как приручить дракона. Краткий пример на clang-c

12 min

16K

Однажды, сидя вечером перед компьютером и предаваясь меланхолии и мыслям о бренности всего сущего, я задумчиво набрал в поиске одного крупного сайта по поиску работы аббревиатуру «LLVM», не надеясь, впрочем, увидеть там что-то особенное, и стал просматривать небогатый, прямо скажем, улов.

Как и следовало ожидать, почти ничего особенного не нашлось, однако одно объявление меня заинтересовало. В нём были такие строки:

«Кого мы возьмем «не глядя» или уровень выполняемых задач:
Вы скачали любой open source проект, собираемый при помощи gcc (объем исходного кода более 10 мегабайт) и для самого большого файла cpp смогли построить AST дерево при помощи clang с –fsyntax-only;
Вы скачали любой open source проект, собираемый при помощи Visual C++ (объем исходного кода более 10 мегабайт) и для самого большого файла cpp смогли построить AST дерево при помощи clang с –fsyntax-only;
Вы смогли написать утилиту, которая выделит все места деклараций и использования локальных переменных, а также все функции, не определенные в данном файле».

Ну что же, подумал я, какое-никакое, а развлечение на вечер.

Читать дальше →

+45

SZinkevich Jan 26 2017 at 10:20

Почему понадобилось разработать «русский дропбокс»

5 min

28K

Programming*System Analysis and Design*КРОК corporate blog

Recovery Mode

В какой-то момент российские организации остро ощутили, что отправлять файлы через иностранные сервера — не самая хорошая идея. Дальше три варианта: либо решать административно и «бить ногами» тех, кто отправляет не на флешке фельдъегерской почтой, либо делать глобальное хранилище данных (например, на базе ECM Documentum, OpenText или Alfresco), либо же сразу разворачивать облачный аналог Дропбокса у себя на серверах в РФ.

Первые два пути работают, но самый простой и эффективный — третий. Поэтому нам пришлось сделать свой сервис обмена файлами для крупного бизнеса. Из приятных примочек — аутентификация через LDAP, шифрование, саморазрушающиеся ссылки и прочие прелести паранойи. Самое смешное — получилось вполне сопоставимо по конечным ценам с бизнес-лицензией на Дропбокс. Да, мы делаем дешевле Dropbox Business для средних и больших компаний.

Читать дальше →

+20

baragol Jan 30 2013 at 20:04

BlackBerry Z10 — лицо с шармом

7 min

48K

Nomobile.Ru corporate blog

Новая платформа от RIM свежа, и у нее есть свой шарм. А интуитивный интерфейс — это вообще глоток свежего воздуха после Android! Разбираем пошагово на примере нового флагмана.

Читать дальше →

+26

wNow Jan 26 2017 at 12:12

KeepDraw.js — javascript framework для рисования на canvas

3 min

13K

JavaScript*HTML*Canvas*

Всем привет. В этой статье речь пойдет о библиотеке для рисования на canvas — KeepDraw.
Это фреймворк для работы с canvas 2d с поддержкой событий и анимации.

Отличительные черты:

API в стиле ООП;
События для мыши, клавиатуры и сенсорных экранов;
Поддержка анимации;
Рисование кривых безье по точкам;
Множество функций, проверяющих пересечения фигур и точек;
Заливка фигур градиентами и изображениями;
Шаблоны объектов — линия, прямоугольник, текст, многоугольник и круг.
Поддержка мобильных устройств.
Сглаживание фигур с использование кривых безье.
Легковесный. Сжатая версия весит 15 килобайт.

Читать дальше →

+18

5nw Jan 7 2017 at 03:26

О строковом форматировании в современном C++

9 min

148K

Доброго времени суток! В этой статье я хотел бы рассказать о существующих возможностях строкового форматирования в современном C++, показать свои наработки, которые я уже несколько лет использую в реальных проектах, а также сравнить производительность различных подходов к строковому форматированию.

Читать дальше →

+37

5nw Apr 14 2015 at 20:03

Алгоритмы быстрого вычисления факториала

6 min

224K

Sport programming*Algorithms*Mathematics*

Понятие факториала известно всем. Это функция, вычисляющая произведение последовательных натуральных чисел от 1 до N включительно: N! = 1 * 2 * 3 *… * N. Факториал — быстрорастущая функция, уже для небольших значений N значение N! имеет много значащих цифр.

Попробуем реализовать эту функцию на языке программирования. Очевидно, нам понадобиться язык, поддерживающий длинную арифметику. Я воспользуюсь C#, но с таким же успехом можно взять Java или Python.

Наивный алгоритм

Итак, простейшая реализация (назовем ее наивной) получается прямо из определения факториала:

static BigInteger FactNaive(int n)
{
    BigInteger r = 1;
    for (int i = 2; i <= n; ++i)
        r *= i;
    return r;            
}

На моей машине эта реализация работает примерно 1,6 секунд для N=50 000.

Далее рассмотрим алгоритмы, которые работают намного быстрее наивной реализации.

Читать дальше →

+34

Karaoke Dec 19 2015 at 12:52

Пол Грэм: Слово «хакер»

9 min

29K

Information Security*Programming*Professional literature*Edison corporate blogReading room

Translation

«Дух сопротивления правительству так ценен в определенных случаях, что мне бы хотелось, чтобы ему никогда не давали погаснуть». Томас Джефферсон, отец-основатель.

(На картинке изображены Стив Джобс и Стив Возняк с их проектом «blue box». Фото сделано Маргрет Возняк. Предоставлено с разрешения Стива Возняка.)

Оригинал — www.paulgraham.com/gba.html
Перевод — Щёкотова Яна
(предыдущий перевод — «Месть Ботанов»)

Слово «Хакер»
Апрель, 2004

В СМИ слово «хакер» используют для описания того, кто взламывает компьютеры. В среде разработчиков программного обеспечения это слово означает искусного программиста. Но между этими двумя понятиями существует связь. Для программистов «хакер» ассоциируется с мастерством в самом буквальном смысле слова: некто, кто может заставить компьютер делать то, что ему заблагорассудится, хочет того сам компьютер или нет.

В дополнение к этой путанице укажем, что существительное «hack» (англ.) также имеет два значения. Это слово может быть как комплиментом, так и оскорблением. Слово «hack» используется для описания ужасного результата вашей деятельности. Но когда вы совершаете что-то так талантливо, что каким-то образом побеждаете систему, то это также называют «hack». Данное слово употребляется чаще всего в первом значении, а не во втором, вероятно, потому, что плохие решения преобладают над блестящими.

Хотите — верьте, хотите — нет, но эти два значения слова «hack» также связаны. У плохих и оригинальных решений есть нечто общее: они оба идут вразрез с правилами. И существует постепенный переход от нарушения правил, граничащего с безобразностью (использование клейкой ленты для присоединения чего-либо к вашему велосипеду), к такому нарушению правил, что сродни блестяще оригинальному (отказ от Евклидового пространства).

+14

nikitasius Dec 23 2015 at 20:24

Вливаемся в tox-сообщество или установка ноды за 5 минут

24 min

32K

Information Security*

Tutorial

Приветствую тебя, о жадный читатель, буквоед и борец за справедливость в интернетах! В нашей оружейной пополнение, называется оно tox. Сейчас я покажу тебе, %username%, его сборку-разборку.

debian_tox_dht

debian_tox_dht

Есть такая замечательная система, которая называется TOX. Вот их официальный сайт, а вот профиль на github.

О tox уже писали множество раз, но я перечислю основные плюшки: DHT — нет зависимости от центрального сервера, достаточно хотя бы одной ноды, шифрование на клиенте — Вася пишет Маше, ~~telegram~~ Паша ничего не прочитает.

Читать дальше →

+17