В статье я покажу как искать зависимости и проверять гипотезы. Мы познакомимся с данными и реализуем предсказание на основе одной логики=)
Преподаватель-исследователь
Тематическое моделирование с использованием эмбеддингов BERT
Обработка естественного языка одно из востребованных направлений машинного обучения, которое постоянно развивается. В 2018 году компания Google представила новую модель - BERT, сделавшую прорыв в области обработки естественного языка. Несмотря на то, что сейчас у BERT много конкурентов, включая модификации классической модели (RoBERTa, DistilBERT и др.) так и совершенно новые (например, XLNet), BERT всё ещё остается в топе nlp-моделей.
Проблемы современного машинного обучения
Во многих популярных курсах машинного и глубокого обучения вас научат классифицировать собак и кошек, предсказывать цены на недвижимость, покажут еще десятки задач, в которых машинное обучение, вроде как, отлично работает. Но вам расскажут намного меньше (или вообще ничего) о тех случаях, когда ML-модели не работают так, как ожидалось.
Частой проблемой в машинном обучении является неспособность ML-моделей корректно работать на большем разнообразии примеров, чем те, что встречались при обучении. Здесь идет речь не просто о других примерах (например, тестовых), а о других типах примеров. Например, сеть обучалась на изображениях коровы, в которых чаще всего корова был на фоне травы, а при тестировании требуется корректное распознавание коровы на любом фоне. Почему ML-модели часто не справляются с такой задачей и что с этим делать – мы рассмотрим далее. Работа над этой проблемой важна не только для решения практических задач, но и в целом для дальнейшего развития ИИ.
Python и Samila. Делаем красиво
Как при помощи языка программирования Пайтон и библиотеки Samila создавать красивые изображения, даже с минимальными усилиями.
Как с помощью трансферного обучения обнаружить вулканы на Гавайях
Data Science — это не только данные о клиентах. К старту нашего флагманского курса рассмотрим пример геопространственной семантической сегментации, где с помощью данных цифровой модели рельефа отобразим шлаковые конусы на Гавайях.
Как переключиться с менталитета нищего на менталитет серийного стартапера из Кремниевой долины
Почему так «мало успешных основателей стартапов, которые выросли в полной нищете»
Рикки Йен (в центре), дважды фаундер Y Combinator: Crowdbooster (S10) и Flow Club (S21)
Всем привет!
Я собрал в одном месте Founders at work: 150+ историй основателей стартапов, которые прошли Y Combinator. Сегодня хочу поделиться переводом про путь Рикки Йена, нищего студента-эмигранта из Тайваня не знающего английского языка с безработным отцом на шее.
Мой кофаундер Дэвид и я оба выросли в нищете и можем назвать себя “закаленными в бою”, когда речь заходит как о жизни, так и о стартапах. Поэтому, когда разговор в Кремниевой Долине зашел о неравенстве доходов, то мы навострили уши. На мгновение наши прошлое и настоящее соприкоснулись. Вот цитата Пола Грэма, которая привлекла наше внимание.
“С бедностью тесно связано отсутствие социальной мобильности. Я сам это видел: вам не нужно расти богатым или даже принадлежать к верхнему среднему классу, чтобы разбогатеть как основатель стартапа, но очень немногие успешные основатели выросли в крайней бедности ”. (Источник)
Грэм был прав, и это правда, которую мы хорошо осознаем как основатели стартапов. Мало того, что все карты против нас, чтобы просто иметь возможность основать стартап, но создать и поддерживать компанию, которая “предназначена для быстрого роста”, особенно сложно, если вы выросли в крайней бедности. Мы с Дэвидом боролись с этой идеей с момента основания нашей компании в 2010 году, и у нас это неплохо получилось. Главная проблема заключается в том, что мы с Дэвидом называем неравенством мировоззрения. Чтобы по-настоящему понять это, вам придется влезть в мою шкуру. Позвольте мне пригласить вас в мою личную историю.
Computer Vision для iOS, Android, Web
Привет, я Денис Соколов, руковожу R&D в Zenia — это платформа для йоги и фитнеса, которая использует ИИ для трекинга поз человека (подробнее об этом — в другой моей статье). Наша система распознавания работает на трёх платформах — iOS, Android, Web. В этой статье поговорим о ключевых отличиях между ними. Расскажу, как устроена подготовка моделей компьютерного зрения к использованию, какими фреймворками пользуемся для запуска на устройствах клиентов, какие сложности решали и чем остались довольны. Если вы занимаетесь запуском нейронных сетей на мобильных устройствах или вебе, статья для вас.
Быстрый, мощный интерфейс на Python
Dear PyGui принципиально отличается от других фреймворков GUI Python. Рендеринг на GPU, более 70 виджетов, встроенная поддержка асинхронности — это лишь некоторые возможности Dear PyGui. Руководством по работе с этим пакетом делимся к старту курса по разработке на Python.
Orchest — конструктор конвейеров Machine Learning
Orchest содержит Jupyter Notebook, не требует ациклических ориентированных графов, а работать можно на Python, R и Julia. Также можно запустить сервис VSCode, метрики TensorBoard — и это далеко не всё. Руководством о создании конвейера ML при помощи Orchest делимся к старту флагманского курса по Data Science.
6 правил по обеспечению качества данных для машинного обучения
В некоторых областях можно почти без проблем использовать данные с высокой частотой ошибок, в других же система даёт сбой при малейших погрешностях в большом датасете. Принцип «мусор на входе, мусор на выходе» нужно воспринимать со всей серьёзностью. Мельчайшая некорректность в наборах данных может иметь большое влияние на модель и приводить к созданию бесполезных результатов. Чистота и целостность данных — ключевой аспект в создании сложных моделей машинного обучения.
Как мыслит GPT? Визуализируем скрытые слои
В стремлении прояснить языковые модели Transformer с помощью пакета Ecco авторы показывают механизм генерации предложений внутри предварительно обученной языковой модели. После генерации предложения возможно визуализировать представление о том, как модель пришла к каждому слову — речь идёт о столбце на рисунке выше. Строки — это слои модели. Чем темнее элемент строки, тем выше ранг токена в слое. Слой 0 расположен на самом верху. Слой 47 — в самом низу. К старту курса о машинном и глубоком обучении показываем и рассказываем о том, как мыслит GPT.
Как превратить спутниковые снимки в карты. Компьютерное зрение в Яндексе
За операции с изображениями отвечает область ИТ, которая называется компьютерным зрением. Последние несколько лет большую часть задач из этой области очень удачно решают, применяя нейронные сети. О нашем опыте применения нейронных сетей в картографировании мы и расскажем сегодня читателям Хабра.
Форма № 16
Преподаватели, работающие в российских ВУЗах, периодически сталкиваются с необходимостью предоставить администрации список своих научных и учебно-методических работ. Например, для (пере)избрания на должность, присвоения звания и т. д. Формат представления информации, форма № 16, разработан невесть когда и до сих пор используется в бюрократических недрах Министерства Науки и Высшего Образования РФ. Мне стало лень заполнять эту форму вручную и я написал небольшой python сценарий, который генерирует нужную таблицу на основе информации, полученной из научной электронной библиотеки elibrary.ru. Возможно, кому-то это будет интересно, так что ниже приведено описание этой процедуры...
Как эффективно проводить эксперименты по машинному обучению. Общий процесс работы над ML/DL проектом
Эффективность экспериментов базируется на организационной и технической стороне работы. Начинающие инженеры, которые занимаются нейросетями и обучают модели, совершают достаточно типовые ошибки. Например, увлекаясь перебором и тюнингом моделей машинного обучения, упускают важнейший этап подготовки данных, не задумываются о том, как сделать эксперименты воспроизводимыми, а этап программирования быстрым. Давайте поговорим об этом - как эффективно проводить эксперименты с нейросетями.
Приемы повышения производительности инференса глубоких моделей с DL Workbench. Часть 1 — введение и установка
Если у вас есть проект с интенсивной обработкой данных глубокими моделями (или еще нет, но вы собираетесь его создать), то вам будет полезно познакомиться с приемами по повышению их производительности и уменьшению затрат на покупку / аренду вычислительных мощностей. Тем более, что многие из приемов сейчас выполняются буквально за несколько кликов мышкой, но при этом позволяют повысить производительность на порядок. В этом посте мы рассмотрим какие оптимизации бывают, установим Docker на Windows 10 и запустим DL Workbench, измерим производительность инференса без оптимизации и с применением оных.
OpenVINO становится «серебряной пулей» хакатонов по компьютерному зрению
Меня зовут Васильев Евгений, и команда в составе Дмитрия, Вячеслава и меня заняла 2 место на хакатоне "Цифровой прорыв" в Нижнем Новгороде в кейсе Ростелекома: Разработка системы мониторинга за поведением студента во время экзамена, и забрала приз в 100 000 рублей. После просмотра решений всех команд и возникла идея для данной заметки с громким названием.
Слушаю и повинуюсь: рыночная экономика как фактор выгорания педагога
Сегодня мы коснемся еще одной болезненной для отечественного образования темы: рыночной парадигмы в вопросах воспитания и обучения детей.
Начиная с девяностых годов прошлого века, мы применяем к деятельности учителя понятие «образовательная услуга». Современный педагог выступает как представитель сферы услуг, и эта социальная роль накладывает определенный отпечаток и на поведение самого педагога, и на отношение к нему других участников образовательного процесса. Ниже мы попытаемся разобраться, как это происходит (и чем педагог отличается от парикмахера).
Создание Python-обвязки для библиотек, написанных на C/C++, с помощью SIP. Часть 1
Российское приборостроение: вертели мы ваш дизайн на пальцах
Или как понять, что ваш дизайн уже пора выкинуть, и как сделать новый
— Нужно делать как нужно, а как не нужно делать не нужно!
Фраза из интернетов
Это статья о промышленном дизайне в приборостроении: почему вы без него не обойдётесь; что делать и кого искать, если вы всё-таки решились «на промдизайн»; как понять, что именно вам необходимо; кто и за сколько сделает эту работу за вас и что предпринять, чтобы получилось то, что нужно вам, а не дизайнеру или кому другому. Всё — на примерах реальных разработок, а как же иначе.
Создание демо-приложения «Умная библиотека» с помощью Intel Distribution of the OpenVINO toolkit
Кустикова Валентина, Васильев Евгений, Вихрев Иван, Дудченко Антон, Уткин Константин и Коробейников Алексей.
Intel Distribution of OpenVINO Toolkit — набор библиотек для разработки приложений, использующих машинное зрение и Deep Learning. А эта статья расскажет, как создавалось демо-приложение «Умная библиотека» на основе библиотеки OpenVINO силами студентов младших курсов. Мы считаем, что данная статья будет интересна начинающим свой путь в программировании и использовании глубоких нейронных сетей.
Information
- Rating
- Does not participate
- Location
- Нижний Новгород, Нижегородская обл., Россия
- Registered
- Activity