Как стать автором
Обновить
532.36
Сбер
Технологии, меняющие мир
Сначала показывать

Машинное обучение с Python и TensorFlow на Windows. Быстрый старт

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров5.7K

Словосочетание «машинное обучение» становится всё более значимым с каждым годом и проникает во все возможные сферы жизни, а с появлением в открытом доступе таких нейронных сетей как Chat GPT [1] интерес к машинному обучению стал высок как никогда. Но при этом многих отпугивает сложность создания своих систем на основе машинного обучения, потому что нужно одновременного использовать и настраивать много разных инструментов разработки.

Поэтому я хочу представить вашему вниманию максимально простую инструкцию для быстрого погружения в мир машинного обучения. Инструкция ориентирована в первую очередь на начинающих программистов, мы будем применять Python 3 [2] с библиотекой TensorFlow [3]. Это лучший выбор для начинающих из-за простоты языка и большого сообщества разработчиков, использующих TensorFlow.

Читать далее
Всего голосов 10: ↑9 и ↓1+12
Комментарии6

Как и зачем активно проверять работоспособность узлов при проксировании запросов с помощью Nginx

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров2.7K

Привет, Хабр! В этом материале рассмотрим, как мы в SynGX реализовали активную проверку работоспособности узлов в группах балансировки, и как этот опыт может быть полезен при использовании прокси-серверов c аналогичной функциональностью.

Меня зовут Ринат Фатхуллин, я владелец продукта Platform V SynGX. В СберТехе мы с 2017 года развиваем собственную сборку Nginx для внутренних заказчиков, а в 2022 вышли на рынок под брендом Platform V SynGX.

Читать далее
Всего голосов 9: ↑7 и ↓2+7
Комментарии0

Кто будет разрабатывать лекарства?

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров1.1K

Появление новых лекарств — всегда ожидаемое событие. Несмотря на широкомасштабные исследования фармкомпаний эффективных средств по–прежнему не хватает. В среднем на разработку одного препарата уходит 10–15 лет и около 2,5 млрд долларов — это долго и дорого. Научное сообщество готово привлечь к работе нейросетевые модели, чтобы ускорить процесс и улучшить результат. В центре «Искусственный интеллект в Фарме» при Сеченовском университете намерены сократить время на разработки и снизить количество ошибок. 

Читать далее
Всего голосов 5: ↑5 и ↓0+6
Комментарии4

Как мы собираем данные для обучения Kandinsky

Уровень сложностиСложный
Время на прочтение14 мин
Количество просмотров2K

Всем привет! Наша команда в Sber AI занимается генеративными моделями и сегодня мы расскажем про очень важный этап разработки моделей для генерации фотореалистичных изображений и видео — процесс сбора и фильтрации данных. Про этот этап очень редко подробно рассказывают разработчики и исследователи таких известных генеративных моделей как DALL-E 3, Stable Diffusion, MidJourney или SORA. Генеративные модели уже многих впечатлили своими возможностями создавать максимально реалистичные изображения и видеоролики, а качественные данные — далеко не последняя причина, по которой такого качества генераций удалось достичь.

Читать далее
Всего голосов 17: ↑16 и ↓1+18
Комментарии0

Белый стенд и никакого мерча: почему вместо раздатки для участников CodeFest мы купили компьютеры в Новосибирский лицей

Уровень сложностиПростой
Время на прочтение2 мин
Количество просмотров642

IT-конференции — один из самых эффективных инструментов для знакомства с комьюнити и поиска новых сотрудников в технологические команды Сбера. В подобных мероприятиях мы участвуем несколько десятков раз в год — и для каждого мероприятия стараемся продумать уникальный тематический стенд, мерч и темы выступлений — чтобы выделиться среди других компаний и удивить тех, кто заглядывает на конференции ежегодно.

Читать далее
Всего голосов 9: ↑8 и ↓1+12
Комментарии1

Kandinsky Video 1.1: обновленная модель генерации видео

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров3.3K

В ноябре прошлого года наша команда представила свою первую разработку в области генерации видео по тексту – модель Kandinsky Video, основанную на модели генерации изображений Kandinsky 3.0, по которой мы недавно выпустили обновление – версию 3.1 (о чем можно почитать здесь). Первая видеомодель уже обладала весьма достойным качеством, сравнимым с лучшими мировыми решениями на тот момент. Нам удалось прокачать скорость генерации и моделирование динамики, но главное – мы вступили в новую для себя область генеративного искусственного интеллекта и быстро достигли в ней заметных результатов. Тогда, полгода назад, о подобных моделях знали в основном лишь те, кто так или иначе интересуется областью генеративного искусственного интеллекта. Сегодня же ситуация изменилась – благодаря значительному росту качества генерации видео за последний период, о существовании подобных моделей не слышал только ленивый. Разумеется, такой вход новых технологий в нашу жизнь стал возможным именно благодаря тем исследованиям, которые сообщество проводило за последние полтора года и в которые исследователи из нашей команды включились практически сразу.

Сегодня мы представляем следующую версию нашей модели генерации видео по тексту – Kandinsky Video 1.1. Мы учли последние тенденции в области разработок видеомоделей и сделали нашу технологию еще более впечатляющей, проведя собственные исследования в области архитектур, обработки данных и замере показателей качества, которые мы опишем ниже.

Читать далее
Всего голосов 24: ↑24 и ↓0+35
Комментарии7

Практичные и не очень проекты на базе Raspberry Pi и не только: DIY-проекты весны 2024 года

Время на прочтение4 мин
Количество просмотров14K

«Малинка» — один из наиболее популярных одноплатников, который, собственно, и положил начало экспансии одноплатных ПК на рынок. На основе Raspberry Pi различных версий созданы десятки тысяч проектов, от just for fun до промышленных систем. Под катом расскажем про новые идеи, которые, возможно, кто‑то из читателей Хабра захочет повторить.

Читать далее
Всего голосов 18: ↑15 и ↓3+22
Комментарии33

Новые материалы готовы изменить мир

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров4.3K

Илон Маск в очередной раз показал себя новатором, черпающим вдохновение для своих прорывов в самых неожиданных местах. Например, к созданию Tesla Cybertruck его подтолкнули автомобили Ford. Главный инженер SpaceX посчитал флагманскую американскую линейку скучной и создал альтернативный прототип со сверхпрочным кузовом из особой марки стали — её же Маск использует для своих сверхтяжёлых ракет Starship. 

Автомобиль разработан, чтобы повысить уровень безопасности водителя и пассажиров, но не за счёт электронной начинки, как можно было бы ожидать, а с помощью «неразрушаемого» кузова. Угловатая форма корпуса — вынужденная мера, поскольку новый сплав очень сложно отштамповать или изогнуть, он просто ломает пресс.  

Читать далее
Всего голосов 22: ↑17 и ↓5+21
Комментарии10

Угрозы информационной безопасности производственного конвейера разработки ПО: выбираем меры нейтрализации

Уровень сложностиСредний
Время на прочтение3 мин
Количество просмотров851

Привет, Хабр! На связи Сергей Кубан, руководитель направления отдела защиты инфраструктуры производства ПО в СберТехе. Наша команда отвечает за то, чтобы поставляемое клиентам ПО и сервисы соответствовали требованиям кибербезопасности.

В предыдущей статье мы говорили о том, как моделировать угрозы информационной безопасности и как это помогает противодействовать угрозам атак на цепочки поставок ПО. Сегодня расскажу, как выбирать меры, которые помогут эти угрозы нейтрализовать.

Читать далее
Всего голосов 7: ↑5 и ↓2+8
Комментарии2

GigaCode и все-все-все. Сравниваем различные ИИ-ассистенты между собой

Уровень сложностиСложный
Время на прочтение19 мин
Количество просмотров3.9K

Привет, Хабр! Мы представляем команду GigaCode. В декабре 2023 года наш продукт стал доступен широкой аудитории. До этого GigaCode использовался только внутри компании, и нас часто спрашивали о том, как GigaCode выглядит на фоне других ИИ-ассистентов, как вы сравниваете себя с остальными? Отвечая на эти вопросы, мы начали с простой задачи, которая оказалась не такой уж и простой и вылилась в увлекательное исследование со всем тем, что мы так любим: множеством измерений, математической статистикой и, конечно же, новыми горизонтами. Интересно? Добро пожаловать под кат.

Читать далее
Всего голосов 13: ↑13 и ↓0+18
Комментарии15

Алгоритмы, вдохновлённые природой

Уровень сложностиСложный
Время на прочтение7 мин
Количество просмотров4.5K

В последние годы в нашей повседневной речи плотно закрепилось словосочетание «нейронные сети». Этот термин означает набор методов и программных решений из машинного обучения, дискретной математики и информатики. Но про что совсем часто забывают — он происходит из нейробиологии. Несмотря на очевидное название, нейросети — это не набор операторов IF и ELSE, а модели, вдохновлённые нервной системой живых организмов. Их эффективность в пору, когда у нас есть такие генеративные модели как GigaChat и Kandinsky, наглядно видна каждому. 

Но окружающая нас живая природа не ограничивается одними лишь нейронами. Наблюдение за поведением от крошечных клеток до колоний в миллионы особей подарило нам множество полезных математических алгоритмов. И продолжает дарить дальше. Остаётся только догадываться, сколько всего нам ещё предстоит открыть. Да, математикой и компьютерными науками можно заниматься не только в лаборатории над микроскопом, но и вовсе в полевой экспедиции. 

И именно об этом я хочу рассказать в этой статье, заодно показав, сколь тонка грань между нашими творениями из бездушного кремния и металла и окружающим нас царством жизни.

Читать далее
Всего голосов 15: ↑15 и ↓0+27
Комментарии3

Скрайбинг в ИТ. Лучше один раз увидеть

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров4.5K

Скрайбинг — это метод визуализации идей, процессов и другой информации через рисунки, символы и текст. Но это не просто рисунки, а целенаправленное создание визуальных записей, которые способствуют лучшему пониманию, запоминанию и обобщению сложных концепций. Скрайбинг делает информацию более доступной, превращая абстрактные идеи в конкретные, легко воспринимаемые визуальные образы.

Скрайбинг применяют в разных сферах, начиная от повседневных заметок и заканчивая стратегическими сессиями в крупных компаниях. В статье мы поговорим о применении скрайбинга в ИТ. В мире, где сложность проектов постоянно растёт, а команды становятся всё более мультидисциплинарными, скрайбинг становится незаменимым инструментом для планирования, разработки и коммуникации. Он позволяет структурировать требования проекта, визуализировать архитектуру систем, проектировать пользовательские интерфейсы и сценарии использования продукта. Благодаря скрайбингу сложные технические идеи становятся понятными не только для специалистов, но и для клиентов, что значительно улучшает взаимопонимание и облегчает процесс разработки.

Читать далее
Всего голосов 15: ↑12 и ↓3+16
Комментарии7

Как новые технологии могут повлиять на культуру?

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров777

В этой статье мы поговорим с вами о том, как развитие новых технологий меняет общество и культуру. Какими могут быть последствия будущих технологических разработок, особенно тех, что касаются информационной среды?

Читать далее
Всего голосов 7: ↑6 и ↓1+9
Комментарии1

Как замерять и повышать производительность Java-кода: личный пример с JMH

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров3.6K

Привет, Хабр! Большинство команд разработки так или иначе вовлечены в гонку за производительностью. Если понимать этот показатель как скорость работы системы, то вся деятельность по прокачке производительности — это, по сути, анализ метрик и поиск инструментов, которые эту скорость могут повысить.

Меня зовут Александр Певненко, я работаю в СберТехе, компании, которая разрабатывает ПО. Для большинства наших продуктов производительность — критичный фактор, поэтому анализ метрик и оптимизация кода — важная часть цикла разработки. Хочу поделиться личным опытом и мнением обо всём, что касается оптимизации и повышения скорости работы кода, а также нагрузочного тестирования как части этой работы. Тут представлены моя собственная практика использования набора библиотек JMH для нагрузочного тестирования и замеров производительности Java-кода. Всем, кому интересно, добро пожаловать под кат!

Читать далее
Всего голосов 13: ↑12 и ↓1+17
Комментарии1

5 библиотек и фреймворков Java, крайне полезных для разработчика

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров7.8K

Java-библиотеки и фреймворки незаменимы для разработчиков разного уровня. Они предоставляют готовые решения для таких часто встречающихся задач, как работа с коллекциями данных, обработка сетевых запросов, работа с базами данных, с графическим интерфейсом пользователя и многое другое. В сегодняшней подборке расскажем о тех из них, которые могут оказаться весьма полезными для вас. Сама статья рассчитана на разработчиков начинающего уровня. Если вы — профессионал, посоветуйте в комментариях тот инструмент, который используете сами.

Читать далее
Всего голосов 28: ↑12 и ↓16+7
Комментарии6

Проблема «галлюцинирования» в больших языковых моделях на примере чат-ботов

Уровень сложностиСредний
Время на прочтение14 мин
Количество просмотров2.3K

Добрый день, уважаемые читатели Хабр. По роду деятельности, я уже некоторое время занимаюсь вопросами NLP, в частности, генеративными большими языковыми моделями и, реализованными, на них чат-ботами. При этом, очень часто в их разработке возникает ряд проблем, с которыми приходится постоянно бороться. Одна из них — «галлюцинирование» моделей, то есть выдача неточной информации на поступающие запросы от пользователя, и, в целом, некорректное поведение модели при длительном ведении диалогов различной степени направленности, специфики, глубины рассуждений, оценки фактов и правдивости выдаваемых ответов. 

Исходя из этого, я решил систематизировать все имеющиеся по этой теме сведения. Сразу оговорюсь, статья носит обзорный характер и я ставлю своей целью обобщение фактов, причин и признаков такого поведения. Поиск возможных вариантов, методик и подходов для решения данной проблемы будут рассмотрены в следующей статье. Здесь, не будет кода и строгих выкладок, лишь, наблюдения, аналитика, способы оценки, выявленные закономерности и оценка работы в общем. 

В качестве результата исследования, предлагается описание общей ситуации с обнаруженными возможными проявлениями феномена «галлюцинирования». На целостность и завершенность обзора, при описании полученных вариаций и проявлений данного факта, не претендую. Это результаты моего поиска и анализа. Информация собиралась, буквально по крупицам, так как все сведения сильно разрознены, проявления их в «дикой природе» не всегда можно заметить и четко классифицировать, либо они начинают проявляться спустя большое количество тестов, диалогов, рассуждений, запросов, вариантов подачи подсказок и уточнений на поставленные запросы и исходных текстов. Кроме всего прочего, градация распределения этих аномалий по степени отслеживания, так же, сильно разнится. Есть те, которые проявляются весьма быстро, а есть крайне редкие, для которых нужен специфических, очень тонкий подход. Ниже я представлю данный перечень с подробными пояснениями, так что всех прошу под кат. 

Читать далее
Всего голосов 15: ↑14 и ↓1+21
Комментарии18

Использование маппера UNROM при разработке игр для Dendy на языке Си

Уровень сложностиСредний
Время на прочтение11 мин
Количество просмотров4.1K

Приветствую всех любителей программирования всяческих ретро-железок. Могу предположить, что у большинства из читателей этой статьи была в детстве Dendy (а может и сейчас есть) или другой клон Famicom (клонов NES в СНГ я не встречал). Сегодня предлагаю обсудить особенности разработки игр для приставок Dendy, NES и Famicom с маппером (mapper) UNROM. Те из вас, кто хоть немного углублялся в особенности архитектуры игр для 8-битных приставок, наверняка слышал про мапперы. Это электронная схема, которая находится на плате картриджа и расширяет возможности консоли, подключаясь напрямую к шинам процессора.

Мапперов для Dendy существует сотни, так как очень часто компании, разрабатывающие игры, делали уникальные мапперы под свои нужды. Поэтому сегодня они есть на любой вкус и цвет. Самые простые мапперы позволяют переключать банки памяти (это было обычным делом для всех компьютеров 1980-х), а самые продвинутые (например, MMC5) уже позволяли использовать дополнительные аппаратные прерывания, улучшенный звук, прокрутку по двум осям и т. д.

Читать далее
Всего голосов 34: ↑34 и ↓0+53
Комментарии2

Вселенная кода, доступная каждому: презентация GitVerse

Время на прочтение5 мин
Количество просмотров16K

Привет, Хабр! На связи Андрей Аврамчук (@Mimizavr). Недавно я побывал на онлайн-презентации GitVerse — платформы для совместной разработки и хостинга кода. Планируется, что она станет инструментом нового поколения, избавляющим разработчика от многих болей. Под катом вы узнаете:

— Чем GitVerse может помочь открытому ПО.

— Почему перенос своих проектов на платформу — это легко и приятно.

— Куда спрятаться от ИИ (спойлер: никуда).

— Умеет ли GitVerse в CI/CD.

— И наконец, какие есть причины смотреть в будущее с оптимизмом.

Читать далее
Всего голосов 46: ↑28 и ↓18+29
Комментарии66

Энтропия на страже безопасности: эволюция генераторов случайных чисел

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров2.8K

Случайности не случайны, особенно когда они реализованы исключительно программными методами и подчиняются распознаваемому детерминизму. А тем временем мы нуждаемся в генерации настоящих, случайных чисел — от криптографии с защитой наших банковских данных, до компьютерных игр. 

Может показаться что эта проблема была решена уже давно, но те же процессоры обзавелись модулями энтропии только в 2012-2014 годах. И на этом прогресс не останавливается: всё доступнее становятся квантовые генераторы энтропии, полностью лишённые изъяна детерминизма. Давайте посмотрим, как от ложного рандома мы пришли к недетерминированному.

Читать далее
Всего голосов 15: ↑14 и ↓1+22
Комментарии11

Немедленно в печать! Настоящее и будущее аддитивных технологий

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров1.8K

Первая волна массового использования 3D–принтеров захлестнула мир чуть больше 10 лет назад. Поначалу технологию воспринимали как выставочную, однако уже в 2016 году она доказала свою состоятельность. Оборудование стоимостью менее 1000$ стало доступным для рядовых покупателей. В печать отправляли самые разные предметы, качество которых практически не уступало магазинным. 

В 2016 с помощью объёмной технологии создали не просто деталь, а полноценный самоуправляемый автобус Olli. Транспортное средство развивает скорость 20 км/ч, заряда батареи хватает на 58 км в режиме города, салон рассчитан на 12 пассажиров.

Революцию произвели инженеры небольшой компании Local Motors в сотрудничестве с гигантом IBM. Новаторы доказали, что можно выпускать не только комплектующие и автомобильные кузова, а буквально всё, чем мы пользуемся в повседневной жизни. Давайте посмотрим, как далеко зашла 3D–печать.

Читать далее
Всего голосов 8: ↑7 и ↓1+14
Комментарии2
1
23 ...

Информация

Сайт
www.sber.ru
Дата регистрации
Дата основания
Численность
свыше 10 000 человек
Местоположение
Россия