Сбер, Москва - Технологии, меняющие мир / Статьи / Хабр

Как стать автором

Профиль Статьи 544Новости 54Вакансии 54Подписчики 106K

Sber 6 июн в 10:10

Машинное обучение с Python и TensorFlow на Windows. Быстрый старт

Простой

6 мин

5.7K

Блог компании СберPython*Машинное обучение*TensorFlow*

Туториал

Словосочетание «машинное обучение» становится всё более значимым с каждым годом и проникает во все возможные сферы жизни, а с появлением в открытом доступе таких нейронных сетей как Chat GPT [1] интерес к машинному обучению стал высок как никогда. Но при этом многих отпугивает сложность создания своих систем на основе машинного обучения, потому что нужно одновременного использовать и настраивать много разных инструментов разработки.

Поэтому я хочу представить вашему вниманию максимально простую инструкцию для быстрого погружения в мир машинного обучения. Инструкция ориентирована в первую очередь на начинающих программистов, мы будем применять Python 3 [2] с библиотекой TensorFlow [3]. Это лучший выбор для начинающих из-за простоты языка и большого сообщества разработчиков, использующих TensorFlow.

Читать далее

+12

Sber 4 июн в 13:13

Как и зачем активно проверять работоспособность узлов при проксировании запросов с помощью Nginx

Средний

7 мин

2.7K

Блог компании СберСетевые технологии*Серверное администрирование*DevOps*

Кейс

Привет, Хабр! В этом материале рассмотрим, как мы в SynGX реализовали активную проверку работоспособности узлов в группах балансировки, и как этот опыт может быть полезен при использовании прокси-серверов c аналогичной функциональностью.

Меня зовут Ринат Фатхуллин, я владелец продукта Platform V SynGX. В СберТехе мы с 2017 года развиваем собственную сборку Nginx для внутренних заказчиков, а в 2022 вышли на рынок под брендом Platform V SynGX.

Читать далее

+7

Hanamime 3 июн в 13:44

Кто будет разрабатывать лекарства?

Простой

8 мин

1.1K

Блог компании СберМашинное обучение*БиотехнологииХимия

Мнение

Появление новых лекарств — всегда ожидаемое событие. Несмотря на широкомасштабные исследования фармкомпаний эффективных средств по–прежнему не хватает. В среднем на разработку одного препарата уходит 10–15 лет и около 2,5 млрд долларов — это долго и дорого. Научное сообщество готово привлечь к работе нейросетевые модели, чтобы ускорить процесс и улучшить результат. В центре «Искусственный интеллект в Фарме» при Сеченовском университете намерены сократить время на разработки и снизить количество ошибок.

Читать далее

+6

boomb0om 31 мая в 10:14

Как мы собираем данные для обучения Kandinsky

Сложный

14 мин

2K

Блог компании СберБлог компании SberDevicesОбработка изображений*Машинное обучение*

Кейс

Всем привет! Наша команда в Sber AI занимается генеративными моделями и сегодня мы расскажем про очень важный этап разработки моделей для генерации фотореалистичных изображений и видео — процесс сбора и фильтрации данных. Про этот этап очень редко подробно рассказывают разработчики и исследователи таких известных генеративных моделей как DALL-E 3, Stable Diffusion, MidJourney или SORA. Генеративные модели уже многих впечатлили своими возможностями создавать максимально реалистичные изображения и видеоролики, а качественные данные — далеко не последняя причина, по которой такого качества генераций удалось достичь.

Читать далее

+18

Sber 29 мая в 10:56

Белый стенд и никакого мерча: почему вместо раздатки для участников CodeFest мы купили компьютеры в Новосибирский лицей

Простой

2 мин

642

Блог компании СберКонференции

Репортаж

IT-конференции — один из самых эффективных инструментов для знакомства с комьюнити и поиска новых сотрудников в технологические команды Сбера. В подобных мероприятиях мы участвуем несколько десятков раз в год — и для каждого мероприятия стараемся продумать уникальный тематический стенд, мерч и темы выступлений — чтобы выделиться среди других компаний и удивить тех, кто заглядывает на конференции ежегодно.

Читать далее

+12

VArkhipkin 28 мая в 12:47

Kandinsky Video 1.1: обновленная модель генерации видео

Средний

9 мин

3.3K

Блог компании СберБлог компании SberDevicesОбработка изображений*Машинное обучение*Natural Language Processing*

Обзор

В ноябре прошлого года наша команда представила свою первую разработку в области генерации видео по тексту – модель Kandinsky Video, основанную на модели генерации изображений Kandinsky 3.0, по которой мы недавно выпустили обновление – версию 3.1 (о чем можно почитать здесь). Первая видеомодель уже обладала весьма достойным качеством, сравнимым с лучшими мировыми решениями на тот момент. Нам удалось прокачать скорость генерации и моделирование динамики, но главное – мы вступили в новую для себя область генеративного искусственного интеллекта и быстро достигли в ней заметных результатов. Тогда, полгода назад, о подобных моделях знали в основном лишь те, кто так или иначе интересуется областью генеративного искусственного интеллекта. Сегодня же ситуация изменилась – благодаря значительному росту качества генерации видео за последний период, о существовании подобных моделей не слышал только ленивый. Разумеется, такой вход новых технологий в нашу жизнь стал возможным именно благодаря тем исследованиям, которые сообщество проводило за последние полтора года и в которые исследователи из нашей команды включились практически сразу.

Сегодня мы представляем следующую версию нашей модели генерации видео по тексту – Kandinsky Video 1.1. Мы учли последние тенденции в области разработок видеомоделей и сделали нашу технологию еще более впечатляющей, проведя собственные исследования в области архитектур, обработки данных и замере показателей качества, которые мы опишем ниже.

Читать далее

+35

Sber 27 мая в 15:47

Практичные и не очень проекты на базе Raspberry Pi и не только: DIY-проекты весны 2024 года

4 мин

14K

Блог компании СберРазработка на Raspberry Pi*РобототехникаDIY или Сделай сам

«Малинка» — один из наиболее популярных одноплатников, который, собственно, и положил начало экспансии одноплатных ПК на рынок. На основе Raspberry Pi различных версий созданы десятки тысяч проектов, от just for fun до промышленных систем. Под катом расскажем про новые идеи, которые, возможно, кто‑то из читателей Хабра захочет повторить.

Читать далее

+22

Hanamime 24 мая в 12:55

Новые материалы готовы изменить мир

Простой

8 мин

4.3K

Блог компании СберФизикаМедгаджетыБудущее здесь

Обзор

Илон Маск в очередной раз показал себя новатором, черпающим вдохновение для своих прорывов в самых неожиданных местах. Например, к созданию Tesla Cybertruck его подтолкнули автомобили Ford. Главный инженер SpaceX посчитал флагманскую американскую линейку скучной и создал альтернативный прототип со сверхпрочным кузовом из особой марки стали — её же Маск использует для своих сверхтяжёлых ракет Starship.

Автомобиль разработан, чтобы повысить уровень безопасности водителя и пассажиров, но не за счёт электронной начинки, как можно было бы ожидать, а с помощью «неразрушаемого» кузова. Угловатая форма корпуса — вынужденная мера, поскольку новый сплав очень сложно отштамповать или изогнуть, он просто ломает пресс.

Читать далее

+21

Sber 23 мая в 15:11

Угрозы информационной безопасности производственного конвейера разработки ПО: выбираем меры нейтрализации

Средний

3 мин

851

Блог компании СберИнформационная безопасность*

Кейс

Привет, Хабр! На связи Сергей Кубан, руководитель направления отдела защиты инфраструктуры производства ПО в СберТехе. Наша команда отвечает за то, чтобы поставляемое клиентам ПО и сервисы соответствовали требованиям кибербезопасности.

В предыдущей статье мы говорили о том, как моделировать угрозы информационной безопасности и как это помогает противодействовать угрозам атак на цепочки поставок ПО. Сегодня расскажу, как выбирать меры, которые помогут эти угрозы нейтрализовать.

Читать далее

+8

Sber 22 мая в 10:30

GigaCode и все-все-все. Сравниваем различные ИИ-ассистенты между собой

Сложный

19 мин

3.9K

Блог компании СберПрограммирование*Алгоритмы*Машинное обучение*

Кейс

Привет, Хабр! Мы представляем команду GigaCode. В декабре 2023 года наш продукт стал доступен широкой аудитории. До этого GigaCode использовался только внутри компании, и нас часто спрашивали о том, как GigaCode выглядит на фоне других ИИ-ассистентов, как вы сравниваете себя с остальными? Отвечая на эти вопросы, мы начали с простой задачи, которая оказалась не такой уж и простой и вылилась в увлекательное исследование со всем тем, что мы так любим: множеством измерений, математической статистикой и, конечно же, новыми горизонтами. Интересно? Добро пожаловать под кат.

Читать далее

+18

Hanamime 21 мая в 11:14

Алгоритмы, вдохновлённые природой

Сложный

7 мин

4.5K

Блог компании СберАлгоритмы*Математика*Биология

Обзор

В последние годы в нашей повседневной речи плотно закрепилось словосочетание «нейронные сети». Этот термин означает набор методов и программных решений из машинного обучения, дискретной математики и информатики. Но про что совсем часто забывают — он происходит из нейробиологии. Несмотря на очевидное название, нейросети — это не набор операторов IF и ELSE, а модели, вдохновлённые нервной системой живых организмов. Их эффективность в пору, когда у нас есть такие генеративные модели как GigaChat и Kandinsky, наглядно видна каждому.

Но окружающая нас живая природа не ограничивается одними лишь нейронами. Наблюдение за поведением от крошечных клеток до колоний в миллионы особей подарило нам множество полезных математических алгоритмов. И продолжает дарить дальше. Остаётся только догадываться, сколько всего нам ещё предстоит открыть. Да, математикой и компьютерными науками можно заниматься не только в лаборатории над микроскопом, но и вовсе в полевой экспедиции.

И именно об этом я хочу рассказать в этой статье, заодно показав, сколь тонка грань между нашими творениями из бездушного кремния и металла и окружающим нас царством жизни.

Читать далее

+27

Hanamime 20 мая в 12:35

Скрайбинг в ИТ. Лучше один раз увидеть

Простой

5 мин

4.5K

Блог компании СберВизуализация данных*Управление разработкой*Прототипирование*Управление проектами*

Мнение

Скрайбинг — это метод визуализации идей, процессов и другой информации через рисунки, символы и текст. Но это не просто рисунки, а целенаправленное создание визуальных записей, которые способствуют лучшему пониманию, запоминанию и обобщению сложных концепций. Скрайбинг делает информацию более доступной, превращая абстрактные идеи в конкретные, легко воспринимаемые визуальные образы.

Скрайбинг применяют в разных сферах, начиная от повседневных заметок и заканчивая стратегическими сессиями в крупных компаниях. В статье мы поговорим о применении скрайбинга в ИТ. В мире, где сложность проектов постоянно растёт, а команды становятся всё более мультидисциплинарными, скрайбинг становится незаменимым инструментом для планирования, разработки и коммуникации. Он позволяет структурировать требования проекта, визуализировать архитектуру систем, проектировать пользовательские интерфейсы и сценарии использования продукта. Благодаря скрайбингу сложные технические идеи становятся понятными не только для специалистов, но и для клиентов, что значительно улучшает взаимопонимание и облегчает процесс разработки.

Читать далее

+16

Hanamime 16 мая в 12:31

Как новые технологии могут повлиять на культуру?

Средний

7 мин

777

Блог компании СберИсследования и прогнозы в IT*Читальный зал

Мнение

В этой статье мы поговорим с вами о том, как развитие новых технологий меняет общество и культуру. Какими могут быть последствия будущих технологических разработок, особенно тех, что касаются информационной среды?

Читать далее

+9

Sber 15 мая в 09:49

Как замерять и повышать производительность Java-кода: личный пример с JMH

Средний

7 мин

3.6K

Блог компании СберТестирование IT-систем*Java*

Туториал

Привет, Хабр! Большинство команд разработки так или иначе вовлечены в гонку за производительностью. Если понимать этот показатель как скорость работы системы, то вся деятельность по прокачке производительности — это, по сути, анализ метрик и поиск инструментов, которые эту скорость могут повысить.

Меня зовут Александр Певненко, я работаю в СберТехе, компании, которая разрабатывает ПО. Для большинства наших продуктов производительность — критичный фактор, поэтому анализ метрик и оптимизация кода — важная часть цикла разработки. Хочу поделиться личным опытом и мнением обо всём, что касается оптимизации и повышения скорости работы кода, а также нагрузочного тестирования как части этой работы. Тут представлены моя собственная практика использования набора библиотек JMH для нагрузочного тестирования и замеров производительности Java-кода. Всем, кому интересно, добро пожаловать под кат!

Читать далее

+17

Sber 14 мая в 09:22

5 библиотек и фреймворков Java, крайне полезных для разработчика

Простой

8 мин

7.8K

Блог компании СберПрограммирование*Java*

Мнение

Java-библиотеки и фреймворки незаменимы для разработчиков разного уровня. Они предоставляют готовые решения для таких часто встречающихся задач, как работа с коллекциями данных, обработка сетевых запросов, работа с базами данных, с графическим интерфейсом пользователя и многое другое. В сегодняшней подборке расскажем о тех из них, которые могут оказаться весьма полезными для вас. Сама статья рассчитана на разработчиков начинающего уровня. Если вы — профессионал, посоветуйте в комментариях тот инструмент, который используете сами.

Читать далее

+7

Sber 7 мая в 10:51

Проблема «галлюцинирования» в больших языковых моделях на примере чат-ботов

Средний

14 мин

2.3K

Блог компании СберМашинное обучение*Искусственный интеллект

Мнение

Добрый день, уважаемые читатели Хабр. По роду деятельности, я уже некоторое время занимаюсь вопросами NLP, в частности, генеративными большими языковыми моделями и, реализованными, на них чат-ботами. При этом, очень часто в их разработке возникает ряд проблем, с которыми приходится постоянно бороться. Одна из них — «галлюцинирование» моделей, то есть выдача неточной информации на поступающие запросы от пользователя, и, в целом, некорректное поведение модели при длительном ведении диалогов различной степени направленности, специфики, глубины рассуждений, оценки фактов и правдивости выдаваемых ответов.

Исходя из этого, я решил систематизировать все имеющиеся по этой теме сведения. Сразу оговорюсь, статья носит обзорный характер и я ставлю своей целью обобщение фактов, причин и признаков такого поведения. Поиск возможных вариантов, методик и подходов для решения данной проблемы будут рассмотрены в следующей статье. Здесь, не будет кода и строгих выкладок, лишь, наблюдения, аналитика, способы оценки, выявленные закономерности и оценка работы в общем.

В качестве результата исследования, предлагается описание общей ситуации с обнаруженными возможными проявлениями феномена «галлюцинирования». На целостность и завершенность обзора, при описании полученных вариаций и проявлений данного факта, не претендую. Это результаты моего поиска и анализа. Информация собиралась, буквально по крупицам, так как все сведения сильно разрознены, проявления их в «дикой природе» не всегда можно заметить и четко классифицировать, либо они начинают проявляться спустя большое количество тестов, диалогов, рассуждений, запросов, вариантов подачи подсказок и уточнений на поставленные запросы и исходных текстов. Кроме всего прочего, градация распределения этих аномалий по степени отслеживания, так же, сильно разнится. Есть те, которые проявляются весьма быстро, а есть крайне редкие, для которых нужен специфических, очень тонкий подход. Ниже я представлю данный перечень с подробными пояснениями, так что всех прошу под кат.

Читать далее

+21

Sber 6 мая в 13:09

Использование маппера UNROM при разработке игр для Dendy на языке Си

Средний

11 мин

4.1K

Блог компании СберСтарое железоИгры и игровые консоли

Туториал

Приветствую всех любителей программирования всяческих ретро-железок. Могу предположить, что у большинства из читателей этой статьи была в детстве Dendy (а может и сейчас есть) или другой клон Famicom (клонов NES в СНГ я не встречал). Сегодня предлагаю обсудить особенности разработки игр для приставок Dendy, NES и Famicom с маппером (mapper) UNROM. Те из вас, кто хоть немного углублялся в особенности архитектуры игр для 8-битных приставок, наверняка слышал про мапперы. Это электронная схема, которая находится на плате картриджа и расширяет возможности консоли, подключаясь напрямую к шинам процессора.

Мапперов для Dendy существует сотни, так как очень часто компании, разрабатывающие игры, делали уникальные мапперы под свои нужды. Поэтому сегодня они есть на любой вкус и цвет. Самые простые мапперы позволяют переключать банки памяти (это было обычным делом для всех компьютеров 1980-х), а самые продвинутые (например, MMC5) уже позволяли использовать дополнительные аппаратные прерывания, улучшенный звук, прокрутку по двум осям и т. д.

Читать далее

+53

3 мая в 09:49

Вселенная кода, доступная каждому: презентация GitVerse

5 мин

16K

Блог компании СберGit*Системы управления версиями*Управление разработкой*Системы сборки*

Привет, Хабр! На связи Андрей Аврамчук (@Mimizavr). Недавно я побывал на онлайн-презентации GitVerse — платформы для совместной разработки и хостинга кода. Планируется, что она станет инструментом нового поколения, избавляющим разработчика от многих болей. Под катом вы узнаете:

— Чем GitVerse может помочь открытому ПО.

— Почему перенос своих проектов на платформу — это легко и приятно.

— Куда спрятаться от ИИ (спойлер: никуда).

— Умеет ли GitVerse в CI/CD.

— И наконец, какие есть причины смотреть в будущее с оптимизмом.

Читать далее

+29

Sber 3 мая в 09:28

Энтропия на страже безопасности: эволюция генераторов случайных чисел

Простой

7 мин

2.8K

Блог компании СберКомпьютерное железоИстория IT

Ретроспектива

Случайности не случайны, особенно когда они реализованы исключительно программными методами и подчиняются распознаваемому детерминизму. А тем временем мы нуждаемся в генерации настоящих, случайных чисел — от криптографии с защитой наших банковских данных, до компьютерных игр.

Может показаться что эта проблема была решена уже давно, но те же процессоры обзавелись модулями энтропии только в 2012-2014 годах. И на этом прогресс не останавливается: всё доступнее становятся квантовые генераторы энтропии, полностью лишённые изъяна детерминизма. Давайте посмотрим, как от ложного рандома мы пришли к недетерминированному.

Читать далее

+22

Hanamime 27 апр в 12:49

Немедленно в печать! Настоящее и будущее аддитивных технологий

Простой

8 мин

1.8K

Блог компании Сбер3D-принтерыФизикаБудущее здесь

Обзор

Первая волна массового использования 3D–принтеров захлестнула мир чуть больше 10 лет назад. Поначалу технологию воспринимали как выставочную, однако уже в 2016 году она доказала свою состоятельность. Оборудование стоимостью менее 1000$ стало доступным для рядовых покупателей. В печать отправляли самые разные предметы, качество которых практически не уступало магазинным.

В 2016 с помощью объёмной технологии создали не просто деталь, а полноценный самоуправляемый автобус Olli. Транспортное средство развивает скорость 20 км/ч, заряда батареи хватает на 58 км в режиме города, салон рассчитан на 12 пассажиров.

Революцию произвели инженеры небольшой компании Local Motors в сотрудничестве с гигантом IBM. Новаторы доказали, что можно выпускать не только комплектующие и автомобильные кузова, а буквально всё, чем мы пользуемся в повседневной жизни. Давайте посмотрим, как далеко зашла 3D–печать.

Читать далее

+14

1

2 3 ...