Comments / Profile of MarkWatney / Habr

How to become an author

Алексей @MarkWatney

Пользователь

Profile Publications 8Comments 22Bookmarks 40

Верле: разрешаем коллизии (часть 2 — сетка, квадратики)

MarkWatney Dec 5 2023 at 11:37

Ну да. Мы можем рассматривать каждую пару как отдельное линейное уравнение, а всю систему как СЛАУ. Тогда последовательное решение каждой коллизии в несколько проходов будет эквивалентно методу итераций для решения СЛАУ.
Но предполагаю, что tony-space предлагает что-то более оптимальное.

+1

Как я учил нейросеть играть в Rocket League

MarkWatney Nov 21 2023 at 12:39

Спасибо!

Вот тут можно посмотреть как Nexto играет против типового игрока и его контроль мяча.

И я уверен, что можно научить бота намеренно стараться держать мяч в воздухе. Вопрос просто в подборе верных наград, гиперпараметров обучения и времени.

+1

Как я учил нейросеть играть в Rocket League

MarkWatney Nov 20 2023 at 20:44

Спасибо!

PPO - proximal policy optimization, метод, предложенный OpenAI.

Я использовал похожие типы наград в первоначальном варианте, но, как я писал, лучше сработали более простые варианты. Если придумать правильные более хитрые типы наград, то бот быстрее будет обучаться, но с другой стороны это может его ограничивать для более хитрых тактик. Например, иногда выгоднее подвести мяч к своим воротам, но зато получить контроль мяча. В целом при достаточном времени обучения, бот все равно найдёт правильную тактику, и в данный момент мне кажется более перспективным мотивировать бота изучать больше вариантов стратегии. Например, я вижу, что он не пытается использовать задний ход, хотя моментами это было бы очень полезно. Для решения таких проблем как раз существует entropy loss, этот лосс заставляет сеть быть менее уверенной в своих решениях, и она в процессе обучение пробует больше других вариантов.

+1

Обучение с блэкджеком и подкреплением. Ищем оптимальную стратегию игры

MarkWatney Nov 15 2023 at 23:36

Тогда это будет не блэкджек. Но и в покере, например, ситуация будет уже посложнее. Если действовать просто по инструкции, то тогда поведение станет слишком читаемым. Там нужно будет добавить элемент случайности при выборе следующего действия.

0

Обучение с блэкджеком и подкреплением. Ищем оптимальную стратегию игры

MarkWatney Nov 15 2023 at 22:12

Это скорее была шутка. Игра изначально сделана таким образом, чтобы дилер выигрывал с небольшим перевесом, иначе бы в казино бы её не использовали. Можно перевести шансы победы в свою пользу, но уже играя ставками и считая насколько колода становиться "горячей". Т.е. грубо говоря, считаем сколько в колоде остаётся 10к (дам, вальтов, королей), чем их больше, тем выше вероятность получить перебор у дилера, тем делаем ставку выше. А сама стратегия остаётся той же. Только в реальности ещё нужно учитывать сплиты и количество колод в игре.

0

Обучение с блэкджеком и подкреплением. Ищем оптимальную стратегию игры

MarkWatney Nov 15 2023 at 19:48

Почему?

0

Собираем русскоязычный лонгформер шаг за шагом

MarkWatney Nov 2 2023 at 17:13

Используется в качестве названия особой схемы архитектуры нейроной сети.

0

Собираем русскоязычный лонгформер шаг за шагом

MarkWatney Sep 19 2023 at 15:37

В первую очередь идёт проект/идея -> следом за ней терминология. Если будет много работ от русскоязычных авторов, будет больше вероятность того, что будут использовать термины на русском языке.

Вам что важнее, чтобы было понятнее для людей в контексте, или чтобы сохранить чистоту русского языка?

В любом случае хабр больше про идеи, а не про русский язык

0

Собираем русскоязычный лонгформер шаг за шагом

MarkWatney Sep 15 2023 at 15:04

Ну может быть. Однако, когда attention в данном контексте имеют ввиду именно тот самый механизм внутри Attention-based слоя. Т.е. ссылаются на термин, который широко используется в актуальных статьях. А термин "механизм внимания" не так распространён, и, например, у меня не сразу бы возникла эта ассоциация. Даже в той статье все эти термины дублируются на английском по этой причине.

К тому же global attention - это достаточно свежий термин. В итоге придётся придумывать свой перевод для него? Глобальное внимание будет совсем непонятно звучать.

+2

Собираем русскоязычный лонгформер шаг за шагом

MarkWatney Sep 15 2023 at 15:03

del

0

Собираем русскоязычный лонгформер шаг за шагом

MarkWatney Sep 15 2023 at 11:44

Слово аттеншн используется не в значении "внимание". Тут это действительно отдельные термины, у которых свое значение.

Вообще вопрос как правильно переводить термины, тут и аттеншн выглядит криво, и матрицей внимания это не назовёшь. И русских терминов и не появится, учитывая, что вся информация на английском.

+4

Определение области коллизии

MarkWatney Aug 14 2023 at 00:41

По опыту - лучше использовать библиотеку Eigen, чем писать свою матричную математику. Ее можно использовать просто как header-only, время компиляции может увеличиться, но это потенциально избавит от многих проблем.

0

8 каверзных вопросов по С++

MarkWatney Aug 12 2022 at 14:39

Только в деталях это работает немного по-разному

-3

Нахлобучиваем домофонные ключи iButton с помощью Flipper Zero

MarkWatney Jun 9 2021 at 22:01

Может написать приложение на телефон, чтобы по фото домофона определять тип ключа? И уменьшить таким образом множество для перебора? Насколько это реально?

0

Как выглядит производство корпусов Flipper Zero изнутри

MarkWatney May 14 2021 at 08:11

Пицца - это Европа? А у России какая иконка?

+1

Свой AR. Маркеры

MarkWatney Mar 23 2021 at 15:09

В скрипте для Unity уже реализовано простенькое сглаживание.
Но по хорошему я бы добавил еще один этап уточнения пололожения. На этом этапе я бы задал функцию ошибки, на которой бы выполнялась оптимизация. В самой функции была бы включена еще разница текущего и предыдущего положения камеры в пространстве, т.е. искалось бы такое решение, которое бы пыталось лучшим образом описать текущие данные и которое бы как можно меньше отличались от предыдущего решения.
Этот у меня подход неплохо работал в этом проекте

0

Свой AR. Основы векторной алгебры

MarkWatney Mar 23 2021 at 09:51

Я использовал вектора разного размера, потому что большинство операций могут работать в любой размерности. А кватернион — это 4х мерный вектор, вот и вся связь.
Кватернионы хороши, но не особо нужны для дальнейших задач в этом направлении

0

Виртуальный зал Эрмитажа — первый шаг к будущему по Пелевину

MarkWatney Jun 28 2018 at 19:33

Я так понял там было предложение использовать структурный свет. Несколько кадров с спроецированной сеткой — для вычисления геометрии, и один кадр без неё — для вычисления цвета точек.
И какой вообще софт использовали?

0

Дополненная реальность на Qt

MarkWatney Sep 6 2015 at 09:55

Трёхмерная реконструкция происходит следующим образом:

Запоминаются кадры нашего потокового видео.
Затем эта последовательность кадров разбиваются на короткие наборы (штук по 5).
Из каждого набора потом создается карта глубины. При этом получается много ошибок, поэтому приходится жестко фильтровать и размывать в процессе.
Далее строится полигональная сетка изоповерхности (алгоритм marching cubes) из скалярного поля, созданного с помощью карт глубины.
Изоповерхность разбивается на подмодели, на которые уже накладываются текстурные координаты.

На выходе получаем трёхмерную модель, которую можно сохранять.

0

Дополненная реальность на Qt

MarkWatney Sep 5 2015 at 11:35

Нет, ничего похожего я не видел, да и до некоторых вещей мне пришлось доходить изучая исходный код.

0

1