Pull to refresh
46
0
Андрей Юношев @YoungSkipper

User

Send message

236 миллионов рублей на такой криво размеченный датасет... либо я просто чего-то не понимаю.

Есть такая мировая практика - приватизация прибылей и национализация убытков.

Яндекс по сути национализировал убыток от создания корпуса, по сути никуда его не выложил (то есть выложил для галочки), а лицензия краулить запрещает.

А дальше коммерческая компания, получившая ~236м на корпус из наших с вами налогов и имеющая яркую анти-российскую позицию по сути приватизирует прибыль от русского национального корпуса, решая кому дать, а кому не дать корпус.

Если вам необходим специфический датасет, об этом можно написать на почту, указанную на этой же странице.

На почту можно не ответить, или отвечать 9 месяцев, или ответить по формальному признаку, или потерять письмо.

Если всё реально делается на наши налоги и всё супер открыто и для людей, не поделитесь статистикой предоставлений / отказов в предоставлении / игнорирования обращений по корпусу по годам его существования с указанием подробных причин отказов?

Так больше людей будет обращаться к вам. Я пропиарю эту ветку по всех своих каналах, NLP получит сильный буст.

заключить лицензионное соглашение на предоставление доступа к данным

А лицензионное соглашение подписывается не с израильской или казахской компанией?

Мы открыты к сотрудничеству и регулярно делимся имеющимися датасетами.

Отлично! Тогда обращаюсь к вам от имени ООО Силеро и прошу выделить нам анонимизированную часть корпуса с правильно расставленными ударениями (в соответствии с современными нормами языка), если таковая имеется.

Цель - добавление функционала расстановки ударений в омографах в наш публично доступный синтез речи.

Для поддержания открытости диалога, ответить прошу мне публично под этим комментарием на Хабре и приложить ваш лицензионный договор и описать кратко типовые сроки / финансовые / юридические условия.

Ответить прошу в течение 5 рабочих дней.

Железнодорожный вариант
image

Кстати, должен работать.
UFO landed and left these words here
Есть еще почти автоматическая очистка фона: clippingmagic.com
1) Ветка от мастера для задачи — работа — Code review — тестирование
2) Ветка релиза от мастера
3) Автомерж веток готовых и протестированных задач в ветку релиза — интеграционное тестирование и staging
4) Нашли багу, откатываем смерженный коммит задачи из релиза c помощью rebase — сборка — повторная проверка на staging
5) Едем на продакшен — проверяем опционально
6) Если все хорошо — сливаем релиз в мастер
7) Все плохо(исключительный случай:)) перекидываем линк на предыдущий релиз.

Два релиза в день, по времени, автомерж тасок останавливается за 2 часа до выкладки на продакшен очередного релиза.

Если кратко:)
1) На пленку сегодня уже практически никто не снимает.
2) МАКСИМАЛЬНОЕ разрешения скана 35мм это 4096x3277. Но 99% материала цифруется в 2к и в таком же виде печатается обратно на негатив (мастер). Но мало из этого мы видим на экране тк на позитиве который уходит в кинотеатр получается ~1200 точек по ширине. Так что смотреть пленку в кинотеатре это намазывать себе глаза мылом, лучше посмотреть блюрей :)
3) Поток 2K (fullap) сканов в DPX 10bit это 300мб/сек или 18гб/минута. В 4К — 600мб/сек или 36 гб/минута.
4) Так что к «настоящему кинотеатральному качеству» мы уже давно подобрались и перебрались.
Во даёт Корпорация Microsoft!

Это слив репутации, в общем-то.
В моем случае используется библиотека android-mapviewballoons.
Есть два варианта.
1. Написать свой плагин, который будет вызывать native-код на Objective-C.
2. Использовать готовые плагины. Есть платные, в том числе. Поискать можно тут.
а может вместо срока напишут капчу по безопаснее?!

Information

Rating
Does not participate
Location
Россия
Date of birth
Registered
Activity