Pull to refresh
107
0
Send message

keyT5 или генерация ключевых слов из текста

Reading time 4 min
Views 5.5K

Я попытался обучить русскоязычную модель ruT5-base и ruT5-large на задаче извлечения ключевых слов из текста.

Читать далее
Total votes 9: ↑9 and ↓0 +9
Comments 2

Обращение к Javascript-сообществу: перестаньте писать квадраты

Reading time 7 min
Views 66K

Пост про то, почему стоит, как минимум избегать квадратичной сложности в тех местах, где на это нет никаких причин. Если вы широко используете .concat в .reduce эта статья для вас. В ней я попытаюсь разобрать на пальцах почему это может быть очень плохим решением, и как это исправить.

Read more
Total votes 216: ↑213 and ↓3 +210
Comments 355

Как выучить иностранный язык: алгоритм

Reading time 13 min
Views 158K

Если вы хоть немного пересекались с Machine Learning, то понимаете, что человеческий мозг — это, по сути, большая нейросеть. А раз так, то и работу с ним можно строить по известным в ML алгоритмам. Так я нашел универсальный способ выучить любой иностранный язык до нормального уровня в разумные сроки. И на себе проверил его эффективность.

Читать далее
Total votes 74: ↑68 and ↓6 +62
Comments 123

Как из ДНК-секвенатора сделать георадар и увидеть все под землей

Reading time 15 min
Views 20K
Какое-то время назад я опубликовал статью про то, как я занимался созданием ДНК-секвенатора (прибора для чтения ДНК) путём реверс-инжиниринга микросхемы. Но со временем, пока я это делал (а делал я это очень долго) этот секвенатор устарел, вышел новый, и мой проект отчасти потерял смысл, поскольку себестоимость секвенирования на новом секвенаторе Oxford Nanopore оказалась ниже, чем та стоимость, к которой стремился я. Проект заглох. С другой стороны, произошли события, которые сместили мой основной интерес в область такой вещи, как георадар. Точнее вернули его туда.

Лет 10 назад я наткнулся на ряд исследований, где применялось устройство, способное видеть, что находится под землёй — георадар. Неделю не мог оторваться, просмотрел огромное количество видеоматериалов, запомнилось название того прибора, который использовали исследователи – георадар «ЛОЗА». Ниже пример исследования Саксайуамана (Перу), на котором найдены подземные склепы, котлованы, лежащая на глубине плита, а также можно предположить наличие засыпанного когда-то дна чашеобразной формы.

Читать дальше →
Total votes 69: ↑69 and ↓0 +69
Comments 32

Самообучение в Data science, с нуля до Senior за два года

Reading time 9 min
Views 242K

Хочу поделиться методами освоения Data science с нуля человеком из другой ИТ специальности. Цель: дать понять, подходит ли Вам эта специальность в принципе, и рассказать про эффективные подходы к самообучению, которые мне помогли.

Отличные материалы уже существуют по большинству конкретных тем, я сам по ним учился. Думаю, многим будут полезны "мета" материалы о том, как выбирать курсы и статьи, по которым учиться.

Читать далее
Total votes 39: ↑27 and ↓12 +15
Comments 32

Интуитивное объяснение интеграла. Часть I — от умножения натуральных чисел до Ньютона и Лейбница

Reading time 10 min
Views 56K

Если у Вас нет математического образования, если Вы хотите по-настоящему разобраться в том, что из себя представляет интеграл и интегрирование, зачем всё это надо, как математика пришла к идее интеграла, то в таком случае Вы пришли по адресу — добро пожаловать!

Читать далее
Total votes 22: ↑19 and ↓3 +16
Comments 67

Random Forest, метод главных компонент и оптимизация гиперпараметров: пример решения задачи классификации на Python

Reading time 14 min
Views 78K
У специалистов по обработке и анализу данных есть множество средств для создания классификационных моделей. Один из самых популярных и надёжных методов разработки таких моделей заключается в использовании алгоритма «случайный лес» (Random Forest, RF). Для того чтобы попытаться улучшить показатели модели, построенной с использованием алгоритма RF, можно воспользоваться оптимизацией гиперпараметров модели (Hyperparameter Tuning, HT).



Кроме того, распространён подход, в соответствии с которым данные, перед их передачей в модель, обрабатывают с помощью метода главных компонент (Principal Component Analysis, PCA). Но стоит ли вообще этим пользоваться? Разве основная цель алгоритма RF заключается не в том, чтобы помочь аналитику интерпретировать важность признаков?
Читать дальше →
Total votes 33: ↑33 and ↓0 +33
Comments 6

Обучение и оценка модели с Keras

Reading time 25 min
Views 96K


Это руководство охватывает обучение, оценку и прогнозирование (выводы) моделей в TensorFlow 2.0 в двух общих ситуациях:

  • При использовании встроенных API для обучения и валидации (таких как model.fit(), model.evaluate(), model.predict()). Этому посвящен раздел «Использование встроенных циклов обучения и оценки»
  • При написании кастомных циклов с нуля с использованием eager execution и объекта GradientTape. Эти вопросы рассматриваются в разделе «Написание собственных циклов обучения и оценки с нуля».

В целом, независимо от того, используете ли вы встроенные циклы или пишете свои собственные, обучение и оценка моделей работает строго одинаково для всех видов моделей Keras: Sequential моделей, созданных с помощью Functional API, и написанных с нуля с использованием субклассирования.
Читать дальше →
Total votes 21: ↑21 and ↓0 +21
Comments 5

Чеклист по UX из 30 пунктов для мобильных приложений

Reading time 7 min
Views 30K
image

Эта статья — напминалка о том, что нужно перепроверить в дизайне вашего приложения, прежде чем отсылать его на AppStore/GooglePlay. Список поделен на тематические блоки:

  1. Вход / Регистрация
  2. Первый опыт
  3. Ежедневные взаимодействия
  4. Уведомления
  5. Параметры аккаунта
  6. Лента
  7. Поиск
  8. AppStore/GooglePlay
Читать дальше →
Total votes 32: ↑32 and ↓0 +32
Comments 9

Внедряем Sign in with Apple — систему авторизации от Apple

Reading time 6 min
Views 48K
Привет, Хабр!

Этим летом на конференции WWDC 2019 Apple представила собственную систему авторизации Sign in with Apple  и сделала ее обязательной для всех приложений в App Store, которые используют вход через соцсети. Исключение составляют образовательные, корпоративные, правительственные и бизнес-приложения, использующие собственную авторизацию. К Sign in with Apple Apple сделала качественную документацию, и в этой статье мы на примере ЦИАН расскажем, как внедрить ее в свой сервис.


Читать дальше →
Total votes 34: ↑34 and ↓0 +34
Comments 10

Подробности о GraphQL: что, как и почему

Reading time 19 min
Views 89K
GraphQL сейчас, без преувеличения, это — последний писк IT-моды. И если вы пока не знаете о том, что это за технология, о том, как ей пользоваться, и о том, почему она может вам пригодиться, значит статья, перевод которой мы сегодня публикуем, написана специально для вас. Здесь мы разберём основы GraphQL на примере реализации схемы данных для API компании, которая занимается попкорном. В частности, поговорим о типах данных, запросах и мутациях.


Читать дальше →
Total votes 27: ↑23 and ↓4 +19
Comments 23

Поиграем в книжки — что такое геймбуки и какие из них стоит попробовать

Reading time 9 min
Views 25K


Учить английский по играм и книгам — приятно и довольно эффективно. А если игра и книга объединены в одно мобильное приложение — еще и удобно. Так сложилось, что на протяжении последнего года я неспешно знакомился с жанром мобильных «геймбуков»; по итогам ознакомления готов признать, что это интересная, самобытная и не слишком известная широкой публике ветвь не то игр, не то литературы. В этой экспериментальной для Skyeng статье я тряхну «игрожуровой» стариной, сделав обзор наиболее интересных представителей жанра и их издателей.

Читать дальше →
Total votes 55: ↑55 and ↓0 +55
Comments 37

Другой Github 2: машинное обучение, датасеты и Jupyter Notebooks

Reading time 6 min
Views 19K


Несмотря на то, что в интернете существует множество источников свободного программного обеспечения для машинного обучения, Github остается важным центром обмена информацией для всех типов инструментов с открытым исходным кодом, используемых в сообществе специалистов по машинному обучению и анализу данных.

В этой подборке собраны репозитории по машинному обучению, датасетам и Jupyter Notebooks, ранжированные по количеству звезд. В предыдущей части мы рассказывали о популярных репозиториях для изучения работ по визуализации данных и глубокому обучению.
Читать дальше →
Total votes 47: ↑45 and ↓2 +43
Comments 1

95% от заявленного объёма торгов Биткоина оказались фейком

Reading time 2 min
Views 53K
image

В рамках 226 слайдов, представленных комиссии по ценным бумагам и биржам, мы( @BitwiseInvest ) провели первый в своем роде анализ данных со всех из 81 бирж, сообщающих об объеме BTC >$1M на CoinMarketCap

TLDR: 95% обозначенного объема является фейком, но есть и хорошие новости!

Осторожно, под катом будет пачка изображений из презентации
Читать дальше →
Total votes 86: ↑80 and ↓6 +74
Comments 164

Личный опыт: Пять сложностей при запуске бизнеса в США

Reading time 6 min
Views 53K


Вот уже пару лет я живу в США, развиваю два собственных проекта и сегодня решил поделиться опытом. Мне на глаза часто попадаются статьи с рассказами о том, как классно делать бизнес в США, авторы которых не рассказывают о возможных сложностях на этом пути. В итоге у многих может сложиться чересчур идеализированное представление о том, как они приедут в Кремниевую Долину со своим стартапом менять мир.

Так было и со мной, что неоднократно приводило к фрустрациям при столкновении с реальности. Поэтому сегодня я расскажу о сложностях в ведении бизнеса в Америке, к которым следует морально подготовиться еще до переезда.
Читать дальше →
Total votes 84: ↑81 and ↓3 +78
Comments 150

Генерация произвольных реалистичных лиц с помощью ИИ

Reading time 10 min
Views 52K
Контролируемый синтез и редактирование изображений с использованием новой модели TL-GAN


Пример контролируемого синтеза в моей модели TL-GAN (transparent latent-space GAN, генеративно-состязательная сеть с прозрачным скрытым пространством)

Весь код и онлайн-демо доступны на странице проекта.
Читать дальше →
Total votes 61: ↑61 and ↓0 +61
Comments 12

Яндекс.Метеум – технология без технологии. Маркетинг с точностью до района

Reading time 11 min
Views 46K
Прошло ровно 3 года с момента запуска сервиса «Яндекс.Метеум», который по заявлению разработчиков выдаёт самые качественные прогнозы среди всех прогностических сайтов. Пришло время подвести итоги. Действительно ли новый продукт Яндекса является революционным или всё это лишь маркетинговый пшик? И как команде ученых из Гидрометцентра России удалось обойти Яндекс и создать по-настоящему качественный прогноз.

image
Для начала представлюсь. Меня зовут Илья Винштейн, я синоптик-любитель из Кургана. Занимаюсь метеорологией 14 лет. Администрирую свой региональный проект «Погода 45», давал несколько лекций для научно-просветительского проекта «Курилка Гутенберга».
Читать дальше →
Total votes 158: ↑143 and ↓15 +128
Comments 177

Микросервисы: размер имеет значение, даже если у вас Kubernetes

Reading time 7 min
Views 30K
19 сентября в Москве состоялся первый тематический митап HUG (Highload++ User Group), который был посвящён микросервисам. На нём прозвучал доклад «Эксплуатация микросервисов: размер имеет значение, даже если у вас Kubernetes», в котором мы поделились обширным опытом компании «Флант» в области эксплуатации проектов с микросервисной архитектурой. В первую очередь он будет полезен всем разработчикам, задумывающимся о применении этого подхода в своём настоящем или будущем проекте.



Представляем видео с докладом (50 минут, гораздо информативнее статьи), а также основную выжимку из него в текстовом виде.

NB: Видео и презентация доступны также в конце этой публикации.
Total votes 40: ↑39 and ↓1 +38
Comments 23

Познакомьтесь с анархистами, самостоятельно делающими лекарства

Reading time 15 min
Views 144K

«Уксусный коллектив четырёх воров» – сеть анархистов, опирающихся на технологии, и бросающих вызов гигантам фарминдустрии при помощи самостоятельно изготовленных лекарств




Впервые я познакомился с Майклом Лофером, когда он швырялся в аудиторию хакерской конференции HOPE (Hackers on Planet Earth), проходящей раз в два года в Нью-Йорке, лекарствами на тысячи долларов.

«Кто-нибудь из присутствующих переживал анафилактический шок, не имея доступа к эпинефрину?» – спросил Лофер у аудитории. Поднялось несколько рук, и Лофер швырнул одному из поднявших руку людей изготовленную в домашних условиях EpiPen [похожее на шариковую ручку устройство для самостоятельных инъекций адреналина / прим. перев.]. «Это одно из первых сделанных нами устройств, — сказал он. – Используйте его с умом».

Немного позлорадствовав насчёт того, как Мартин Шкрели из племени фармацевтических гигантов поднял цены на препарат дараприм, необходимый для людей, страдающих от ВИЧ, с $13 до $750, Лофер посерьёзнел. «Прошло два года, но несмотря на всё произошедшее, стоимость препарата дараприм не поменялась», — сказал он. Он залез в карман и достал пригоршню белых таблеток. «Думаю, надо раздать ещё немного», — сказал Лофер, и швырнул дараприм в аудиторию.
Читать дальше →
Total votes 147: ↑141 and ↓6 +135
Comments 450

Information

Rating
Does not participate
Registered
Activity