Pull to refresh
5
0
Ольга Плюта @Analytique

Product data analyst | Ex-Yandex

Send message

Как понять логику EXISTS в SQL запросах

Level of difficultyEasy
Reading time6 min
Views30K

Как следует из названия, данная статья для тех, у кого есть сложности с пониманием SQL запросов, в составе которых, используется EXISTS, т.к., исходя из опыта, его использование частенько вызывает вопросы у начинающих, а иногда даже у продолжающих. 

Стандартное описание работы оператора EXISTS, для SQL, выглядит примерно так: “Оператор EXISTS возвращает true, если подзапрос возвращает одну, или более записей, в противном случае, возвращает false”. 

И еще: “Поскольку возвращения набора строк не происходит, то подзапросы с подобным оператором выполняются довольно быстро.”

Непонимание, обычно, как раз кроется, где-то здесь: Если EXISTS возвращает true/false, но не возвращает набор записей, то каким образом, основной запрос, в ходе выполнения, отбирает записи, соответствующие условиям описанным во вложенном запросе.

Читать далее
Total votes 7: ↑4 and ↓3+3
Comments2

Как переключиться с work-work balance и не выгореть. Материалы Lamoda Tech 1С Meetup

Level of difficultyEasy
Reading time2 min
Views1.6K

13 декабря мы провели первую встречу Lamoda Tech 1С Meetup. Вместе с экспертами поговорили о том, как получать от работы удовольствие, удовлетворение и, конечно, достойное вознаграждение. А на круглом столе успели обсудить и технические вопросы — проблемы интеграции в 1С.

Спикерами в этот день были карьерный консультант Анна Степанян, психолог Дмитрий Фадеев и руководитель отдела 1С-проектов Lamoda Tech Владимир Короткий.

Делимся с вами видеозаписиями всех докладов и презентациями спикеров.

Читать далее
Total votes 8: ↑5 and ↓3+2
Comments0

Универсальные факты: конструктор извлечения для аналитика

Level of difficultyMedium
Reading time7 min
Views1.3K

Привет, мы команда LegalDocs Управления «Проектный офис» в Правовом департаменте. У Сбербанка огромное количество клиентов, от обычных людей до больших корпораций. Все вместе они предоставляют множество видов документов, из которых нам нужно быстро извлекать юридически значимую информацию для последующей правовой экспертизы. Например, к нам обращается представитель большой компании за кредитом. И нам нужно оценить правоспособность: проверить, есть ли у этого представителя соответствующие полномочия в той организации, которую он представляет.

Если бы эту экспертизу проводил человек, то на его стол (физический или виртуальный) должен попасть большой пакет документов: устав организации, протокол о создании общества, протокол о нотариальные доверенности и многое другое. И чтобы искусственный интеллект (система автоматического принятия правового решения, или, как мы её называем, «робот-юрист», эта технология даже запатентована) мог принять решение, нужно сначала из каждого документа извлечь определённую информацию (значимые факты), структурировать её и отправить на проверку. Только после этого робот-юрист решит, есть ли правовые риски в этой кредитной сделке.

Читать далее
Total votes 9: ↑7 and ↓2+11
Comments3

Принципы создания сильной команды

Reading time5 min
Views8K

Привет! Меня зовут Курдюмов Дмитрий, я являюсь сертифицированным Agile коучем и консультантом по трансформациям компаний, больше 7 лет помогаю компаниями на пути к гибкости через трансформацию их подходов к управлению продуктами и проектами.

Тема команд стала актуальна с приходом Agile подходов. Но на самом деле процесс начался гораздо раньше. В 1986 году в Журнале Harvard Business Review вышла статья "The New New Product Development Game", в которой было сказано:

Новый акцент на скорость и гибкость требует изменения подхода к управлению разработкой новых продуктов. Традиционный последовательный или «эстафетный» подход к разработке продуктов, примером которого служит система поэтапного планирования, может противоречить целям максимальной скорости и гибкости. Вместо этого целесообразнее использовать «регби»-подход, где команда пытается преодолеть расстояние как единое целое, передавая мяч туда и обратно — что лучше соответствует текущим конкурентным требованиям.

Читать далее
Total votes 25: ↑14 and ↓11+4
Comments23

Годовой дайджест по аналитике и ML за 2023

Level of difficultyMedium
Reading time5 min
Views4.8K

Привет, Хабр! Я Стас, занимаюсь развитием аналитических и ML-продуктов в Selectel. В новом мегадайджесте мы с командой собрали для вас свои лучшие материалы по итогам 2023 года. Читайте и сохраняйте в закладки: пригодится всем, кто хочет быть в курсе новостей и актуальных технологий из мира AI, ML и дата-аналитики.

Под катом — ежемесячные дайджесты, которые вы могли пропустить, экспертные статьи по совместному использованию GPU, кэшированию датасетов и бэкапированию данных в Kubernetes, а также записи докладов с наших мероприятий.
Читать дальше →
Total votes 34: ↑34 and ↓0+34
Comments0

Игроки с преимуществом: чем оно больше, тем хуже они себя ведут с оппонентами

Reading time6 min
Views9.8K
image
Из недавней рекламы игры

Социальный психолог Пол Пифф из Беркли провёл серию экспериментов о том, как богатство и везение влияют на социальное поведение людей (спойлер — плохо), а потом выступил с результатами своего исследования на TED. Гневные письма ему продолжают приходить до сих пор, хотя прошло уже больше десяти лет.

Сам Пифф думает, что это происходит потому, что исследование выглядит как что-то политически ангажированное. А ещё — потому что он посягнул на «великую американскую мечту» о том, что все равны и разбогатеть может каждый, если очень постарается. А если разбогатеть не вышло, значит, старался человек не сильно и долю свою заслужил. Осознавать, что это не всегда так, бывает довольно обидно.

Ну а пока Пол Пифф продолжает исследовать социальное неравенство, эмоции и поведение людей в обществе, давайте поговорим про одну из самых популярных в мире настолок — «Монополию» — и про то, как всё это отражается в игре.
Читать дальше →
Total votes 26: ↑25 and ↓1+28
Comments77

Книга «Грокаем машинное обучение»

Reading time10 min
Views20K
imageПривет, Хаброжители!

Машинное обучение — это набор методов анализа данных, основанных на алгоритмах, которые дают все более точные результаты по мере поступления новых данных. Машинное обучение лежит в основе систем рекомендаций, программ распознавания лиц, «умных» колонок и даже беспилотных автомобилей. Эта уникальная книга объясняет основные понятия машинного обучения на простых и доступных примерах, увлекательных упражнениях и запоминающихся иллюстрациях.

Здесь нет зубодробительного академического жаргона, для понимания объяснений достаточно знаний основ алгебры. По мере чтения вы будете создавать модели для идентификации спама и распознавания изображений и другие интересные проекты на языке Python.

Откройте для себя мощные методы машинного обучения, для понимания и применения которых достаточно знаний математики на уровне средней школы!

Для читателей, знающих основы языка Python. Знаний в области машинного обучения не требуется.

В качестве обзора книги мы предлагаем вам ознакомится с переводом статьи автора Luis Serrano.
Читать дальше →
Total votes 9: ↑9 and ↓0+9
Comments9

Где искать работу Дата Саентисту в 2024 году

Reading time4 min
Views15K

В настоящее время профессия дата-саентиста является одной из самых востребованных и перспективных. С развитием технологий и увеличением объема данных, специалисты в области анализа данных становятся незаменимыми для компаний всех отраслей. Однако, в 2024 году сфера науки о данных будет развиваться еще более динамично, что означает, что поиск работы и интересных проектов станет еще более конкурентным и требовательным.

Одной из основных тенденций в 2024 году будет увеличение спроса на специалистов с опытом работы в машинном обучении и искусственном интеллекте. Компании будут стремиться применять эти технологии для оптимизации своих бизнес-процессов и повышения эффективности. Поэтому, для дата-саентистов будет важно иметь глубокие знания в области машинного обучения и умение применять их на практике.

Еще одной важной тенденцией будет рост значимости этического аспекта работы дата-саентистов. В связи с увеличением количества данных и их влиянием на принятие решений, специалисты должны будут учитывать этические и правовые аспекты своей работы. Компании будут искать дата-саентистов, которые могут гарантировать безопасность и конфиденциальность данных, а также соблюдение норм и правил использования.

Кроме того, в 2024 году ожидается развитие новых технологий и инструментов для работы с данными. Дата-саентисты будут сталкиваться с большим объемом информации, поэтому им необходимо будет обладать навыками работы с Big Data и уметь использовать современные инструменты для анализа и визуализации данных.

В целом, в 2024 году дата-саентистам предстоит столкнуться с новыми вызовами и возможностями. Поиск работы и интересных проектов будет требовать от них не только глубоких знаний и навыков, но и гибкости, творческого мышления и способности быстро адаптироваться к изменениям в сфере анализа данных.

t.me/ai_machinelearning_big_data – огромное количество уроков, библиотек и примеров с кодом в моем телеграм канале для Дата саенистов разработчиков.

https://t.me/addlist/_FjtIq8qMhU0NTYy – тут я собрал огромную папку для Дата Саентистов.

В этой статье я собрал 20 ресурсов для поиска работы и фриланс-проектов для специалистов по работе с данными.

Читать далее
Total votes 8: ↑5 and ↓3+4
Comments4

Отток в офлайн-ритейле — как увеличить возврат клиентов ПРО на 20%?

Level of difficultyEasy
Reading time12 min
Views1.6K

Привет, Хабр! Меня зовут Никита Мелентьев, я Lead Data Scientist в команде дата-акселератора «Леруа Мерлен». Сегодня мы с коллегой Алексеем Зубаревым поделимся нашим кейсом по использованию ML для прогнозирования оттока и возврата профессиональных (ПРО) клиентов в «Леруа Мерлен». 

Коснемся не только модели прогнозирования, но также подхода к построению ML-продуктов, который мы используем: от оценки эффекта перед разработкой — до продуктивизации сервиса и интеграции в системы компании. Разберем методологии разметки ушедших клиентов и A/B-тестирования. И, конечно, затронем тему метрик. Оставайтесь, будет интересно!

Читать далее
Total votes 7: ↑5 and ↓2+3
Comments4

Minimal Phone: смартфон с e-Ink, QWERTY-клавиатурой и минимальным энергопотреблением. Что это за девайс?

Reading time3 min
Views9.1K

В январе 2024 года стало известно о новом смартфоне, который позиционируется как телефон, способный проработать несколько дней на одной зарядке. При этом он не предназначен для просмотра видео и ряда других задач, поскольку его дисплей — e-Ink. То есть обновление экрана не особо комфортное для пользователя, если тот планирует регулярно работать с социальными сетями. Подробности — под катом.

Читать далее
Total votes 8: ↑6 and ↓2+12
Comments25

Как совмещать работу с учебой. Что-то про тайм-менеджмент

Level of difficultyEasy
Reading time7 min
Views18K

Всем привет! Меня зовут Даша и я системный аналитик компании SM Lab. Работаю в команде Brand Planning Tool. Наша команда BPT помогает брендам (таким как Fila, Demix, Northland) запускать новые коллекции.

В этом я году закончила бакалавриат и поступила в магистратуру по направлению «Системный анализ и управление». С третьего курса начала работать по специальности.

В этой статье я расскажу о своем опыте совмещения работы с учебой, о различных методиках и лайфхаках в тайм-менеджменте, которые помогают грамотно планировать свой день. Надеюсь, что мой опыт окажется полезным для всех, кто так же планирует совмещать эти сферы жизни или просто хочет успевать больше в течение дня.

Под катом:

• Моя история
• Важные моменты при планировании
• Методики тайм‑менеджмента
• Выводы

Читать далее
Total votes 17: ↑11 and ↓6+10
Comments15

Про нашу регенерацию

Reading time17 min
Views12K
В течение жизни человек меняется почти полностью за исключением сетчатки и хрусталика глаза, а также коры головного мозга. Всё остальное потихоньку умирает и обновляется: спасибо регенерации!

Мы так смело подходим к человеку со скальпелем и щипцами, вкручиваем в него импланты и перекраиваем целые участки тканей только потому, что знаем: регенерация нам поможет. В самом известном вам примере с зубным имплантом костная ткань и слизистая оболочка в определённые сроки обновятся, все раны заживут, и человек будет жить дальше.

Чтобы организм понял, какие ткани и в каком месте выращивать, нужно правильно составить техзадание.

image
В принципе договориться о приживлении имплантов не так уж и сложно

Сегодня я расскажу, как составить это самое техзадание, что бывает с теми, кто после удаления зуба ходит в баню, курит и пьёт коктейли через трубочку, а ещё — про бессмертные организмы, стволовые клетки и отращивание всяких тканей. Страшных картинок не будет — заглядывать под кат можно смело и решительно.
Читать дальше →
Total votes 53: ↑50 and ↓3+61
Comments18

Вы делаете аналитику неправильно — 5 конкретных примеров

Level of difficultyMedium
Reading time4 min
Views7.4K

Сегодня хочу рассказать вам про ошибку «поверхностных» выводов - последнее время я ее встречаю и у аналитиков, и у предпринимателей, и вообще у всех. В статье приведены 5 конкретных примеров, которые показывают, как неправильная аналитика приводит к миллионным убыткам - на примере CR, LTV и других метрик.

Обязательно прочитайте статью и проверьте - не совершаете ли вы эти ошибки!

Читать далее
Total votes 7: ↑2 and ↓5-1
Comments5

Инструменты продуктового аналитика VK, или Как мы работаем с большими данными

Level of difficultyMedium
Reading time15 min
Views8.7K

Принятие решений на основе данных является неотъемлемой частью работы аналитика. Данные помогают сделать это быстро. Но что если объём данных достигает десятков петабайт? Подобная задача становится не такой тривиальной, как может показаться на первый взгляд. Как масштабировать работу с данными в продуктовых командах? Как быстро найти инсайты в куче данных? Какие инструменты могут быть полезны для аналитика?

Заинтригованы? Добро пожаловать в мир аналитики больших данных.

Читать далее
Total votes 33: ↑29 and ↓4+34
Comments2

Разметить всё: как мы настроили систему логирования в приложении каршеринга

Level of difficultyEasy
Reading time8 min
Views1.7K

Сразу признаюсь: на старте у нас было всего 10 событий, которые мы могли отслеживать. И показывали они нам то, что мы и так знали.

Расскажу, как мы разогнались до 700 уникальных событий и выстроили систему разметки, которая стала фундаментом аналитики в нашем каршеринге; а ещё покажу все аспекты жизненного цикла события: от идеи и технической реализации до попадания в отчёт и получения инсайтов.

Твой тык сюда — тоже событие 😏
Rating0
Comments1

Как извлекать пользу из данных: подборка материалов

Level of difficultyEasy
Reading time6 min
Views5.8K

Анализ данных — один из ключевых драйверов роста для бизнеса. Аналитика позволяет выявить скрытые закономерности и тренды, прогнозировать будущие события и принимать обоснованные решения на основе фактов. Бизнес, основанный на данных, не просто реагирует на переменчивость, но и активно формирует свое будущее. 

Сегодня мы подготовили для вас новую подборку книг с высоким читательским рейтингом, которые дают понимание, как собирать данные и извлекать из них ценность, как принимать обоснованные решения, определять сильные и слабые стороны различных инструментов.

Читать далее
Total votes 14: ↑14 and ↓0+14
Comments0

Что такое аналитический инжиниринг?

Reading time7 min
Views3K

Будучи единственным аналитиком в быстрорастущем сиднейском стартапе, Клэр испытала на себе все тяготы традиционного рабочего процесса аналитика — застревание в "хомячьем колесе", постоянно растущий бэклог и цифры, которые никогда не сходились. Поэтому она освоила dbt, командную строку, контроль версий и привнесла в свою команду всю скрупулезность аналитического инжиниринга. Попутно она так полюбила dbt, что в итоге собрала вещи и переехала в США, чтобы возглавить активно развивающееся сообщество dbt.

Инженеры-аналитики предоставляют конечным пользователям чистые наборы данных, моделируя их таким образом, чтобы конечные пользователи могли сами отвечать на свои вопросы. Сегодня мы с вами поговорим о тенденциях рынка, которые привели к появлению этой новой роли в современных командах по работе с данными.

Читать далее
Total votes 13: ↑8 and ↓5+4
Comments0

АБ тесты и подводные камни при их автоматизации

Level of difficultyMedium
Reading time14 min
Views6.8K

Задача оценки нововведений в онлайн и мобильных приложениях возникает повсеместно. Один из наиболее надёжных и популярных способов решения этой задачи - двойной слепой рандомизированный эксперимент, также известный как АБ-тест.

На тему АБ-тестирования доступны как статьи на Хабре, так и целые книги (неполный список литературы в конце). В основе АБ-теста лежит следующая идея - случайно разделить пользователей на две или более группы, в одной из которых исследуемая функциональность выключена, а в других - включена. Затем можно сравнить метрики и сделать выводы.

Читать далее
Total votes 8: ↑8 and ↓0+8
Comments0

Краткое руководство по анализу данных и проведению продуктовых исследований

Reading time7 min
Views8.3K

Привет. Я занимаюсь продуктовой аналитикой уже довольно давно, и так получилось, что чаще всего в работе мне прилетают именно продуктовые рисёрчи. Иногда нужно разобраться с какой-то фичей, которую никто никогда не изучал, иногда это моделирование перед какими-то изменениями, иногда просто раскопка какой-то проблемы.

По мере моего развития, я экспериментировал с разными подходами к таким задачам, пытался выработать удобный фреймворк, учась на предыдущих ошибках. Читал книги по теме и внедрял интересные идеи из опыта авторов.

Тут я хочу поделиться порядком действий, если хочешь — чек-листом, как я провожу аналитические исследования.

Получилось объёмно, и много где идеи очень простые. Но, как это обычно бывает, на некоторые этапы просто нет времени или желания, а в итоге может пострадать вся суть работы. Наливай чай, бери попкорн — приятного чтения.

Читать далее
Total votes 3: ↑3 and ↓0+3
Comments1

Расчетная архитектура платформы для A/B-тестов Mail.Ru

Level of difficultyMedium
Reading time9 min
Views3.2K

Привет Хабр! Меня зовут Андрей Каймаков, я работаю в продуктовой аналитике Mail.ru в VK. Сейчас практически каждая IT-компания (да и не только IT) знает про A/B-тесты и понимает важность проверки новых фичей с помощью этого метода. Когда фичей становится много, то A/B-тесты начинают занимать значительное время в работе команд. Чтобы автоматизировать эти процессы создаются платформы для проведения A/B-тестов. Мы разрабатываем свою систему с 2017 года, а недавно сильно ее обновили. Хочу вместе со своим коллегой разработчиком Андреем Чубаркиным поделиться опытом и инсайтами, которые мы обнаружили в ходе этого проекта. 

Читать далее
Total votes 20: ↑18 and ↓2+23
Comments7
1
23 ...

Information

Rating
Does not participate
Registered
Activity

Specialization

Data Analyst, Product Analyst
Senior
SQL
Python
English
Tableau
Math statistics
Visualization
Jupyter Notebook
Pandas
Yandex DataLens
French