Sergey Maximov @unlocker

System Architect, Java/Scala Developer

Profile Publications 3Comments 7Bookmarks 76

dmitriizolotov Jun 9 2022 at 16:56

Учимся жить с Kafka без Zookeeper

13 min

29K

High performance*System administration*DevOps*OTUS corporate blogDistributed systems*

При всех достоинствах Kafka как распределенного хранилища потока сообщений, боль вызывало раздельное хранение метаданных (топологии разделов, конфигурации кластера и прочего) и необходимость запуска в кластере рядом с Kafka еще и Apache Zookeeper. Побочным эффектом такого соседства (кроме дополнительных забот об администрировании и мониторинге) является долгое время восстановления после сбоя при больших размерах кластера, значительном количестве разделов или сложной топологии групп. Но ситуация улучшается и отличная новость появилась полторы недели назад в KIP-833, что в ближайшей версии Kafka 3.3 новый протокол согласования метаданных (KRaft), работающий внутри Kafka без Zookeeper, будет признан Production-Ready и далее постепенно зависимость от Zookeeper будет помечена как deprecated и удалена. В этой статье мы поговорим об особенностях протокола KRaft и разберемся как настроить новый кластер Kafka без необходимости установки Zookeeper.

+19

AlexSergeenko Jul 15 2021 at 17:01

Потоковый захват изменений из PostgreSQL/MySQL с помощью Apache Flink

18 min

15K

PostgreSQL*Big Data*Neoflex corporate blog

Tutorial

Привет! Сегодня мы поговорим и попробуем на практике реализацию паттерна Change Data Capture (далее – CDC) в Apache Flink.

Статья разделена на несколько частей: в первой мы рассмотрим теоретические основы Change Data Capture, варианты реализации и сферы применения. Во второй – обратимся к особенностям CDC-коннекторов экосистемы Apache Flink, а также выделим самые интересные фичи (а заодно и немного расскажем об Apache Flink для тех, кто раньше с ним не сталкивался). В третьей части – перейдем к практике, закатаем рукава и реализуем несложный сценарий захвата изменений из WAL PostgreSQL, приправленный объединениями, агрегацией, стеком ELK и целым кластером Flink, правда в миниатюре.

Anna_sokol22 Apr 11 2023 at 18:45

Prometheus + Grafana: 4 golden signals и другие подходы к мониторингу

9 min

8.2K

IT Infrastructure*Слёрм corporate blogIT career

С мониторингом, как с кораблем. Конечно, успех в обоих случаях зависит не только от названия. Чтобы все не потонуло, важно помнить о базовых вещах на старте.

В этой статье мы хотим подробнее разобрать подходы к мониторингу и посмотреть на стек Prometheus и Grafana. Материал поможет расширить ваш кругозор, если вы недавно начали или только собираетесь работать с мониторингом.

Flexxxey Oct 19 2023 at 13:00

YTsaurus SPYT: помогаем планировщику Apache Spark быть ещё эффективнее

Hard

13 min

2.3K

Конференции Олега Бунина (Онтико) corporate blogBig Data*Data Engineering*Yandex Cloud & Yandex Infrastructure corporate blog

В больших распределённых системах многое зависит от эффективности запросов: если на гигабайте данных неоптимальный запрос может выполняться за миллисекунды, то при увеличении массива в тысячи раз, сервер начнёт кряхтеть, пыхтеть и жаловаться. Чтобы избежать этого, помогут знания о работе распределённых систем и их частей, а именно — планировщиков.

Ещё с университетских времён я исследую распределённые системы, а последние два года в Яндексе адаптирую Apache Spark к внутренней инфраструктуре. Эта статья посвящена Apache Spark, а именно: как мы в рамках YTsaurus делали его ещё эффективнее. Написана она по мотивам моего доклада для «Онтико».

+17

BlasterAlex Oct 1 2019 at 18:37

Настройка VSCode для работы с Scala

5 min

13K

Programming*Visual Studio*Scala*

From sandbox

Статья рассчитана на новичков в программировании на Scala, каким я сам и являюсь, и просто на желающих начать писать программный код в VSCode.

Так получилось, что единственным гайдом по теме работы со Scalой в Visial Studio Сode оказалось это видео на ютуб-канале DevInsideYou. В нем очень подробно описан процесс установки и настройки среды для VS Code и Sublime Text.

Данная статья – адаптация видео с какими-то добавлениями от меня. Вы можете перейти к просмотру видео или продолжить читать эту статью (либо сделать и то, и другое), в таком случае, надеюсь, она будет вам полезна.

Читать дальше →

+18

hakain Aug 22 2021 at 21:28

Refined типы в Scala

4 min

4.8K

Scala*Functional Programming*

В процессе написания программ мы часто сталкиваемся с данными, для которых возможен только ограниченный набор значений. Например, возраст, который не может быть отрицательным или email, который может иметь только определенный формат строки.

+16

Moscow_Exchange Apr 5 2023 at 18:07

Практика использования BPMS в бэк-офисных процессах биржи

Medium

5 min

Programming*System Analysis and Design*MOEX corporate blog

Case

Центральной частью биржи являются торговые системы и их торговые ядра, в которых происходит matching заявок участников рынка и формируется order_log

Именно к торговому ядру (вернее к шлюзу) подключаются участники торгов. При этом, чтобы торговая система (ТС) могла работать, в неё к началу ежедневной торговой сессии должны попасть описания торговых инструментов и описания клиентов и их параметров подключения к ТС.

Если в двух словах описать эти процессы: они долгие и сложные.

Почему так?

Приведем пример – допустим, пришла к нам мошенническая фирма, выпустила облигации, участники рынка купили эти облигации, а фирма вместо того, чтобы исполнять обязательства перед держателями облигаций, перевела все полученные от рынка средства на офшор на Каймановых островах и была такова. Кто за это ответит? Кого будут сажать в тюрьму?

Чтобы избежать подобных ситуаций, как при допуске к торгам финансовых инструментов, так и при допуске к торгам участников этих торгов, выполняются KYC проверки и тех и других, причем в зависимости от роли в торгах и от рынка (например, валютный, фондовый, рынок деривативов) – процессы, по которым биржа будет проверять участника торгов или эмитента финансовых инструментов, будут свои и будут состоять из разных шагов и разных наборов проверок.

eapotapov Jan 25 2019 at 09:00

Apache Kafka и RabbitMQ: семантика и гарантия доставки сообщений

17 min

65K

High performance*Instant Messaging*ITSumma corporate blogApache*Big Data*

Translation

Подготовили перевод следующей части многосерийной статьи, где сравнивается функциональность Apache Kafka и RabbitMQ. В этой публикации речь идёт о семантике и гарантии доставки сообщений. Обращаем ваше внимание, что автор учитывал Кафку до версии 0.10 включительно, а в версии 0.11 появился exactly-once. Тем не менее, статья остаётся актуальной и полна полезных с практической точки зрения моментов.
Предыдущие части: первая, вторая.

Читать дальше →

+34

eapotapov Jul 27 2018 at 10:45

RabbitMQ против Kafka: применение Kafka в событийно ориентированных приложениях

12 min

32K

High performance*Instant Messaging*ITSumma corporate blogApache*Big Data*

В предыдущей статье мы рассмотрели шаблоны и топологии, применяемые в RabbitMQ. В этой части мы обратимся к Kafka и сравним её с RabbitMQ, чтобы получить некоторые представления об их различиях. Следует иметь в виду, что сравниваться будут скорее архитектуры событийно-ориентированных приложений, а не конвейеры обработки данных, хотя грань между этими двумя понятиями в данном случае будет довольно размытой. Вообще, это скорее спектр, чем четкое разделение. Просто наше сравнение будет сфокусировано на части этого спектра, связанной с событийно-управляемыми приложениями.

Читать дальше →

+37

eapotapov Jun 9 2020 at 10:22

Мониторинг микросервисных приложений: взгляд SRE

8 min

12K

IT Infrastructure*ITSumma corporate blogIT Standards*DevOps*Microservices*

Современная инфраструктура — множество небольших приложений, запущенных в контексте одного менеджера приложений, который упра'вляет их количеством, обновлением и запросами на ресурсы. Она является таковой не потому, что админы решили, будто так удобно ею управлять. Такая инфраструктура отражает текущее мышление в области разработки программного обеспечения. Для того чтобы понять, почему мы сейчас говорим о микросервисной архитектуре как об идеологии, необходимо вернуться на 30 лет назад.

Читать дальше →

+16

ITSumma Mar 18 2020 at 16:34

13 инструментов для обработки текста в командной оболочке

17 min

87K

Configuring Linux*System administration*ITSumma corporate blogServer Administration*Software

Tutorial

Translation

Здесь представлен фрагмент будущей книги «Основные инструменты и практики для начинающего разработчика программного обеспечения» Бальтазара Рубероля и Этьена Броду. Книга должна помочь образованию подрастающего поколения разработчиков. Она охватит такие темы, как освоение консоли, настройка и эффективная работа в командной оболочке, управление версиями кода с помощью git, основы SQL, инструменты вроде Make, jq и регулярные выражения, основы сетевого взаимодействия, а также лучшие практики разработки программного обеспечения и совместной работы. В настоящее время авторы упорно работают над этим проектом и приглашают всех поучаствовать в списке рассылки.

Содержание

Читать дальше →

+50

eapotapov Jul 10 2018 at 11:17

RabbitMQ против Kafka: два разных подхода к обмену сообщениями

18 min

304K

High performance*Instant Messaging*ITSumma corporate blogApache*Big Data*

В прошлых двух статьях мы рассказывали об IIoT — индустриальном интернете вещей — строили архитектуру, чтобы принимать данные от сенсоров, паяли сами сенсоры. Краеугольным камнем архитектур IIoT да и вообще любых архитектур работающих с BigData является потоковая обработка данных. В ее основе лежит концепция передачи сообщений и очередей. Стандартом работы с рассылкой сообщений сейчас стала Apache Kafka. Однако, для того, чтобы разобраться в ее преимуществах (и понять ее недостатки) было бы хорошо разобраться в основах работы систем очередей в целом, механизмах их работы, шаблонах использования и основной функциональности.

Мы нашли отличную серию статей, которая сравнивает функциональность Apache Kafka и другого (незаслуженно игнорируемого) гиганта среди систем очередей — RabbitMQ. Эту серию статей мы перевели, снабдили своими комментариями и дополнили. Хотя серия и написана в декабре 2017 года, мир систем обмена сообщениями (и особенно Apache Kafka) меняется так быстро, что уже к лету 2018-го года некоторые вещи изменились.

Читать дальше →

+77

bingo347 May 30 2018 at 10:05

Опыт настройки и использования WSL (подсистемы Linux в Windows 10)

9 min

253K

Configuring Linux*System administration*

К написанию данной статьи меня побудил вопрос на Тостере, связанный с WSL. Я, после нескольких лет использования систем на ядре Linux, около полугода назад перешел к использованию Windows 10 на домашнем ПК. Зависимость от терминала и Linux окружения в моей работе практически сразу привели меня к вопросу: или ставить виртуалку или попробовать WSL. Я выбрал второе, и остался вполне доволен.

Под катом я расскажу как установить и настроить WSL, на какие я наткнулся проблемы и ограничения, как запускать Linux приложения из Windows и наоборот, а так же как интегрировать элементы окружения Xfce в окружение рабочего стола Windows.

Читать дальше →

+61

Montmorency May 31 2019 at 15:03

Как мы учились эксплуатировать Java в Docker

13 min

45K

Java*hh.ru corporate blogMicroservices*

Под капотом hh.ru — большое количество Java-сервисов, запущенных в докер-контейнерах. За время их эксплуатации мы столкнулись с большим количеством нетривиальных проблем. Во многих случаях чтобы докопаться до решения приходилось долго гуглить, читать исходники OpenJDK и даже профилировать сервисы на продакшене. В этой статье я постараюсь передать квинтэссенцию полученного в процессе знания.

Читать дальше →

+50

Apollon_Diamed May 20 2018 at 16:52

Универсальный API для получения информации по чекам

9 min

111K

Open source*API*

Привет жителям Хабра.

В данной статье хотелось бы рассказать про API для получения чеков, которое нам не предоставила ~~всеми любимая~~ ФНС.

Когда только появились QR-коды на чеках я подумал «Вау, как круто! Ты сканируешь код и видишь если не всю инфу по чеку, то ссылку на него». И какого же было мое разочарование, когда просканировав такой код я увидел что-то вроде

t=20180518T220500&s=975.88&fn=8710000101125654&i=99456&fp=1250448795&n=1

Но расстраиваться я не стал и подумал, что ФНС позаботилась о нас и предоставила API для получения такой информации. Погуглив некоторое время я понял, что ФНС нам предоставила только мобильное приложение для проверки чека и просмотра той информации, что поступила к ним от магазина.

Читать дальше →

+31

xpendence Feb 19 2019 at 07:11

Apache Kafka + Spring Boot: Hello, microservices

12 min

125K

Programming*Java*

Tutorial

Привет, Хабр! В этом посте мы напишем приложение на Spring Boot 2 с использованием Apache Kafka под Linux, от установки JRE до работающего микросервисного приложения.

Коллеги из отдела фронтэнд-разработки, увидевшие статью, сетуют на то, что я не объясняю, что такое Apache Kafka и Spring Boot. Я полагаю, что всякий, кому понадобится собрать готовый проект с использованием вышеперечисленных технологий, знают, что это и зачем они им нужны. Если для читателя вопрос не праздный, вот отличные статьи на Хабре, что такое Apache Kafka и Spring Boot.

Мы же обойдёмся без пространных объяснений, что такое Kafka, Spring Boot и Linux, а вместо этого запустим Kafka-сервер с нуля на Linux-машине, напишем два микросервиса и сделаем так, чтобы одно из них посылало сообщения на другое — в общем, настроим полноценную микросервисную архитектуру.

Пост будет состоять из двух разделов. В первом мы настроим и запустим Apache Kafka на Linux-машине, во втором — напишем два микросервиса на Java.

Читать дальше →

entony Feb 13 2019 at 16:36

Scala + MXNet = Микросервис с нейронкой в проде

20 min

8.9K

VK corporate blogScala*Machine learning*Microservices*

В интернете есть огромное количество руководств и примеров, на основе которых вы, дорогие читатели, сможете «без особого труда» и с «минимальными» временными затратами написать код, способный на фото отличать кошечек от собачек. И зачем тогда тратить время на эту статью?

Основной, на мой взгляд, недостаток всех этих примеров — ограниченность возможностей. Вы взяли пример, — пусть даже с базовой нейронной сетью, которую предлагает автор, — запустили его, возможно, он даже заработал, а что дальше? Как сделать так, чтобы этот незамысловатый код начал работать на production-сервере? Как его обновлять и поддерживать? Вот тут и начинается самое интересное. Мне не удалось найти полного описания процесса от момента «ну вот, ML-инженер обучил нейронную сеть» до «наконец-то мы выкатили это в production». И я решил закрыть этот пробел.

Читать дальше →

+40

olemskoi Nov 2 2016 at 07:37

Мониторинг докер-хостов, контейнеров и контейнерных служб

7 min

58K

System administration*Server Administration*Слёрм corporate blogDevOps*

Tutorial

Translation

Я искал self-hosted мониторинговое решение с открытым кодом, которое может предоставить хранилище метрик, визуализацию и оповещение для физических серверов, виртуальных машин, контейнеров и сервисов, действующих внутри контейнеров. Опробовав Elastic Beats, Graphite и Prometheus, я остановился на Prometheus. В первую очередь меня привлекли поддержка многомерных метрик и несложный в овладении язык запросов. Возможность использования одного и того же языка для графических изображений и уведомления сильно упрощает задачу мониторинга. Prometheus осуществляет тестирование по методу как черного, так и белого ящика, это означает, что вы можете тестировать инфраструктуру, а также контролировать внутреннее состояние своих приложений.

Читать дальше →

+24

kossik Oct 25 2016 at 12:56

Еще 7 сервисов для мониторинга сайтов

4 min

25K

HostingSystem administration*Virtualization*Network technologies*HOSTING.cafe corporate blog

В комментариях к предыдущей статье набралось такое количество сайтов, предоставляющих услуги мониторинга, что хватило еще на один пост. Приношу благодарность за обратную связь, без которой не было бы этого обзора.

Ещё семь новых сервисов мониторинга в этой статье

Читать дальше →

+19

kossik Oct 19 2016 at 12:04

7 сервисов для мониторинга сайтов

4 min

121K

HostingSystem administration*Virtualization*Network technologies*HOSTING.cafe corporate blog

Здравствуйте! Часто перебои в работе сайта могут привести к потере клиентов, репутации, ~~минусам в карму~~ и прочим неприятностям. После покупки виртуального или выделенного сервера важно вовремя получать информацию о недоступности, поэтому сегодня я хочу рассказать о нескольких сервисах мониторинга сайтов/серверов и провести их сравнение.

На обозрение представлены следующие сервисы:

Читать дальше →

+18

2 3 4

Учимся жить с Kafka без Zookeeper

Потоковый захват изменений из PostgreSQL/MySQL с помощью Apache Flink

Prometheus + Grafana: 4 golden signals и другие подходы к мониторингу

YTsaurus SPYT: помогаем планировщику Apache Spark быть ещё эффективнее

Настройка VSCode для работы с Scala

Refined типы в Scala

Практика использования BPMS в бэк-офисных процессах биржи

Apache Kafka и RabbitMQ: семантика и гарантия доставки сообщений

RabbitMQ против Kafka: применение Kafka в событийно ориентированных приложениях

Мониторинг микросервисных приложений: взгляд SRE

13 инструментов для обработки текста в командной оболочке

Содержание

RabbitMQ против Kafka: два разных подхода к обмену сообщениями

Опыт настройки и использования WSL (подсистемы Linux в Windows 10)

Как мы учились эксплуатировать Java в Docker

Универсальный API для получения информации по чекам

Apache Kafka + Spring Boot: Hello, microservices

Scala + MXNet = Микросервис с нейронкой в проде

Мониторинг докер-хостов, контейнеров и контейнерных служб

Еще 7 сервисов для мониторинга сайтов

7 сервисов для мониторинга сайтов

Information

Specialization