trusted Nov 11 2022 at 16:07

Чем различаются Kafka и RabbitMQ: простыми словами

8 min

75K

Иннотех corporate blogProgramming*IT Infrastructure*Data storage*DevOps*

Technotext 2022

+55

Comments 33

Barmaglote Nov 11 2022 at 16:38

Эх... если бы все статьи были такими четкими, лаконичными!

BA_TW Dec 9 2022 at 11:00

Согласна полностью. Шикарная статья. Спасибо автору!

nronnie Dec 11 2022 at 20:33

если бы все статьи были такими четкими, лаконичными

Твои б слова, да Богу в уши. Вместо этого появится еще одна дюжина статей на темы: "Из ветеринаров в программисты Python", "Как я победил алкоголизм и игроманию", и "Жизнь в Намибии после релокации".

Maxim_Evstigneev Nov 11 2022 at 16:56

фантастика, здорово "разжевано", но хотелось бы примеров с кодом для наглядности

baldr Nov 11 2022 at 17:27

На хабре уже с десяток статей на эту тему было. Поищите - там и с кодом найдется, думаю.

dejecher Nov 11 2022 at 18:44

Чем различаются Kafka и RabbitMQ: простыми словами

Хорошая попытка. Но увы - я уже лет пять примерно тоже самое пытаюсь объяснить, и примерно теми-же словами но... в общем плюнул уже...

а так да - все правильно написано

ryanl Nov 11 2022 at 19:06

По крайней мере, хорошая затравка, однозначно

trusted Nov 12 2022 at 01:09

Не думаю, что все попытки объяснений непонятного понятным языком безрезультативны? Если At least once кто то понял то уже хорошо )))

freeg0r Nov 11 2022 at 19:07

Количество партиций в топике зависит от количества его конкурирующих подписчиков

не корректно, оно не зависит от подписчиков. Вы можете сделать 10 partitions и 1 consumer, а можете наоборот (тогда конечно 9 консьюмеров будут простаивать). В идеальном случае число partitions должно соответствовать числу потребителей.

Ну очень поверхностно, есть гораздо больше различий, например Кафка более чувствительна к размеру сообщения и времени его обработки в отличие от RabbitMQ, а у последнего есть варианты подписки basic.consume (подписка как в Kafka) и basic.get, который делает только один запрос в queue. В RabbitMQ можно удалять очереди после прочтения сообщения или по timeout, в отличие от Kafka, и т.п.

baldr Nov 11 2022 at 19:22

А еще есть Rabbit.Streams

freeg0r Nov 11 2022 at 19:25

есть и Kafka Streams – https://docs.confluent.io/platform/current/streams/index.html

trusted Nov 12 2022 at 01:00

Но все же зависимость существует? Если у топика 10 конкурирующих подписчиков то логично создать 10 партиций? В начале предложения надо было добавить слово "Обычно".

Fuud Nov 12 2022 at 12:00

Не логично. По крайней мере в общем смысле.

Если захочется проскалировать, добавив консюмера, то придется добавить и партицию. А это 1) ручная операция, 2) поломает партицирование по ключу (если используется)

Если завести 15 партиций на 10 консюмеров, то 5 из них будут нагружены в два раза больше чем 5 остальных.

Может показаться, что надо завести сотню-другую партиций, чтобы примерно распределить нагрузку поровну между изменяемым количеством консюмеров. Но каждая партиция - это минимум 6 открытых файловых дескрипторов на каждой ноде. И большое количество партиций - возможная проблема с Zookeeper.

Увы, приходится это все учитывать, по возможности, заранее.

ptr128 Nov 12 2022 at 00:23

под управлением Apache Zookeeper

Уже больше года, как под управлением кворума метаданных

https://issues.apache.org/jira/browse/KAFKA-9119

trusted Nov 12 2022 at 00:50

Хорошее замечание, спасибо. Статья относится к начальному уровню поэтому многие подробности были опущены. Иначе пришлось бы углубляться и рассказать и о существовании других альтернатив для Zoo в виде Consul, Atomix, Jocko ...

Fuud Nov 12 2022 at 12:02

А Кафка поддерживает другие альтернативы зукиперу, кроме собственного кворума?

freeg0r Nov 12 2022 at 13:21

не так ультимативно, Zookeeper так же и остался в Кафке, а Metadata Quorum, он же KRaft (https://developer.confluent.io/learn/kraft/) добавлен как мод, и as production ready он помечен только в последнем релизе, вышедшем буквально несколько дней назад

mstaoru Nov 12 2022 at 06:34

Простыми словами: Kafka — для работы, RabbitMQ — поиграться.

-8

dyadyaSerezha Nov 12 2022 at 07:25

Совсем не так. Работы бывают разные.

16tomatotonns Nov 12 2022 at 10:40

Если для вас "если не хайлоад - то это не работа а на поиграться", то конечно да. Правда, звучит это довольно по-дилетантски - хайлоад это просто немножко другой класс задач, особой сложностью, с учётом имеющегося инструментария, не обладающий.

mstaoru Nov 12 2022 at 19:09

Немного о разных вещах. Какое-то время назад занимался фрилансом в духе "подниму все, что совсем упало", кролик с тенденцией прилечь был в топе. Может быть, сейчас что-то поменялось. Но Кафка для небольших нагрузок тоже работает нормально. Часто проблемы из пп.1 возникают, потому что проектировали все под девизом "ну у нас же не хайлоад". Наверняка мой датасет весьма перекошен, конечно.

dyadyaSerezha Nov 12 2022 at 07:26

Все понял, кроме одного - почему отправитель обозначен буквой N? 😎

trusted Nov 12 2022 at 10:45

N - Ninja

murkin-kot Nov 12 2022 at 13:13

При этом имеет высокий порог вхождения, требователен к ресурсам.

Kafka как раз имеет очень низкий порог вхождения, благодаря хорошей документации и качественной архитектуре. Высоким же этот порог становится лишь для тех, кто привык лишь аннотации расставлять, не понимая происходящего внутри. Мир разработки заполнен плохо понимающими общие принципы быстроделами, но как раз эти общие принципы и дают возможность понять кафку гораздо легче, чем какой-нибудь, прости хосспади, спринг. Спринг требует понимания, что было в голове у автора той или иной части и как он это сумел по быстрому сляпать в своей обвязке вокруг заимствованных компонентов. А кафка, если человек хорошо знаком с базовыми принципами, просто предлагает ему чистую реализацию, без малейшей каши из головы очередного мамкиного "архитектора".

Немного аналогий:

Кафка - это кольцо, оно вставляется в этот цилиндр.

Спринг - это магический круг вечного огня, он разжигает небесное пламя, и после всего лишь нескольких (но очень важных!) заклинаний вы сумеете победить подземного дракона, а потом поймать океанского кита, на чём вы заработаете огромную кучу денег и станете самым уважаемым архитектором в мире вечно зелёных цилиндров, поглощающих пламя вечного кругового огня! Скорее, все на спринг!

Trigger1985 Nov 19 2022 at 19:16

Такой низкий порог, что по кафке изданы книги и не одна. А CCDAK, CCAAK у вас есть сертификат, а у ваших коллег?

murkin-kot Nov 19 2022 at 22:05

Не беспокойтесь, за свои слова я привык отвечать. Сертификаты же на самом деле ничего не доказывают, хоть и есть их у меня несколько штук, правда по технологиям IBM (MQ, Message Broker, etc).

Книги же - способ заработать. Никто не собирается давать вам систематизированные знания просто так, потому что систематизация затратна. Их дают исключительно ради прибыли, которая и окупает затраты. Ну а что бы была прибыль, нужна массовость. Поэтому про любой массовый продукт обязательно пишут книги. Да, про помаду и пенку для задницы малышей тоже пишут книги. Спросите у мамы, насколько сложно ей было разобраться с пенкой для задницы не читая соответствующие книги, поймёте смысл книжек про кафку.

ottonturk Nov 12 2022 at 17:21

статья норм для теоретической части, но важный момент: как проектировать такое взаимодействие?
Я понимаю, что что архвопрос, но то частый вопрос на людом собеседовании/любом месте работы...
То есть: как выглядит внутри. где можно развернуть поиграться...

foatto Nov 12 2022 at 21:14

Ещё одна разница, могущая стать весомой - Kafka не поддерживает приоритеты в очереди сообщений (что логично по самому принципу её работы), Rabbit - поддерживает.
Возможно, сейчас что-то изменилось в лучшую сторону, но где-то полгода назад пришлось велосипедить несколько топиков для псевдо-как-бы-приоритезации в кафке, потому что когда выяснилась эта необходимость - уже поздно было ~~пить брожоми~~ переходить на Rabbit.

manyakRus Nov 14 2022 at 13:35

Самое главное то не написали:

Kafka - надо её опрашивать 100 раз в секунду - есть что нового ?

RabbitMQ - сам вызовет функцию CallBack приложения когда придёт новое сообщение, не надо его опрашивать совсем.

ptr128 Nov 14 2022 at 15:50

Kafka - надо её опрашивать 100 раз в секунду - есть что нового ?

Если только средствами Kafka - нет. А вот другими средствами обеспечить нотификацию подписчика из публикатора никто не запрещает. Знаю, костыль. Через REST делаю это в исключительных случаях.

freeg0r Nov 15 2022 at 00:50

все написано, статью по диагонали читаете? тогда поищите слова push и pull.

TurboKaban Nov 14 2022 at 16:41

Поясните пожалуйста, почему Rabbit уступает в отказоустойчивости? Там же есть и персистентность на уровне очередей и сообщений, режимы подтверждений как для паблишера, так и для получателя. Есть реликация между нодами и кворумные очереди на случай если живые ноды теряют связь между собой.

sergeyns Dec 12 2022 at 09:59

Ну а какой-нибудь IBM MQ не стали рассматривать... наверно из-за того что он платный )))