danx Aug 29 2011 at 17:46

Репликация базы данных PostgreSQL на основе SymmetricDS

10 min

20K

PostgreSQL*

From sandbox

+21

Comments 29

compdemon Aug 29 2011 at 17:57

В принципе интересно, но как добавить репликацию к уже имеющейся и пусть не сильно большой, но уже прилично весящей базе? Экспортировать текущую, создавать новую реплицируемую и импортировать данные туда? Или можно добавить репликацию к имеющейся рабочей базе «на лету» (естественно с требующейся по ходе дела остановкой, если нужно).

danx Aug 29 2011 at 18:14

Да, можно добавить репликацию к имеющейся базе. Для этого необходимо модифицировать код файла insert_sample.sql, создав в таблицах Symmetric DS (начинающизся на sym_) нужные записи.
Особенность Symmetric DS такова, что он может реплицировать не всю базу подряд, а только некоторые ее таблицы. Например, у нас есть branch office и менеджер по продажам вносит в локальную базу нового клиента. Эта информация о клиенте синхронизируется с главной базой в headquarters и становится после этого доступна для остальных branch offices.

Lolka Aug 29 2011 at 18:35

И еще, рассматривали, как ведут себя базы в случае потери соединения? Скажем, у меня две БД в разных городах — интернет есть всегда, но вдруг чего, разное бывает — пропадает. В таких случаях, если у нас мультимастер репликация, надо будет решать конфликты по id'ам insert'ов и update'ам. Хотелось бы еще несколько слов об этом.

miwa Aug 30 2011 at 12:17

Из тех систем, с которыми я сталкивался проблема решается двумя способами — либо каждая база данных имеет свой непересекающийся диапазон идентификаторов, либо первичный идентификатор составной — ИД записи + ИД базы данных. Можно еще позаморачиваться с UUID в качестве идентификаторов, но это уже совсем для гурманов.

Lolka Aug 30 2011 at 12:27

Да-да, у меня, к примеру, две ноды и больше не предвидится, id'ы идут чёт-нечёт.

el777 Aug 30 2011 at 14:27

Проблема не только в id.
А если так? Что будет на выходе?

LighteR Aug 29 2011 at 19:04

Каким образом SymmetricDS разрешает конфликты?

datacompboy Aug 29 2011 at 19:29

А в чем преимущество над, например, slony?
Если я понимаю, разрешения конфликтов при доступе в обе нет — это master-slave репликация только?

danx Aug 29 2011 at 21:22

В нашем проекте используется master-slave модель, когда данные пишутся только в master базу и реплицируются на находящуюся в hot standby вторичную базу.

Отвечу сразу на вопрос Lolka — при временном обрыве соединения между базами изменения в master базе накапливаются в служебных таблицах SymmetricDS, и при возобновлении соединения они загоняются в secondary db.

Вопрос об разрешении конфликтов при мультимастерной конфигурации, думаю, это тема отдельного поста. Пока же скажу, что симметрик умеет изменять запрос INSERT на UPDATE в случае, если в destination db такая запись уже есть.

LighteR Sep 14 2011 at 12:12

Если вы используете только master-slave, то чем это тогда лучше встроенной в постгрес streaming replication?

el777 Aug 29 2011 at 21:31

К сожалению, полноценной мастер-мастер репликации не существует в природе. См. CAP-теорему Брюэра — это прямо следует оттуда.

Как поведет себя система в такой ситуации:

1> BEGIN;
2> BEGIN;
1> UPDATE…
2> UPDATE той же строки с другими данными
1> COMMIT;
2> COMMIT;

Lolka Aug 30 2011 at 10:20

Да, но можно решать конфликты одним из способов. Например — кто последний, тот и прав. Такое работает, не для всех данных, конечно же.

el777 Aug 30 2011 at 11:47

Это очень важно как он будет себя вести.
Например, rubyrep, так же позионирующийся как мастер-мастер репликатор, тупо падает в этой ситуации. А это, согласитесь, обозначает полную неприменимость.

Давно смотрел на М-М решения, но пока не видел ничего достойного.

440hz Aug 30 2011 at 12:09

тоже мониторим М+М решения. пока ничего не нашли работающего.
=(

Lolka Aug 30 2011 at 12:24

У меня работает уже второй год Bucardo в режиме асинхронной М-М для двух серверов в разных городах. С падениями канала справляется. Конфликты решаются по методу latest. Всё работает без сбоев. «Трафик» по запросам правда совсем маленький — до 50k запросов (update, insert, delete) в сутки.

440hz Aug 30 2011 at 10:29

БД более 300G. продакшен. работаем на master-slave реплике (hot_standby WAL) + pgpool для отказоустойчивости. полет нормальный. отставание практически незаметное. pgpool допилен немного скриптами для грамотного переключения и управления нодами.

так же есть балансировка нагрузки. на slave летит 99% SELECT.

el777 Aug 30 2011 at 11:48

Какая у вас версия PG?

Как осуществляется переключение при выходе из строя мастера?

440hz Aug 30 2011 at 12:08

схема такая.

pgpool. 2 сервера под HA.

pgcluster. 2 сервера master-slave. все запросы идут через pgpool. он же переключает master-slave.

есть скрипты ручной/автоматической синхронизации мастера со слейвами.

на тестовом стенде делали 1 мастер 2 слейва. все прекрасно синкается, переключается, обрабатывается. отставания нод практически нет.

работает все под серверами ubuntu + pgpoolIII ( 2 проца. 2Г памяти)+ pgbonucer+pg9.0.4 (8 проц. 40Г память)

нагрузка порядка 100-200 коннектов на PG. 1000-1500 на бонусерах и пуле в сек.

п.с. в принципе есть дока… могу куда-нить выложить… наверное… =)

el777 Aug 30 2011 at 14:24

Интересно. Выложите :)

Как пгпул переключает слейвы? Не нужно как-то явно говорить, что такой-то слейв теперь стал мастером?
Во всяком случае в слоне так — и он просто запрещает запись на слейв сервер.

440hz Aug 30 2011 at 14:39

pgpool мониторит сервера и при отказе запускает скрипт, который и возвращает ему мастера.

el777 Aug 30 2011 at 14:41

Мы поостереглись делать автоматическое переключение мастера — т.к. в случае временных перебоев или еще каких сетевых проблем, начнется переконфигурация кластера.

440hz Aug 30 2011 at 15:08

с чего она начнется-то?

1. падает мастер.
2. pgpool делает slave мастером. в случае нескольких слейвов запускается синхронизация с новым мастером.

даже если старый мастер поднимется он не включиться в текущую схему. его можно только принудительно сделать слейвом и так же принудительно включить в кластер.

где-же тут конфликты?

el777 Aug 31 2011 at 10:07

Представим, что где-то возник таймаут — например, за счет перебоев в сети, скачка нагрузки, где-то своп подкачался и пр. — причин может быть масса.
После этого скрипт считает, что мастер пропал — тут же все переключается на слейв. Затем мастер появился, но работать уже не может — т.к. он рассинхронизирован. Таким образом из рабочей конфигурации вы потеряли 1 сервер БД. Конфигурация ослабла. Если будет скачок нагрузки, то есть риск вылета еще одного сервера таким же макаром, а дальше все будет «складываться» как домино.

440hz Aug 31 2011 at 10:30

надо понимать, что это все-таки псевдо-кластер. да. с большим отказом, но есть узкие места.
=)

при переходе на нового мастера, слейвы должны будут посинкаться с новым мастером. старый мастер стать слейвом и тоже посинкаться. в общем есть там слабые места. есть. не спорю, но это лучше чем вообще ничего и если надо обеспечить 24Хх7 то это хоть что-то при отказах, а не тупое «БД не доступна».

440hz Aug 31 2011 at 10:31

момент переключения очень слабое место в таком конфиге. да. но пока нет ничего лучше.

440hz Aug 30 2011 at 14:40

все в автоматическом режиме. сиди, кури…
=)

el777 Aug 30 2011 at 14:41

Если это все еще развалится в автоматическом режиме :)

440hz Aug 30 2011 at 15:08

это с чего бы?

vasilisc Aug 30 2011 at 10:36

хорошая статья спасибо
позвольте поумничать
«Сервера должны пинговать друг друга, потому что SymmetricDS использует HTTP протокол для синхронизации. „
пинг это ICMP протокол, а HTTP — это другой протокол.
можно сделать чтобы сервера не пингались, а HTTP работает =)
[/умничать]

Show the best of all time