Articles / Bookmarks / Profile of 1000tour / Habr

dk @1000tour

Пользователь

Profile Publications Comments 12Bookmarks 1.3K

Kilor Apr 2 at 12:50

Курс «PostgreSQL для начинающих»: #4 — Анализ запросов (ч.1 — как и зачем читать планы)

Medium

16 min

18K

PostgreSQL*System Analysis and Design*SQL*Database Administration*Тензор corporate blog

Tutorial

Продолжаю публикацию расширенных транскриптов лекционного курса "PostgreSQL для начинающих", подготовленного мной в рамках "Школы backend-разработчика" в "Тензоре".

В этой лекции мы узнаем, что такое план выполнения запроса, как и зачем его читать (и почему это совсем непросто), и о каких проблемах с производительностью базы он может сигнализировать. Разберем, что такое Seq Scan, Bitmap Heap Scan, Index Scan и почему Index Only Scan бывает нехорош, чем отличается Materialize от Memoize, а Gather Merge от "просто" Gather.

Как обычно, для предпочитающих смотреть и слушать, а не читать - доступна видеозапись (часть 1, часть 2).

+36

Razoomnick Mar 24 at 06:25

Как устроена наша PIM-система, и почему мы не используем ни реакт, ни микросервисы

Medium

12 min

9.5K

System Analysis and Design*.NET*Development for e-commerce*E-commerce management*Start-up development

Review

Пара слов обо мне. У меня никогда не было серьезного плана делать свой продукт, открывать под это дело компанию, погружаться в custdev и вот это вот всё. Днем я работал в сеньёр девелопером, по вечерам - делал pet-проекты типа онлайн версии настольной игры или онлайн-редактора пиксель-арта, и все было хорошо.

Но в какой-то момент так совпало, что вопрос с жильем был решен, была накоплена финансовая подушка на пару лет и подвернулся интересный, как мне показалось, проект. Свою лепту также внес мой друг, который вложил в мою голову мысль, что со временем мы стареем, хуже учимся, труднее воспринимаем новую информацию, и чем дальше, тем будет хуже. Так что если я не хочу всю жизнь в найме провести - то вот подходящее время, когда и опыт уже есть, и силы еще есть.

В общем, мы разрабатываем PIM-систему catalog.app, и я оказался ответственным за весь процесс, начиная от общения с клиентами и формирования требований и заканчивая оптимизацией SQL запросов. В этой статье я расскажу, как наша система устроена внутри, и постараюсь обосновать, почему были выбраны именно такие подходы и инструменты, как у нас организован процесс разработки.

У нас нет кубернетеса, кликхауса, реакта, бессерверных вычислений, рэббит эмкью, кафки, кибаны, графаны, дженкинса, ноды, эластика, и много чего ещё нет. Зато есть дотнет последней версии, энтити фреймворк, нгинкс и шваггер. Я постараюсь рассказать, как и почему мы дошли до такой жизни, и жизнь ли это.

Вы не подумайте, все то, что перечислено выше и чего у нас нет, я считаю прекрасными инструментами (кроме ноды, нода ужасна), и со многим когда-то имел дело. Но любая сторонняя зависимость, а особенно инфраструктурная зависимость, имеет свою цену, и я искренне считаю, что на этом этапе развития проекта не все зависимости нам по карману. Возможно, в комментариях будет порция обоснованной критики по выбору технологий, мы постараемся к ней прислушаться.

+33

eivanov Mar 20 at 11:07

Когда одного Postgres'a мало: сравнение производительности PostgreSQL и распределенных СУБД

Hard

12 min

11K

High performance*PostgreSQL*Database Administration*Distributed systems*YDB corporate blog

Translation

Общеизвестно, что PostgreSQL - крайне эффективная СУБД с богатой функциональностью. При этом не секрет, что PostgreSQL масштабируется только вертикально и её производительность ограничена возможностями одного сервера.

Написано много хороших постов, в которых сравнивают архитектуру монолитных и распределенных СУБД. К сожалению, обычно авторы ограничиваются теоретическим сравнением и не приводят конкретные цифры. Данный пост же наоборот основан на эмпирическом исследовании с использованием бенчмарка TPC-C, который является промышленным стандартом для оценки производительности транзакционных СУБД (On-Line Transaction Processing, OLTP).

Мы расскажем, когда именно одного Postgres'a становится мало, и какие возможны компромиссы между производительностью и надежностью. Для тех, кто не готов к компромиссам, мы покажем, что могут предложить такие распределенные СУБД, как CockroachDB и YDB.

+27

alexmusyka Mar 5 at 21:58

Obsidian. Путь от простой структуры к сложной и обратно. Часть 2

Medium

9 min

12K

Studying in ITPopular scienceSoftwareLifehacks for geeks

Tutorial

Первая часть статьи описывает возростание сложности системы, за счёт постоянного увеличения сбора метрик, задач и конечно же используемых плагинов

Закончилось это всё не очень хорошо, так заполнение "ежедневной рутины" усложнилось настолько, что заполнять её уже не хотелось. Поэтому критической задачей стало упрощение (идём обратно) в местах где сложность излишняя и автоматизация в местах, где есть лишние 2-3 клика.

Попробуем теперь всё упросить...

P.S. Как у любого новоиспечённого автора, у меня после написания первой статьи появился тг-канал. Милости прошу. Там пишу чаще, проще и более свободно. Формат статьи всё-таки сдерживает в каких-то рамках повествования.

miruzzy Mar 3 at 21:45

PostgreSQL: обеспечение уникальности записи с проверкой даты валидности

2 min

3.6K

Website development*PostgreSQL*Programming*SQL*Karuna corporate blog

Как бы вы решали такую задачу? Предположим, есть таблица с купонами, и у купонов есть некая дата устаревания valid_until. Вам надо обеспечить такое ограничение (constraint) на уровне БД, чтобы у одного человека мог быть только один действующий купон.

Т.е., таблица изначально выглядит так:

CREATE TABLE coupons (
    id  bigint primary key generated by default as identity,
    user_id bigint not null,
    created_at timestamp not null,
    valid_until timestamp not null
)

Читать дальше →

+12

mizhka Feb 20 at 12:00

Мифы и реалии «Мультимастера» в архитектуре СУБД PostgreSQL. Часть. 1

12 min

9.9K

System administration*PostgreSQL*Database Administration*Postgres Professional corporate blog

Привет, Хабр! Недавно мы делали доклад на конференции HighLoad 2023 — «Мифы и реалии Мультимастера в архитектуре СУБД PostgreSQL». Мы — это Павел Конотопов (@kakoka) и Михаил Жилин (@mizhka), сотрудники компании Postgres Professional. Павел занимается архитектурой построения отказоустойчивых кластеров, а Михаил — анализом производительности СУБД. У каждого за плечами более десяти лет опыта в своей области.

Порассуждаем о том, как развивалась технология «Мультимастер» в экосистеме PostgreSQL, остановимся на том, что она из себя представляет, на каких внутренних механизмах PostgreSQL основана и как её можно использовать.

Мы также поговорим о том, существует ли «Честный Мультимастер» (само понятие «Честный Мультимастер» достаточно специфично и в основном употребляется в кругу разработчиков), какие реализации у него есть и как его следует применять.

+40

sergepetrenko Feb 19 at 12:34

Во что обойдется линеаризуемость в распределенной системе

Medium

12 min

High performance*VK corporate blogDatabase Administration*Distributed systems*Tarantool*

Всем привет, меня зовут Сергей Петренко, я программист в Tarantool. Сегодня мы посмотрим, с какими трудностями сталкивается клиент, когда вместо того чтобы общаться с системой, расположенной на одном инстансе, начинает общаться с распределенной системой. И разумеется, поговорим о том, как эти трудности преодолеть. Я расскажу, что такое линеаризуемость, как мы ее реализуем в Tarantool и как это делают другие СУБД. В завершение мы поговорим о накладных расходах от линеаризуемости.

Читать дальше →

+59

justnikobird Feb 14 at 19:39

Проект юного DevOps Глава 1: Введение и подготовка стенда

Medium

16 min

16K

Configuring Linux*System administration*Network technologies*Server Administration*DevOps*

Tutorial

В данной серии статей описан процесс создания первого pet-проекта для начинающего инженера в DevOps:

Глава 1: Введение и подготовка стенда

Глава 2: Настройка центра сертификации и репозитория

Глава 3: Настройка OpenVPN

Глава 4: Настройка мониторинга

Vlan-48 Jan 31 at 22:28

Шаг за шагом: Реализация автоматического резервного копирования PostgreSQL в Kubernetes и его синхронная отправка на S3

Medium

27 min

6.5K

Python*DevOps*Kubernetes*

Tutorial

Привет! У каждого из нас бывает что после какой-то задачи, ты хочешь чем-то поделиться. Но зачастую мотивации хватает только на поделиться в рамках внутреннего Confluence. Сейчас, я реализовал решение которое объявлено в названии статьи. Сразу хотелось бы сказать, что я не претендую на истину в последней инстанции со своим решением, оно просто отражает путь который пройден мной. Более того, СУБД в кластере здесь тоже не предмет для обсуждения.

Читать дальше →

neoflex Jan 15 at 12:02

Особенности партиционирования в PostgreSQL и Apache Hive

11 min

PostgreSQL*SQL*Neoflex corporate blog

Tutorial

Часто специалисты, работающие с классическими реляционными базами данных, например, с PostgreSQL, испытывают затруднения в работе при переходе на систему хранения больших данных типа Apache Hive. Это связано с непониманием того, как можно использовать в новой среде уже наработанные подходы и методы работы с данными.

В данной статье рассмотрены некоторые особенности использования языка SQL в реляционных СУБД и Apache Hive. Кроме того, проведен сравнительный обзор возможностей и подходов, а также применение партиционирования на практике.

Материал будет полезен специалистам младших и средних грейдов, которые используют в своей практике SQL, но имеют мало опыта в Hive или Postgres.

MGorkov Jan 15 at 16:13

Плагин для анализа планов PostgreSQL в IDE JetBrains и его разработка

Medium

11 min

6.5K

PostgreSQL*Java*Тензор corporate blog

Tutorial

Для пользователей explain.tensor.ru - нашего сервиса визуализации PostgreSQL-планов, мы создали плагин "Explain PostgreSQL" для всех IDE от JetBrains, теперь есть возможность форматировать запросы и анализировать планы непосредственно в IDE.

Как использовать плагин и детали о его разработке читайте ниже.

+17

Marat2010 Jan 13 at 03:11

Быстрая установка PostgreSQL (PgAdmin 4, Adminer) на VPS

Medium

3 min

5.6K

Configuring Linux*Website development*PostgreSQL*DevOps*Cloud services*

Tutorial

Быстрая установка PostgreSQL (PgAdmin 4, Adminer) на VPS через docker.

Подключиться к своему VPS по SSH.

Для установки надо перейти на Гитхаб

Скопировать одну команду, вставить в терминале и запустить.

Команды скачает bash скрипт, сделает его исполняемым и запустит его.

После ответить на пару вопросов и все готово.

-8

CHAMPMOON Jan 12 at 14:39

Как оптимизировать медленные SQL запросы?

18 min

27K

MySQL*PostgreSQL*SQL*SQLite*

From sandbox

Translation

Большинство проблем, связанных с БД, во время разработки остаются незамеченными, потому что мы пишем код и проверяем его правильность только при малой "заполненности" нашей БД. Поэтому, когда приложение выкатывается в продакшн, через некоторое время начинают появляться проблемы с производительностью БД, отдельные части приложения начинают работать всё медленнее и медленнее по мере роста самого БД.

Как выявить и отладить такие проблемы? В этой статье будет показано решение наиболее распространённых проблем с производительностью БД, вызванных неправильной индексацией. Примеры будут приведены для Postgres, MySQL и SQLite.

ptr128 Dec 29 2023 at 19:09

Немного про OR в SQL запросах

Easy

6 min

12K

PostgreSQL*SQL*Microsoft SQL Server*

Review

Несмотря на избитость темы и многочисленные рекомендации избегать OR в выражениях WHERE/ON SQL запросов, жизнь вносит свои коррективы. Иногда сама постановка задачи подразумевает необходимость использовать OR. Я не собираюсь здесь рассматривать простые случаи, а сразу возьму быка за рога и рассмотрю случай, когда OR должно привести к двум разным выборкам по разным индексам одной и той же таблицы.

+20

BeQuick Dec 27 2023 at 17:04

Использование Postgres-триггеров для исторических таблиц

Medium

4 min

PostgreSQL*SQL*DevOps*

Review

Translation

В динамичной среде управления базами данных постоянно присутствует необходимость фиксировать и понимать изменения данных с течением времени. Начните управлять временем с использованием Postgres-триггеров, которые открывают легкий путь к сложному решению — историческим таблицам.

Представьте себе мир, в котором каждое изменение вашей базы данных оставляет след, фиксирующую эволюцию ваших данных. В этом заключаются перспективы исторических таблиц — концепции, которая выходит за рамки традиционных ограничений проектирования баз данных. В этом исследовании мы углубимся во временное измерение PostgreSQL, раскроем возможности Postgres-триггеров и их ключевую роль в создании и обслуживании исторических таблиц.

+11

artydev Dec 22 2023 at 14:51

PostgreSQL: вернуть место после delete

Easy

3 min

9.5K

PostgreSQL*SQL*

Case

У вас есть таблицы, либо ряд таблиц, строки которых нужно очистить и единственный способ, которым вы можете это сделать - это операция DELETE.

Помимо очевидной цели - очистки ненужных данных из таблицы, хотелось бы также увеличить свободное место в области диска, доступного для данных postgresql. Но при определенных условиях - операция DELETE не возвращает место, а операция UPDATE дополнительно его забирает.

gle4er Dec 22 2023 at 12:53

Архивная репликация в PostgreSQL: пошаговая инструкция

9 min

7.6K

PostgreSQL*Database Administration*AvitoTech corporate blog

Разбираем c Григорием Тарасенко, инженером команды SQL на примере, как реплицировать базы без использования слотов репликации.

+10

AlexGriss Dec 12 2023 at 22:33

Эмуляция бэкенда: как разрабатывать изолированный фронтенд с помощью Mock Service Worker

Medium

8 min

Website development*JavaScript*API*Debugging*Web services testing*

FAQ

Всем привет! Сегодня я хочу рассказать о Mock Service Worker — технологии, которая позволяет эмулировать поведение бэкенда в ситуациях, когда по каким-то причинам невозможно использовать реальный бэкенд для полноценной разработки фронтенда, а также когда необходимо изолированно протестировать различные пользовательские сценарии. Тем более, что совсем недавно вышла новая мажорная версия библиотеки msw, и в ней достаточно много важных обновлений.

Kilor Nov 28 2023 at 10:20

SQL HowTo: TOP-N на субинтервалах

Easy

3 min

4.4K

High performance*PostgreSQL*SQL*Database Administration*Тензор corporate blog

Case

Периодически сталкиваюсь с однотипными задачами вида "показать TOP-N позиций на каждом из вложенных интервалов некоторого периода".

Это может быть "5 лучших по успеваемости студентов в каждом семестре за последний учебный год", или "помесячная динамика позиции 10 наиболее продающихся товаров", или, как у нас в сервисе визуализации PostgreSQL-планов explain.tensor.ru, "3 наиболее активных страны за каждый день":

+11

2 3 ...

62 63

Курс «PostgreSQL для начинающих»: #4 — Анализ запросов (ч.1 — как и зачем читать планы)

Как устроена наша PIM-система, и почему мы не используем ни реакт, ни микросервисы

Когда одного Postgres'a мало: сравнение производительности PostgreSQL и распределенных СУБД

Obsidian. Путь от простой структуры к сложной и обратно. Часть 2

Рекомендации при работе с PostgreSQL

PostgreSQL: обеспечение уникальности записи с проверкой даты валидности

Мифы и реалии «Мультимастера» в архитектуре СУБД PostgreSQL. Часть. 1

Во что обойдется линеаризуемость в распределенной системе

Проект юного DevOps Глава 1: Введение и подготовка стенда

Шаг за шагом: Реализация автоматического резервного копирования PostgreSQL в Kubernetes и его синхронная отправка на S3

Особенности партиционирования в PostgreSQL и Apache Hive

Плагин для анализа планов PostgreSQL в IDE JetBrains и его разработка

Быстрая установка PostgreSQL (PgAdmin 4, Adminer) на VPS

Как оптимизировать медленные SQL запросы?

Немного про OR в SQL запросах

Использование Postgres-триггеров для исторических таблиц

PostgreSQL: вернуть место после delete

Архивная репликация в PostgreSQL: пошаговая инструкция

Эмуляция бэкенда: как разрабатывать изолированный фронтенд с помощью Mock Service Worker

SQL HowTo: TOP-N на субинтервалах

Information