oldadmin Dec 19 2020 at 16:08

Использование journalctl для просмотра и анализа логов: подробный гайд

6 min

167K

RUVDS.com corporate blogServer optimization*Server Administration*Cloud services*Lifehacks for geeks

Tutorial

+60

Comments 25

justhabrauser Dec 19 2020 at 22:25

Век живи — век учись.
Статья отличная, автору респектище.
PS. внезапно в RUVDS есть нормальные авторы (один шт.), а не только ~~«кунг-фу...»~~ чтецы манов вслух.

dlinyj Dec 20 2020 at 12:58

Справедливости ради, всё это есть в манах по journald

justhabrauser Dec 20 2020 at 13:15

Я больше скажу — в манах вообще практически всё есть.
Надо просто их почитать.
Все 14694 штуки например (только-что на своей машине посчитал).

ogost Dec 19 2020 at 22:59

Он до сих пор не умеет чистить логи отдельных юнитов? А поиск?

pansa Dec 19 2020 at 23:30

Не отношусь к хейтерам systemd, но journald получился у них не очень. Конкретные предъявы такие: 1) структурированные данные дело полезное, но плата за это — оверхед места = 2 порядка (x100) по сравнению с обычными текстовыми логами. Поэтому если у вас много логов, то готовьте или много места или подключайте старый-добрый ( r ) syslog.
2) Нет возможности хранить логи раздельно по службам. Т.е нжинкс в один файл, мускуль — в другой и тп. Т.е имеем вариант только, когда все селёдки в одной бочке. Опять же, на десктопе мне без разницы, а на прод серверах это неудобно, особенно, с учетом п.1, когда какой-нибудь говорливый сервис вымывает другие логи. И это эпик фейл.

А logrotate как бы и до journald работает уже 100 лет в обед и есть не просит.

Pavel1114 Dec 20 2020 at 04:20

По поводу первого пункта. Удобство часто требует оверхэд. Это нормально. К счастью живём в мире где дисковое пространство достаточно дешёвое.

kt97679 Dec 20 2020 at 04:33

Не у всех компьютеров есть физический диск.

pansa Dec 21 2020 at 02:29

Удобство требует, но понятие "достаточно" не имеет смысла без уточнения для чего именно. Если у вас сервер в облаке, то оверхед за удобство может превратиться в круглую сумму в конвертируемой валюте. Если у вас VPS с диском 50-100 гб, то какая-нибудь внезапная ошибка, приводящая к спаму в логи может уложить весь раздел с логами. И хорошо, если они раздел сделан отдельно от общего.
А конкретно у нас была необходимость хранить несколько недель относительно говорливых сервисов. На сервере были диски на несколько Тб, но их хватало для хранения менее, чем 1 неделя. А нужно было больше. Переход на 10тб диски несет в себе не только финансовые затраты, это совсем другие затраты на ребилд, например, и в разы другая надежность.

VolCh Dec 20 2020 at 04:48

Вот с службами, это, да, очень неудобно. Особенно когда логи nginx и mysql — это по сути логи целевого приложения сервера, а не общесистемные.

hottabxp Dec 20 2020 at 08:10

Экспериментируя с Linux, заметил такой эффект — если вручную удалить все файлы журналов, то компьютер потом работает быстрее (вернее, открытие директорий). Это заметно на слабом пк с hdd. Потом, после нескольких дней активного использования linux производительность падает (но это незаметно до очистки директории).

dlinyj Dec 20 2020 at 13:28

Можно настроить правила, чтобы журналы чистились автоматически.

JPEGEC Dec 20 2020 at 14:21

Представьте, что вам приходится иметь дело с проблемным сервером, который даже не загружается — в таком случае можно загрузиться с live-дистрибутива, смонтировать системный раздел и просмотреть логи systemd, чтобы понять, в чем проблема.

И чем это отличается от варианта с syslog? :)

DerRotBaron Dec 20 2020 at 15:31

На всякий случай у journald лучше включать ForwardToSyslog, если на машине есть достаточный запас IO на диск с логами. Обычно в случае падений текстовые логи намного более восстановимы, чем бинарные

HiMem-74 Dec 21 2020 at 11:04

С помощью этой тулзы можно ответить на вопрос: «кто и когда удалил файлы из %этого% каталога»? «Что и откуда именно удалил %пользователь%»?
Просто посмотреть «логи за конкретную дату» малоинформативно.

maledog Dec 21 2020 at 13:32

С помощью этой тулзы можно ответить на вопрос: «кто и когда удалил файлы из %этого% каталога»? «Что и откуда именно удалил %пользователь%»?

Я тоже не сторонник сабжа, но это уже скорее аудит файловой системы, и для этого есть другие средства. Все зависит от конкретной задачи. Например, если у вас файлопомоечка на samba, то там есть встроенные модули аудита и даже «Корзина» для удаленных файлов. Если нужно мониторить всю файловую систему или каталоги, то есть несколько утилит и библиотек для inotify, например inotify-utils, iwatch. Или можно написать свой кастом на fsnotify.

VolCh Dec 21 2020 at 14:42

Тут вопрос, наверное, больше про то, что аудит есть, в логи пишется кто-что сделал, но хотелось бы фильтровать по конкретным полям, а не тупо грепать

maledog Dec 21 2020 at 14:55

Не знаю как в systemd(не сторонник), но в rsyslog поля настраиваемые + можно выводить логи в отдельные файлы. И почему grep тупо?

VolCh Dec 21 2020 at 21:24

Например, дат у вас в записи лога 10, а вам нужна конкретная типа created_at

maledog Dec 22 2020 at 00:08

Вы формат даты в логе видите? Вы думаю можете grep отсортировать даты с глубиной до 10 секунд. Там где не справится grep помогут sed и awk. Но даже grep может делать выборку по нескольким условиям объединяя их AND/OR/NOT. Производительность этого метода конечно будет сильно зависеть от того, как вы построите сортировку, но всяко в сотни раз быстрее, чем фильтр в журнале сообщений windows, который миллион событий может несколько секунд сортировать.

VolCh Dec 22 2020 at 13:22

Дело не в нескольких условиях, а в том, что греп и ко тупо ищет соответствие текстовой строки паттерну. Поддержка семантики только на уровне границ слова и т. п. и именованных областей. Для него не существует даже чисел, только последовательности цифр максимум. Я уж молчу про поля, атрибуты и т. п.

slimlv Dec 21 2020 at 23:44

Какой-нибудь встроенный grep по тексту сообщений, желательно с pcre, уже подвезли ?

VolCh Dec 22 2020 at 13:23

пайпы работают )

slimlv Dec 23 2020 at 18:02

syslog-ng работает

bestia Dec 23 2020 at 19:02

-g, --grep=
Filter output to entries where the MESSAGE= field matches the specified regular expression. PERL-compatible
regular expressions are used, see pcre2pattern(3) for a detailed description of the syntax.

Ru6aKa Jul 23 2023 at 23:30

В гайде забыли рассказать про "-o verbose" где можно посмотреть переменные и их названия чтобы потом фильтровать, например для фильтрации журналов из директории по _MACHINE_ID journalctl -D /var/log/journal/remote _MACHINE_ID=... -u ssh