Пользователь
0,0
рейтинг
9 апреля 2008 в 22:42

Дизайн → Всё (или почти всё) о пробеле

Как следует из заголовка, речь в статье пойдёт о неотъемлемой части любого русскоязычного (и не только) текста — о пробеле. Мы затронем историю пробела, виды пробелов, вопросы употребления пробела в веб-типографике.

Вообще говоря, пробел — это любое пустое место в рукописном, печатном или отображаемом на любом другом носителе тексте. Так что пробелы бывают разные:
  • спусковые (большие вертикальные пропуски в первой полосе издания) и концевые пробелы полосы,
  • абзацные отступы и концевые пробелы абзаца,
  • межстрочные пробелы (между строками текста),
  • межсловные пробелы (между словами в одной строке),
  • межбуквенные пробелы (между буквами в слове).
Далее речь пойдёт о межсловных пробелах, разделяющих слова, и функционально принадлежащих к знакам препинания.

История межсловного пробела

Межсловный пробел — сравнительно позднее изобретении в истории человеческой мысли. Глубоко история пробела изложена в книге Пола Санджера (Paul Saenger) «Space between Words: The Origins of Silent Reading», а также, несколько менее глубоко, в книге Иоганнеса Фридриха «История письма».

Также есть неплохая статья Антона Бизяева о пробелах и об их истории «В начале пробелов не было», которая была опубликована в 1997 году в журнале «Publish».

Вкратце, пробел появился достаточно поздно, в тех письменностях, где отсутствие разграничения слов приводило к сложности чтения (так называемое консонантное письмо, где записываются только согласные звуки). Однако в греческом и латыни, в которых записывали и гласные звуки, использование пробела было утеряно. Пол Санджер связывает это с тем, что чтение производилось вслух, что упрощало разграничение слов при восприятии текста.

Вновь пробел начал использоваться приблизительно в VII—IX вв. н. э., и эта традиция пришла из Ирландии, где у писцов и чтецов родным языком являлся древнеирландский, а религиозная литература записывалась на латыни. По-видимому, по этой причине монахи испытывали трудности с чтением вслух. Считается, что появление пробела плотно связано с постепенным переходом от чтения вслух к чтению про себя. Примерами книг на латыни с межсловными пробелами являются памятники британской литературы: Евангелие из Дарроу (VII в.) и Келлская книга (VIII—IX вв.).

В глаголице и кириллице пробел также отсутствовал, и в привычном нам смысле используется только с XVII века.

До того, как человечество изобрело наборный шрифт, никакой особенной классификации межсловных пробелов не было — ставили писцы пробелы на глазок и ставили. Напомню (мы писали об этом в статье «Выключка по ширине»), что рукопись и ксиллография относятся к способам создания текстов без подвижности литер. Естественно, пробелы могли получаться различной ширины, так как пропуски делались вручную.

Пробелы в ручном наборе


Когда подвижность литер появилась (а произошло это с появлением наборных шрифтов), появились соответственно и вопросы — а как же ставить пробелы, чтобы соблюдалась выключка по ширине?

Технология ручного набора такова, что набранная строка полностью зажимается в верстатке и в гранке, и, соответственно, должна иметь ширину, практически точно равную ширине полосы (подробнее с технологией ручного набора можно познакомиться в одноимённой книге М. В. Шульмейстера).

Строка при ручном наборе набиралась из литер (брусков, на торце которых делались выпуклые зеркальные копии букв, отпечатывающиеся на бумаге), а межсловные пробелы создавались с помощью так называемых шпаций — брусков различной толщины, у которых на торце нет печатающей поверхности. Выглядит это примерно вот так. Шпации для каждого кегля шрифта, естественно, выпускались свои, и имели различную ширину. Например, для шрифта кегля 10 пунктов (стандартный кегль для большинства текстовых изданий) выпускались шпации шириной 10, 5, 4, 3, 2 и 1 пункт.

Шпации шириной в кегль назывались кегельными или круглыми. Шпации в половину кегельной назывались полукегельными или полукруглыми. Также существует название «тонкая шпация», под которой понимают шпации толщиной 1—2 пункта для шрифта кегля 8—12 пунктов. То есть, для шрифта кегля 10 пунктов тонкая шпация обычно составляет 2 пункта (соответственно, 1⁄5 кегельной). Однако, в связи с отсутствием точного определения тонкой шпации, в руководствах издателя, редактора и верстальщика обычно говорят не об отбивке на тонкую шпацию, а об отбивке на столько-то пунктов (считая, что кегль шрифта равен 10 пунктам).

Таким образом, нужно понимать, что в зависимости от кегля шрифта доля круглой шпации (треть, четверть и т. п.) может иметь разную ширину в пунктах, и наоборот.

Традиционная ширина межсловного пробела


Итак, разобравшись с тем, что такое круглая и полукруглая шпации, перейдём к принятой в российском наборе ширине собственно межсловного пробела.

Шульмейстер пишет (стр. 94), что при наборе строки между словами ставится полукруглая. Когда строка набрана до конца, в большинстве случаев её ширина оказывается либо меньше, либо больше ширины полосы набора. Поэтому верстальщику приходится изменять ширину пробелов, уменьшая её минимум до 1⁄4 круглой и увеличивая максимум до 3⁄4 круглой (соответственно, при наборе кеглем 10 пунктов межсловные пробелы могут варьироваться от 3 до 7 пунктов). Естественно, бывают нюансы, зависящие от формата издания, но мы их касаться не будем.

Однако, Шульмейстер оговаривается, что сам по себе межсловный пробел в полукруглую великоват, и использование стандартного пробела в 1⁄3 круглой является как более экономичным с точки зрения расхода бумаги, так зачастую и более красивым. Также использование межсловного пробела в полукруглую не рекомендуется для узких шрифтов.

С появлением строкоотливных машин пробелы стали делаться равномерными по ширине в пределах одной строки, а ширина межсловного пробела стала варьироваться около 1⁄3 круглой.

Компьютерный набор и веб-типографика

В настоящее время мы ограничены возможностями используемых шрифтов, и, естественно, набором символов в Unicode. Нужно помнить, что далеко не все шрифты содержат большинство пробельных Unicode-символов.

При переходе к компьютерным системам вёрстки был совершён переход от указания ширины шпаций в пунктах к указанию ширины шпаций в долях круглой, так как шрифты стали легко масштабироваться до любого кегля, а пробельные элементы должны были оставаться пропорциональными кеглю шрифта.

Символы пробела в Unicode


В Unicode предусмотрены следующие символы для пробелов западной типографики.
  • Межсловный пробел, U+0020,   — ширина от 1⁄5 до 1⁄2 круглой в зависимости от шрифта. Для средних шрифтов межсловный пробел имеет ширину порядка 1⁄4 круглой (например, Times New Roman имеет именно такой пробел), для широких — порядка 1⁄3 круглой (Microsoft Verdana — 0,35 круглой, Microsoft Tahoma — 0,31 круглой).
  • Неразрывный межсловный пробел, U+00A0,   — имеет ту же ширину, что и обычный межсловный пробел, но в месте неразрывного пробела запрещён разрыв строки.
Обычный и неразрывный межсловный пробелы входят в любой шрифт и правильно отображаются всеми агентами, если не считать отсутствия увеличения и уменьшения неразрывного пробела при выключке по ширине в некоторых текстовых процессорах и браузерах (что является нарушением рекомендаций). Например, FireFox правильно масштабирует неразрывные пробелы, а MSIE 7.0 не масштабирует их вовсе.

Все остальные пробельные символы имеют фиксированную ширину и не растягиваются при выключке строк по ширине. Вместе с тем, согласно алгоритму разрыва строк в Unicode, все они должны обрабатываться как точка разрыва строки.
  • Круглая шпация, U+2003,   — как было сказано, имеет ширину, равную размеру кегля. Также называется Em Space, возможно, потому что буква «M» в каких-либо старых шрифтах имела такую ширину. Вместе с тем, сейчас это выполняется далеко не везде, и поэтому утверждение, что Em Space всегда имеет ширину буквы «M» — заблуждение.
  • Полукруглая шпация, U+2002,   — половина круглой. Также называется En Space, возможно, потому что буква «N» в каких-либо старых шрифтах имела такую ширину. Вместе с тем, сейчас это выполняется далеко не везде, и поэтому утверждение, что En Space всегда имеет ширину буквы «N» — заблуждение.
  • Третная шпация, U+2004,   — треть круглой. По-английски называется Three-per-Em Space.
  • Четвертная шпация, U+2005,   — четверть круглой. По-английски называется Four-per-Em Space.
  • Одна шестая круглой, U+2006,  . По-английски называется Six-per-Em Space.
  • Тонкая шпация, U+2009,   — обычно имеет ширину в 1⁄5 круглой (реже — 1⁄6). Вообще говоря, её ширина зависит от языка набора и производителя шрифта, и в кириллических шрифтах тонкая шпация обычно имеет ширину в 1⁄5 круглой. Эта шпация по пропорциям в точности соответствует двухпунктовой шпации при наборе кеглем в 10 пунктов. По-английски называется Thin Space.
  • Волосяная шпация, U+200A,   — самая узкая шпация, шириной около 1⁄10—1⁄16 круглой. Такая шпация по пропорциям примерно соответствует однопунктовой шпации при наборе кеглем в 10 пунктов или выглядит даже у́же.

Использование различных пробелов


Поскольку ширина межсловного пробела фиксирована в шрифте и изменяется автоматически при выключке по ширине, использование других пробельных символов в качестве межсловных оправдано только при наборе печатных изданий, и только при наличии глубокого понимания, для чего это делается.

В обычной вёрстке для веба для разделения слов достаточно пользоваться обычными и неразрывными межсловными пробелами.

Вместе  тем, по правилам русскоязычной типографики в ряде мест должна использоваться тонкая шпация (точнее, в справочниках написано о двухпунктовой шпации, но мы будем употреблять термин «тонкая шпация» как наиболее соответствующий и с точки зрения устоявшейся терминологии, и с точки зрения внешнего вида строки при наборе).

Основные правила использования пробелов будут описаны ниже, но в целом мы рекомендуем следующий принцип для использования при вёрстке для веба.

При подготовке документов в формате HTML для публикации в Интернете в качестве пробельных элементов должны использоваться только пробел, неразрывный пробел   и тонкая шпация  . В том случае, если автор предполагает, что страница должна просматриваться с помощью агентов, некорректно обрабатывающих символ  , то вместо тонкой шпации должен использоваться обычный или неразрывный пробел.

Использование только тонкой шпации из всего разнообразия пробельных элементов позволяет, во-первых, сохранить гармоничный вид набранного текста, а во-вторых, не перегружать автора публикации разнообразными правилами употребления шпаций различной дробной ширины.

Обработка пробелов браузерами и поисковиками


При подготовке материала статьи мы провели своеобразный эксперимент на специально подготовленной странице. Яндекс и Google справляются с нестандартными символами хорошо, заменяя при поиске все нестандартные пробельные элементы на обычные (мы считаем, что это — правильное поведение). То есть, они не делают разницы между текстами «два слова», «два  слова», «два  слова» и т. п.

Как выяснилось, рендеринг нестандартных пробельных элементов работает в браузерах из рук вон плохо. Нормально справляются с задачей только Firefox 3.0 в Windows XP и *nix, MSIE 7.0 и Safari в Windows XP. Об MSIE 8.0 данных нет, но скорее всего, у него тоже всё в порядке.
  • Firefox до версии 3.0 вообще не разрывает строку в местах нестандартных пробелов. При этом ширина пробелов отображается правильно.
  • Opera 9.26 и 9.50, FireFox 3.0 под Mac, Safari под Mac строку переносят, но зато все пробелы оказываются одной ширины.
  • MSIE 5.5 и 6.0 под Windows 2000 вместо пробелов ставят квадратики (возможно, соответствующие символы просто отсутствуют в системном шрифте).
Не вполне понятно, с чем связана одинаковая ширина всех пробельных элементов во всех браузерах под Mac. Вероятно, со встроенными шрифтами.

Основные правила употребления пробелов

Итак, ещё раз подчеркнём, что во всех правилах, перечисленных ниже, тонкая шпация   используется только в том случае, когда автор отметает риск использования посетителем сайта браузеров, неверно отображающих тонкую шпацию. К ним относятся некоторые браузеры в *nix (возможно, это связано со встроенными шрифтами), MSIE версии 6.0 и раньше, браузеры для Mac (ими можно пренебречь, так как ошибка рендеринга заключается только в ширине шпации), возможно — некоторые браузеры для мобильных телефонов и КПК.

В том случае, если использование таких браузеров вероятно, мы рекомендуем использовать вместо тонкой шпации обычный или неразрывный межсловный пробелы.

Как было описано выше, согласно рекомендациям Unicode тонкая шпация является таким пробелом, где возможен разрыв строки. В тех случаях, когда правила требуют постановки тонкой шпации и запрета разрыва строки (например, между разрядами при наборе числа), необходимо использовать конструкцию типа <span style="white-space: nowrap;">250&thinsp;000</span>. HTML-элемент nobr является проприетарным и к использованию запрещён.

Далее мы опишем те правила расстановки пробелов, которые чаще всего, по нашим наблюдениям, нарушаются при вёрстке текстов. Более подробную информацию о правилах набора текстов можно почерпнуть, например, в «Справочнике издателя и автора» А. Э. Мильчина и Л. К. Чельцовой.

Сокращения и символы

  1. В сокращениях «и так далее», «и тому подобное», «так как», «то есть», «и другие», «до нашей эры», «южной широты» и подобных все элементы сокращения отделяются неразрывным пробелом.
    и т. д. — и&nbsp; т.&nbsp; д.
    и т. п. — и&nbsp; т.&nbsp; п.
    т. к. — т.&nbsp; к.
    т. е. — т.&nbsp; е.
    и др. — и&nbsp; др.
    до н. э. — до&nbsp; н.&nbsp; э.
    ю. ш. — ю.&nbsp; ш.
  2. Инициалы отбиваются друг от друга и от фамилии неразрывным пробелом.
    А. С. Пушкин — А.&nbsp; С.&nbsp; Пушкин
    Дж. Р. Р. Толкиен — Дж.&nbsp; Р.&nbsp; Р.&nbsp; Толкиен

    Допустима также отбивка инициалов друг от друга и от следующей за ним фамилии тонкой шпацией, однако перенос инициалов либо фамилии на следующую строку запрещён. Независимо от выбора стиля отбивки инициалов необходимо придерживаться единства стиля в рамках всего документа или сайта.
    В. В. Путин — В.&thinsp; В.&thinsp; Путин
    В. Путин — В.&thinsp; Путин
    Путин В. В. — Путин&nbsp; В.&thinsp; В.
    Путин В. — Путин&nbsp; В.
  3. Сокращённое слово отбивается от имени собственного неразрывным пробелом.
    ул. Щорса — ул.&nbsp; Щорса
    г. Москва — г.&nbsp; Москва
    метрополитен им. Ленина — метрополитен им.&nbsp; Ленина
  4. Число и соответствующее ему счётное слово отбиваются неразрывным пробелом.
    12 млрд рублей — 12&nbsp; млрд рублей
    гл. IV — гл.&nbsp;IV
    пп. 3—6 — пп.&nbsp;3—6
    рис. 42 — рис.&nbsp;42
    XX в. — XX&nbsp; в.
    1941—1945 гг. — 1941—1945&nbsp; гг.
    палата № 6 — палата №&nbsp;6
    § 22 — §&nbsp;22
    25 % — 25&nbsp;%
    97,5 ? — 97,5&nbsp;?
    16 ¢ — 16&nbsp;¢
    .
  5. Число и соответствующая ему единица измерения (кроме знаков градуса, минуты и секунды) отбиваются тонкой шпацией, разрыв строки запрещён.
    400 м — 400&thinsp; м
    100 т — 100&thinsp; т
    451 °F — 451&thinsp;°F

    но 59°, 57′, 00″.
  6. Знаки градуса, минуты и секунды отбиваются тонкой шпацией от последующих цифр.
    59° 57′ 00″ — 59°&thinsp;57′&thinsp;00″
Нужно учесть, что по поводу отбивки знаков процента и валют в среде типографов нет полностью устоявшегося правила, так что набор знака процента и символов валют вплотную к числу не является ошибкой, если такое употребление проводится единообразно на всём сайте. Однако, мы считаем, что использование пробела в данном случае улучшает читаемость текста.

Числа и интервалы

  1. Дробная и целая части числа не отбиваются пробелом от запятой: 0,62, 345,5.
  2. Разряды числа отбиваются друг от друга тонкой шпацией, кроме дат, номеров (например, документов), обозначений машин и механизмов.
    25 563,42 — 25&thinsp;563,42
    1 652 — 1&thinsp;652
    1 298 300 — 1&thinsp;298&thinsp;300

    но 1999 год, ГОСТ 20283, вх. № 982364
  3. При численном обозначении интервалов тире не отбивается от границ интервала.
    50—100 м — 50—100&thinsp; м
    1 500—2 000 — 1&thinsp;500—2&thinsp;000
    1,5—2 тыс. — 1,5—2&nbsp; тыс.
    15—20 % — 15—20&nbsp;%
  4. Унарные знаки плюс, минус и плюс-минус не отбиваются от следующего за ним числа: +20 °C, −42, ±0,1.
  5. Бинарные знаки математических операций и соотношений отбиваются с обеих сторон на тонкую шпацию.
    2 + 3 = 5 — 2&thinsp;+&thinsp;3&thinsp;=&thinsp;5

Знаки препинания

  1. Точка, запятая, двоеточие, вопросительный и восклицательный знаки, точка с запятой не отбиваются пробелом от предшествующего слова, и отбиваются пробелом от последующего: Ха, ха. Ха? Ха!
  2. Многоточие не отбивается от предшествующего слова, если оно стоит в конце предложения или части предложения, и от последующего — если оно стоит в начале предложения: Ого… Что? …Ничего.
  3. Кавычки не отбиваются пробелами от заключённого в них текста: броненосец «Потёмкин».
  4. Скобки не отбиваются пробелами от заключённого в них текста, и отбиваются пробелами снаружи (кроме того случая, когда закрывающая скобка соседствует с знаком препинания справа): Текст в&nbsp; скобках никому не&nbsp; интересен (обычно).
  5. Тире отбивается от предыдущего слова неразрывным пробелом, а от следующего — обычным пробелом (в том числе и в случае, если интервал указан в словесной, а не цифровой форме).
    Витенька&nbsp;— молодец!
    нам подойдёт только огурец длиной пятнадцать&nbsp;— двадцать сантиметров
    пакт Молотова&nbsp;— Риббентропа
    .
  6. Если два числа в словесной форме не образуют интервал, а означают «то ли одно число, то ли другое», то между ними ставится дефис, который не отбивается пробелами: выпил рюмки две-три.
Существует рекомендация отбивать тире на тонкую шпацию или не отбивать вообще от точки, запятой или кавычки. Это может быть оправдано при наборе печатного текста конкретным шрифтом, так как увеличивает однородность пробелов. В то же время, при просмотре текста для веба шрифты у пользователя могут быть совершенно разнообразными, из-за чего левый от тире пробел постоянно становится уже, чем правый.

Нежелательные переносы

  1. Короткие слова и союзы (а, и, но, я, ты, и так далее) лучше отбивать от последующего слова неразрывным пробелом, так как висящее на конце строки короткое слово ухудшает читаемость. В том числе очень желательно не допускать переноса строки между частицей не и следующим за ней глаголом.
  2. Частицы же, бы, ли желательно отбивать от предыдущего слова неразрывным пробелом: то&nbsp; же, сказал&nbsp; бы, думал&nbsp; ли я.
  3. Желательно не отрывать предлоги в начале предложения от следующих за ними слов. (даже более длинные, чем одно- и двухбуквенные)
Алексей Ёжиков @Heath
карма
220,1
рейтинг 0,0
Пользователь
Реклама помогает поддерживать и развивать наши сервисы

Подробнее
Реклама

Самое читаемое Дизайн

Комментарии (129)

  • +5
    Конкурент посмотреть профиль besisland'a? )
    • +13
      Почему? Совсем наоборот. :)

      Главное — повышение грамотности веб-рабочего населения. Глядишь, сайты станут лучше выглядеть. :)
      • +3
        Я только за, тем более что материал интересный. Спасибо.
        Можно поинтересоваться вашей профессией?

        З.Ы. Предрекаю вам взлет кармы и золото посту. Похоже я опять не туда пишу
        • +2
          Руковожу разработкой и наполнением сайта со стороны заказчика.
        • +1
          За такие статьи таким авторов "ручку позолотить" не мешало бы ;)
          • +4
            Можно публиковать номер кошелька? :)))
            • 0
              Эту идею надо пропагандировать! :)
            • +3
              Нужно. Уже отложил денежку. :)
              Карму два раза поднять не получается, а поощрять авторов таких постов просто необходимо.
              • 0
                Каких таких постов?
                • 0
                  И таких тоже, да. Если оставите кошелёк, то и вам «озолочу ручку». ;)
                  • –1
                    Спасибо, не стоит :) Лучше сделайте предложение, от которого я не смогу отказаться.
                    • 0
                      Самое первое, чего не стоит, — это переоценивать себя. ;)
          • +2
            Не кармой единой… Я постоянно покупаю прессу в поисках конкретной информации, но при штудировании нахожу только две-три статьи, интересующие меня. Почему бы «Люди, которые делают Хабр Хабром» ©, не могут быть вознаграждены? Если я трачу на прессу, то я могу потратиться и на автора понравившейся статьи. Сидение на Хабре сэкономило мне уйму времени и денег, при этом таким количеством полезной информации (даже из комментариев) зачастую не располагает книжная продукция. То, что Вы читаете в книге или журнале было актуально вчера, но не сегодня!
      • 0
        хорошая статья
  • +2
    Кстати, прошу прощения за придирку, но на 94-ой странице о Шульмейстере ни слова... ))
  • НЛО прилетело и опубликовало эту надпись здесь
    • +1
      Спасибо, поправил. У одной шестой — U+2006.
  • НЛО прилетело и опубликовало эту надпись здесь
    • +1
      Вы как-то связаны с контент-менеджментом или дизайном текстовых блоков для полиграфии?
      • НЛО прилетело и опубликовало эту надпись здесь
        • +2
          Так я к тому и вёл, и близко совершенно не принимаю. :) То, что здесь написано, обязан знать любой профессиональный контент-менеджер и дизайнер. Для всех остальных лично она может быть неинтересна. :) Именно поэтому она и находится в блоге «Типографика», а не «Я умный», например.
          • НЛО прилетело и опубликовало эту надпись здесь
        • +2
          А дизайнеров, я так понимаю, должно быть много. В любой студии веб-дизайна должен быть человек, который должен хорошо разбираться в вышеописанном. Иначе эта студия делает плохие с точки зрения типографики работы.
      • НЛО прилетело и опубликовало эту надпись здесь
        • НЛО прилетело и опубликовало эту надпись здесь
        • 0
          то, что вы "принялись к прочтению" - заметно...
        • +2
          Мне кажется, профессиональные статьи о работе с музыкой при помощи электронных устройств и компьютерных программ будут интересны.
          • +1
            Кстати да. Узнавать из первых рук про что-нибудь эдакое лично мне было бы интересно.
            • +1
              Спасибо за ссылку, получил массу удовольствия! Гран мерси!
        • 0
          Давайте заведем топик "САУНД" - с удовольствием буду читать и даже писать. Музыку без высоких технологий сегодня как-то не представляю. Даешь хабрамузыку!
          • 0
            Кстати, топик МУЗЫКА уже есть.
  • 0
    хорошая статья, спасибо, Алексей
    P.S. jan Josa! lipu sona ni li pona, o sitelen ante, o sitelen mute!
    • +1
      toki sina li pona tawa mi. :) mi wile pana e sona mi tawa jan ante. tan ni la lon li kama pona.
      • 0
        ni li pona :)
        • +3
          Надо срочно научить tranlsate.ru переводить с токипоны.
          • +4
            Не получится, язык глубоко контекстный. Гораздо проще и быстрее выучить самому. :)
            • 0
              #18
              Андрей Шляхов 11 ноя 2007 в 21:33
              mi awen li awen li awen, taso jan pi toki pona li tawa ala. :( tenpo ante la mi mute li wan.

              переведите, плиз, а то я моск уже сломал :-)
              • 0
                Ну, человек ждал, ждал, ждал - а никто из такипоноговорящих:) не пришел. А последнее предложение труднее, я язык сегодня первый раз в жизни вижу! >< Но вроде как просто что кучу времени провел один.
              • 0
                «Я ждал, ждал, ждал, а токипонщики не пришли. :( В другой раз нам нужно собраться вместе.»
          • 0
            — Алексей! эта статья хорошая, пишите ещё, много.
            ЫЫЫ, сиськи Рад говорить с тобой. :) Буду делиться своими знаниями с другими, т.к. эта статья пошла хорошо.
            — Это хорошо.
            • 0
              Ну, последнюю фразу по словарю я перевёл :)
  • +1
    Ну вот... опередили :)
    Я как раз информацию собираю, но не по пробелу, а о простейших правилах типографского набора текста, а то в прошлый раз у меня черезчур эмоционально получилось.
    В общем то всё знал, большое спасибо за то что собрали воедино.
    • +1
      Дело хорошее, но на мой взгляд тема глобальная, и лучше её разбивать на подтемы.
      • 0
        Это да... Пожалуй, на досуге, пособираю информацию о знаках препинания.
      • +3
        Можно сделать один обзорный пост, в котором изложить базовые принципы, и из него ссылаться на развёрнутые статьи по отдельным вопросам.
        • +4
          Я думал об этом, но что-то с базовыми принципами сложно. Мне кажется, блог «Типографика» достаточно чистенький пока, чтобы в нём можно было без труда находить интересующие тематические посты.

          Если у тебя есть идея, как сделать такой базовый пост хорошо — было бы супер, если бы ты сделал.
          • 0
            Уже ведь посмотреть профиль karasov, кажется, изъявил желание.
            • 0
              А, ну тогда ждём. :)
  • +3
    Начитавшись статей на Хабре, заразилась типографикой. Теперь если вижу короткое тире или неправильные кавычки, ощущение, что с текстом что-то глобально не так, не покидает во время прочтения. Теперь вот с пробелами тоже самое будет. :)

    Статью — в избранное. Буду читать и переваривать по частям, чтобы лучше отложилось.
    • +3
      Цель блога «Типографика» — в том числе и в этом, как я вижу. :)
    • +1
      Тяжело читать книги если профессионально занимаешься версткой. Все ляпы как на ладони.
  • 0
    Настоящая Статья. Огромное Вам за неё спасибо!
  • +2
    В Firefox неразрывный пробел увеличивается и уменьшается также, как и разрывный.
    • +1
      В какой версии?
      • +2
        1.5.0.12
        2.0.0.4

        И насколько помню, движок Gecko умел это делать еще со времен Mozilla Suite 1.3, возможно и раньше. Хотя могу в данном случае ошибаться.
        • +1
          Благодарю, поправил статью и карму немного. :)
  • +1
    Витенька — молодец!

    Прекрасная статья, спасибо!
  • НЛО прилетело и опубликовало эту надпись здесь
  • +2


    В FireFox на вашей специальной страничке горизонтальная прокрутка, так и задумывалось?
    • +1
      Это баг фаерфокса, который связан с отображением «нестандартных» пробелов. В ФФ 3.0 уже всё хорошо, а в 2 — ещё плохо. Там вместо пробелов в каждом абзаце стоят как раз «нестандартные» пробелы.
      • +1
        А ещё цвет фона страницы не задан.
        • 0
          Благодарю! Исправил.
  • 0
    А можно про неразрывный пробел подробнее? Насколько адекватно использовать вместо привычного "nbsp" ascii символ с кодом A0. Только что проверил в фф — отображает как неразрывный пробел. Но для UTF-8, к примеру, символ с таким кодом не валидный… To be or not to be?
    • +1
      Можно его ещё писать как &#160; или  . Можно набирать неразрывный пробел с клавиатуры, как я иногда делаю. :) А что с UTF-8?
      • 0
        Гуглил… Нагуглил мысль, что "0xA0 is an illegal UTF-8 character; bytes greater than 0x7F must not exist in an XML document unless they are 1. part of a valid UTF-8 sequence, or 2. in documents which contain an XML declaration that declares an encoding for which 0xA0 is a legal character."
        http://www.germane-software.com/projects…
        • +1
          Не совсем догоняю, в случае с работой с HTML-документами в каком случае и какой баг происходит, если не использовать мнемоники?
          • +1
            Разница между мнемоникой и кодом конкретного знака именно в том, что мнемоника говорит что надо нарисовать любой системе, а код говорит какой по счёту знак надо выдать. Первое и второе могут не совпадать.
        • 0
          В данном случае имеет место valid UTF-8 sequence , разве нет?

          Между прочим, W3C Validator (только что проверил) ничего плохого про &#xA0; не говорит.
          • +1
            Я так понимаю, что имеется какая-то проблема, когда символ неразрывного пробела вставлен в текст не мнемоникой, а сам по себе. Только вот не понимаю, что за проблема и как воспроизвести. :)
            • 0
              Я думаю, если кодировка корректная, и парсер корректный, то всё должно быть хорошо.
      • 0
        А что с UTF-8 ? Должно записываться как два символа: 0xC2 0xA0. В чём вопрос???
  • НЛО прилетело и опубликовало эту надпись здесь
    • +2
      Красота спасет мир, а такие правильно оттипографированные статьи — еще и наши несчастные глаза. Спасибо автору. Читать статью одно удовольствие.
  • +4
    Что касается em и en, то боюсь ошибиться, но здесь не «возможно, в каких-то старых шрифтах», а вполне известное происхождение: буква M делалась шириной по размеру кегля, поэтому размер кегля для удобства обозначали em.

    Буква n (строчная, отмечу) породила размер en, часто em ровно вдвое шире en.

    Ещё есть ex — как нетрудно догадаться, это размер буквы x (икс), однако не ширина, в отличие от em и en, а высота; впрочем, x обычно квадратен. Также ex и en часто совпадают.

    Em, en и ex стали использовать в качестве базовых размеров, и используют их и сейчас, когда таких чётких зависимостей в современных шрифтах нет.

    Это примерно как килограмм изначально определялся как масса одного кубического дециметра воды или метр как одна сорокамиллионная часть Парижского меридиана; а потом их переопределили эталонами.

    В CSS сейчас есть единицы измерения em и ex, которые удобно использовать для масштабируемости размеров текстовых блоков; а ежели ещё и помнить о происхождении, то вообще замечательно: например, можно использовать em как примерную высоту заглавной буквы и как ширину широкой буквы, а ex — как ширину не широкой строчной буквы.
    • 0
      В каком конкретно шрифте М делалась по ширине равной кеглю? :) В английской Википедии приведены примеры шрифтов (правда, весьма современных), где это не так. Я, к сожалению, не знаю точного происхождения английского термина, и было бы интересно увидеть оттиск, где M по ширине равна кеглю. Я хотел пояснить, что конкретно сейчас утверждение «в любом шрифте Em Space равен ширине прописной „M“» неверно.

      Про «ex» правильно, по-русски эту цифру называют «высотой строчных».
      Em и en в шрифтах Arial и Times New Roman размера 12 пунктов совпадают, и равны 6 и 12 пунктов соответственно. А ex могут различаться (в зависимости от высоты строчных букв).
      Em больше высоты заглавной буквы примерно на хвостик букв «р» и «у».
      • 0
        Em больше высоты заглавной буквы примерно на хвостик букв «р» и «у».

        То есть, как раз равна максимальной высоте строки, получается?
        • 0
          Ну собственно да. Выделите кусок строки мышкой — высота выделения и равна кеглю. То есть, и ширине кегельной шпации.
  • 0
    Спасибо, почерпнул. Больше даже не для веба (потому что набор приёмов резко ограничен, да и знал уже), а для обычной вёрстки. Я в этмо деле не грамотный, но очень хочу таковым стать :)

    Да пребудет с Вами карма ;)
    • +7
      Тогда лучше читайте книги. «Основы стиля в типографике» Брингхёрста как системообразующую, а потом — справочники редактора и автора: тех же Мильчина — Чельцову, Гиленсона (хоть и староват уже источник). Реально помогает читать справочники Розенталя. :)

      Для художественного развития — «Типографику» Рудера, «Типографику в терминах и образах» Кричевского, «Облик книги» Чихольда, «О шрифте» Шпикермана.
      • 0
        мы лучше подождем популярного объяснения и отображение типографской верстки на веб =). большой вам сэнкс за пробелы!
  • 0
    Спасибо за такую развернутую статью :)
  • 0
    Сплю и вижу — кто-нибудь «на пальцах» объясняет, как грамотно корректировать межбуквенные пробелы в словах, набранных крупным кеглем…
    • 0
      Это называется «кернинг». На пальцах не объяснишь, я и сам не очень специалист. Общие принципы есть, но это надо тренироваться.
      • 0
        В том-то и дело — тренируясь, как понять, правильно ли получилось?
    • 0
      Под крупным кеглем имеются ввиду заголовки, я так думаю.
      Это называется кернинг и трекинг. Различие между ними в том, что кернинг делается для пары символов, а трекинг — для группы. Каких-либо четких правил для заголовков не встречал и как это технически реализовать в веб-верстке я не знаю, но на бумаге обычно делаю трекинг в районе 0,020—0,030 em для капителей и 0,010—0,020 em для строчных.
      • 0
        Совсем чётких правил нет, мне кажется. Всё зависит от пропорций полосы набора и используемых шрифтов. С учётом того, что у всех шрифты отображаются по-разному, добиться одинакового результата у всех пользователей практически невозможно. Тем более, что обработка CSS-свойств letter-spacing и word-spacing в разных браузерах немного разная. Это что касается трекинга.

        А ручной кернинг на вебе — вообще задача муторная, в драфтах для CSS 3 даже такого свойства пока нет.
        • +1
          Кернинг вообще задача муторная. Не только на вебе. Мне кажется, что на вебе не стоит особо заморачиваться трекингом и кернингом. Экран все-таки не бумага. С другой стороны иногда хочется распечатать что-либо из интернета. С третьей стороны все эти распечатки недолговечны и в рамочку на стенку вряд-ли кто нибуть их повесит.
      • 0
        Если говорить о бумажной вёрстке, когда нужно делать трекинг, а когда кернинг? Допустимо ли сделать кернинг для пары символов, не трогая оставшиеся?
        • 0
          Теоретически да, это зависит от того, как выглядит строка в целом. И межбуквенные расстояния и пробелы должны быть такой ширины, чтобы строки были визуально однородными, «серебристыми». Но это уже искусство.
        • 0
          Трекинг по русски можно назвать разрядкой и применяется он к группе символов, обычно к заголовкам. Кернинг в тексте лучше оставить на совести шрифта, а вот в очень крупных надписях (на плакатах, афишах) — тут уж надо визуально смотреть и решать: где-то он нужен, а гдето нет.

          О втором вопросе.

          Поставьте в ряд на столе кубики. Сдвиньте один вправо и посмотрите, куда сдвинутся те, что стоят правее него?
  • 0
    Изумительная статья!
    В настольную библию web-дизайнера однозначно!
  • 0
    За статью спасибо, предлагаю поправки.
    Пакт Рибентропа-Молотова пишется через дефис, а не через тире.

    Также "и т. д.", "т. к." и им подобные на мой взгляд совсем плохо смотрятся с пробелами. Особенно на моноширинных шрифтах. Мне кажется, там должно быть thinsp — максимум. Либо вообще без пробела: "и т.д.", "т.к.".
    Можно ссылку на первоисточник?
    • 0
      Нет, не через дефис. Листайте вниз правила на Грамоте.ру, например.

      § 179. Тире ставится между двумя или несколькими именами собственными, совокупностью которых называется какое либо учение, научное учреждение и т. п., например:
      Физический закон Бойля — Мариотта.
    • 0
      На моноширинных нет &thinsp;. :) Поэтому там лучше набирать без пробела, но я редко встречаю набор текстов моноширинным шрифтом.
  • 0
    Попозже прочитаю но посмотрев увидел что вы ставите неразрывный пробел между инициалами а не маленький пробел. Почему? Помоему это не правильно.
    • 0
      Такая традиция — посмотрите Шульмейстера, Мильчина — Чельцову. В примечаниях к «Основам стиля в типографике» Ефимов рекомендует отбивку тонкой шпацией. Так что в принципе, я считаю, что это не будет являться ошибкой. Но совсем не отбивать пробелом, на мой вкус, мало того, что нетрадиционно, ещё и некрасиво. :)

      Логика использования межсловного пробела, видимо, состоит в том, что не нужно запоминать различия между «Иванов А.» (неразрывный пробел), «Иванов А. А.» (неразрывный + тонкая шпация), «А. Иванов» (тонкая шпация), «А. А. Иванов» (две тонких шпации).
    • 0
      Дополнил статью, спасибо.
      • 0
        Я сейчас на руби пишу типограф. Так вот если учитывать то что инициалы не должны разрываться и могут "для красоты" быть "тонкие шпации", то предлагаю метод. Ставить между двумя инициалами — &_#8202; и между тремя — &_#8201; или entity &_thinsp; (соотвественно без _ ) и завернуть все это в span с классом .nobr {white-space: nowrap}
        Вот тогда будет красота. Было бы круто если бы все эти правила были описаны по пунктам. Тогда легче и быстрее типограф написать самый крутой =)
        • 0
          Автоматический типограф — это очень тяжко. Есть масса моментов, которые я не понимаю, как автоматизировать. Например, инициалы бывают двухбуквенные (типа того же «Дж.»). Как автоматически отличать, это двухбуквенный инициал или двухбуквенное слово в конце предложения? Придумать таких заковык можно вагон и маленькую тележку, поэтому без ручной работы и понимания правил вёрстки всё равно не обойтись.
          • 0
            Ну почему же. Все можно предусмотреть. Главное описать все это. А насчет волосяной шпации.. так можно тогда вообще не ставить никаких пробелов или неразрывных. какой смысл. Многие и без этого вполне себе живут.
            • 0
              В российской типографике однопунктовая шпация (а волосяная часто даже более узкая) применяется крайне редко, и совсем не для того, для чего предлагаете Вы. Минимум, который принят для постановки между инициалами — тонкая шпация, волосяную практически не заметно.
        • 0
          Волосяную шпацию &#8202; я бы вообще не рекомендовал использовать, дабы не плодить сущностей без необходимости — в любом наборе для веба вполне достаточно тонкой &thinsp;.
  • 0
    Народ..не подскажите скриптик типографа, который можно было бы разместить на сайте, для редакции текста такого уровня,что указано в статье? Был бы очень благодарен
  • 0
    Уверены, что "Молотова-Риббентропа" надо писать через тире?
    • 0
      Да, уверен.

      § 179. Тире ставится между двумя или несколькими именами собственными, совокупностью которых называется какое либо учение, научное учреждение и т. п., например:
      Физический закон Бойля — Мариотта.


      Норма, что тире в таком случае должно пробелами отбиваться, есть в справочниках, но сходу найти не могу.
    • 0
      Это необходимо, чтобы отличать от сложной фамилии: «книга Салтыкова-Щедрина», «тактика Бонч-Бруевича — Жукова», «закон Био — Савара — Лапласа».
      • 0
        Да, правда. Спасибо.
  • +1
    Спасибо! Очень интересно!
  • 0
    Блеск!
  • 0
    Никогда не думал что греки и римляне писали без пробелов. Интересно, а у китайцев пробелы есть? Или они им не нужны?
    • 0
      У китайцев точно нет. Пробелы были бы полезны, особенно изучающим китайский язык, но их там нет. :( Поэтому при чтении дробление предложения на части и слова — одна из основных проблем для изучающих (кроме знания лексики, конечно).
      • 0
        Примерно так же в токипоне — «наматывание» свойств объекта на объект, особенно когда прилагательных больше одного.
  • 0
    Спасибо за статью. В избранное. =)

    Хочу добавить, что тире в обычном случае (когда это не цифры и не фамилии и не символ диалога) по правилам отбивается от соседних слов не стандартными пробелами, а двухпунктовыми шпациями.
    • 0
      Это было принято, когда про тире было известно, что у него отсутствуют апроши. Оно ещё и от предыдущих точек и запятых не отбивалось. Но проблема в том, что веб — не бумажная вёрстка, и неизвестно, какие у пользователя будут шрифты. Поэтому отбивка пробелами вполне допустима.

      Кроме того, тонкой шпации, как я писал, тяжело добавлять неразрывность, что в случае с тире (которое часто встречается в тексте) значительно увеличивает работу верстальщика.
  • 0
    У Вас написано, что знак номера и знак параграфа пишутся через неразрывный пробел (&nbsp;), в то время как, по моим сведениям, он должен писаться через тонкую шпацию (&thinsp;).
    Укажите, пожалуйста, источник, на основе которого Вы перечисляете правила типографского набора.
    • 0
      Я их перечисляю на основе нескольких источников. Приоритетным является «Справочник издателя и автора» Мильчина — Чельцовой. Менее приоритетными — «Справочник технического редактора» Гиленсона, «Ручной набор» Шульмейстера, «Ручной набор» Вигдорчика. Везде рекомендуется отбивка от последующего числа на полукегельную (это означает, что при выключке строки этот набор не должен дополняться шпациями или уменьшаться). В тех средствах, которые мы рекомендуем использовать, более всего подходит обычный неразрывный межсловный пробел.

      А Ваши сведения откуда почерпнуты?
      • 0
        Ну, мои сведения почерпнуты просто опытом работы верстальщиком, который закончился давно и был под управлением сурового дядьки, происхождение знаний которого мне теперь сложно восстановить. Я спросил Вас, чтобы проверить себя и почитать источники.

        Кстати, я совершенно неправ хотя бы тем, что проскочил взглядом Ваш раздел "Основные правила употребления пробелов", где, собственно, всё и сказано по этому поводу.

        Спасибо за статью. Особенно интересным оказались сведения о том, что поисковики начинают обрабатывать экзотические пробелы.
  • 0
    По поводу неразрывного пробела. Мне кажется, в одних случаях его раздвигать нужно, в других нельзя.

    Нужно:
    места, где перенос нежелателен: "в лесу".

    Нельзя:
    Инициалы: "И. И. Иванов".
    Цифры: "Теорема 2", "100 м". Особенно бесит, когда идёт ряд определений: "Определение 1", "Определение 2" и т.д., и пробелы пляшут.
    Прочие вещи, в которых есть пробел, но которые являются одной целостной единицей: "и т. д", "г. Москва"...

    Word, насколько я знаю, его не раздвигает.
    • 0
      Ну, это не так страшно. При вёрстке для полиграфии эти вопросы действительно надо решать вручную, а при вёрстке для Интернета нужно просто использовать выравнивание по левому краю без выключки колонки набора по ширине, и всё. И никакие пробелы растягиваться не будут.
  • 0
    Спасибо.
    Мне понравилось.;)
  • 0
    "Вновь пробел начал использоваться приблизительно в VII—IX вв. н. э. , и эта традиция пришла из Ирландии, где тексты записывали на английском языке, и, по-видимому, испытывали трудности с чтением вслух по той причине, что латинский не являлся родным языком писцов и чтецов." - бред. В указанный период ни английского языка, ни англо-норманского завоевания Ирландии, ни ирландской литературы на английском языке не существовало.
    • 0
      Хм, спасибо за комментарий. Давайте исправим положение: видимо, я ошибся при переводе.

      http://www.abc.net.au/rn/arts/ling/stori…
      And this process created a certain model for facilitating reading by the intrusion of space, which was rapidly expanded in the British Isles, particularly in Ireland. And by the end of the 7th century you had full word separation. And there you had the greatest disjunction between the language, the vernacular language, that is among the Celtic people and Anglo Saxons, and the literate language, or the Latin tongue of the Church.

      По-видимому, лучше «записывали на английском языке» заменить на «записывали на древнеирландском языке». Судя по Википедии, в VII—IX вв. н. э. на территории Ирландии был именно древнеирландский язык.
      • 0
        Да, так будет верно.
        • 0
          И снова не совсем верно. :) У них родным языком был ирландский, а писали-то они как раз на латыни. Подправил статью.
          • 0
            В тот период были и книги на древнеирландском, хотя конечно же, в эпоху раннего Средневековья латынь превалировала в книжном деле.
  • 0
    еще бы обзор плагинов для CMS, реализующих правильную типографику...
    для джумлы видел только такой плаг — рекомендую.
    "русская типографика" - называется.
    а для WP не встречал таких...
    • +1
      Мой опыт работы с автоматическими типографами показывает, что всё равно что-то нужно делать руками — какие-то ошибки они всё равно не вылавливают. А для этого надо либо самому разбираться в типографике, либо не писать тексты со сложной разметкой. То есть, лучший плагин — это руки автора при наборе текста. :)
  • 0
    В статье не нашел такой случай…
    Надо ли употреблять пробел в словосочетаниях типа «пять на пять»?
    К примеру 5 x 5 или 5x5? Как будет правильно?
    Или вот 5/5 или 5 / 5?
    Относится это к математическим операциям где нужно ставить & thinsp;?
    • 0
      Отвечу через пару лет, чтобы информация была в одном месте собрана. :)

      Правильно «5×5» и «5⁄5», где в качестве знака умножения используется настоящий знак умножения (&times;), а в качестве знака деления — или fraction slash (&#8260;), или division slash (&#8725;). Пробелами они не отбиваются.

      Со знаком деления надо быть аккуратнее, у него не во всех шрифтах полуапроши правильно выставлены, поэтому он может прилипать к левому и правому соседям. Проверяйте гармоничность набора в том шрифте, который у вас используется!

Только зарегистрированные пользователи могут оставлять комментарии. Войдите, пожалуйста.