Pull to refresh

Специальный шрифт для нахождения ошибок после OCR

Reading time 1 min
Views 15K
Сообщество Distributed Proofreaders («Распределённые корректоры») больше десяти лет занимается сканированием книг для проекта «Гутенберг». Сотни добровольцев помогают вычитывать тексты и исправлять ошибки.

После автоматического распознавания чаще всего ошибки встречаются в символах, которые похожи друг на друга, как I, l и 1, O и 0, и так далее. Если пользоваться обычным шрифтом вроде Times, то такие ошибки можно и не заметить. Поэтому для проекта Distributed Proofreaders был создан специальный шрифт, в котором «похожие» символы как можно сильнее отличаются друг от друга.



Все символы шрифта разработаны с учётом многочисленных советов и пожеланий участников проекта, добровольных корректоров. Цель — максимально удобно и эффективно идентифицировать типичные ошибки OCR.

К сожалению, сайт Distributed Proofreaders по историческим причинам не поддерживает юникод, и сообщество работает с весьма ограниченным списком языков, среди которых нет кириллических. Поэтому и сам шрифт DPCustomMono2 спроектирован только для латиницы. Но идеи, которые применили дизайнеры шрифта, можно использовать и в создании кириллического набора символов.

На этой странице можно сравнить DPCustomMono2 с различными популярными шрифтами.

Tags:
Hubs:
+29
Comments 62
Comments Comments 62

Articles