Перечитайте комментарий, с которого вы сами начали эту ветку. Страница отдельно, картинки отдельно. Как бы-то ни было, размер не отличается «на порядок».
Уточню: страница — это размер тела HTTP-ответа. То есть весь HTML (или что там). Без заголовков, но и без запроса и подсчета зависимостей — скриптов, css, картинок.
Считал в символах, как раз чтобы избежать вопросов с кодировкой. Соответственно, в CP1251 это составило 27,796 байт (с записью отсутствующих символов энтитями), в UTF-8 составило 31,241 байт (поскольку русскоязычные страницы).
Если кто эту штуку захочет реализовать на русском языке, то напомню, что нужно проследить за формами множественного числа.
В Asana заморачиваться не стали, и просто привели к обязательному множественному (2-33). Для русского языка этого мало, желательно вместо: «22 грустных кальмаров…» выводить правильное «22 грустных кальмара…»
PS. Пожалуй, я такую штуку сделаю (генерацию предложения по 32-битному числу). Если кто хочет присоединиться, пишите в личку, расшарю репозиторий.
Считал в символах, как раз чтобы избежать вопросов с кодировкой. Соответственно, в CP1251 это составило 27,796 байт (с записью отсутствующих символов энтитями), в UTF-8 составило 31,241 байт (поскольку русскоязычные страницы).
Медианный размер страницы, по 200 000 сайтам в рунете: 27 679 символов.
return n % 10 == 1 && n % 100 != 11 ? 0 : n % 10 >= 2 && n % 10 <= 4 && (n % 100 < 10 || n % 100 >= 20) ? 1 : 2;
Моя коллекция для других языков: github / alien / ali-public
В Asana заморачиваться не стали, и просто привели к обязательному множественному (2-33). Для русского языка этого мало, желательно вместо: «22 грустных кальмаров…» выводить правильное «22 грустных кальмара…»
PS. Пожалуй, я такую штуку сделаю (генерацию предложения по 32-битному числу). Если кто хочет присоединиться, пишите в личку, расшарю репозиторий.
Для ценителей есть, например, такое: Unicode Character 'BIKINI'
Я все ждал, когда появятся «окна пвх недорого».
У них теперь есть специальные символы для дерьма (1F4A9) и пидорасов (1F46C).