Pull to refresh

Comments 50

Я всего лишь проанализировал нынешнее положение дел глазами инженера и поразмышлял как бы могла бы быть решена данная задача, если бы за её решение изначально брался инженер.

В системе присутствовали бы легаси-ошметки старой грамматики для обратной совместимости с языком уважаемого заказчика, лидера в своей отрасли.

Еще "четыре" выбивается по количеству слогов - само по себе редко мешает, но "четыредесят" - уже явно слишком громоздко. Раз уж рефакторим, ломая обратную совместимость, можно и сократить. В идеале - все простые числительные сделать односложными (примерно как в английском, только без zero и seven. Сравните, насколько быстрее произносить nine-one-one, чем девять-один-один).

И заодно избавиться от созвучности некоторых числительных, которая мешает при восприятии на слух, особенно, когда качество связи не очень: семь-восемь (особенно, если о безударное, как в "восемнадцать"), девять-десять...

Т.е. могло бы получиться что-то вроде ноль-ван-два-три-фо-пять-шесть-семь-эйт-найн

Во всех славянских языках, включая русский до определённого времени, число 40 записывается как "четырдесят", с небольшими отклонениями с учётом языка.

Я бы даже уточнил, что четыредцать и девятьдесят. В том смысле, что 40 сохраняет окончание от линейки двадцать-тридцать, а 90 — от пятьдесят-восемьдесят.
я бы еще добавил, что: три, четыре (в общем первая половина) заканчиваются на гласные, а вторая на согласные!
if-else или ?:

Во всех славянских языках, кроме русского, украинского и белорусского именно так и говорят "четыредесят" и "девятдесят". С чехами, поляками, сербами и болгарами мне все время приходится запинаться при произношении числительных из этой группы.

А теперь положение дел глазами трезвого инженера.

Вводим «упорядочивающие» правила. Ждем N лет до того, чтобы система стала легаси и обрасла костылями, когда реальные пользователи (которые не дураки произносить постоянно четыредесят и двасто) начинают сокращать неудобные конструкции до легких в произношении четысет и двесси. И N+M до того, как у прескриптивистов не получается удержать позиции «чистоты» языка. Ждем нового юного инженера с пылающими глазами.
В единицах что-то похожее на сотни есть, там с пяти меняется окончание
два дерева, три дерева, четыре дерева, НО пять деревьев
Да, есть такое. )))
Я думал потом ещё про образование множественного числа у числительных написать. Там ещё хлеще.

Вообще-то разные суффиксы у сотен - это и есть разные склонения слова "сто": 1 Сто, 2 сти, 4 ста, 5 сот.

Это легаси от наличия в древнерусском языке двойственного числа (для пары предметов). Сама структура ушла очень давно, но следы ее видны в этой форме
Начинается всё просто, с уникальных числительных: Один, два, три… восемнадцать, девятнадцать.

Эвона как вы лихо записали числа 11-19 в уникальные. Но ведь они очень даже составные:

один-на-дцать (от праславянского *jedinъ na desęte «один на десять»)
две-на-дцать
три-на-дцать
… и т. п.

Дальше идёт образование десятков, добавлением к уникальному числительному окончания:

Это не окончание, это слегка обкатавшееся на языке слово «десять». Фактически названия десятков — это словосочетания, просто пишутся слитно.

Два — два(дцать), три — три(дцать), четыре — четыре(дцать)? Нет. Сорок! Почему? Не спрашивайте.

Спрашивать можно и даже нужно.
Слово «сорок» действительно стоит особняком и представляет собой этакую загадку.
Для начала: слово «сорок» есть только в восточнославянских языках (русский, украинский и белорусский). В западнославянских и южнославянских языках все в порядке, никаких исключений нет: в сербском — четрдесет, в польском — czterdzieści и т. п.
Один из вариантов происхождения — от древнерусского слова «сорокъ», обозначавшего связку из 40 собольих шкур. Поскольку шкуры пушных животных использовались в качестве денег, название связки вполне могло прижиться в качестве числительного и вытеснить общеславянское «четыредесетъ».
Впрочем, есть еще вариант заимствования из древнегреческого ([те]ссараконта — сорок), но это сильно вряд ли. Ну и как вариант — заимствование из тюркских языков (тут этимология совсем натянуто выглядит).

Пять — пять(десят). Тут снова поворот. Очередное уникальное окончание для образования десятков, но кажется самое логичное — «десят».

Это не окончание. Это слово в словосочетании («пять десят[ков]»).

Сто, двести, три(ста), четыре(ста)… В этом моменте похоже опять вернулся дядя Фёдор и дописал — пять(сот), шесть(сот), семь(сот), восемь(сот), девять(сот).

Федор — греческое имя (Theodor — богом дарованный). А числительные формировались гораздо раньше. Так что Федя тут точно ни при чем. :)
Собственно, первый десяток индоевропейских числительных прослеживается на многие тысячелетия вглубь веков. Сунья, дви, три, чатур, панча, шаш, саптар…

Ну, а если бы меня попросили сделать максимально простую, удобную и логичную систему?

Максимально простая и логичная, но неудобная система: просто писать каждую цифру словом. 100 — один-ноль-ноль. 5634 — пять-шесть-три-четыре. Неудобство в том, что человеку для оценки величины числа придется мысленно подсчитывать число десятичных позиций (один-ноль и один-ноль-ноль-ноль — это сильно не одно и то же).
Максимально удобная, но непривычная система — использовать отдельные слова для кратных величин (десять, сто, тысяча, миллион), а количество этих единиц писать перед величиной. Примерно так устроены числительные в китайском, например:
100 — сто
101 — сто один
201 — два сто один
231 — два сто три десять один

Я всего лишь проанализировал нынешнее положение дел глазами инженера и поразмышлял как бы могла бы быть решена данная задача, если бы за её решение изначально брался инженер.

Если бы за задачу создания числительных изначально брался инженер, получилась бы позиционная система а-ля древневавилонская 60-ричная или майяская 20-ричная.
Вот только у них есть проблемка — они сложны в повседневном использовании. Именно поэтому люди сейчас используют аддитивные системы счисления (сто двадцать пять = 100 + 20 + 5).

Это не окончание, это слегка обкатавшееся на языке слово «десять». 

Не совсем так. Это остатки ранее существовавшей формы слова десять. Цитата из великого Зализняка (которого стоит почитать автору статьи перед рассуждениями о лингвистике):

слово десять. Оно было существительным, т. е. тем, что сейчас десятка или десяток. Это нам важно. Поэтому десять лошадей — это была такая же конструкция, как если бы мы сейчас сказали десятка лошадейили десяток лошадей. Тем самым у слова десять были и формы множественного числа. В частности, была форма родительного падежа множественного числа, т. е. то, что сейчас по смыслу было бы десятков. Она была такова: минусовая морфема десят-и окончание родительного падежа множественного числа  — плюсовое.

В комментариях уже упоминали слово «легаси». Вот это оно. Язык наполнен такими элементами доверху, он и есть одно сплошное легаси с развитием на десять тысяч лет назад.

Астрологи объявили неделю русской грамматики?
Я планировал написать статью уже пару месяцев назад.
Ну что мне теперь делать? Если вышли пару статей перед моей, не писать?
Будем считать, что коллективное-бессознательное унесло народ в сторону естественных языков. )))
Ну что мне теперь делать?
не писать?
С дивана, неожиданно для себя подумав, можно многому удивиться и «изобрести». Но лучше подобные открытия оставлять при себе.

Немой инженер, а скорее — погромист, поковырял в носу. Т.к. не представляет, как это — проговорить по русски "двесот" или, тем более, "пятьста".

Вот вы про русский язык.. А вы знаете правила французского?

Там вообще мозг ломается.

Шестьдесят двеннадцать. Что, простите? 72? Да нуна?

Четыре двадцать одиннадцать? Ну неужели непонятно, что это 91?

Просто надо добавить привычные русскому языку связки, которые менее употребимы в других языках (русский язык гораздо больше любит согласовывать слова, чем французский, хотя французский любит согласования гораздо больше английского).

Шестьдесят и двенадцать = 72

Четырежды двадцать и одинадцать = 91

Это точно не счет майя?

Точно. Взгляните на картинки по запросу "числительные во французском языке"

Я в 1991 году заканчивал его изучать, и с текущими датами там была просто беда...

UFO just landed and posted this here
Вот-вот, я всегда считал что инженерное/техническое/математическое мышление как раз помогает разбираться в такой несложной вещи как языки

В немецком языке числительные от 20 до 99 образуются не как «двадцать два», а «два и двадцать» (zweiundzwanzig). «Как-то не логично» — подумал я, пока мне не показали, что это в как раз в русском языке не логично):
Немецкий:
19: neunzehn (девять — десять)
20: zwanzig (двадцать)
21: einundzwanzig (один и двадцать)
То есть 21 Образуется также, как и 19: единицы и затем десятки.
И русский:
19: девят-надцать
20: двадцать
21: двадцать-один
В русском языке почему-то логика образования числительных со второй двадцатки меняется на обратную: до 20 это «единицы плюс десятки», а после 20 уже «десятки плюс единицы»

Автор, не смотри на языки, в которые пришли числительные из неродственного языка, частично заменив родные. Естественно, в зависимости от того, что считается, используется свой набор из родных-неродных слов.

Думаю, китайский вам понравится:

Числа 11-19 формируются как "десять один", "десять два"..."десять девять".

Числа 20, 30,...90 - как "два десять", "три десять",..., "девять десять".

Прочие числа типа 23, 45, 68 - "два десять три", "четыре десять пять", "шесть десять восемь" (хм, а по-русски почти так же), etc. Естественно, не в кириллице, в пиньинь это примерно "er shí san" (23), но я не настолько хорошо помню тоны.

Дни недели: понедельник - "первый день", вторник - "второй день", и т.д.

Месяцы: январь - "первый месяц", февраль - "второй месяц", и т.д.

Если, конечно, учитель китайского не соврал :) Мне даже кажется, что эта схема формирования месяцев и дней недели - какое-то упрощение для иностранцев, выглядит неправдоподобно, чтобы эта схема естественным образом появилась.

Но и там есть исключения: "два" в зависимости от контекста произносится по-разному: "ér" либо "dián", вроде бы.

выглядит неправдоподобно, чтобы эта схема естественным образом появилась.

До сих пор римское легаси торчит: septem, octo, novem, decem...

Мне казалось, что в Китае другой календарь, и январь там не первый месяц. Однако, сдвиг не так уж велик. см. "современное название" в таблице.

Так и сентябрь сейчас немного не седьмой.

Но вообще, я имел в виду, что это всего лишь две аналогичных системы именования месяцев: на основании порядкового номера, а не личных имён.

liang или lian (простите, что без тонов, нет их у меня)) — это вариация двойки в зависимости от контекста. При lian не используется счетное слово, например, пара ручек, пара чего-то еще, что обычно не парное.
Про месяцы и дни недели все верно, китайцы так и говорят сами)). есть просто разные слова-синонимы для недели (я знаю три), и небольшое исключение для воскресенья со всеми тремя вариантами.
А еще они объеденяют не тысячи, а десятки тысяч. То есть вместо привычного нам 10.000 это выглядит как 1 wan (слово, обозначающее 4 нуля). То есть население моего родного города 9 wan = 90 тысяч человек)) Первое время ломало голову это очень, потом привыкла.
Если бы «инженеры» переизобрели естественные языки, то всё звучало бы так: я хождение верх мост; я любовь ты прошлое; ты хождение самолёт Москва. И всё без родов, суффиксов, приставок, артиклей, девятнадцати падежей и двенадцати времен года…

PS. «Инженерного» аналога самолёту придумать не могу, так как не «инженер».
«Если бы «инженеры» переизобрели естественные языки»… или использовали грамматику языков программирования, добавив в них описывающие повседневность термины.
Мне кажется, что «инженеры» уже изобрели в своё время язык эсперанто. Говорят получилось неплохо, но не взлетело.
Ой, ладно Вам. Подобное есть во многих языках. И русский — не исключение. А в сравнении с некоторыми на русском ещё по божески.

Французский:… Шестьдесят семь, шестьдесят восемь, шестьдесят девять, шестьдесят десять…
Другие языки: *внимательно посмотрели*
Французский: *посмотрел в ответ*
Французский:… шестьдесят одиннадцать, шестьдесят двенадцать, шестьдесят тринадцать…
Французский:… шестьдесят шестнадцать, шестьдесят десять семь…
Другие языки: *зажмурились*
Французский:… шестьдесят десять восемь, шестьдесят десять девять…
Другие языки: *закрыли лицо руками*
Французский:… четыре двадцатки! :) Четыре двадцатки один…

Грузия: десять
Грузия: двадцать
Грузия: двадцать десять
Другие языки: грузия, что ты дел-
Грузия: два двадцать
Франция: о да, грузия, продолжай
Грузия: два двадцать десять
Другие языки:…
Грузия: три двадцать
Франция: еще, грузия, еще!
Грузия: три двадцать десять
Другие языки: что с ними не так…
Грузия: четыре двадцать
Франция: Я КОНЧИЛ!
Грузия:…
Другие языки:…
Грузия: Сто… сто двадцать… сто двадцать десять…

Рискую повториться, возможно уже писали, но называть каждое число второго десятка уникальными по-моему не корректно - одиннадцать = один на десять и т.д., как результат развития языка исчезновение гласных и оглушение или озвончение согласных явление вовсе не редкое. Полагаю мы имеем дело не с уникальными именами, а с еще одной группой происхождение которой вполне понятно.

одиннадцать !== один на десять
одиннадцать == один(надцать)

Но может быть всё укладывается в простое правило (число обозначающее единицы) + (надцать)?
Давайте посмотрим внимательно на весь второй десяток:
один(надцать) +
две(надцать) — два(надцать)
три(надцать) +
четыр(надцать) — четыре(надцать)
пят(надцать) — пять(надцать)
шест(надцать) — шесть(надцать)
сем(надцать) — семь(надцать)
восем(надцать) — восемь(надцать)
девят(надцать) — девять(надцать)

Только два числа соответствуют правилу. В остальных, где-то отсутствует мягки знак, где-то совсем по другому пишется (две, четыр).
В итоге получается, что мы всё-равно должны запомнить каждое число! Несмотря на кажущийся порядок, там точно такой же беспорядок.
Обязательно нужно учитывать, что имена чисел появились не сегодня и даже не вчера. Живой язык развивается и изменяется. Читал мнение одного умного человека, запамятовал кого, что нам в России, как впрочем и в Германии, Франции или любой другой не англоговорящей стране чертовски повезло с Шекспиром — мы можем наслаждаться им на вполне понятном нам языке (при условии качественного перевода разумеется). Британцы же вынуждены читать его в оригинале, не понимая половины слов — написано ведь было в 16-ом веке. Попробуйте почитать написанное на русском образца шестнадцатого века.)) А русские имена чисел будут постарше Шекспира, отсюда некоторая «неочевидность», с современной точки зрения, их словообразования. Так вижу. ))
Числительные употребляются очень часто, а их смысл не меняется. Поэтому они сами мало изменяются с течением времени. Даже у давно разошедшихся в своем развитии языков система числительных остается похожей, а названия можно сопоставить друг с другом.
Кстати, на том, что числительные меняются медленно, строятся некоторые попытки реконструировать эволюцию праиндоевропейских языков.

Если изучать развитие языка в динамике и проследить изменения в течение столетий, то, в принципе, несуразностей-то особо и нет, всё легко объясняется и в принципе логично. Просто вы рассматриваете текущий snapshot языка ("синхрония" на языке лингвистов). Если смотреть только на него, то да, выглядит странно.

Можно представить, что язык развивается частями, которые в определенные промежутки времени синхронизуются. В лингвистике это называется аналогические выравнивания, а у инженеров - eventual consistency.

Да и вроде все такие крутые инженеры, а придешь на проект - тут TODO стоит, тут костыль впилили, тут заказчик в пятый раз требования поменял, а тут - мы в процессе распила/рефакторинга, в итоге вообще ерунда вышла, но вы особо сюда не смотрите. Ну и в языке так же - в конкретный момент времени всегда будут неконсистентности, но в общей картине, в динамике, не всё так плохо :)

Статья всего лишь маленькое пособие как:
1. Видеть плохо работающие элементы механизма.
2. Не бояться разрабатывать более эффективные решения.
К языку это имеет опосредованное отношение. Хотя многие, похоже подумали по другому. :)
1. Видеть плохо работающие элементы механизма.

А можно поподробней — что именно плохо работает в системе числительных русского языка? :)

2. Не бояться разрабатывать более эффективные решения.

Вы знаете, решение должно быть не только эффективным, но и применимым на практике. Иначе это не решение, а умствование.
У автора «эффективность» заключается в экономии сотни байт (пардон, одинсот байт) по сравнению с нормальным решением. Но где сие супер-эффективное решение можно применить? Лично мне функции по переводу числа в строку встречались исключительно в бухгалтерских программах, и использовались они при печати всяческих накладных и счетов-фактур. Но ни одна бухгалтерия не согласится на «одинсот двадесят три рублей четырдесят девять копейки» (если «рубли» и «копейки» тоже выбирать по принципу «что чаще всего используется»). И кстати, в бухгалтериях счет не ограничивается сотнями, нужны еще тысячи, миллионы и даже миллиарды. Плюс как минимум нужен родительный падеж числительных («трехсот пятидесяти двух рублей»).

Единственное, что пришло в голову по поводу использования такой вот системы, как у автоар — это компьютерная игра с фантастическим миром. Скажем, инопланетяне-торговцы могли бы так называть свои цены (им можно, они не местные). Или так говорят жители параллельной вселенной, упростившие свой язык до безобразия. Вот только лор не построишь на одних числительных. :)
Пятьсот семьдесят два. Ужасно звучит, ужасно!
Отнимем одинсот тридесят и получим четыресот четыредесят два. Истиново лепова говорка!

Если уж браться за улучшайзинг языка, неплохо для начала определиться с целью улучшайзинга. Где конкретно будет использоваться ваше творение?

Вон гражданин Марк Гучко аж целый язык придумал с целью облегчить общение носителей различных славянских языков, например.
А вы вообще читали сообщение, на которое вы первоначально ответили?
Ну так там, как раз, ответ на ваш вопрос.
Всего доброго.
Мне показалось, что целью статьи было спровоцировать дискуссию в каментах. Она с этим справилась. ))
Sign up to leave a comment.

Articles