Пользователь
0,0
рейтинг
15 июля 2012 в 17:19

Дизайн → Как определить язык по виду иероглифов/закорючек?

Вот, задался таким вопросом… С помощью гугл транслейта и такой-то матери, родилась такая блок-схемка:



картинка кликабельна

Кому нужен сорец (в .docx): тут
Святослав @soulburner
карма
231,5
рейтинг 0,0
Реклама помогает поддерживать и развивать наши сервисы

Подробнее
Реклама

Самое читаемое Дизайн

Комментарии (185)

  • +3
    Хм) Удобно однако)
  • +1
    Кто-нибудь дошёл до гуджарати?
    • +80
      Мое прошлогодний рецепт врача похож на гуджарати.
      • +18
        Наши врачи пишут на урду
        • +4
          Действительно! и мой тоже на урду!
        • +5
          Что-то мне кажется, на хабре урду понимает больше людей, чем врачебную письменность.
    • 0
      Ага, т.к. я снизу начал )
  • +8
    Половина перечисленных языков состоят вовсе не из иероглифов.
    • +1
      Иероглифами там названы символы только трех языков (корейский, японский, китайский). Половина этих трех?
      • НЛО прилетело и опубликовало эту надпись здесь
        • 0
          Если точнее, то из 51 символа, из которых 24 это отдельные буквы, а остальные — их комбинации.
          • +1
            Что-то я как-то неграмотно фразу выстроил (а в топике про языки это практически недопустимо). Будем считать, что я забыл вставить «алфавит состоит» после «то».

            Функция редактирования комментариев (хотя бы в течение минуты после публикования!) была бы чрезвычайно полезна.
            • +1
              В ЖЖ комментарий можно редактировать, пока на него нет ответов. Можно так же.
        • 0
          Хотя в группы их придумали объединять по аналогии с китайскими иероглифами (для записи названий который, и был придуман этот фонетический алфавит), а квадратики куда вписываются буквы их действительно немного напоминают.
  • +5
    Разве в китайском и японском языке не одинаковый набор иероглифов? (не учитывая слоговые)
    • +4
      японский заимствует некоторые иероглифы из китайского.

      но выглядят в целом они по-разному
      • –1
        пример — птица — по японски и по китайски и пишется одинаково.
        • +1
          один пример в данном случае ничего не доказывает.
        • +6
          Так можно докатиться до того, что кириллица состоит из латиницы.
          • 0
            Ну, не состоит, но графическое подобие есть :)
      • +5
        Неа. Кандзи от китайских иероглифов отличить по написанию не возможно, они одинаковые. Произносятся по разному, имеют разные значения, но пишутся одинаково.
        То есть, если на японском написать фразу без использования хираганы или катаканы, то человек, не умеющий читать ни на одном из языков, хрен разберет, что это за язык.
        • +1
          кандзи не просто одинаковые, они и есть китайские иероглифы/знаки (в переводе)
      • +22
        Почему только некоторые?

        В японском есть так называемые кокудзи (国字 — こくじ, национальные символы). Это японские иероглифы, их не очень много (то есть вообще-то их есть несколько сотен, но реально сейчас используются только некоторые из них).

        Остальное — алфавит: хирагана (平仮名) и катакана (片仮名) — обе по 47 базовых знаков (плюс могут быть их сочетания). И, конечно же, кандзи — и это как раз китайские символы. У них, кстати, есть он-ёми (音読み — японизированное китайское чтение иероглифа) и кун-ёми (訓読み — японское чтение).

        Выглядит хирагана, кстати, вот так: ひらがな
        А катакана вот так: カタカナ

        Если хотя бы несколько раз увидеть японский текст (и присмотреться), то даже не зная этих алфавитов можно их достаточно легко отличать друг от друга (и от иероглифов).

        (Надеюсь, никто уже не пользуется ОС, где в поставке нет китайских и японских шрифтов.)

        История возникновения двух чтений и китайских иероглифов, использующихся в японском языке (кандзи), очень проста: когда на японский архипелаг с материка проникли иероглифы (это было очень давно), то те японские слова, которые наиболее точно подходили по смыслу к тем или иным иероглифам, стали записываться такими иероглифами. Например, японское слово «мити», которое означает «дорога», стали записывать иероглифом 道, который в китайском, собственно, тоже означает дорогу или путь — «дао». Но поскольку отдельно стоящий иероглиф читается по кун-ёми, то когда кто-нибудь читает японский текст и видит иероглиф 道, то он читает именно みち («мити»), а не どう («до:» — упрощённое японизированное китайское чтение).

        А вот если этот иероглиф — часть слова, то тогда уже будет использоваться он-ёми. Например, 水道 читается суйдо: (двоеточие ставится в случае удлинения гласной: すいどう).

        Кстати, с этим связано очень весёлое недоразумение. Дело в том, что очень многие люди в России уверены, что гора Фудзи по-японски будет «фудзияма». Так вот, на самом деле это — ошибка. По-японски это будет «фудзисан» (富士山, то есть ふじさん) — потому что он-ёми для иероглифа «гора» (山) именно さん — «сан» (либо せん — «сэн»), но не やま (яма). やま — это кун-ёми, японское чтение для 山.

        Таким образом, ошибка тут заключается в неправильном чтении слова. Тем не менее, если написать 富士の山, то это уже будет читаться как ふじのやま, то есть «фудзи но яма» (он не «фуджи но яма», разумеется — так как в японском языке нет звука «ы»: с этой точки зрения «суши», например — тоже ошибка) — «фудзявая гора» (чья гора), ну или опять же гора Фудзи. Чтение того же самого иероглифа изменилось именно потому, что здесь это уже отдельное, самостоятельное слово. Поэтому-то и используется его японское чтение.

        Кстати, если у кого-то вдруг возникло желание почитать ещё, то очень рекомендую книгу Александра Вурдова «Японский для души. Кандзявые эссе». А в принципе японский с нуля можно начать изучать по довольно весёлым и ненавязчивым урокам вот тут — особенно хорошо подходят для анимешников.
        • +8
          Да, кстати, в хирагане и катакане может встречаться более 47 символов (например: ヰ или ゐ — «ви», ヱ или ゑ — «вэ») — но эти символы считаются устаревшими (точно так же, как, например, буква ѣ) и, в общем-то, не используются — по крайней мере, если вы не Мицгол. :)

          Впрочем, эти устаревшие символы содержатся в тексте стихотворения Ироха-ута (いろは歌 — いろはうた, песня цветов):

          いろはにほへと
          ちりぬるを
          わかよた—れそ
          つねならむ
          うゐのおくやま
          けふこえて
          あさきゆめみし
          ゑひもせす

          Это стихотворение содержит в себе все символы хираганы, кроме ん («н» — кстати, единственная отдельная согласная в хирагане и катакане). Если хочется прочитать в красивом «травяном» написании, то можно посмотреть в виде картинки. Тут используется более старый вариант письма — столбиками. Столбики читаются сверху вниз и справа налево.
          • 0
            О ゑ не знал, но судя по написанию это вообще из хэнтайганы, разве нет?
            • 0
              Да нет, почему? Хэнтайгана — это, грубо говоря, старое написание современных букв (слогов) современной хираганы. Произошла она при более «травянистом» написании знаков манъёганы (где для одного слова могли использоваться разные кандзи).

              А — это, по сути, полноценный знак хираганы, который (вместе с ゐ) с 1946 года почти полностью вышел из употребления (но всё же встречается в некоторых случаях). Например, в заимствованиях пишут ウェ (что тоже читается как «вэ»).

              Ну, а хэнтайгана вышла из употребления (но тоже не полностью) во время реформы 1900 года. Это было нужно в том числе с той точки зрения, что в ней было больше двусмысленности, и возможно было такое, что для одного и того же знака могло быть два разных чтения (плюс обратная ситуация — разные знаки с одинаковым чтением). Тогда установилось, что む должно использоваться только для «му», а ん только для «н» (до этого не было отдельного знака, который бы читался именно как «н»).
        • 0
          Вообще-то 150-200 лет назад японцы, как и многие другие писали и читали все на древнекитайском, а хирагана была алфавитом для простых не образованных людей и женщин. Все писали одинаково, а читали по-своему. Были даже церемонии, где знатные люди не разговаривали, а переписывались, прям как сейчас :)

          А что касается корейского, так их алфавит вообще появился 50 лет назад. И до сих пор все корейское можно написать без запарки по-китайски.
          • +1
            А мне ещё вспомнился вэньянь (китайский письменный язык). И тут же вспомнил про вот эту публикацию. По-моему, она совершенно прекрасна, и, к тому же, у неё есть ещё и продолжение. Почитайте, если ещё не видели.
          • 0
            Хангыль используется в Корее официально с 1945 года. Использовалась и ранее, ещё в XIX веке, а придумана вообще в XV.
    • +13
      В японском используется три разных алфавита, часто в одном тексте. Иероглифический (канзи), символы которого позаимствованы из китайской письменности, но называются/читаются по другому и часто отличаются по смыслу. Не зная языка, текст на чистом канзи, от китайского вы не отличите. Кроме этого, есть еще два фонетических слоговых алфавита хирогана и катакана, которые почти всегда встречаются в тексте и по которым легко определяется японский (они выглядят совсем не как иероглифы). Хирогана используется для транскрипции японских слов (в том числе иероглифов канзи) а катакана — иностранных (например имен и названий).
      • +9
        Вообще говоря, хирагана чаще всего используется не для транскрипции, а для обозначения грамматических форм и разделения слов, так как в японском не используются пробелы. К примеру, 見る(миру) — смотреть, 見て(митэ) — смотри. А текста на чистом кандзи существовать не может, хотя бы потому, что многие вещи записываются исключительно хираганой. Например, частица , примерно соответствующая is в английском. Хотя, транскрипция тоже существует, называется фуригана, и она действительно выполняется хираганой.
        • 0
          Спасибо за уточнение.
        • +4
          текста на чистом кандзи существовать не может


          Вообще то может. В частности манъегана. Но в современном языке используется не чаще чем скажем хэнтайгана (нет, не тот хэнтай).

          Во вторых, заголовки газет, аббревиатуры и прочие ходовые фразы могут получиться целиком на иероглифах. Так что настолько категорично я бы не утверждал.
          • +2
            Манъегана, как уже отмечено, в современном японском практически не используется (насколько я знаю, далеко не все японцы вообще в состоянии её прочесть), что же до заголовков — так ведь это именно заголовки. Я имел в виду достаточно большие самомтоятельные тексты, а не отдельные фразы.
            • +1
              С текстами тоже не все гладко. Например конституция, если не ошибаюсь, целиком пишется катаканой. Неподготовленный читатель вполне ее может спутать с текстом на корейском языке, например.
            • 0
              Опять же, тексты с большим количеством терминов или «высокие» документы будут на 90% из иероглифов. Выхватить отдельные элементы каны сторонний наблюдатель просто не сможет.
              • +1
                Технические тексты, касающиеся IT, могут на 90% состоять из катаканы. Это гораздо страшнее.
                • 0
                  чем страшнее? большая часть технических терминов — это исковерканный транслит с английского, читать же можно даже не зная японского вполне.
                  • +1
                    Исковерканность гарантирует, что без контекста некоторые вещи нереально расшифровать однозначно (а иногда они не расшифровываются без словаря). Плюс все эти сокращения, начиная с パソコン.
                    • +2
                      ну да, возможно и сложновато понять с первого раза, что пасокон это perso[nal] com[puter]
                      немного привыкнуть к принципам искажений придется
                      • +1
                        например
                        * записывается обычно не транслит слов, а транслит произношения
                        * в связи с ограничениями японской фонетики идут преобразования вида m->n, v->b итп
                        • 0
                          «Транслит произношения» называется транскрипцией.
                          • 0
                            Похоже, вы путаете транскрипцию и транслитерацию.
                            Транскрипция — это запись произношения слов при помощи специальных знаков (в настоящее время для этой цели используется международный фонетический алфавит (МФА) в котором есть символы для обозначения любого звука любого языка. Он представляет собой латинский алфавит с разными дополнительными знаками (большинство из них за пределами МФА не используются вообще).

                            Транслитерация — это передача слов одного языка графическими средствами другого языка: например, английских имен — буквами русского алфавит, или арабских — буквами латинского.
                            • 0
                              До вашего комментария я был уверен в том, что транскрипция — это запись произношения слов чем угодно, например, буквами другого языка: «football» → «футбол».
                    • 0
                      Чёрт возьми, как они различают «ソ» и «ン»‽ Особенно в рукописном тексте.
                      • 0
                        Между чертой вниз и чертой вправо большая разница. Особенно в рукописном тексте.
                        • 0
                          На печати (во всяком случае, в том шрифте, который я сейчас вижу) они обе выглядят, как черты вниз-вправо, только немного угол наклона различается. И дуги тоже чуть по-разному наклонены.
                          • +1
                            раз, два, бонус. В рукописном тексте первое со вторым не перепутать, они по-разному пишутся.
          • 0
            Вот придумал фразу целиком на иероглифах 日本語乃例文 которая тем не менее является валидной в современном японском языке. Так что опять же, надо осторожнее.
            • 0
              Забавно. Ну, в конце концов, я пока только начинающий, могу не все знать. Однако, в большинстве обычных случаев, как мне кажется, использование каны все-таки заметно.
            • 0
              Не знаю насчёт правильности, но Google Translate полностью не осилил. При переводе с китайского «ливень»: 例文, с японского — 乃例. Что это, имя?
              • 0
                Тут の заменено на 乃 (в японском — редкий иероглиф, используется только в именах), современные японцы так никогда не делают. Поэтому гугль и неосилил.
              • +1
                Хм, только сейчас сообразил, что «ливень» — это не сильный дождь, а два иероглифа: лѝ 例 и ве́нь 文
              • 0
                例文 в данном случае это «пример предложения» или «предложение-пример» (例 — «пример», 文 — «предложение, текст»). Все вместе будет читаться как «пример предложения на японском языке».

                Хабрачеловек 3al упомянул про знак 乃, однако я встречал его использование и в предложениях именно в роли падежного показателя の. Да, строго говоря это «финт ушами», но никаких запретительных правил на этот счет нет (ну или я их не знаю на данный момент).
        • +3
          Запись хираганой это скорее традиция, нежели строгое правило. Многие управляющие слова, вроде こと пишутся и иероглифом (事), так же как например ため (為).

          В официальных и прочих «высоких» документах текст может всецело записываться иероглифами для понтов.
          • 0
            Угу. Или, например, たち. Можно сказать 子供達, а можно — 子供たち.
        • 0
          >частица は, примерно соответствующая is в английском.

          Очень хорошее приближение для быстрого перевода даже при том, что は всего лишь ставит слово перед ней в именительный тематический падеж. Просто глаголы в японском идут в конце предложения и тот же is часто сокращается до だ либо опускается совсем. Ещё удобны параллели между 's, の и китайскими 的/之.
          • 0
            Для запоминания の есть очень классный трюк:

            Даша — Дашино
            Коля — Колино
            Женя — Женино

            То есть «Дашино мороженое», например — ダシャさんのアイスクリーム («Дася-сан но айсукуриму»).

            Сплошная кана получается, кстати. Причём тут получилось много катаканы, но в некоторых случаях может быть фраза, где много как катаканы, так и хираганы, потому что часть современных японских слов записывается уже без кандзи (просто хираганой).
            • 0
              Угу, только иногда это не совсем так.
              緑の目 — «мидори но ме» — зеленые глаза. В принципе, дословно то же самое — глаза, принадлежащие «зелёности».
      • +1
        Отличите, конечно, потому что — спасибо тов. Мао и Культурной Революции — в Китае с 1950-х годов используются упрощенные иероглифы. Вот, например, штуки: 个 и 個, или восток: 东 и 東, и т.п.
        • +2
          Ну традиционная запись от этого никуда не делась, и в Тайване и Гонконге, например, используется в качестве основной записи. Вообще все множество китайских языков, их письменность и отношения между собой и родственными языкам — довольно запутанная и интересная тема.
        • +2
          Спасибо, конечно, за доброе слово о Культурной революции, но она ни в каком смысле не может быть ответственна за то, что случилось до 1964 г.
    • –6
      Кандзи — это буквы, украденные из Китая. Каждый раз, когда Япония вторгалась в Китай (что случалось очень часто), они брали себе еще немного букв, так что теперь из у японцев 400 газильонов. Все Кандзи состоят из нескольких «черт», которые надо писать в особом порядке, и имеют особое значение, например «лошадь» или «девушка». Кроме того, Кандзи можно комбинировать, чтобы получать новые слова. Например, если объединить Кандзи «маленький» и «женщина», получится слово «карбюратор». Кандзи также произносятся по-разному, в зависимости от того, где они стоят в слове, сколько тебе лет, и какой сейчас день недели. Когда европейцы впервые прибыли в Японию, японские ученые предложили всем европейским народам перенять японский письменный язык, как «универсальный» язык, понимаемый всеми. Это послужило причиной Второй Мировой Войны несколькими годами спустя. Однако, и здесь беспокоиться не о чем, потому что тебе не придется использовать Кандзи в «реальной жизни» — потому что большинство японцев давным-давно отказались от чтения и теперь тратят большую часть времени, играя в «Покемон».
      Рекомендуется к прочтению полностью.
      • 0
        «Карбюратор» убил :)
        • +2
          Это такая странная шутка, которая плавно переросла уже в городскую легенду. На самом деле, конечно, «карбюратор» — в чистом виде заимствованное слово, будет записываться чисто по слогам катаканой: キャブレター.

          Из «маленький» (小) и «женщина» (女), что характерно, если сложить их как 小女 — то это будет «маленькая женщина» (правда, страшно архаичная форма), а если взять это как составные части одного канджи — то боюсь, лучшее, что в этом месте можно получить — 妙 — «отличный», «замечательный».
      • +7
        >Рекомендуется к прочтению полностью.
        Прочитал. За исключением редких мест с подобающими шутками, показалось диким петросянством с чрезмерными гиперболами, хотя те вещи которые высмеиваются безусловно этого заслуживают.
        Когда прочел английский текст, который тоже не шедевр но вроде сносный, все стало на свои места. Текст ужасно переведен на русский и, что еще хуже, не адаптирован (что к сожалению необходимо, потому что он раскрывает американскую специфику получше японской). Явно поработал надмозг.
        Вообще я даже вижу иронию, в том что текст шуточно отговаривающий учить японский переводил(и) люди, которые английский то толком не осилили.
        Вывод: если соберетесь читать, доскрольте до оригинала.
  • 0
    круто теперь я буду угадывать эти закорючки ) спасибо
  • +6
    Надо такое же, только для кодировок сделать.
  • +29
    Как определить верх-низ?

    Встречали китайца, распечатали фамилию и приплыли.
    • +1
      Комментарий достоин баша!
      Спс, посмеялся )))))
      • 0
        По вопросу — лично я — без понятия
    • +2
      У китайцев и японцев всегда лучше спросить, как читается и пишется их имя. Часто один и тот же набор символов читается десятком вариантов.
    • 0
      В китайском почти все иероглифы имеют характерные покаты или склоны, они сверху вниз идут. Если же вашего китайца зовут как-нибудь вроде 上十, то тогда конечно проблема.
      • +1
        Писать оба варианта!
        • НЛО прилетело и опубликовало эту надпись здесь
          • +1
            И встретить двоих китайцев. Следующий вопрос — как их отличить?
    • +4
      В общем-то достаточно изучить основы китайского письма, чтобы такой вопрос уже не вставал. Можно начать с простейших иероглифов: 一, 人, 力, 十, 大, 土, 女, 中, 心, 山, 月, 水 и т.п., а так же посмотреть ключи, которые часто входят в состав сложных иероглиф, они так же помогут найти иероглиф в словаре, в свою очередь это позволяет сопоставить иероглиф и произношение.
  • +2
    Да, про японские и китайские у меня такое же наблюдение.
    Ещё косвенный признак: китайцы традиционно чаще применяют иероглифы с переменной толщиной штриха и засечками (приближенные к каллиграфическим), японцы — без (ровные «типографские» штрихи).
    • 0
      Да, наличие катаканы как бы вынуждает подстраивать все под один стиль, но это далеко не всегда так. Если мы говорим про брендовые надписи, то вероятность большая, но тоже не всегда.

      Со второго — третьего взгляда, можно научиться отличать кану от иероглифов и тогда отличить китайский от японского не сложно.
  • +3
    Набор символов в урду и фарси (персидский) такой же, как в арабском с некоторыми дополнениями. Если используется один шрифт, то отличить почти невозможно, как и иврит от идиша, русский от украинского, белорусского и пр.
    в остальном классно ) спасибо
    • +2
      Белорусский 100%-но опознаётся по букве ў, украинский — по буквам ґ и ї.
      • 0
        украинский узнается скорее по i, а не по надуманной черточке в одном из 5ти слов всего языка (ґанок, ґадзиня, etc.), но задумайтесь, существенно ли это человеку, который смотрит на буквы, как на картинки?
        • 0
          Ну это зависит от того, какое правописание используется — можно писать ґречний, ґречність, ґра, ґриміти і т.д., хотя я с вами согласен, чаще узнается язык все-таки по і. Сам часто обнаруживаю то, что забыл переключить раскладку именно по этой букве.
        • +2
          украинский узнается скорее по i
          Если брать восточно-славянские языки, то «i» может быть как в украинском, так и в белорусском. А ещё — в русском до реформы орфографии. Ещё к характерным украинским можно добавить «є». Если на мгновение представить, что мы не владеем славянскими языками, то ещё не факт, что текст, набранный кириллицей, вообще на одном из славянских языков.
          Расставили, так сказать, точки над «i».
        • 0
          а как у вас получается вводить эти букву (украинскую твердую г)?
      • 0
        Не владеющий славянскими языками по такому признаку точно не отличит (а представленная схема универсальна и не апеллирует к языку читателя).
      • –1
        "ґ"? Удачи :)
    • 0
      А в сербском есть љ, њ, ђ, ћ и џ. А в случае с латинским написанием (гаевица, которая является почти единственным используемым письмом в Черногории, например) — характерны đ, ž, ć, č и š. Другое дело, что черногорцам обычно лениво настраивать на компьютере сербскую раскладку и они просто пишут английскими буквами (то есть, например, c — это и c, и ć, и č). Поэтому если не знать сербский достаточно хорошо, то замучаешься в словаре искать все возможные варианты слова. :)
      • +1
        И не только черногорцы пишут просто латинскими буквами. В интернете (например, в Твиттере) часто даже сами сербы пишут просто латиницей, что уж за хорватов и боснийцев говорить…

        Ну, и панграмма на десерт:
        Љубазни фењерџија чађавог лица хоће да ми покаже штос.
        Ljubazni fenjerdžija čađavog lica hoće da mi pokaže štos.


  • +7
    Урду пишется арабскими буквами. Визуально не отличается.
  • +5
    Вяяяязь आईडीई
  • –8
    мешанина какая-то, китайский и японские иероглифы в картинке пересекаются… нельзя ей руководствоваться.
    • +2
      Все правильно. Они и в языке пересекаются. Почитайте комменты выше.
  • +4
    Вставлю свои пять копеек. «На глаз» урду и арабский почти не различить, придётся вчитываться в слова. На самом деле, есть разница в почерках, но не думаю, что это как-то отражено в компьютерных шрифтах. А вот персидский (фарси), который использует арабскую вязь, можно опознать по четырём буквам, которых нет в арабском: پ ,چ ,گ ,ژ.
  • +3
    Хинди стоило бы заменить на деванагари, потому как маратхи (и ещё несколько языков) используют ту же письменность.
  • 0
    Когда выкатывали свою игру на корейские и японские соц. сети тоже со временем научился на глаз различать их, но поначалу было тяжко.
  • +9
    Редкие тамильский (70 млн), каннада (38 млн), телугу (80 млн) — все вместе превышают численность населения России.
    • +1
      Редкие за счет малой вероятности их присутствия в печатном или цифровом виде.
  • +4
    1) Китайский — много вертикальных и горизонтальных палочек
    2) Японский — есть перевёрнутые семёрки «7» в разных проекциях
    3) Корейский — есть буквы символы похожие на букву«ю»
    • +1
      Комментарий прелестен, такую узкость (не в обидном понимании того слова) мышления еще поискать нужно :)
      • 0
        > не в обидном понимании того слова

        а так бывает?
        • 0
          Ну в качестве психологических исследований, это всегда здорово :)
      • 0
        при чём тут узкость мышления? у меня свои личные методы определения языка, я ими поделился. Кстати, вполне успешно работают. По существу есть что сказать?
        • 0
          Я просто заметил, что у вас все образы генерируются через призму русского языка. Это и есть узкость мышления. Просто вот таких людей не так много, большинство из них воспитывались и сформировались еще при совке, где это было вездесущим явлением.

          Ну и я же не со зла. Я вот про катакану много чего слышал, но семерки мне нравятся больше всего :) Ну и буква «ю» тоже порадовала. Извиняюсь, если применил неправильное слово, но с чисто психологической точки зрения, узкость мышления — это норма.
  • 0
    Все таки в японский еще бы катакану добавить. А то фразу コンニチハ世界 неподготовленный читатель может интерпретировать как корейский или как китайский.
  • +1
    Небезызвестный смайлик ಠ_ಠ — «родом» из языка каннада :)

    Восточноиндийские бенгали и чакма непосвящённому и вовсе покажутся каракулями маленького ребёнка.

    Дивехи — язык Мальдивских островов, самоназвание «ދިވެހިބަސް» — напоминает завитки нарезанных кусочков морского каната.

    Красота!
    • 0
      Эх, не везде доехал юникод.

      • 0
        Поддержку восточных и иероглифических языков в системе нужно полностью установить :)
        • 0
          Восточные есть, а вот экзотика потерялась.
  • 0
    В блок схеме у китайского и японского языков последний и предпоследний символ одинаковые. Как так?
    • +4
      Изучите комментарии выше.
      • 0
        Теперь ясно. Но все-таки наверное конкретно эта пара одинаковых символов не лучший пример в статье о том, как РАЗЛИЧАТЬ языки
        • 0
          Почему, как раз показывает, что не надо ориентироваться на отдельные буквы.
  • +2
    В завитушки нужно еще добавить кхмерский (в камбодже такой), а вообще занятная картинка :)
    • +1
      Да чего уж, надо тогда и синдарин, и тёмное наречие.
      • 0
        И клингонский, и квэнью, и глаголицу, и футарк.
        • 0
          Чрезмерно усердствовать, впрочем, не следует, а-то ведь можно и до древнеегипетских иероглифов дойти.

          Хотя такую же схему на тему «как различать различные виды клинописи» я бы изучил.
        • 0
          Кстати, ниже в комментариях вспомнили тенгвар (один из алфавитов синдарина, квеньи и тёмного наречия) и клингонский.
      • +1
        И тот и другое пишутся тэнгваром.
  • +1
    Не хватает эфиопского письма, его можно спутать с армянским.
    • 0
      эфиопский также весьма схож с греческим )
      • +3
        Более того, целый ряд эфиопских цифр похож на буквы русского кириллического алфавита (с помощью которого на Руси вплоть до первых десятилетий XVIII века указывали год и вообще применяли для написания чисел).

        Это объясняется тем, что эфиопское обозначение цифр возникло из древнегреческого через посредство коптского письма (копты — от греческого «айгиптос» (египтянин) — египетская народность с православной верой, почти не изменившейся за 2000 лет); тогда как на Русь азбука, основанная на греческой письменности, пришла напрямую — скажем за это спасибо Кириллу и Мефодию.

        Как-то делал картинку для наглядности:

        image

        Таким образом, довольно чётко прослеживается взаимосвязь распространения религии и распространения письменности.
        • +2
          спасибо и за информацию, и за time machine )
        • +1
          Кстати, да, некоторые символы эфиопского алфавита еще и похожи на глаголицу.
          И еще одно замечание: копты — все-таки не совсем православные. С православием их сближает обрядность, но при этом имеется ряд догматических отличий (в отличии от православных, копты отрицают человеческую природу Христа, и признают лишь божественную).
    • +3
      (Картинка для примера)

      • 0
        Ну так эта картинка образца 1896 года. Если уж сравнивать, то лучше по юникодным чартам.
        • 0
          Мало что изменилось. (Случайный текст на амхарском из сети)

  • +1
    спасибо за схему — весьма информативно!
    однако должен сделать пару замечаний по поводу армянского языка ;)
    1. слово "мир" в конце лишняя буква ը. хотя и именительный падеж, однако правила здесь немного другие (в данном случае получается винительный падеж).
    2. в основе армянского алфавита многие буквы из латинского алфавита (например, h, который также произносится как и в англ.).
    также схожи как многие морфологические части (корни, суффиксы, префиксы), так и лексические (многие значения прямо таки произносятся и пишутся как в латыни/англ. языке).
  • 0
    Канада?
    • +1
      Нет, не Канада. Хотя в Канаде есть интересная письменность — слоговое письмо эскимосов. Квадратики, треугольники =)
      • 0
        Эскимосских слоговых азбук существовало несколько. Но ни одна из них, насколько мне известно, не прижилась.
        Письмо, используемое в Канаде сейчас — это вариант слогового письма для индейцев кри, несколько искусственного, придуманного, кстати, европейскими миссионерами=))) В Нунавуте сейчас имеет официальный статус. Хотя есть мнение, что латиница была бы гораздо удобнее.
  • +8
    Гулять так гулять!
    Ещё есть тегнавар (квенья, черное наречие, синдарин, телерин, нандорин)


    И ауребеш (основной галактический базовый).
    • +8
      Как можно было забыть клингонский?
      image
    • +1
      Из Футурамы:
    • +3
      Вспомнив тенгвар, следовало бы вспомнить и кирт:

      [пример]
    • +1
      Тенгвар я вообще обожаю. Даже написал конвертер из кириллицы. Только пишите пожалуйста название этой письменности правильно.
    • –1

      Иркский. Довольно малоизвестный (и незаконченый) алфавит.
    • 0
      Чем-то похоже на туарегское письмо тифинаг:)
    • 0
      А ещё кхароштхи
  • +1
    Тема китайского упрощенного и китайского традиционного не раскрыта.
  • +1
    Чем-то это мне напомнило «Историю Искусства», где учили определять художников на глаз.
  • 0
    Не уверен, что об этом еще никто не написал, но в схеме ошибка: не хватает стрелки из «связанные» по «нет» в «остались только редкие» (или еще куда-нибудь).
  • 0
    Уже опередили с вымышленными алфавитами, но армянский таки довольно сильно тенгвар напоминает.
  • +2
    Еще есть сингальский язык, тоже очень красивый. :)
    ක ඛ ග ඝ ඞ ඟ ච ඡ ජ ඣ ඤ
    Кстати, у него носителей примерно в три раза больше, чем у армянского.
    • +19
      Действительно очень красивая письменность.
      Но есть и странности:

      imageimage
  • 0
    Что касается арабского, он отличается от всех остальных на раз-два. Даже от персидского.

    Я его даже как-то изучал…
    • +1
      Так вопрос не стоит так, что читающий знает язык и угадывает его, а именно пытается распознать язык. А то получается так: «текст написан на армянском, так как вы учили армянский и узнали пару-тройку знакомых вам слов». Замечательная «логика».
      • 0
        Я не сказал, что я узнаю арабский потому что я его изучал.

        Просто однажды увидев арабские письмена, вы их можете легко отличить от любых других иероглифов. Даже от персидских
        • 0
          Персидский же использует именно арабскую вязь в качестве письма, которую они переняли после исламизации, нет?
          • 0
            Отличия всё же видны. Арабская вязь более прямая. Или она такая только на картинке? Персидскую до сих пор ни разу не видел
            • 0
              Я Фарси тоже не знаю. Судя по статье в википедии, это арабское письмо как есть в которое добавили несколько новых букв, для обозначения звуков, которые есть в Фарси но не а Арабском. Если знать — можно отличить, но просто на вид, думаю, будет трудно.

              Пример из Google Translate:
              Арабский:
              مرحبا العالم
              Фарси:
              سلام جهان
            • 0
              Особенности написания арабской вязи в разных текстах могут варьироваться.
  • +1
    Странно, что никто не вспомнил чероки: ᎤᎵᎮᎵᏍᏗ
  • 0
    Как может человек, не знающий этих письменностей, принять решение на первой же развилке, «иероглифы»?
    Почему каннада, телугу и гуджарати попали в «вязь»? По виду же явные «отдельные закорючки».
  • +2
    Простите меня за эту маленькую неуклюжую шалость, но не могу удержаться:

    image
  • +1
    Странно, что ещё не было упоминания сайта со всеми письменностями: Omniglot.
  • +1
    У вас иврит слева-направо.
    • +4
      Не только иврит, но и идиш, арабский, урду и фарси — у всех письменностей с письмом справа налево на картинке порядок слов наизнанку (world hello вместо hello world). Порядок букв в словах правильный (ну только в иврите одна буква «съехала» со своего места, должно было быть "שלום עולם").

      На распознание письменности по виду символов это всё равно не влияет.
      • +1
        я просто скопипастил из гугла, извиняюсь если что не так :)
  • 0
    Давно интересуюсь историей письма, и прочитал пост с большим интересом. Позволю себе несколько критических замечаний.

    В предложенной блок-схеме учтены далеко не все особенности используемых в мире письменностей.
    Скажем, письменность на основе арабской графики используется не только в арабском и в персидском, а еще и в других языках (пушту, дари, курдский, уйгурский, урду и т.д., и т.п.), и во всех этих языках имеются некоторые индивидуальные особенности написания.

    Письменность, похожая на используемую в хинди или бенгальском, используется в очень многих индийских языках. Руководствуясь данной схемой, не мудрено перепутать хинди с мартахи или непали (и т.п.).

    И еще вопрос к автору поста: на какие работы по истории письма/дешифровке Вы опирались при написании данного поста?
  • +2
    И еще один практический вопрос. Можете ли Вы, опираясь исключительно на данную блок-схему, определить, что это за письменность:

    ߞߏ ߡߍ߲ ߞߵߊ߬ ߞߍ߫ ߊ߲ ߛߋ߫ ߘߊ߫ ߞߊ߬ ߕߟߋ߬ߓߊ߰ߓߟߐߟߐ ߘߊߦߟߍ߬ ߒߞߏ ߦߋ߫ ߸ ߊ߲ ߧߴߊ߲ ߞߊߘߊ߲߫ ߏ߬ ߘߐ߫ ߞߙߊߕߊߕߊ߫ ߞߊ߬ ߒ߬ ߓߊߘߋ߲ ߕߐ߬ߡߊ ߟߎ߬ ߟߊߞߍ߫ ߊ߬ ߞߊ߬ߟߊߡߊ߬߸ ߞߵߊ߬ߟߎ߬ ߡߊߛߊ߬ߡߊ߲߫ ߞߵߊ߬ߟߎ߬ ߡߊߘߏ߲߬ ߒ߬ ߠߊ߫ ߒߞߏ ߛߘߊߟߊ߫ ߞߏߓߊ ߣߌ߲߬ ߞߊߡߊ߲ ߞߣߐ߫߸ ߏ߬ ߘߏ߲߬ ߕߴߛߋ߫ ߘߊߓߊ߲߫ ߠߊ߫ ߝߋߎ߫ ߝߏ߫ ߊ߬ߟߎ߬ ߦߋ߫ ߛߋ߫ ߞߊ߬ ߓߟߐߟߐ ߞߐߜߍ ߟߎ߬ ߡߊߝߟߍ߫ ߟߴߊ߬ߟߎ߫ ߖߘߍ߬ ߦߋ߫?
    • 0
      Псевдописьменность какая-то, больше всего похожа на битую кодировку.
      • 0
        Это не псевдописьменность. Это письмо нко, используемое в Западной Африке (в основном — в Гвинее, но используется и в Мали, и в некоторых районах Кот-д'Ивуара). По очертаниям оно похоже на арабский (собственно, его создатель Сулимана Конте взял за образец арабский алфавит). Читается справа налево.
    • 0
      И как эту кодировку подключить? :)
      На какой операционке и с какими параметрами — оно будет работать?
      • 0
        Как сообщает Википедия, Pango 1.18 и GNOME 2.20 имеют встроенную поддержку письменности нко.
        См. также ссылки здесь: en.wikipedia.org/wiki/N%27Ko_alphabet

        P.S. А вы тоже интересуетесь языками манде?
  • +1
    Мне кажется, автор путает «распознание языка» и «распознание письменности».

    Как уже упомянули, арабский, урду и фарси (и ещё масса языков) пользуются одной и той же письменностью, и определить на глаз, на каком из языков текст, набранный «арабской вязью», не зная самих этих языков, совершенно невозможно.
    То же самое касается иврита и идиша, то же самое касается нескольких индийских языков с письмом деванагари, и т.д.

    Также уже упомянули, что на глаз можно отличить кандзи от каны, но не китайский от японского. Да и японский язык не перестаёт быть японским языком, если он записан латиницей.

    С интересом бы воспринял статью именно о распознавании языков, например в латинской транслитерации, чтоб нивелировать эффекты письменности. По принципу, «если часто встречается сочетание th, значит английский, если встречается сочетание sch и много слов с заглавной буквы, значит немецкий, и так далее».
    • +2
      Вот определитель языков мира по письменности: www.binetti.ru/collectio/philologia/opredelitel.shtml

      Конечно, книга издана в 1961 году, и часть приведенной в ней информации уже устарела (например, во многих младописьменных языках Азии и Африки в то время еще не сложилось орфографической нормы). Но пока что она остается наиболее авторитетным и подробным из всех известных источников на эту тему.
  • +9
    Откуда, разрази меня гром, здесь столько людей разбирающихся в японском и китайском.
    • +4
      Это помните?
      <Sashok> — Здравствуйте, это канал об аниме?...
      • 0
        Я вот на Хабрахабре и ключевое слово (точнее, словосочетание) соответствующее создал.
    • 0
      あなたは日本語が少し分かりますか。
      • 0
        Знаете ли вы немного японского? И что, собственно?
    • 0
      Простите, а где по-вашему сейчас все гаджеты производят?
      • 0
        Простите, но как это дает ответ на мой вопрос? :)
  • 0
  • 0
  • +2
    Кстати, насчёт корейского письма, для любознательных, если кто вдруг ещё не видел: jpg, pdf.
  • +1
    особенно понравилось «символы без излишеств» ))
  • –1
    интересно, что за слова вы подобрали :)
    или на всех языках слово «прекрасно»?
    • +1
      Там hello, world переведённый гуглепереводчиком.
      • 0
        по-грузински именно слово «прекрасно» :)
        кажется, это используют наши горе- (или не горе) программеры вместо hello, world :)
  • 0
    Кажется, ссылки более не работают. Можете поправить?

Только зарегистрированные пользователи могут оставлять комментарии. Войдите, пожалуйста.