Что-то я как-то неграмотно фразу выстроил (а в топике про языки это практически недопустимо). Будем считать, что я забыл вставить «алфавит состоит» после «то».
Функция редактирования комментариев (хотя бы в течение минуты после публикования!) была бы чрезвычайно полезна.
Хотя в группы их придумали объединять по аналогии с китайскими иероглифами (для записи названий который, и был придуман этот фонетический алфавит), а квадратики куда вписываются буквы их действительно немного напоминают.
Неа. Кандзи от китайских иероглифов отличить по написанию не возможно, они одинаковые. Произносятся по разному, имеют разные значения, но пишутся одинаково.
То есть, если на японском написать фразу без использования хираганы или катаканы, то человек, не умеющий читать ни на одном из языков, хрен разберет, что это за язык.
В японском есть так называемые кокудзи (国字 — こくじ, национальные символы). Это японские иероглифы, их не очень много (то есть вообще-то их есть несколько сотен, но реально сейчас используются только некоторые из них).
Остальное — алфавит: хирагана (平仮名) и катакана (片仮名) — обе по 47 базовых знаков (плюс могут быть их сочетания). И, конечно же, кандзи — и это как раз китайские символы. У них, кстати, есть он-ёми (音読み — японизированное китайское чтение иероглифа) и кун-ёми (訓読み — японское чтение).
Выглядит хирагана, кстати, вот так: ひらがな
А катакана вот так: カタカナ
Если хотя бы несколько раз увидеть японский текст (и присмотреться), то даже не зная этих алфавитов можно их достаточно легко отличать друг от друга (и от иероглифов).
(Надеюсь, никто уже не пользуется ОС, где в поставке нет китайских и японских шрифтов.)
История возникновения двух чтений и китайских иероглифов, использующихся в японском языке (кандзи), очень проста: когда на японский архипелаг с материка проникли иероглифы (это было очень давно), то те японские слова, которые наиболее точно подходили по смыслу к тем или иным иероглифам, стали записываться такими иероглифами. Например, японское слово «мити», которое означает «дорога», стали записывать иероглифом 道, который в китайском, собственно, тоже означает дорогу или путь — «дао». Но поскольку отдельно стоящий иероглиф читается по кун-ёми, то когда кто-нибудь читает японский текст и видит иероглиф 道, то он читает именно みち («мити»), а не どう («до:» — упрощённое японизированное китайское чтение).
А вот если этот иероглиф — часть слова, то тогда уже будет использоваться он-ёми. Например, 水道 читается суйдо: (двоеточие ставится в случае удлинения гласной: すいどう).
Кстати, с этим связано очень весёлое недоразумение. Дело в том, что очень многие люди в России уверены, что гора Фудзи по-японски будет «фудзияма». Так вот, на самом деле это — ошибка. По-японски это будет «фудзисан» (富士山, то есть ふじさん) — потому что он-ёми для иероглифа «гора» (山) именно さん — «сан» (либо せん — «сэн»), но не やま (яма). やま — это кун-ёми, японское чтение для 山.
Таким образом, ошибка тут заключается в неправильном чтении слова. Тем не менее, если написать 富士の山, то это уже будет читаться как ふじのやま, то есть «фудзи но яма» (он не «фуджи но яма», разумеется — так как в японском языке нет звука «ы»: с этой точки зрения «суши», например — тоже ошибка) — «фудзявая гора» (чья гора), ну или опять же гора Фудзи. Чтение того же самого иероглифа изменилось именно потому, что здесь это уже отдельное, самостоятельное слово. Поэтому-то и используется его японское чтение.
Кстати, если у кого-то вдруг возникло желание почитать ещё, то очень рекомендую книгу Александра Вурдова «Японский для души. Кандзявые эссе». А в принципе японский с нуля можно начать изучать по довольно весёлым и ненавязчивым урокам вот тут — особенно хорошо подходят для анимешников.
Да, кстати, в хирагане и катакане может встречаться более 47 символов (например: ヰ или ゐ — «ви», ヱ или ゑ — «вэ») — но эти символы считаются устаревшими (точно так же, как, например, буква ѣ) и, в общем-то, не используются — по крайней мере, если вы не Мицгол. :)
Впрочем, эти устаревшие символы содержатся в тексте стихотворения Ироха-ута (いろは歌 — いろはうた, песня цветов):
Это стихотворение содержит в себе все символы хираганы, кроме ん («н» — кстати, единственная отдельная согласная в хирагане и катакане). Если хочется прочитать в красивом «травяном» написании, то можно посмотреть в виде картинки. Тут используется более старый вариант письма — столбиками. Столбики читаются сверху вниз и справа налево.
Да нет, почему? Хэнтайгана — это, грубо говоря, старое написание современных букв (слогов) современной хираганы. Произошла она при более «травянистом» написании знаков манъёганы (где для одного слова могли использоваться разные кандзи).
А ゑ — это, по сути, полноценный знак хираганы, который (вместе с ゐ) с 1946 года почти полностью вышел из употребления (но всё же встречается в некоторых случаях). Например, в заимствованиях пишут ウェ (что тоже читается как «вэ»).
Ну, а хэнтайгана вышла из употребления (но тоже не полностью) во время реформы 1900 года. Это было нужно в том числе с той точки зрения, что в ней было больше двусмысленности, и возможно было такое, что для одного и того же знака могло быть два разных чтения (плюс обратная ситуация — разные знаки с одинаковым чтением). Тогда установилось, что む должно использоваться только для «му», а ん только для «н» (до этого не было отдельного знака, который бы читался именно как «н»).
Вообще-то 150-200 лет назад японцы, как и многие другие писали и читали все на древнекитайском, а хирагана была алфавитом для простых не образованных людей и женщин. Все писали одинаково, а читали по-своему. Были даже церемонии, где знатные люди не разговаривали, а переписывались, прям как сейчас :)
А что касается корейского, так их алфавит вообще появился 50 лет назад. И до сих пор все корейское можно написать без запарки по-китайски.
А мне ещё вспомнился вэньянь (китайский письменный язык). И тут же вспомнил про вот эту публикацию. По-моему, она совершенно прекрасна, и, к тому же, у неё есть ещё и продолжение. Почитайте, если ещё не видели.
В японском используется три разных алфавита, часто в одном тексте. Иероглифический (канзи), символы которого позаимствованы из китайской письменности, но называются/читаются по другому и часто отличаются по смыслу. Не зная языка, текст на чистом канзи, от китайского вы не отличите. Кроме этого, есть еще два фонетических слоговых алфавита хирогана и катакана, которые почти всегда встречаются в тексте и по которым легко определяется японский (они выглядят совсем не как иероглифы). Хирогана используется для транскрипции японских слов (в том числе иероглифов канзи) а катакана — иностранных (например имен и названий).
Вообще говоря, хирагана чаще всего используется не для транскрипции, а для обозначения грамматических форм и разделения слов, так как в японском не используются пробелы. К примеру, 見る(миру) — смотреть, 見て(митэ) — смотри. А текста на чистом кандзи существовать не может, хотя бы потому, что многие вещи записываются исключительно хираганой. Например, частица は, примерно соответствующая is в английском. Хотя, транскрипция тоже существует, называется фуригана, и она действительно выполняется хираганой.
Вообще то может. В частности манъегана. Но в современном языке используется не чаще чем скажем хэнтайгана (нет, не тот хэнтай).
Во вторых, заголовки газет, аббревиатуры и прочие ходовые фразы могут получиться целиком на иероглифах. Так что настолько категорично я бы не утверждал.
Манъегана, как уже отмечено, в современном японском практически не используется (насколько я знаю, далеко не все японцы вообще в состоянии её прочесть), что же до заголовков — так ведь это именно заголовки. Я имел в виду достаточно большие самомтоятельные тексты, а не отдельные фразы.
С текстами тоже не все гладко. Например конституция, если не ошибаюсь, целиком пишется катаканой. Неподготовленный читатель вполне ее может спутать с текстом на корейском языке, например.
Опять же, тексты с большим количеством терминов или «высокие» документы будут на 90% из иероглифов. Выхватить отдельные элементы каны сторонний наблюдатель просто не сможет.
Исковерканность гарантирует, что без контекста некоторые вещи нереально расшифровать однозначно (а иногда они не расшифровываются без словаря). Плюс все эти сокращения, начиная с パソコン.
например
* записывается обычно не транслит слов, а транслит произношения
* в связи с ограничениями японской фонетики идут преобразования вида m->n, v->b итп
Похоже, вы путаете транскрипцию и транслитерацию.
Транскрипция — это запись произношения слов при помощи специальных знаков (в настоящее время для этой цели используется международный фонетический алфавит (МФА) в котором есть символы для обозначения любого звука любого языка. Он представляет собой латинский алфавит с разными дополнительными знаками (большинство из них за пределами МФА не используются вообще).
Транслитерация — это передача слов одного языка графическими средствами другого языка: например, английских имен — буквами русского алфавит, или арабских — буквами латинского.
До вашего комментария я был уверен в том, что транскрипция — это запись произношения слов чем угодно, например, буквами другого языка: «football» → «футбол».
На печати (во всяком случае, в том шрифте, который я сейчас вижу) они обе выглядят, как черты вниз-вправо, только немного угол наклона различается. И дуги тоже чуть по-разному наклонены.
Вот придумал фразу целиком на иероглифах 日本語乃例文 которая тем не менее является валидной в современном японском языке. Так что опять же, надо осторожнее.
Забавно. Ну, в конце концов, я пока только начинающий, могу не все знать. Однако, в большинстве обычных случаев, как мне кажется, использование каны все-таки заметно.
例文 в данном случае это «пример предложения» или «предложение-пример» (例 — «пример», 文 — «предложение, текст»). Все вместе будет читаться как «пример предложения на японском языке».
Хабрачеловек 3al упомянул про знак 乃, однако я встречал его использование и в предложениях именно в роли падежного показателя の. Да, строго говоря это «финт ушами», но никаких запретительных правил на этот счет нет (ну или я их не знаю на данный момент).
>частица は, примерно соответствующая is в английском.
Очень хорошее приближение для быстрого перевода даже при том, что は всего лишь ставит слово перед ней в именительный тематический падеж. Просто глаголы в японском идут в конце предложения и тот же is часто сокращается до だ либо опускается совсем. Ещё удобны параллели между 's, の и китайскими 的/之.
То есть «Дашино мороженое», например — ダシャさんのアイスクリーム («Дася-сан но айсукуриму»).
Сплошная кана получается, кстати. Причём тут получилось много катаканы, но в некоторых случаях может быть фраза, где много как катаканы, так и хираганы, потому что часть современных японских слов записывается уже без кандзи (просто хираганой).
Отличите, конечно, потому что — спасибо тов. Мао и Культурной Революции — в Китае с 1950-х годов используются упрощенные иероглифы. Вот, например, штуки: 个 и 個, или восток: 东 и 東, и т.п.
Ну традиционная запись от этого никуда не делась, и в Тайване и Гонконге, например, используется в качестве основной записи. Вообще все множество китайских языков, их письменность и отношения между собой и родственными языкам — довольно запутанная и интересная тема.
Кандзи — это буквы, украденные из Китая. Каждый раз, когда Япония вторгалась в Китай (что случалось очень часто), они брали себе еще немного букв, так что теперь из у японцев 400 газильонов. Все Кандзи состоят из нескольких «черт», которые надо писать в особом порядке, и имеют особое значение, например «лошадь» или «девушка». Кроме того, Кандзи можно комбинировать, чтобы получать новые слова. Например, если объединить Кандзи «маленький» и «женщина», получится слово «карбюратор». Кандзи также произносятся по-разному, в зависимости от того, где они стоят в слове, сколько тебе лет, и какой сейчас день недели. Когда европейцы впервые прибыли в Японию, японские ученые предложили всем европейским народам перенять японский письменный язык, как «универсальный» язык, понимаемый всеми. Это послужило причиной Второй Мировой Войны несколькими годами спустя. Однако, и здесь беспокоиться не о чем, потому что тебе не придется использовать Кандзи в «реальной жизни» — потому что большинство японцев давным-давно отказались от чтения и теперь тратят большую часть времени, играя в «Покемон».
Это такая странная шутка, которая плавно переросла уже в городскую легенду. На самом деле, конечно, «карбюратор» — в чистом виде заимствованное слово, будет записываться чисто по слогам катаканой: キャブレター.
Из «маленький» (小) и «женщина» (女), что характерно, если сложить их как 小女 — то это будет «маленькая женщина» (правда, страшно архаичная форма), а если взять это как составные части одного канджи — то боюсь, лучшее, что в этом месте можно получить — 妙 — «отличный», «замечательный».
>Рекомендуется к прочтению полностью.
Прочитал. За исключением редких мест с подобающими шутками, показалось диким петросянством с чрезмерными гиперболами, хотя те вещи которые высмеиваются безусловно этого заслуживают.
Когда прочел английский текст, который тоже не шедевр но вроде сносный, все стало на свои места. Текст ужасно переведен на русский и, что еще хуже, не адаптирован (что к сожалению необходимо, потому что он раскрывает американскую специфику получше японской). Явно поработал надмозг.
Вообще я даже вижу иронию, в том что текст шуточно отговаривающий учить японский переводил(и) люди, которые английский то толком не осилили.
Вывод: если соберетесь читать, доскрольте до оригинала.
В китайском почти все иероглифы имеют характерные покаты или склоны, они сверху вниз идут. Если же вашего китайца зовут как-нибудь вроде 上十, то тогда конечно проблема.
В общем-то достаточно изучить основы китайского письма, чтобы такой вопрос уже не вставал. Можно начать с простейших иероглифов: 一, 人, 力, 十, 大, 土, 女, 中, 心, 山, 月, 水 и т.п., а так же посмотреть ключи, которые часто входят в состав сложных иероглиф, они так же помогут найти иероглиф в словаре, в свою очередь это позволяет сопоставить иероглиф и произношение.
Да, про японские и китайские у меня такое же наблюдение.
Ещё косвенный признак: китайцы традиционно чаще применяют иероглифы с переменной толщиной штриха и засечками (приближенные к каллиграфическим), японцы — без (ровные «типографские» штрихи).
Да, наличие катаканы как бы вынуждает подстраивать все под один стиль, но это далеко не всегда так. Если мы говорим про брендовые надписи, то вероятность большая, но тоже не всегда.
Со второго — третьего взгляда, можно научиться отличать кану от иероглифов и тогда отличить китайский от японского не сложно.
Набор символов в урду и фарси (персидский) такой же, как в арабском с некоторыми дополнениями. Если используется один шрифт, то отличить почти невозможно, как и иврит от идиша, русский от украинского, белорусского и пр.
в остальном классно ) спасибо
украинский узнается скорее по i, а не по надуманной черточке в одном из 5ти слов всего языка (ґанок, ґадзиня, etc.), но задумайтесь, существенно ли это человеку, который смотрит на буквы, как на картинки?
Ну это зависит от того, какое правописание используется — можно писать ґречний, ґречність, ґра, ґриміти і т.д., хотя я с вами согласен, чаще узнается язык все-таки по і. Сам часто обнаруживаю то, что забыл переключить раскладку именно по этой букве.
Если брать восточно-славянские языки, то «i» может быть как в украинском, так и в белорусском. А ещё — в русском до реформы орфографии. Ещё к характерным украинским можно добавить «є». Если на мгновение представить, что мы не владеем славянскими языками, то ещё не факт, что текст, набранный кириллицей, вообще на одном из славянских языков.
Расставили, так сказать, точки над «i».
А в сербском есть љ, њ, ђ, ћ и џ. А в случае с латинским написанием (гаевица, которая является почти единственным используемым письмом в Черногории, например) — характерны đ, ž, ć, č и š. Другое дело, что черногорцам обычно лениво настраивать на компьютере сербскую раскладку и они просто пишут английскими буквами (то есть, например, c — это и c, и ć, и č). Поэтому если не знать сербский достаточно хорошо, то замучаешься в словаре искать все возможные варианты слова. :)
И не только черногорцы пишут просто латинскими буквами. В интернете (например, в Твиттере) часто даже сами сербы пишут просто латиницей, что уж за хорватов и боснийцев говорить…
Ну, и панграмма на десерт:
Љубазни фењерџија чађавог лица хоће да ми покаже штос.
Ljubazni fenjerdžija čađavog lica hoće da mi pokaže štos.
Вставлю свои пять копеек. «На глаз» урду и арабский почти не различить, придётся вчитываться в слова. На самом деле, есть разница в почерках, но не думаю, что это как-то отражено в компьютерных шрифтах. А вот персидский (фарси), который использует арабскую вязь, можно опознать по четырём буквам, которых нет в арабском: پ ,چ ,گ ,ژ.
1) Китайский — много вертикальных и горизонтальных палочек
2) Японский — есть перевёрнутые семёрки «7» в разных проекциях
3) Корейский — есть буквы символы похожие на букву«ю»
при чём тут узкость мышления? у меня свои личные методы определения языка, я ими поделился. Кстати, вполне успешно работают. По существу есть что сказать?
Я просто заметил, что у вас все образы генерируются через призму русского языка. Это и есть узкость мышления. Просто вот таких людей не так много, большинство из них воспитывались и сформировались еще при совке, где это было вездесущим явлением.
Ну и я же не со зла. Я вот про катакану много чего слышал, но семерки мне нравятся больше всего :) Ну и буква «ю» тоже порадовала. Извиняюсь, если применил неправильное слово, но с чисто психологической точки зрения, узкость мышления — это норма.
Это объясняется тем, что эфиопское обозначение цифр возникло из древнегреческого через посредство коптского письма (копты — от греческого «айгиптос» (египтянин) — египетская народность с православной верой, почти не изменившейся за 2000 лет); тогда как на Русь азбука, основанная на греческой письменности, пришла напрямую — скажем за это спасибо Кириллу и Мефодию.
Кстати, да, некоторые символы эфиопского алфавита еще и похожи на глаголицу.
И еще одно замечание: копты — все-таки не совсем православные. С православием их сближает обрядность, но при этом имеется ряд догматических отличий (в отличии от православных, копты отрицают человеческую природу Христа, и признают лишь божественную).
спасибо за схему — весьма информативно!
однако должен сделать пару замечаний по поводу армянского языка ;)
1. слово "мир" в конце лишняя буква ը. хотя и именительный падеж, однако правила здесь немного другие (в данном случае получается винительный падеж).
2. в основе армянского алфавита многие буквы из латинского алфавита (например, h, который также произносится как и в англ.).
также схожи как многие морфологические части (корни, суффиксы, префиксы), так и лексические (многие значения прямо таки произносятся и пишутся как в латыни/англ. языке).
Эскимосских слоговых азбук существовало несколько. Но ни одна из них, насколько мне известно, не прижилась.
Письмо, используемое в Канаде сейчас — это вариант слогового письма для индейцев кри, несколько искусственного, придуманного, кстати, европейскими миссионерами=))) В Нунавуте сейчас имеет официальный статус. Хотя есть мнение, что латиница была бы гораздо удобнее.
Не уверен, что об этом еще никто не написал, но в схеме ошибка: не хватает стрелки из «связанные» по «нет» в «остались только редкие» (или еще куда-нибудь).
Так вопрос не стоит так, что читающий знает язык и угадывает его, а именно пытается распознать язык. А то получается так: «текст написан на армянском, так как вы учили армянский и узнали пару-тройку знакомых вам слов». Замечательная «логика».
Я Фарси тоже не знаю. Судя по статье в википедии, это арабское письмо как есть в которое добавили несколько новых букв, для обозначения звуков, которые есть в Фарси но не а Арабском. Если знать — можно отличить, но просто на вид, думаю, будет трудно.
Пример из Google Translate:
Арабский:
مرحبا العالم
Фарси:
سلام جهان
Как может человек, не знающий этих письменностей, принять решение на первой же развилке, «иероглифы»?
Почему каннада, телугу и гуджарати попали в «вязь»? По виду же явные «отдельные закорючки».
Не только иврит, но и идиш, арабский, урду и фарси — у всех письменностей с письмом справа налево на картинке порядок слов наизнанку (world hello вместо hello world). Порядок букв в словах правильный (ну только в иврите одна буква «съехала» со своего места, должно было быть "שלום עולם").
На распознание письменности по виду символов это всё равно не влияет.
Давно интересуюсь историей письма, и прочитал пост с большим интересом. Позволю себе несколько критических замечаний.
В предложенной блок-схеме учтены далеко не все особенности используемых в мире письменностей.
Скажем, письменность на основе арабской графики используется не только в арабском и в персидском, а еще и в других языках (пушту, дари, курдский, уйгурский, урду и т.д., и т.п.), и во всех этих языках имеются некоторые индивидуальные особенности написания.
Письменность, похожая на используемую в хинди или бенгальском, используется в очень многих индийских языках. Руководствуясь данной схемой, не мудрено перепутать хинди с мартахи или непали (и т.п.).
И еще вопрос к автору поста: на какие работы по истории письма/дешифровке Вы опирались при написании данного поста?
Это не псевдописьменность. Это письмо нко, используемое в Западной Африке (в основном — в Гвинее, но используется и в Мали, и в некоторых районах Кот-д'Ивуара). По очертаниям оно похоже на арабский (собственно, его создатель Сулимана Конте взял за образец арабский алфавит). Читается справа налево.
Как сообщает Википедия, Pango 1.18 и GNOME 2.20 имеют встроенную поддержку письменности нко.
См. также ссылки здесь: en.wikipedia.org/wiki/N%27Ko_alphabet
Мне кажется, автор путает «распознание языка» и «распознание письменности».
Как уже упомянули, арабский, урду и фарси (и ещё масса языков) пользуются одной и той же письменностью, и определить на глаз, на каком из языков текст, набранный «арабской вязью», не зная самих этих языков, совершенно невозможно.
То же самое касается иврита и идиша, то же самое касается нескольких индийских языков с письмом деванагари, и т.д.
Также уже упомянули, что на глаз можно отличить кандзи от каны, но не китайский от японского. Да и японский язык не перестаёт быть японским языком, если он записан латиницей.
С интересом бы воспринял статью именно о распознавании языков, например в латинской транслитерации, чтоб нивелировать эффекты письменности. По принципу, «если часто встречается сочетание th, значит английский, если встречается сочетание sch и много слов с заглавной буквы, значит немецкий, и так далее».
Конечно, книга издана в 1961 году, и часть приведенной в ней информации уже устарела (например, во многих младописьменных языках Азии и Африки в то время еще не сложилось орфографической нормы). Но пока что она остается наиболее авторитетным и подробным из всех известных источников на эту тему.
комментарии (184)