Pull to refresh

Comments 3

Цитата:

в UTF-16 кодовая точка всегда использует 2 байта (16 бит)

И тут же противоречие:

Но максимальным значение 16-битного числа является 65535! Как представляются большие числа в UTF-16? Для этого используется концепция суррогатной пары (surrogate pair)

Вывод: В UTF-16 кодовая точка, также как и в UTF-8, занимает максимум 4 байта.

Да как обычно, путают code point и code unit. Code unit в utf16 всегда два байта, а code point кодируется одним или двумя code unit'ами.

Sign up to leave a comment.

Articles