投稿者 まこ  (社会人) 投稿日時 2021/9/5 21:15:52
プログラムとあまり関係ないですが、文字コードについて教えてください。

(1)文字をUnicodeスカラー値で表す場合、16進数表示で頭に「U+」を付けて
「A」だったら「U+0041」のように表す。と覚えていたのですが、
Webなんかでは頭に「#」、末尾に「;」を付けて「#x0041;」のような表記があり、
同じ文字を表しているのは判りますが、どのような使い分けがされるのでしょうか?

(2)又、前者(U+xxxx)は「コードポイント」と言うと思っているのですが、
後者(#xxxxx;)は何と呼べば良いのでしょうか?

(3)コードポイントを一目見て、スカラー値が2バイト(&HFFFF)を超えているものは
サロゲート文字と判断していいでしょうか?