投稿者 まこ  (社会人) 投稿日時 2021/9/6 19:14:15
魔界の仮面弁士様、ありがとうございます。

非常に濃い内容をご教示頂き、感謝します。

サロゲートペアについては、理解できたつもりです。今まではエンコードに関係なく
U+29E3D 「𩸽」はサロゲート文字という認識だったのです。
今回の件でUTF-16の時のみにサロゲートペアという2バイトのペアを使って表現するという事がわかりました。

異体字については、存在自体は存じておりましたが、関わる事案がなかったので深く調査したことはありませんが
これを機に少し調べようと思います。サロゲートと同じような仕組みで実装されているのですね。

内容が広域なので、全て理解できたとは言えませんが、少しずつ勉強していきたいと思います。
とりあえず、今回の件はこれで解決とさせていただきます。

本当に、ありがとうございました。感謝....