コンテンツへスキップ
ものがたり
戻る

ੴ 本当に歌うの??

グルムキー文字が見えない人ゴメンナサイ…ഛ

今日(25)は日の出ているうちはほとんどDateTimeみたいな雑務に費やしてしまったが、とりあえずcollationはまだ続けている。nonspacing markの順番は全く理解不能な上に、それほど文字の順番の重要度が高いとは思えないので後回しだ。ブヒൠ

というわけで今週は手っ取り早いChar.IsLetter(c) == trueな文字のprimary keyを埋める作業をしている。実際にはprimary equivalentな文字でもUCD (Unicode Character Database)の定めるdecompositionと合致しないところがある(先日ちこっと書いた)部分があって、それは大いに困るのだけど、まあとりあえず見なかったことにしている。

で、collationの命題として、一体どういう順番なんだよ?というのがそれぞれの文字カテゴリについて問題なわけで…

はぁ、疲れた。ここまでで調べるのに1昼夜くらいかかった。

codepoint的にはマラヤーラム文字とタイ文字の間に位置するシンハラ文字が、完全に抜け落ちているのは、意図的なのか、後出しで出てきたセットなのか、分からない。

Footnotes

  1. というか、もしかしたら昔はキリル文字の一部が本当にNFKD非正規形だったのかもしれない


この記事を共有:

前の記事
次の記事
2005-05-26