最近の日本の TeX 界隈では「索引」がホットトピックになってるようで、例えば、mendex が(部分的に)Unicode に対応*1したり、或いは、とある TeX な目的のために とある技術情報投稿サイトでとある人が日本語のソート処理の説明を英語で書いていたりする。 ところで、その英語の解説は、JIS X 4061(日本語文字列照合順番)という JIS 規格に定められた処理方法(のうちの一つ)を解説することを目的としているようである。この JIS 規格に、ちょっと解釈に迷う箇所がある、というのがこの記事のお話。 基底文字と照合属性 JIS X 4061 の照合処理*2の対象とする文字列は、通常の日本語表記に現れる文字種*3の全て(記号や欧文文字も含む)を許しているが、ここでの話は、最も重要な部分である「仮名文字列」に対象を絞る。*4そして、この小節では実際の JIS 規格を少し単純化した