タグ

プログラミングとJIS X 4061に関するtekimenのブックマーク (2)

  • JISX4061:1996 日本語文字列照合順番

    2019年7月1日の法改正により名称が変わりました。まえがきを除き,規格中の「日工業規格」を「日産業規格」に読み替えてください。 日工業規格          JIS X 4061-1996 日語文字列照合順番 Collation of japanese character string 1. 適用範囲 この規格は,日語を主とする表記に用いられる文字列を含むレコードの照合順番を規定 する。このため,文字列の順序関係を定める照合規則を規定し,その照合規則のレコードヘの適用の仕方 である照合方法を規定する。 この規格で規定する照合順番は,次の三つとする(参考1.参照)。 (1) 単純照合 (2) 読み・表記照合 (3) 代表読み照合 この規格は,辞書の項目,データベースの索引,書籍の索引,用語集,人名録などのように,各項目に 施されている読み,その項目自体の表記などに基づいて項目を

    JISX4061:1996 日本語文字列照合順番
  • 単なるソートで詰まった話 - Qiita

    この記事はJustSystems Advent Calendar 2017の22日目の記事です。 はじめに 普段は自然言語処理に使う言語資源をいじっています。 担当している業務のひとつに、 辞書リソース(語句リストのようなもの)をソートしてね Excelの「並べ替え」機能を使ってやってね という工程が含まれています。 たしかにExcelで行っても特段コストのかかる作業ではありませんが、普通にsortコマンドで済ませたらもっと楽になるのでは?とあるとき思いました。 とはいえ、「ソート手順を変えた」という要因だけで従来のリソースとの差分が大量に出ると面倒くさいです・・・。1 ということで、まずは様々な条件でソートしてみて、Excelのソート結果を再現できるものはあるか試してみました。 結論としては、自分がやってみた限りではsortコマンドではExcelのソート結果を再現できませんでした。 ただ

    単なるソートで詰まった話 - Qiita
  • 1