タグ

2009年8月27日のブックマーク (2件)

  • シソーラス・類語辞典

    Weblio類語辞典の特徴 様々な同義語や同意語の日語表現を約40万語を収録。 使う場面やニュアンスごとに、類語とシソーラスを分類・整理。 リンクによって「類語の類語」を簡単に検索。 名詞や形容詞、感嘆符など、品詞の区別にとらわれず類語を紹介。 通俗表現やセリフも多数収録。 Weblio類語辞典は、以下の辞書を利用しています。 「Weblio類語・言い換え辞書」 Weblioシソーラス(自動抽出機能)

  • Common Lisp と 日本語 と 文字コード

    external-format の使い方がわかったところで、実用的には文字コードの判定処理が必要になる場合が多い。 external-format を知っただけでは、with-open-file の external-format に何を指定すればいいのか迷ってしまう。 で、いろいろ蘊蓄を語ろうと思ったのだが、ふと Gauche の文字コード判定処理を CL に移植して比較したところ 性能、精度とも私の手作りのものより断然よかったのでこっちを採用。 Gauche のソースの ext/charconv/guess.scm, ext/charconv/guess.c, ext/charconv/guesstab.c が日語エンコーディング判定処理だ。 guess.scm で状態表 guesstab.c を出力し、 C コンパイラで guess.c guesstab.c をコンパイルしてモジュ