タグ

japaneseに関するgymnoのブックマーク (4)

  • Fedora 9 の悲しい点

    昨晩 Fedora 9 をインストールしてみました。予告どおり、VLGothic が日語のデフォルトフォントになっています。久しくさざなみでしたが、大きく改善されたと言っていいでしょう。これはいいことのひとつです。 でも、ダメな点もあるんです。 それは、日語関係のバグ。設定ファイルにミスがあって、インプットメソッドがインストールされないのです。これでは日語が入力できません。これのたぶん一番簡単な解決方法は、メタパッケージ「scim-lang-japanese」をインストールしてしまうことです。 ですが、私の場合(?)これだけでは解決しません。私は多少訳があって、英語環境でログインしているのですが、英語環境で日本語入力をできるようにするためには、[System]−[Preferences]−[Personal]−[Input Method] を立ち上げて、「Enable input m

  • シソーラス(類語)検索

  • 誤用・慣用

    佐藤和美 誤読 佐藤和美 (1998/06/20 11:00) 「凡例」をなんと読むでしょうか。これはわりと有名なまちがえやすい字です。答えは「はんれい」です。 私は高校時代に「五十歩百歩」を「ごじゅっぽひゃっぽ」で辞書をひいて、出てこなかった経験があります。出てくるわけないですね。正しくは「ごじっぽひゃっぽ」ですから。 「早急」はなんと読むでしょうか。答えは「さっきゅう」です。「そうきゅう」という読み方は来はまちがいですが、「そうきゅう」と読む人がだんだん増えて、それでとおるようになってしまいました。こういうのを慣用読みといいます。 「発足」の読み方 GAUCHA (2001/08/30 12:30) 組織などが設立されて活動を始めるという意味の「発足」を、私は「ほっそく」と読んできましたが、辞書は「はっそく」も見出し語として載せています。三省堂の新明解国語辞典には「ほっそく」の新しい

  • グーグルが日本語N-gramデータを公開 ― @IT

    2007/11/01 グーグルは11月1日、大規模日語コーパスのN-gramデータを公開した。N-gramは自然言語処理の領域で、単語同士の結びつきを統計的に処理する計算モデル。「グーグルで検索」「グーグルで調べる」「グーグルで探す」のように特定の単語(例では“グーグル”)と、他の単語の結びつきを予測できる。 N-gramは特定の位置にある単語が何であるかを、その直前の単語、さらに前の単語……、とN個分さかのぼって推測できるという仮説に基づいている。かな漢字変換、OCRのエラー訂正、機械翻訳、音声認識などに使われている。 公開したのはグーグルがWebサイトから抽出した約200億文(約2550億単語)の日語データから作成したN-gramデータ(1~7gram)。データは特定非営利活動法人 言語資源協会を通じて配布しており、団体・個人の区別なく利用できる。これまで米グーグル英語について同

  • 1