タグ

corpusに関するnilabのブックマーク (4)

  • Webとコーパス 第六回「日英対訳文対応付けデータ」

    Webとコーパス 第六回「日英対訳文対応付けデータ」 2007-10-29-1 [WebAndCorpus] ウェブ上で使えるコーパスツールを紹介している連載ブログ記事、 今回で6回目になります。今回のテーマは対訳データです。 なお、この記事は「三省堂辞書サイトのブログ」へも転載という形で 提供していますが、そちらでの連載(転載)は今回で最終回となります。 今後は不定期でこのブログ「たつをの ChangeLog」で更新していきます (たぶん年内の更新はないでしょう)。 - ウェブコーパス徹底活用 第六回「日英対訳文対応付けデータ」 - Sanseido Word-Wise Web [三省堂辞書サイト] http://dictionary.sanseido-publ.co.jp/wp/ § ■ウェブコーパス徹底活用 第六回 「日英対訳文対応付けデータ」 「翻訳メモリ」と呼ばれる一連のソフトを

    Webとコーパス 第六回「日英対訳文対応付けデータ」
    nilab
    nilab 2007/11/01
    _ [を] Webとコーパス 第六回「日英対訳文対応付けデータ」
  • Webとコーパス 第三回「英文校正サイト NativeChecker」

    Webとコーパス 第三回「英文校正サイト NativeChecker」 2007-09-18-3 [WebAndCorpus] Web上のテキストデータをコーパスとして見る、 というテーマでブログ記事を書いています。 今回は英文校正サイト NativeChecker を取り上げます。 なお、この記事は「三省堂辞書サイトのブログ」へも転載という形で 提供していますので、そちらでもお楽しみ下さい。 - 第三回「英文校正サイト NativeChecker」 - Sanseido Word-Wise Web [三省堂辞書サイト] http://dictionary.sanseido-publ.co.jp/wp/ ちなみに Sanseido Word-Wise Web によれば、明日19日は、 子供向けかと油断すると結構エグいサバイバル小説「蝿の王」[2004-06-15-4]の 著者ウィリアム・ゴ

    Webとコーパス 第三回「英文校正サイト NativeChecker」
    nilab
    nilab 2007/09/21
    _ [を] Webとコーパス 第三回「英文校正サイト NativeChecker」
  • Webとコーパス 第一回「序論:コーパスとしてのウェブ」

    Webとコーパス 第一回「序論:コーパスとしてのウェブ」 2007-08-20-2 [WebAndCorpus] Web上のテキストデータをコーパスとして見る、 というテーマでちょっと長めの記事を連載という形で書いていきたいと 思います。よろしくです。 今回は序論。次回は EReK を取り上げます。 なお、この記事は「三省堂辞書サイトのブログ」へ転載という形で 提供しています。こちらの方でもお楽しみ下さい。 - ウェブコーパス徹底活用 第一回「序論:コーパスとしてのウェブ」 - Sanseido Word-Wise Web [三省堂辞書サイト] http://dictionary.sanseido-publ.co.jp/wp/ § ■第一回「序論:コーパスとしてのウェブ」 インターネットの発展のおかげで、 調べもの、情報収集が格段に楽になりました。 一昔前は、知ってそうな人を探して聞いてま

    Webとコーパス 第一回「序論:コーパスとしてのウェブ」
    nilab
    nilab 2007/08/24
    _ [を] 第一回「序論:コーパスとしてのウェブ」
  • Webでの単語共起を調べるサイトを作った

    Webでの単語共起を調べるサイトを作った 2007-07-29-3 [Programming][NLP] ヤフー検索を用いてWebでの単語共起を調べるサイト 「Web単語共起」(http://yapi.ta2o.net/tangokyouki/) を作りました。 日語だけじゃなく英語もいけますよ。 Yahoo!ウェブ検索APIで検索結果100件を取ってきて、 日語の場合は形態素解析(MeCabを使用)をかけて、 単語の出現頻度をカウントして表示します。 Unigram は1語単位でのカウント、 Bigram は連続2語単位でのカウント、 Trigram は連続3語単位でのカウントを意味します。

    Webでの単語共起を調べるサイトを作った
    nilab
    nilab 2007/07/30
    _ [を] Webでの単語共起を調べるサイトを作った : Yahoo!ウェブ検索APIで検索結果100件を取ってきて、日本語の場合は形態素解析(MeCabを使用)をかけて、単語の出現頻度をカウント
  • 1