タグ

日本語と自然言語処理に関するkimihitoのブックマーク (4)

  • Vimで少納言をささっと見たい - さわだのノート

    さて、ここからが題です。この少納言、とっても便利なのですが、いちいちサイトを見に行くのは面倒です。ぼくは原稿の編集・執筆にVimを使っており、Yahoo!辞書やWeblioの類義語辞典をVimから閲覧できるようにするためのプラグインを過去に作ってみました。これと同じような仕組みでなんとか少納言も閲覧できないか考えてみたいと思います。 Vimから国語辞典をチェックする - takepierrot Editor Note 続・Vimで国語辞典を見る(同音異義語 対応版) - takepierrot Editor Note これまで作ってきたプラグインは、GETメソッドを用いてアクセスしていましたが、少納言の場合は、POSTメソッドで検索クエリを送信しているみたいです。 POSTメソッドでの送信内容の解析方法は今度説明するとして、とりあえずPerlでコードを書いてみました。 #!/usr/bi

    Vimで少納言をささっと見たい - さわだのノート
  • 国立国語研究所の言語コーパス整備計画KOTONOHA

    国立国語研究所が中心となって,2006年度から5年計画で構築している「現代日語書き言葉均衡コーパス」(Balanced Corpus of Contemporary Japanese,略称BCCWJ)の紹介。BCCWJは,書籍,雑誌,新聞,白書,ベストセラー,Web(掲示板,ブログ),法律,論文等を収録する1億語規模のコーパスです。国立国語研究所では、明治から現代にいたる日語の全貌を把握するための言語コーパスKOTONOHAを構築しています。2006年度から5年間は、現代日語の書き言葉を対象としたコーパスの構築を進めます。サイトでは、この書き言葉コーパスについて説明します。 モニター公開データ利用者アンケート (2010.07.25) モニター公開データの利用者の方を対象に利用実態アンケートを実施しています。(締め切りを2010年8月6日に延長しました) 報告書の追加 (2010.

  • gr.jp

    This domain may be for sale!

  • Python による日本語自然言語処理

    はじめに この文書は、 Steven Bird, Ewan Klein, Edward Loper 著 萩原 正人、中山 敬広、水野 貴明 訳 『入門 自然言語処理』 O'Reilly Japan, 2010. の第12章「Python による日語自然言語処理」を、原書 Natural Language Processing with Python と同じ Creative Commons Attribution Noncommercial No Derivative Works 3.0 US License の下で公開するものです。 原書では主に英語を対象とした自然言語処理を取り扱っています。内容や考え方の多くは言語に依存しないものではありますが、単語の分かち書きをしない点や統語構造等の違いから、日語を対象とする場合、いくつか気をつけなければいけない点があります。日語を扱う場合にも

  • 1