Sample usage for wordnet¶ b.. Copyright (C) 2001-2024 NLTK Project .. For license information, see LICENSE.TXT WordNet Interface¶ WordNet is just another NLTK corpus reader, and can be imported like this:
どちらかというとメモ書き.流れとしては,sqlite3のデータをダンプして,少し修正して,MySQLに流す. まずはダンプ. ~$ sqlite3 wnjpn.db .dump > wnjpn.mysql.dump このできたダンプファイルはテキストで,MySQL用ではないので以下のように修正. 最初の「PRAGMA foreign_keys=OFF;」,「BEGIN TRANSACTION;」を削除 最後の「COMMIT;」とそこから上にある「CREATE INDEX」を削除 各SQL文のテーブル名を囲む「"」を削除 本当は最初にdrop table if existsとかするんだろうけど,省略. あとは普通にMySQLに流し込むだけ.データベースはあらかじめ作っておく. ~$ mysql -u -h -p < wnjpn.mysql.dump
日本語 WordNet リリース * 画像 * ダウンロード * 今後の予定 * 参考文献 * リンク * English 本プロジェクトでは、 Princeton WordNet や Global WordNet Gridに 着想をえて、日本語のワードネットを構築し、オープンで公開します。 独立行政法人情報通信研究機構(NICT)では、自然言語処理研究をサポー ト する一環として、2006年に日本語ワードネットの開発を開始しました。最初の 版、version 0.9は、2009年2月にリリースされました。このversion 0.9は、 Princeton WordNetのsynsetに対応して日本語をつけています。もちろん、 Princeton WordNetにはない日本語synsetを付与する必要があり、また、 Princeton WordNetにみられるsynsetの階層構造に、
はじめに この文書は、 Steven Bird, Ewan Klein, Edward Loper 著 萩原 正人、中山 敬広、水野 貴明 訳 『入門 自然言語処理』 O'Reilly Japan, 2010. の第12章「Python による日本語自然言語処理」を、原書 Natural Language Processing with Python と同じ Creative Commons Attribution Noncommercial No Derivative Works 3.0 US License の下で公開するものです。 原書では主に英語を対象とした自然言語処理を取り扱っています。内容や考え方の多くは言語に依存しないものではありますが、単語の分かち書きをしない点や統語構造等の違いから、日本語を対象とする場合、いくつか気をつけなければいけない点があります。日本語を扱う場合にも
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く