エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
wikipediaからのデータ取得 (Anthy-dev 2821) - Anthy - OSDN
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
wikipediaからのデータ取得 (Anthy-dev 2821) - Anthy - OSDN
Yusuke TABATA yusuk****@w5***** 2006年 2月 18日 (土) 02:12:51 JST 前の記事 [Anthy-dev 2820] Re: ... Yusuke TABATA yusuk****@w5***** 2006年 2月 18日 (土) 02:12:51 JST 前の記事 [Anthy-dev 2820] Re: 登録単語内のスペースの扱い 次の記事 [Anthy-dev 2822] Re: wikipediaからのデータ取得 記事の並び順: [ 日付 ] [ スレッド ] [ 件名 ] [ 著者 ] 田畑です。 anthyの性能向上のためにwikipedia日本語版から統計情報を取ってくる 実験をしているのですが、データを作るところまではできたので 状況を書いておきます。 出力としては、http://ofanim.net/~yusuke/060218/result の ように自立語、付属語に切ったものが得られています。 (2MBのテキストなのでダウンロードの時は注意してください) wikipedia全体だと1GBで1000万