Dogs are the most popular pet in the U.S.: 65.1 million households have one, according to the American Pet Products Association. But while cats are not far off, with 46.5…
Dogs are the most popular pet in the U.S.: 65.1 million households have one, according to the American Pet Products Association. But while cats are not far off, with 46.5…
Googleは米国時間9月20日、「Googleドライブ」の検索機能で自然言語処理をサポートすることにより、ドキュメントの検索がさらに容易になると発表した。 ファイル内のキーワードを使うだけでなく、ユーザーは「『find my budget spreadsheet from last December(昨年12月の予算のスプレッドシートを探して)』とか、『show me presentations from Anissa(Anissaのプレゼン資料を見せて)』といったようなテキストを入力できる」と、Googleの製品担当マネージャー、Josh Smith氏はブログで説明している。「Googleドライブは、ユーザーの意図を把握して(リンク形式の)オプションを提示し、クリックするとそうした特定の検索結果が得られる」 自然言語機能は検索を重ねるごとに向上するはずだと、Smith氏は記している。
(1)はこちら、(2)はこちらから。 自然言語処理における前処理、後処理 自然言語処理では各種ツールの前後でデータを変換する前処理、後処理が必要となることがあります。本節ではその際に利用できるモジュールなどを紹介します。 表記の正規化 自然言語処理では、先述のUnicode正規化に加えて必要に応じて正規化を行います。 Regexp::Assemble Regexp::Assembleは、正規表現を使用して表記の正規化を行う場合に重宝するモジュールです。指定したパターンにマッチする高速な正規表現を生成します。 Number::Phone::JP Number::Phone::JPは電話番号の正規化を行う場合に使うモジュールで、数字の並びが電話番号か判定し、電話番号である場合は特定の番号表記に統一するといったことができます。 Text::Darts Text::Dartsにはgsubというメ
Twitterで@zelchmixijp先生のつぶやきから言語処理学会の2008年までの学会誌が公開されているのに気づきました。自然言語処理の最先端の研究を論文のPDFという形で読むことができます。閲覧は年別か、キーワード検索を行なうことができます。The error occurred in this web page. 私は最近の論文や興味のある分野の論文についてはだいたい知っていたのですが、1994年の創刊号から時系列順にまとまっているので、初期の論文がどんな感じだったかとか、90年代後半の研究動向について知ることができます。昔の論文を読むと、業界では有名な先生方の若い頃の仕事を垣間見ることができたりして、面白いです。 というわけで、いくつか紹介していきたいと思います。なおPDFにリンクを張っているので、ブラウザで開く場合はPDFを非常に高速に表示できるChrome 8以降をおすすめし
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く