jnlpのブックマーク / 2011年5月13日 - はてなブックマーク

サービス終了のお知らせ

サービス終了のお知らせいつもYahoo! JAPANのサービスをご利用いただき誠にありがとうございます。お客様がアクセスされたサービスは本日までにサービスを終了いたしました。今後ともYahoo! JAPANのサービスをご愛顧くださいますよう、よろしくお願いいたします。

jnlp 2011/05/13

リンク

統計的自然言語処理エンジンStaKK - nokunoの日記

統計的自然言語処理エンジンStaKK を開発しました。nokuno’s stakk at master - GitHub 以下、READMEからの引用です。現在の機能かな漢字変換予測変換またはサジェストスペル訂正形態素解析 HTTPによるAPIサーバ Trieの直接操作現在は、StaKK は辞書として Mozc （Google日本語入力のOSS版）のデータを使っています。リバースモードについてStaKK はノーマルモードとリバースモードの2つのモードを持っています。ノーマルモードでは、かなを入力し、単語（主に漢字）を出力します。リバースモードでは、単語を入力し、読みや品詞を出力します。これらの2つのモードの応用例をまとめると、次の表のようになります。機能ノーマルモードリバースモード Convert かな漢字変換形態素解析 Predict 予測変換検索ワードのサ

jnlp 2011/05/13

ツール

リンク

スタンフォード大学の自然言語処理(NLP)の授業公開っぷりがとてつもない件 - Unchained Life

以前からMITのOCWを中心にアメリカの大学の授業のビデオや資料などが公開されているのは知っていたが、今日知ったスタンフォード大学の授業公開っぷりがものすごい。 http://see.stanford.edu/SEE/lecturelist.aspx?coll=63480b48-8819-4efd-8412-263f1a472f5a 授業のビデオだけではなく、なんと授業のtranscript、つまり授業中に先生がしゃべったことがテキストに書き起こされているのだ。 MITなどでも授業のビデオは公開されていたが、当然授業の内容を理解するには授業資料がある場合にせよ、何をしゃべっているかを自分で聞き取るほか無く、リスニング力が低い僕には結構ネックだった。それが今回しゃべる内容がテキストになっているということで聞き取れなくてもテキストを見ればよいし、リスニングの勉強にもなる。しかも公開されてい

jnlp 2011/05/13

勉強

リンク

日本語 WordNet (wn-ja)

日本語 WordNet リリース * 画像 * ダウンロード * 今後の予定 * 参考文献 * リンク * English 本プロジェクトでは、 Princeton WordNet や Global WordNet Gridに着想をえて、日本語のワードネットを構築し、オープンで公開します。独立行政法人情報通信研究機構（NICT）では、自然言語処理研究をサポートする一環として、2006年に日本語ワードネットの開発を開始しました。最初の版、version 0.9は、2009年2月にリリースされました。このversion 0.9は、 Princeton WordNetのsynsetに対応して日本語をつけています。もちろん、 Princeton WordNetにはない日本語synsetを付与する必要があり、また、 Princeton WordNetにみられるsynsetの階層構造に、

jnlp 2011/05/13

言語資源

リンク

自然言語処理における類似度学習(機械学習における距離学習)について - 武蔵野日記

Twitter でグラフ理論に関する話題が上がっていたので、最近調べている距離学習(distance metric learning)について少しまとめてみる。カーネルとか距離(類似度)とかを学習するという話(カーネルというのは2点間の近さを測る関数だと思ってもらえれば)。この分野では Liu Yang によるA comprehensive survey on distance metric learning (2005) が包括的なサーベイ論文として有名なようだが、それのアップデート(かつ簡略)版として同じ著者によるAn overview of distance metric learning (2007) が出ているので、それをさらに簡略化してお届けする(元論文自体本文は3ページしかないし、引用文献のあとに表が2ページあって、それぞれ相違点と共通点がまとまっているので、これを見ると非

jnlp 2011/05/13

勉強

リンク

Perl で自然言語処理

PyData Tokyo 05 でのLTのプレゼン資料です。絵文字に対応した mecab-ipadic-NEologd は以下からダウンロードできます。 https://github.com/neologd/mecab-ipadic-neologd/blob/master/README.ja.md 以下は資料のまとめです。 - mecab-ipadic-NEologdで絵文字に読みを付与するためのエントリを”試験的”に追加したという話 -mecab-ipadicと併用すれることで、絵文字の読み・原型の文字列で検索が可能になりました - 応用 => 言語処理・音声処理・コンテンツ監視等が考えられます - 今後アノテーションは徐々に改善していきます

jnlp 2011/05/13

プログラミング

リンク

自然言語処理

jnlp 2011/05/13

言語処理学会論文ダウンロード

文献

リンク

自然言語処理は Python がいちばん - 武蔵野日記

現在大学1年生の人で3年後には NAIST に (というか松本研に) 来たいという人から「どんなプログラミング言語やっておくといいですか」と質問されたりするのだが、なかなか答えるのは難しい。自分は Perl → Python がメインでときどき C++/C# を使ったりするのだが、どれが一番いいかはなんとも言えないので、自然言語処理以外に転向する可能性も考えると、C とか C++ とか Java とか(授業でそちらをやるのであれば)を最初の武器に選んだ方がいいのでは、と思ってはいる。そんなこんなで最近 Hal Daume III (機械学習を用いた自然言語処理では非常に有名な人) のブログで Language of Choice というタイムリーなエントリーが出ていたので、紹介すると、「それなりに大きな自然言語処理のプロジェクトでどのプログラミング言語を使うのか」というアンケート結果が出

jnlp 2011/05/13

プログラミング

リンク

全てのプログラマが読むべき本まとめ

全てのプログラマが読むべき本まとめは、2010 年 11 月 23 日に投稿された全てのプログラマが読むべき本ベスト10冊 - とみーを発端とする、多くの技術者（ソフトウェアエンジニア）が「全てのプログラマが読むべき本」や「プログラマにおすすめする良書」と言うテーマで執筆した記事の中から、プログラミングやソフトウェア開発に役立つ推薦書籍を集計してランキング形式でまとめた Web サイトです。独学でプログラミングを勉強しようと考えている初心者、初学者等が、書籍を選ぶ際の参考としてご利用下さい。尚、上記期の間以外に公開された記事でも、同様の趣旨で執筆されたものについては集計の対象としています。

jnlp 2011/05/13

プログラミング

リンク

入門自然言語処理を禁書にすべき10の理由 | TRIVIAL TECHNOLOGIES on CLOUD

みんなのIoT/みんなのPythonの著者。二子玉近く160平米の庭付き一戸建てに嫁/息子/娘/わんこと暮らしてます。月間1000万PV/150万UUのWebサービス運営中。免責事項プライバシーポリシー「入門自然言語処理」はヤバい書籍なので禁書にすべきだ。タイトルは釣りじゃない。その理由を10個挙げる。自然言語処理のかなり基本的なことからそこそこ高度なことについて解説されてあり，自然言語処理について理解が深まり過ぎるボリュームがあるのに書き方が平易でついつい読みふけってしまう演習問題があり，自分の理解度を確かめられたりするのもケシカラン原著は欧米語のための言語処理について書かれた書籍なのに，日本語の形態素解析などについても解説してあって我慢できない必要ライブラリのインストールなど環境構築に時間が取られそうでヤバい書籍の応用でBotとか人工無能とか作ったらどうかな−，と

jnlp 2011/05/13

プログラミング

リンク

Python による日本語自然言語処理

はじめにこの文書は、 Steven Bird, Ewan Klein, Edward Loper 著萩原正人、中山敬広、水野貴明　訳『入門自然言語処理』 O'Reilly Japan, 2010. の第12章「Python による日本語自然言語処理」を、原書 Natural Language Processing with Python と同じ Creative Commons Attribution Noncommercial No Derivative Works 3.0 US License の下で公開するものです。原書では主に英語を対象とした自然言語処理を取り扱っています。内容や考え方の多くは言語に依存しないものではありますが、単語の分かち書きをしない点や統語構造等の違いから、日本語を対象とする場合、いくつか気をつけなければいけない点があります。日本語を扱う場合にも

jnlp 2011/05/13

プログラミング

リンク

ノンパラメトリックベイズ法

jnlp 2011/05/13

勉強

リンク

http://www.phontron.com/slides/nonparametric-tutorial-ja-2.pdf

jnlp 2011/05/13

勉強

リンク

ノンパラメトリックベイズ入門〜ベイジアン HMM の実装まで〜

jnlp 2011/05/13

勉強

リンク

Expired

Expired：掲載期限切れですこの記事は，産経デジタルとの契約の掲載期限（6ヶ月間）を過ぎましたので本サーバから削除しました。このページは20秒後にITmedia ニューストップページに自動的に切り替わります。

jnlp 2011/05/13

ニュース

リンク

Su-Gomori

オンサイトコロナウイルス検査サービス市場レポートは、詳細な世界市場シェア分析とともに、制限、主要な推進要因、および機会に関連する情報を提示します。現在の市場を 2023 年から 2030 年まで定量的に分析し、世界市場の成長シナリオを強調します。競争環境は、今後数年間の主要なプレーヤー、戦略、および新しい開発で構成されています。レポートの PDF サンプルコピーを取得: (TOC、表と図のリスト、チャートを含む): https://globalmarketvision.com/sample_request/200434 このレポートは、アプリケーションごとに国際オンサイトコロナウイルス検査サービス市場を分割しています。地域別、タイプ別、エンドユーザー別。市場投資のための信頼できる知識を提供するために、市場の各セグメントが広く調査されています。オンサイトコロナウイルス検査サ

jnlp 2011/05/13

その他

リンク

現代日本語文法概説　主要目次

サービス終了のお知らせいつもYahoo! JAPANのサービスをご利用いただき誠にありがとうございます。お客様がアクセスされたサービスは本日までにサービスを終了いたしました。今後ともYahoo! JAPANのサービスをご愛顧くださいますよう、よろしくお願いいたします。

jnlp 2011/05/13

日本語

リンク

Python入門者に贈る16の鍵 « python練習帳

このエントリーは、Python入門者と、Python入門予備軍の方を対象としています。どうしてPythonやるの？ Pythonって覚えやすい言語なんです。といっても、それなりに使いこなせるようになるには、数十時間程度はかかるわけです。なんとなく・・で勉強するなら、やらないほうがましです。ちゃんと、自分なりの目標を設定してから勉強しましょう。私の目標は、2011年中に、Pythonで日本国内でそこそこ有名になることです。そこそこでいいです。pythonでぐぐって10番ぐらいに表示されれば満足です。それぐらい有名になったら、来年はPythonで仕事しつつ、他のこと勉強してると思います。実は世界的にはPHPより人気がある Pythonは、Java、C、C++に次いで人気のある言語です。決してマイナー言語ではありません。 2011年2月のランキング GoogleAppEngineで使えるク

jnlp 2011/05/13

プログラミング

リンク

半構造データマイニングにおけるパターン発見技法 | CiNii Research

JaLC IRDB Crossref DataCite NDL NDL-Digital RUDA JDCat NINJAL CiNii Articles CiNii Books CiNii Dissertations DBpedia Nikkei BP KAKEN Integbio MDR PubMed LSDB Archive 極地研ADS 極地研学術DB 公共データカタログムーンショット型研究開発事業

jnlp 2011/05/13

文献

リンク

英語例文検索 EReK

英語で書かれたウェブ上のテキストを巨大な例文集（コーパス）とみなし、それを検索します。Web Service by Yahoo! Developer Network / 連絡先

jnlp 2011/05/13

原稿作成

リンク

StatMT Home - statmt - Wiki Service

We use cookies for security purposes, rem embering your preferences and to analyse site traffic to understand our users' behaviour. This includes anonymised Google Analytics data.

jnlp 2011/05/13

文献

リンク

TAGGY、単語の意味変換エンジンで特許--オプトの「Xrost」に導入

TAGGYは1月24日、同社が開発したセマンティック変換技術「おもてなしエンジン」の特許を取得したと発表した。おもてなしエンジンは、ウェブページ上の文章の内容を解析し、その内容を「趣意」を表す単語に変換する技術。たとえば、文章中に「彼氏」「ドライブ」といった単語が含まれていれば、これらの単語の関連から「デート」という本質的な内容を導き出すのだという。おもてなしエンジンの利用によって、キーワードマッチングの手法が大きく変わるとTAGGY代表取締役社長の石上裕氏は説明する。これまでのキーワードマッチングと言えば、ウェブページ上の文章から重要度のある単語を解析し、その単語にマッチした広告やコンテンツを表示するのが一般的。しかしこのエンジンを使えば、直接的に単語でマッチさせるのではなく、ユーザーが潜在的に興味を持つ単語に関する広告などを表示できるようになるという。「ターゲティングデータのオプテ

jnlp 2011/05/13

ニュース

リンク

百度文库搜索 -

jnlp 2011/05/13

中国語

リンク

不適切な書込みの7割は個人情報 - ライブドアニュース

提供社の都合により、削除されました。ランキング総合国内政治海外経済 IT スポーツ芸能女子

jnlp 2011/05/13

ニュース

リンク

漢字変換の発明対価、東芝に６４０万支払い命?? - Google 検索

2012/05/02 · 仮名で入力した文字を効率的に漢字交じりに変換できる日本語ワープロの基本技術を巡り、東芝の技術者だった天野真家湘南工科大教授が、同社に約3億2千 ...

jnlp 2011/05/13

ニュース

リンク

クイズ王に勝利したIBMの「Watson」、学生に実力を披露する

与えられたトピックに関する質問に解答するために最も適したテキスト資料を特定する「知識源拡張アルゴリズム」と、解答候補が正しい可能性が高いことを認識する能力を向上させる「スコアリングアルゴリズム」はどのような用途に使えるのだろうか。 IBMは2011年3月末、米国ピッツバーグ市に立地するCarnegie Mellon University（CMU）でシンポジウムを開催した。IBMのスーパーコンピュータ「Watson」に用いたOpen Advancement of Question-Answering Initiative（OAQA）技術が、医療や法律、ビジネス、コンピュータサイエンス、エンジニアリングなどのさまざまな分野にもたらす可能性について、学究的な関心が集まり、学生たちとのアイデア共有が進んだ。 CMUコンピュータサイエンス学部のLanguage Techno logies Instit

jnlp 2011/05/13

ニュース

リンク

EM algorithm（EMアルゴリズム、Expectation Maximization algorithm）について - データサイエンティスト上がりのDX参謀・起業家

EMアルゴリズムはいろんなところで使われます。基本的には未知パラメータの推定方法の一種です。とりあえず箇条書でまとめます。提案論文：Maximun likelihood from incomplete data via the EM algorithm. Dempster AP, Laird NM and Rubin DB. JRSS B. 39,1-38. 1977. 提案者のRubinは欠測分野、因果推論の権威で次の教科書も書いています。 Statistical Analysis with Missing Data (Wiley Series in Probability and Statistics) 作者: Roderick J. A. Little,Donald B. Rubin出版社/メーカー: Wiley-Interscience発売日: 2002/09/09メディア:

jnlp 2011/05/13

勉強

リンク

Loading...

jnlp 2011/05/13

研究者

リンク

検索を入力のスピードよりも速く

メディア関係者向けお問い合わせ先メールでのお問い合わせ: pr-jp@google.com メディア関係者以外からのお問い合わせにはお答えいたしかねます。その他すべてのお問い合わせにつきましては、ヘルプセンターをご覧ください。

jnlp 2011/05/13

ニュース

リンク

shogun | A Large Scale Machine Learning Toolbox

Shogun - A Large Scale Machine Learning Toolbox This is the official homepage of the SHOGUN machine learning toolbox. The machine learning toolbox's focus is on large scale kernel methods and especially on Support Vector Machines (SVM) [1]. It provides a generic SVM object interfacing to several different SVM implementations, among them the state of the art OCAS [21], Liblinear [20], LibSVM [2], S

jnlp 2011/05/13

ツール

リンク

overlasting.net

overlasting.net 2019 Copyright. All Rights Reserved. The Sponsored Listings displayed above are served automatically by a third party. Neither the service provider nor the domain owner maintain any relationship with the advertisers. In case of trademark issues please contact the domain owner directly (contact information can be found in whois). Privacy Policy

jnlp 2011/05/13

勉強

リンク

テキスト解析 - Yahoo!デベロッパーネットワーク

LINEヤフーが提供するテキスト解析WebAPI 日本語形態素解析日本語文を形態素に分割し、品詞、読みがなの付与、統計情報を取得できる機能を提供します。かな漢字変換ローマ字、ひらがなの文を文節に区切り、変換候補を提示します。短い文字列から変換候補を推測するモードも提供します。VJEと同じ方式のかな漢字変換です。ルビ振り漢字かな交じり文に、ひらがなとローマ字のふりがな（ルビ）を付けます。校正支援日本語文の校正作業を支援します。文字の入力ミスや言葉の誤用がないか、わかりにくい表記や不適切な表現が使われていないかなどをチェックします。日本語係り受け解析日本語文の係り受け関係を解析する機能を提供します。キーフレーズ抽出日本語文を解析し、特徴的な表現（キーフレーズ）を抽出します。自然言語理解日本語文を解析し、情報の抽出を行う機能を提供します。固有表現抽出日本語文を解析し

jnlp 2011/05/13

ツール

リンク

タグ

2011年5月13日のブックマーク (33件)

お知らせ

今週のはてなブックマーク数ランキング（2024年7月第2週）

はてなブックマーク透明性レポート（2024年 2月-2024年4月）

今週のはてなブックマーク数ランキング（2024年7月第1週）

公式Twitter

キーボードショートカット一覧

公式Twitter

はてなのサービス