タグ

NLに関するsuikyoのブックマーク (11)

  • 福島ラビット - Google

    Join the official community for Google Workspace administrators In the Google Cloud Community, connect with Googlers and other Google Workspace admins like yourself. Participate in product discussions, check out the Community Articles, and learn tips and tricks that will make your work and life easier. Be the first to know what's happening with Google Workspace. ______________ Learn about more Goo

    福島ラビット - Google
    suikyo
    suikyo 2014/07/11
  • サルの鳴き声に「文法的規則」を発見 | WIRED VISION

    前の記事 発見続く旧日軍の潜水艦:「潜水空母」や、真珠湾の「最後の1隻」 サルの鳴き声に「文法的規則」を発見 2009年12月10日 Brandon Keim Image: Florian Mollers アフリカの熱帯雨林に住むキャンベルモンキー[オナガザル科]は、音を言葉にする文法的な規則を用いて、同じ鳴き声を、さまざまな方法で組み合わせているようだ。 仏レンヌ第1大学のAlban Lemasson氏は、「動物のコミュニケーションにおいて、動物は異なる鳴き声を意味論的に結びつけて新しいメッセージを作り出すことができるという証拠が見つかったのはこれが初めてだ」と話す。「これが人間の言語と強い類似性をもつものなのか、そこに主語や目的語や動詞が見つかるのか、私にはわからない。とにかくキャンベルモンキーは、意味をもった単位を結合して、別の意味をもった連なりを作り、その結びつけ方にはルールが認

  • 4.2 確率的生成モデル - yasuhisa's blog

    ゼミで発表したので、まとめておきます。自分用メモ。 まず、ベイズの定理を使って、クラスの事後分布を計算する。直接事後分布をモデル化しにいく識別モデルとは違い、内部では(クラスとデータの)同時分布を計算しているのが生成モデル。この計算をしていくと自然な形でロジステックシグモイド関数が出てくる。2クラス以上の場合を考えるとソフトマックス関数を導出することができる。 4.2.1 連続値入力 生成モデルでは、入力がどのように分布しているかをモデリングしていく。連続値入力の場合を考えて、それぞれのクラスの確率密度は多次元ガウス分布であると仮定してみる。ここで一つ重要な仮定をする。それは全てのクラスにおいて同じ分散共分散行列が共有されている、という仮定だ。ここが一般化線形モデルになるかどうかの鍵を握っているところになる。この仮定を置くと、クラスに対する事後確率がで書き表わされる。と書け、これはパラメー

    suikyo
    suikyo 2009/11/10
  • スタンフォード大学の自然言語処理(NLP)の授業公開っぷりがとてつもない件 - Unchained Life

    以前からMITのOCWを中心にアメリカの大学の授業のビデオや資料などが公開されているのは知っていたが、今日知ったスタンフォード大学の授業公開っぷりがものすごい。 http://see.stanford.edu/SEE/lecturelist.aspx?coll=63480b48-8819-4efd-8412-263f1a472f5a 授業のビデオだけではなく、なんと授業のtranscript、つまり授業中に先生がしゃべったことがテキストに書き起こされているのだ。 MITなどでも授業のビデオは公開されていたが、当然授業の内容を理解するには授業資料がある場合にせよ、何をしゃべっているかを自分で聞き取るほか無く、リスニング力が低い僕には結構ネックだった。 それが今回しゃべる内容がテキストになっているということで聞き取れなくてもテキストを見ればよいし、リスニングの勉強にもなる。 しかも公開されてい

    スタンフォード大学の自然言語処理(NLP)の授業公開っぷりがとてつもない件 - Unchained Life
    suikyo
    suikyo 2009/05/21
    高速道路がまた一つ。1000円も要らないし。
  • Loading...

  • 自然言語処理における半教師あり学習のテキスト - 武蔵野日記

    最近移動続きであまり研究に時間は割けないのだが、は読めるということでを2冊、サーベイ的な記事を3(うち2はチュートリアルスライドつき)を紹介する。まず Semisupervised Learning for Computational Linguistics (Chapman & Hall/CRC Computer Science & Data Analysis) 作者: Steven Abney出版社/メーカー: Chapman and Hall/CRC発売日: 2007/09/17メディア: ハードカバーこの商品を含むブログ (4件) を見る を読む。このの著者の Steven Abney はブートストラッピングの理論的解析をした人で、 Steven Abney. Bootstrapping. 40th Annual Meeting of the Association fo

    自然言語処理における半教師あり学習のテキスト - 武蔵野日記
  • 自然言語処理は Python がいちばん - 武蔵野日記

    現在大学1年生の人で3年後には NAIST に (というか松研に) 来たいという人から「どんなプログラミング言語やっておくといいですか」と質問されたりするのだが、なかなか答えるのは難しい。自分は PerlPython がメインでときどき C++/C# を使ったりするのだが、どれが一番いいかはなんとも言えないので、自然言語処理以外に転向する可能性も考えると、C とか C++ とか Java とか(授業でそちらをやるのであれば)を最初の武器に選んだ方がいいのでは、と思ってはいる。 そんなこんなで最近 Hal Daume III (機械学習を用いた自然言語処理では非常に有名な人) のブログで Language of Choice というタイムリーなエントリーが出ていたので、紹介すると、「それなりに大きな自然言語処理のプロジェクトでどのプログラミング言語を使うのか」というアンケート結果が出

    自然言語処理は Python がいちばん - 武蔵野日記
    suikyo
    suikyo 2009/03/30
    最近その方向でPython見るなぁと思っていたら、そんなにメジャーになっていたのか。
  • コンピューターの言語認識向上、セマンティック技術で検索性アップ

    中国・北京でネットサーフィンをする子どもたち(2007年9月22日撮影)。(c)AFP/TEH ENG KOON 【9月22日 AFP】コンピューターに単語の識別だけではなく、言語の意味認識までさせる次世代のセマンティック自然言語処理システムを開発する米Cognition Technologiesが前週、この言語認識の基礎となる「意味マップ」の使用許諾を開始した。 この「意味マップ」は、米国の一般的な大卒者が知っている10倍以上の語彙を提供し「世界最大の意味マップ」と呼ばれているだけでなく、コンピュータープログラムに対し、人間の脳とより近い認識方法で時制や文脈から単語を「理解」させる。開発には30年が要された。 同社のスコット・ジャラス(Scott Jarus)CEOは「このマップは明らかに、Web 3.0とも呼ばれるセマンティックWebの基礎的な部分を構成する」と胸を張る。すでに英語のほ

    コンピューターの言語認識向上、セマンティック技術で検索性アップ
  • DO++: 機械学習による自然言語処理チュートリアル

    自然言語処理のときに使う機械学習手法のテクニックをざーっと2時間程度で紹介してほしいとのことだったので今日話してきました。基的に、そんなに頑張らなくても効果が大きいものを中心に説明(特にパーセプトロンとか)を説明してます。 紹介した手法はパーセプトロン、最大エントロピー、正則化、多クラス分類、系列分類(CRF, Structured Perceptron)などなどです。どれも一かじりする感じで網羅的に見る方を優先してます。個々の詳しい話はそれぞれの文献や実装などを当たってみてください。 スライド [ppt] [pdf] ここで話しているのは線形識別モデルの教師有り学習が中心で教師無し学習(クラスタリングなど)など他の自然言語処理を支える技術は省いてます。 こういうのを使って(使わなくてもいいけど)どんどんアプリケーション作らないといかんね。 Tarot is not used to ma

    DO++: 機械学習による自然言語処理チュートリアル
    suikyo
    suikyo 2008/08/05
  • Google Japan Blog: 大規模日本語 n-gram データの公開

    メディア関係者向けお問い合わせ先 メールでのお問い合わせ: pr-jp@google.com メディア関係者以外からのお問い合わせにはお答えいたしかねます。 その他すべてのお問い合わせにつきましては、ヘルプセンターをご覧ください。

    Google Japan Blog: 大規模日本語 n-gram データの公開
    suikyo
    suikyo 2008/05/23
    わざわざ団体を経ているのに、何で商用利用不可?? AdSenceも使えないってことよね? 今の時代にそぐわないんじゃないかなぁ…
  • プレスリリース | 404 File not found | NICT-情報通信研究機構

    大変申し訳ございません。 お客様がアクセスしようとしたプレスリリースが見つかりませんでした。 恐れいりますが、右側のメニューから、再度お探しいただけますでしょうか? English page

    suikyo
    suikyo 2008/05/20
    NICT、けいはんな
  • 1