タグ

2010年3月25日のブックマーク (17件)

  • 確率的言語モデルによる自由発話認識に関する研究 - 村上仁一

    次へ: 目次 目次 確率的言語モデルによる自由発話認識に関する研究 博士(工学) 村上仁一 豊橋技術科学大学 論文要旨 確率的言語モデルによる自由発話認識に関する研究 日文音声入力においては、音声の持つ物理的特性に着目した音声認識装置の 限界を克服するため、日語の文法や意味を用いた自然言語処理を併用するこ との必要性が指摘されている。この場合の言語処理の方法として、多くの言語 モデルがあるが、大きく分類してルールベースの言語モデルと確率ベースの言 語モデルがある。 言語の確率ベースの研究を行なう場合、基的には大量のテキストデー タ量が必要である。英語ではデータベースの重要性が認識されていて古くから Brown corpusやAP corpusなどがあるが、しかし日語ではコンピュータに読 み込める形式で利用できる大量のデータベースが最近まで存在していなかった。 そのため、確率的な言語

  • Class N-gramモデルとHMM、もしくはどこが隠れてるねん - 射撃しつつ前転 改

    Class N-gramモデルというのは、各単語はあるクラスに所属するものとし、クラスの連なりによって次の単語の確率分布を予測する言語モデルである。各単語がどのクラスに所属するかは、コーパスの対数尤度を最大化するように決定される。 このモデルはHMMと非常に似ている。HMMとの違いは、HMMでは単語があるクラスへと所属する確率が存在するのに対し、Class N-gramモデルでは単語はあるクラスへと確実に所属するところだ。つまり、クラスAに所属する単語は、クラスBやCには絶対に所属しない。(HMMだと、クラスAへの所属確率0.8, クラスBへの所属確率0.1、みたいになる。)比べてみるとつまり、HMMの方がちょっと柔らかい印象を受ける。 今、ちょっと嘘を書いた。もしかするとClass N-gramモデルという言葉で、各単語のクラスへの所属確率をイメージする人もいるかもしれない。ただ、この日

    Class N-gramモデルとHMM、もしくはどこが隠れてるねん - 射撃しつつ前転 改
  • Loading...

  • PRML3章 線形回帰モデルが終わった - yasuhisa's blog

    研究科の友達とやっているPRML勉強会で、第3章が終わりました。忘れないようにメモっておきます。 3.1章【線形基底関数モデル】基底関数を使った線形回帰モデルを定義。加法性のガウスノイズを使って、確率変数にし尤度関数も定義。尤度関数を最大にするように勾配ベクトルを求めるなどすると、いつものdesign matrixが出てくる。基底関数を使うことで非線形なものを扱うことができるようになったけど、パラメータに関して線形であることで正規方程式となって、閉じた形でを求めることができるのでうれしい。 幾何的な解釈を与えた後、バッチ処理ではなくオンライン学習でやる方法。その後、正則化項を導入。しかし、結局wに関して閉じた形で解くことができた。L1正則化(lassoと書いてあるけど)を導入すると、0に近いようなパラメータの数を増やすことができる。その後、出力変数が多次元になった場合にどうすればいいか書い

    PRML3章 線形回帰モデルが終わった - yasuhisa's blog
    gologo13
    gologo13 2010/03/25
    3章
  • 統計的言語モデルツールキットpalmkitマニュアル

    はじめに palmkit(Publicly Available Language Modelling toolKIT) は、N-gram 言語モデル作成のためのプログラム群である.このツールキットは, 多くのコマンド群からなる コマンドレベルでCMU-Cambridge SLM toolkitと互換性がある 任意のNについてのN-gramモデルのサポート 各種のback-off クラスモデルが作成可能 という特徴を持つ. このツールキットを使うことで,以下のような作業を簡単に行なうことができる. 単語頻度リストの作成 語彙リストの作成 back-off N-gram言語モデルの作成 back-off N-gram言語モデルの評価 また,このツールキットは,目的を問わず無料で利用・配布することができる. ファイル形式 palmkitでは,以下のようなファイルを扱う. .text 統計の元とな

  • Ghostscript, Ghostview and GSview

    This was the home page for Ghostscript, an interpreter for the PostScript language and for PDF, and related software and documentation. The ghostscript home page is now https://www.ghostscript.com/ Ghostscript Downloads Ghostscript Documentation Artifex GSView 6 - a previewer for MS-Windows, Linux and Apple OS X Ghostgum GSview 5 - an old previewer for MS-Windows. There is no further development p

  • 精神を鋭く研ぎ澄ますブルース・リーの7つの教え : earth in us. - 人生をシンプル&クリーンに調和させるミニマリストライフ

    精神を鋭く研ぎ澄ますブルース・リーの名言に学ぶ7つの教え http://www.earthinus.com/2010/03/bruce-lee-philosophy.html

  • じ~んときた!現代のエンジニア22人の名言集|【Tech総研】

    世の中には名言、格言、○○語録といった、味わい深いフレーズがいくつもあります。その中には当然(?)エンジニアが語った内容もあるわけです。歴史上の人物、ではなく、現在を生きるエンジニアの言葉を紹介します。

  • 本・書籍通販検索 - オンライン書店/中古本・古本/本通販

    2019年12月21日:「タワーレコード」「Dショッピング」の追加ほか カテゴリ「和書」の「タワーレコード」「Dショッピング」を追加しました。「タワーレコード」はタワーレコード株式会社が運営するメディア系総合通販サイトです。「Dショッピング」は、NTTドコモが運営する総合ショッピングモールです。・コミックカテゴリでの売主はNTTドコモになります。また、カテゴリ「書評・ブックニュース」に「ブックバン」「ALL REVIEWS」を追加しました。 更新履歴の詳細はこちら→・書籍通販検索 更新履歴のページをご確認ください。 2018年08月24日:「mibon」「Yahoo!、雑誌」の追加ほか カテゴリ「和書」の「mibon」を追加しました。mibonは未来屋書店が運営するの通販サイトです。カテゴリ「古・中古」に「Yahoo!、雑誌」を追加しました。Yahoo!ショッピング内から、中

  • KUROHASHI LAB (In Japanese)

    京都大学 大学院情報学研究科 知能情報学専攻 知能メディア講座 言語メディア分野 黒橋研究室 研究室では,言語の仕組み,それを用いたコミュニケーションの仕組みを計算機が扱える正確さで解明するという理論的研究と,それによって情報検索,自動翻訳,マンマシンインタフェース等をより高度化して人間の活動を支援するという工学的研究を行っています.(→詳細) メンバー NLPリソース 科研情報爆発 開放型検索エンジン基盤 TSUBAKI (試験運用中) 言語情報処理ポータル 研究室内部ページ 連絡先 〒606-8501 京都市左京区吉田町 Tel/Fax:(075)753-5962 Last Modified: September 7, 2007

  • Twitterでフォローを外されたり、mixiでマイミクを拒否られるタイプ8種類、あなたは大丈夫?

    Twitterやmixiなどは人間が社会的動物である側面をうまく利用しており、コミュニケーションを活性化させることでうまい具合にさまざまなメリットを引き出しているわけですが、当然ながら誰もがみんなと仲良く友達になれるわけではありません。中には嫌われてしまい、Twitterならフォローを外されて「アンフォロー」されたり、mixiなら友達から外されてマイミクを拒否られたりるするケースもあります。 一体何が原因なのでしょうか?詳細は以下から。 The Eight Types of People to Unfollow on Twitter or Defriend on Facebook - Facebook - Gawker ◆タイプその1「コミュニケーション中毒者」 英語だと「Overuser」、濫用者という意味になります。要するにオンラインゲームで言うところの「あいつずっとログインしていつで

    Twitterでフォローを外されたり、mixiでマイミクを拒否られるタイプ8種類、あなたは大丈夫?
  • 表のセル内で改行する - y_tsuda's blog - s21g

    1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31

    gologo13
    gologo13 2010/03/25
  • 科学論文に役立つ英語

    読書は、他人にものを考えてもらう事である。を読む我々は、他人の考えた過程を反復的にたどるにすぎない。(中略)だから読書にはものを考える苦労はほとんどない。 作者:大山(東北大金属材料研究所) FWGA8124@nifty.com このサイトへのリンクは無断でどこにでもご自由にどうぞ。 事後連絡も不要ですが、でも、 免責 掲載情報中の間違いを減らすよう努力していますが、それでも多数の間違いがあります。ケアレスミスだけでなく、質的に間違っているケースもあるはずです。このサイトの情報は御自分の判断と責任でお使いください。作者は当サイト上の瑕疵などの責を負いません。また、当サイトで得た情報によって生じたいかなる損害に対しても、作者は責を負いません.。

  • 日本KDEユーザ会

    KDE ユーザ会 (JKUG: Japan KDE Users' Group) は、主に KDE/Qt のローカライズや、日における KDE のプロモーションなどを行っています。 質問したい、話したい フォーラム・ML・チャット 活動に参加したい ソフトウェアの翻訳の情報

    gologo13
    gologo13 2010/03/25
  • Home

    KDE ApplicationsPowerful, multi-platform, and for everyoneUse KDE software to surf the web, keep in touch with colleagues, friends and family, manage your files, enjoy music and videos; and get creative and productive at work. The KDE community develops and maintains more than 200 applications which run on any Linux desktop, and often other platforms too. See all applications KdevelopKDevelop is a

    Home
    gologo13
    gologo13 2010/03/25
  • Mike Matas Blog

    Kevin ScottBill BarnesJake CohenAdam MengesMarkus BeissingerZach StiggelboutRamon GilabertMike Matas

    Mike Matas Blog
  • 【東大式】「現役東大生だけが知っている!集中力を高める34のルール」 : マインドマップ的読書感想文

    の概要】◆今日ご紹介するのは、勉強するには必須の能力といえる「集中力」に関するご。 一見、齋藤先生がお書きののように見えますが、先生は監修と巻末の1つの章のみの担当であり、実際はcubixという勉強系に強い編集プロダクションさんがまとめてらっしゃるようです。 アマゾンの内容紹介から。いざ勉強を始めようとしてもなかなか集中できない……。 このように感じる学生やビジネスパーソンの方々も少なくないはずです。 そこで、”受験勉強の王者”とも言うべき現役東大生へのアンケート調査&徹底取材を敢行。「”面倒くさい”を禁句にせよ」や「情報源はなるべく一元化せよ」など、受験勉強に不可欠な「集中力」を強化する34のアイデアをまとめました。監修は様々なメディアで活躍中の明治大学文学部の齋藤孝教授。 東大卒の先生が自らの体験をもとに語る「集中力アップの勉強術」も絶対に必読です。 このを読めば、あなたの勉