hjym_uのブックマーク (359)

  • 機械学習の理論と実践

    ベイズ統計学の基礎概念からW理論まで概論的に紹介するスライドです.数理・計算科学チュートリアル実践のチュートリアル資料です.引用しているipynbは * http://nhayashi.main.jp/codes/BayesStatAbstIntro.zip * https://github.com/chijan-nh/BayesStatAbstIntro を参照ください. 以下,エラッタ. * 52 of 80:KL(q||p)≠KL(q||p)ではなくKL(q||p)≠KL(p||q). * 67 of 80:2ν=E[V_n]ではなくE[V_n] → 2ν (n→∞). * 70 of 80:AICの第2項は d/2n ではなく d/n. * 76 of 80:βH(w)ではなくβ log P(X^n|w) + log φ(w). - レプリカ交換MCと異なり、逆温度を尤度にのみ乗す

    機械学習の理論と実践
    hjym_u
    hjym_u 2013/05/23
  • Travatar - A Tree-to-String Translation Toolkit

    This is the home of Travatar, a tree-to-string statistical machine translation system. In other words, when performing translation, you first parse the input using a syntactic parser, then Travatar will perform translation for you. This is particularly effective for language pairs that require a large amount of reordering, such as English-Japanese. Download/Install Documentation Development/Suppor

    hjym_u
    hjym_u 2013/05/22
  • Introduction to Conditional Random Fields

    Imagine you have a sequence of snapshots from a day in Justin Bieber’s life, and you want to label each image with the activity it represents (eating, sleeping, driving, etc.). How can you do this? One way is to ignore the sequential nature of the snapshots, and build a per-image classifier. For example, given a month’s worth of labeled snapshots, you might learn that dark images taken at 6am tend

    hjym_u
    hjym_u 2013/05/22
  • IBM、Watsonの顧客サポート機能「Ask Watson」を発表

    米IBMは5月21日(現地時間)、スーパーコンピュータ「Watson」による企業向けの顧客サービスやマーケティング支援システム「IBM Watson Engagement Advisor」を発表した。 Watsonは、同社が2011年に発表した「Cognitive Computing(認識するコンピューティング)」でのビッグデータ分析を得意とするコンピュータシステム。米国の人気クイズ番組「Jeopardy!」で人間のチャンピオンに勝って話題になった。 Engagement Advisorは顧客企業およびその顧客のデータを迅速に分析することで、顧客サービスを支援する。例えば、銀行や生命保険会社は自社WebサイトやモバイルサービスにEngagement Advisorの「Ask Watson」機能を組み込める。顧客はこうしたWebサイトで自分の口座や保険プランの確認、新しいプランの相談などをW

    IBM、Watsonの顧客サポート機能「Ask Watson」を発表
    hjym_u
    hjym_u 2013/05/22
  • Launching the Quantum Artificial Intelligence Lab

    Philosophy We strive to create an environment conducive to many different types of research across many different time scales and levels of risk. Learn more about our Philosophy Learn more

    Launching the Quantum Artificial Intelligence Lab
    hjym_u
    hjym_u 2013/05/21
  • 米Google、会話型検索サービス Conversational Search を発表 質問するだけで検索可能 ::SEM R (#SEMR)

    Google、会話型検索サービス Conversational Search を発表 質問するだけで検索可能 グーグルが会話型検索サービス(Conversational search)を公開。音声で質問すると、必要な情報にアクセスできる。 公開日時:2013年05月16日 03:22 米Googleは2013年5月16日、開催中のGoogle I/O 2013で会話型検索サービス(Conversational search)を発表した。PC及びモバイル端末(Android及びiOS)のChromeブラウザから利用可能。 ハンズフリーで、音声でGoogleと"会話"しながら検索を通じて必要な情報にアクセス出来る。キーノートで紹介したデモでは、"OK Google" と話しかけると音声検索を受け付ける状態になる。ここで欲しい情報を質問すると、検索結果に切り替わると共に、直接的な回答がある場合

    米Google、会話型検索サービス Conversational Search を発表 質問するだけで検索可能 ::SEM R (#SEMR)
    hjym_u
    hjym_u 2013/05/18
  • Deep learning made easy - FastML

    As usual, there’s an interesting competition at Kaggle: The Black Box. It’s connected to ICML 2013 Workshop on Challenges in Representation Learning, held by the deep learning guys from Montreal. There are a couple benchmarks for this competition and the best one is unusually hard to beat1 - only less than a fourth of those taking part managed to do so. We’re among them. Here’s how. The key ingred

    hjym_u
    hjym_u 2013/05/18
  • マイクロブログ、ソーシャルメディア上の崩れた表記の現在 - Topics Related to Computers and NLP

    Twitterのマイニング技術については東工大の奥村先生が2012年1月に発表された「マイクロブログマイニングの現在」という原稿が非常にわかりやすかった。 マイクロブログマイニングの現在 自分が今関心がある分野の1つとして「崩れた表記」がある。 崩れた表記の定義は非常に難しいのだが、「標準の表記でないもの(not in canonical form)」と自分は定義付けている。例を挙げると標準的な表記である「きた」に対して「きたあああああ」等に余分に「あ」を足して、自分の感情の強さを表す事などがそうである。自分は「崩れた表記」と呼んでいるが、「くだけた表現」、「口語的表現」、「表記揺れ」等、様々な呼び方がある。 奥村先生の原稿の続編ではないが、2013年6月に開催予定のNAACLにacceptされた崩れた表記に関するサーベイ論文が最新の話題をカバーしている。 What to do About

    マイクロブログ、ソーシャルメディア上の崩れた表記の現在 - Topics Related to Computers and NLP
    hjym_u
    hjym_u 2013/05/18
  • データマイニングコンペティションサイト Kaggle にも Deep Learning ブームがきてるかと思ったのでまとめる - 糞糞糞ネット弁慶

    概要 最近話題の Deep Learning,NIPS や ICML,CVPR といった世界の話だろうと思っていたら Kaggle で Deep learning が去年一件,今年に入って更に一件優勝していたのでまとめる. Kaggle Kaggle: Your Home for Data Science おなじみのデータマイニングコンペティションサイト.データと目的関数が与えられた上で最も高いスコアを出したチームに賞金が出る. 最近では KDD Cup や http://www.kaggle.com/c/challenges-in-representation-learning-the-black-box-learning-challenge:title=ICML2013 workshop competition],や RecSys2013 Competition,レストランレビューサイ

    データマイニングコンペティションサイト Kaggle にも Deep Learning ブームがきてるかと思ったのでまとめる - 糞糞糞ネット弁慶
    hjym_u
    hjym_u 2013/05/09
  • Bazilとは — BazilDocument 1.00 documentation

    Bazilとは¶ Bazilは、日初のクラウドベース機械学習分析サービスです。 どなたでもWebブラウザ上で簡単に機械学習を用いたデータ解析を実現することができます。 面倒なインストールやプログラミングスキルは一切必要なし。 CSVファイルをアップロードするだけで、あなたが知りたかった分析結果を瞬時に手に入れることができます。 Who uses Bazil?¶ Bazilは、「今手元にあるデータを分析してその意味を理解したい」、「何が起こっているのかを知りたい」、「隠れた法則を見つけ出したい」、「将来の動向を予測したい」、「どうすればビジネスを改善できるか知りたい」、などと考える全てのユーザーを対象としています。 データ収集コストの低減と、データ活用への意識の高まりから、データさえあれば、Bazilの適用分野は限りなく広がっています。 以下のような利用シーンが想定できますが、あなたのアイ

    hjym_u
    hjym_u 2013/05/08
  • 音声合成・歌声合成の新星「CeVIO」、その謎が解けた!

    等身大の3Dキャラクターが感情表現豊かに客と会話するデジタルサイネージが東京のアニメイト秋葉原で稼働している。キャラクターの名前は「さとうささら」。「CeVIO Vision」というシステムを使っている。 4月26日午後6時には無償の音声合成・歌声合成アプリケーション「CeVIO Creative Studio FREE」も公開された。このCeVIOというプロジェクト、素性がただものではないことは分かるのだが、どこが主体でやっているのかは不明だった。ようやくその実体が判明した。 稼働しているシステムをアニメイト秋葉原まで見に行ってみたが、MMDAgentを使った双方向音声デジタルサイネージである名古屋工業大学のバーチャル案内嬢「メイちゃん」と構成が似ている。真相を問い合わせみたが、もうちょっと待ってくれと言われて3カ月。ようやく取材が実現したのがつい先日のことだ。 話をうかがったのは、名古

    音声合成・歌声合成の新星「CeVIO」、その謎が解けた!
    hjym_u
    hjym_u 2013/05/01
  • 業界初!人から学習し自動的に能力が高まる文章校正技術の開発に成功 : 富士通

    PRESS RELEASE (技術) 2012年4月4日 株式会社富士通研究所 業界初!人から学習し自動的に能力が高まる文章校正技術の開発に成功 複数の誤りの同時修正を実現し、外国人の作成する日語文書の誤りを8割削減 株式会社富士通研究所(注1)は、文章の校正作業において、人が校正した文章の履歴を使って、文章校正を自動的に行う技術を、業界で初めて開発しました。これにより、校正履歴が蓄積されるに従って校正能力が自動的に向上する文章校正システムが実現できます。技術により、近年、オフショア開発の拡大に伴い増加する、開発受注先の外国人によるプログラム仕様書など日語文章の執筆作業において、その品質を向上させることが可能になります。今回、中国語ネイティブが作成する日語文章に対して、1万件の校正履歴を用いた自動校正を実行したところ、約80%の誤りを修正できることを確認しました。 オフショア開発の

    業界初!人から学習し自動的に能力が高まる文章校正技術の開発に成功 : 富士通
    hjym_u
    hjym_u 2013/04/21
  • NLP論文ネタ一覧

    by Graham Neubig 「言語処理を研究したいけれど、ネタが思いつかない」という人は世の中にいるかと思います。 このように困っている人を助けるべく、以下の論文ネタを1,000分考えました*。 面白そうなものがあったら、ぜひご自由に研究してください**。 翻訳別アクセス 割込における複合語構文の分析と自動評価 外国語ネット時間の効果の訳文に関する考察 発話講義のための文の自動評価と文脈の変化方法の評価 京都機械翻訳の曖昧性検証 大規模コーパスを話動画抽出文ふさわし支援システム 画像情報を対象とした文行為発表語の抽出 医薬・半教師条件対訳辞書非対話における日語単語用辞書ANASYS推定 Web検索エンジンを用いた推論曖昧性知識の構築 解説クラスタリング辞書と構築に対する反義を考慮した類別発言 言い動詞・評価者の上位判定に着目した評価語彙いデータ基盤方法 日英統計翻訳における複数の

    hjym_u
    hjym_u 2013/04/13
  • 未来の検索は「言葉」を超える:Googleのナレッジグラフ

    hjym_u
    hjym_u 2013/04/13
  • RとRubyによるデータ解析入門

    人気の高いオープンソースのツール、RとRubyを使い、生データを処理し、シミュレーションし、仮説を立て、統計的手法を用いて検証する、というデータ解析の基の理解を促します。基が学べるだけでなく、自分のメールボックスや自分の心臓の鼓動など身近な題材を対象としており、データサイエンスの醍醐味を味わうことができる一冊です。日語版ではさまざまな統計分析手法についての入門となる章を追加。こので使っている統計の基礎も学べる構成になっています。プログラマ視点で書かれた書は、ビッグデータを活用するためのスキルを身に付ける必要に迫られた多くの開発者にとっても貴重な情報源となるでしょう。 関連ファイル サンプルコード 正誤表 ここで紹介する正誤表には、書籍発行後に気づいた誤植や更新された情報を掲載しています。以下のリストに記載の年月は、正誤表を作成し、増刷書籍を印刷した月です。お手持ちの書籍では、すで

    RとRubyによるデータ解析入門
    hjym_u
    hjym_u 2013/04/13
  • 検索エンジンは妖怪“覚(さとり)”の夢を見るか【前編】|ガジェット通信 GetNews

    ※この原稿は「情報の科学と技術」Vol. 63 (2013) より許諾を得て転載させていただいております。執筆者はガジェット通信の関連企業「未来検索ブラジル」社で検索エンジン開発を行なっている森大二郎です。 「情報の科学と技術」(情報科学技術協会) http://www.infosta.or.jp/journal/journal.html 検索エンジンの未来 -検索エンジンは妖怪“覚(さとり)”の夢を見るか-【前編】(森大二郎) 1.はじめに 検索エンジンサービスと、それを支える情報ネットワークはこの先どのように変化していくのだろうか。あるいは変化しないのであろうか。WWW検索エンジンの歴史がまだ20年にも満たないことを考えると、未来を予想するなど無謀な試みに過ぎないのはもちろんであるが、稿ではあえて想像を逞しくして将来を展望してみよう。 今からちょうど20年前の1993年にNCSA M

    検索エンジンは妖怪“覚(さとり)”の夢を見るか【前編】|ガジェット通信 GetNews
    hjym_u
    hjym_u 2013/03/30
  • LibShortText: A Library for Short-text Classification and Analysis

    LibShortText: A Library for Short-text Classification and Analysis Machine Learning Group at National Taiwan University Contributors Version 1.1 released on September 10, 2013. Introduction LibShortText is an open source tool for short-text classification and analysis. It can handle the classification of, for example, titles, questions, sentences, and short messages. Main features of LibShortText

    hjym_u
    hjym_u 2013/03/23
  • Facebookの「いいね!」で個人的属性が分かる?--ケンブリッジ大が危険性を指摘

    米国時間3月11日に発表された調査結果によると、Facebook上でユーザーがクリックする「Like(いいね!)」によって、意図せぬところで性格や性的指向、知性などが明らかになってしまう可能性があるという。 ケンブリッジ大学の研究者らによると、Facebook上で5万8000人のユーザーのLikeを調査することによって、ユーザーのIQや性別、性的指向、政治的および宗教的信念、さらには薬物使用までもを80%以上の精度で特定することができたという。 研究者は検討対象の確率変数の数を減らすモデルを使って、Facebook上での写真や友達の近況アップデート、さらにスポーツやミュージシャン、書籍のページなどに対する支持表明を分析した。それを、ユーザーが提供した人口統計学的プロフィールやそのほかの精神測定テストと比較したところ、自分たちが性的指向を88%、民族性を95%、政治的傾向を85%の確率で正し

    Facebookの「いいね!」で個人的属性が分かる?--ケンブリッジ大が危険性を指摘
    hjym_u
    hjym_u 2013/03/14
  • http://techcrunch.com/2013/03/08/google-research-releases-wikilinks-corpus-with-40m-mentions-and-3m-entities/

    http://techcrunch.com/2013/03/08/google-research-releases-wikilinks-corpus-with-40m-mentions-and-3m-entities/
    hjym_u
    hjym_u 2013/03/09
  • What Business Can Learn from Open Source

    August 2005 (This essay is derived from a talk at Oscon 2005.) Lately companies have been paying more attention to open source. Ten years ago there seemed a real danger Microsoft would extend its monopoly to servers. It seems safe to say now that open source has prevented that. A recent survey found 52% of companies are replacing Windows servers with Linux servers. [1] More significant, I think, i

    hjym_u
    hjym_u 2013/03/06