タグ

2014年11月8日のブックマーク (3件)

  • きまぐれ日記: キーワード抽出: tf-idf の意味づけ

    単語の重み付けの古典的な方法に tf-idf があります。文書中の各単語の tf-idf 値計算し、値でソートすると、その文書に特徴的な単語リストを得ることができます。 http://nais.to/~yto/clog/2005-10-12-1.html tf-idf は、単なるヒューリスティックスだと考えられていましたが、最近言語モデルに基づく情報検索手法がさかんに研究されるようになり、tf*idf の解釈が明らかになってきました。言語モデルに基づく手法は、ヒューリスティックスばりばりの手法と同性能にもかかわらず、文書のランキングに理論的で合理的な説明を与えることができます。 情報検索は、クエリ q に対し、もっとも適合する文書 d_opt を求めるタスクです。つまり、q が与えられたとき、文書 d が出現する確率 p(d|q) の最大化問題と解釈できます。 d_opt = argmax

  • 英文に対する苦手意識を克服して、スラスラ読めるようになる方法 | ライフハッカー・ジャパン

    多くのビジネスパーソンが一度は真剣に考える「英語の勉強」。将来に向けての投資として、長年勉強している人も多いでしょう。しかし、いまだに英文に対する苦手意識を持っていて、英語のメールを見るたびにストレスを感じる人も多いのではないでしょうか? 今回は、そんな英文嫌いな人がスラスラ読めるようになるとっておきのコツをお伝えします。 実践で一番多く使うのは「リーディング」 まず、悲しい現実に向き合いましょう。語学学習における4つの技能である「リスニング」「スピーキング」「リーディング」「ライティング」のうち、学習法としてハードルが低いのは目の前にある英語を読んでいく「リーディング」です。 実践で使う技能も「リーディング」が一番多いことがTOEIC(R)テストを運営するEducational Testing Service(ETS)の調べて明らかになりました。普段英語を読む機会が多い人でも、「1つの1

    英文に対する苦手意識を克服して、スラスラ読めるようになる方法 | ライフハッカー・ジャパン
  • 必要なのはブラウザだけ。Python使ったWebサービス構築(画面を作ってみよう編) - 今日学んだこと

    前回の続きになります 。きっと反響が少なかったのはタイトルが悪かったんだな!ということでタイトル変えました。(もし「お、いいかも」と思いましたら、ハテブよろしくです。モチベーション上がるので・・・) 前回で、環境を作ることができました。今回はページを作っていきます。 前回は「写経しよう!」が主な内容でしたが、今回からは好きなものを作っていこう!を主眼としようかと思います。 その前に・・・Webサービスってどうやって動くの? 好きなものを作っていこう!と言いましたが、まずはWebサービス(プログラム)の概念的なイメージを抑えていた方がいいと思いまして。 基的に、プログラムは単純化すると 入力→計算/保存→出力 というプロセスを経ることになります。これが、Webだと 画面で入力して→サーバーで計算/保存して→画面に描画する といった形になります。画面が2回出てくるので 画面をどうつくるか サ

    必要なのはブラウザだけ。Python使ったWebサービス構築(画面を作ってみよう編) - 今日学んだこと