タグ

2012年11月1日のブックマーク (16件)

  • 『授業用ハッシュタグを大量のアニメアイコンが占拠しに来た件。 - sageszk's blog』へのコメント

    ブックマークしました ここにツイート内容が記載されます https://b.hatena.ne.jp/URLはspanで囲んでください Twitterで共有

    『授業用ハッシュタグを大量のアニメアイコンが占拠しに来た件。 - sageszk's blog』へのコメント
    nhayato
    nhayato 2012/11/01
  • 語の共起情報を用いたWeb検索

    概要 現在、Web上の莫大な情報の中から、ユーザが必要な情報を 得る手段として検索エンジンが広く用いられている。 各検索エンジンでは、検索結果を順位付けし、 一般的に評価の高いWebページを検索結果の上位と することで効率化を図っている。 しかし、有用であるということは主観的であるため、 一般的に評価の高いページが誰にでも有用であるとは限らない。 研究では、ユーザが入力した検索キーワードと Webページ内に含まれる語との共起性を用いて、 Webページを評価し、さらにユーザからのフィードバックを 得ることで、各ユーザの要求により適合した結果を提示する 検索方法を提案する。 従来手法 重要語抽出の従来手法 多くの自然言語文書処理において用いられている 代表的な手法に tfidf(Term Frequency-Inverse Document Frequency)法 [1][2]がある。 対象

    nhayato
    nhayato 2012/11/01
  • Mean reciprocal rank - Wikipedia

    This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed. Find sources: "Mean reciprocal rank" – news · newspapers · books · scholar · JSTOR (June 2007) (Learn how and when to remove this message) The mean reciprocal rank is a statistic measure for evaluating any process that

    nhayato
    nhayato 2012/11/01
  • HITS, 主成分分析, SVD - naoyaのはてなダイアリー

    ウェブグラフのリンク解析によるページの評価と言えば PageRank が著名ですが、もうひとつ Jon Kleinberg による HITS (Hyperlink-induced topic search)も有名です。最初の論文 Authoritative Sources in a Hyperlinked Environment は 1999年です。IIR の 21章で、この PageRank と HITS についての解説がありました。 HITS HITS はウェブページの評価に二つの軸を用います。一つが authority スコア、もう一つが hub スコアです。 例えば「Perl の情報が欲しい」という検索要求に対しては CPAN や 開発者である Larry Wall のホームページなどが重要度の高いページかと思います。これらのページは「Perl に関して信頼できる情報源」ということ

    HITS, 主成分分析, SVD - naoyaのはてなダイアリー
    nhayato
    nhayato 2012/11/01
  • DSIRNLP#1 ランキング学習ことはじめ

    2. 自己紹介 • 数原 良彦 (すはら よしひこ) – @sleepy_yoshi – http://d.hatena.ne.jp/sleepy_yoshi/ • 情報検索の研究開発ぽい仕事など – 情報検索とか機械学習とか • 特にランキング学習 • 三浦半島在住 – マグロをべる頻度が減った  – 三浦半島で地震に怯える日々  2 4. 発表のねらい • ねらい – ランキング学習の認知度を高める – ランキング学習をざっくり伝える – なにか实装できるようになっていただく • 理論的妥当性の説明はほとんど無し • アルゴリズムを可能な限り紹介 • おねがい? – 質問は適宜お気軽にどうぞ – 手法をたくさん紹介するのはイメージづけのため • 完全に理解する必要ありません • イメージがつけば後で詳細を追える(ハズ) 4

    DSIRNLP#1 ランキング学習ことはじめ
    nhayato
    nhayato 2012/11/01
  • NHK NEWS WEB 震災ビッグデータ報告【1】 ツイッター「次に」生かすには

    「震災直後、全体のわずか4%のアカウントが、全ツイートの半数をつぶやいた」 「善意の拡散が、デマ情報をさらに広げていった」 10月28日に開かれた「東日大震災ビッグデータワークショップ」の報告会では、震災後に流れた大量の情報=ビッグデータの解析に取り組んだ研究成果が次々に発表された。 再び大災害が起きたとき、必要な情報を必要とする人に確実に届けるためには、さらに何が必要なのか。 震災ビッグデータが浮き彫りにした課題と、今後の取り組みを考える。 (ネット報道部デスク・足立義則) 埋もれた情報を救うには グーグルとツイッター・ジャパンの呼びかけで実現したワークショップには、国内外のデータ解析の専門家やエンジニア、ジャーナリスト、学生などが参加して、9月から1か月半、それぞれ独自のテーマと手法でビッグデータに向き合った。 (解析対象となったデータの種類は、文末を参照) 報告会の壇上

  • SJN News 再生可能エネルギー最新情報 » Maintenance Mode

    SJN News 再生可能エネルギー最新情報 is currently undergoing scheduled maintenance. Please try back in 142 days, 17 hours, and 5 minutes (on 2024年6月25日 at 9:58 AM). Sorry for the inconvenience.

  • Change The Game - Go ahead!

    知ってる人はもう知っているとは思いますが,10月をもって1年と10ヶ月勤めた謎のベンチャーPreferred Infrastructure, Incを去りました.PFIの方々,当に有り難うございました! エントリを書けと色々な人に脅されているので,てきとうに書きます. 環境 インターンで飛び込み,そのテンションのまま大学を辞めて入社.俺みたいな機械学習や情報検索の基礎すらなかった人間が,今では機械学習プロジェクトで開発をやっていたわけですから,岡野原さんを筆頭に当濃い社員の人達には感謝しかありません. 学習の高速道路という言葉がありますが,間違いなく超高速,時には事故るんじゃないかという環境でした.右を見ても左を見ても怪物だらけであるこの魔窟で,エンジニアとして勤めることが出来たのは当に良い経験でした. 俺が入社した時は正社員は15人くらいだった気がしますが,今では既に26人で,もう

  • 授業用ハッシュタグを大量のアニメアイコンが占拠しに来た件。 - sageszk's blog

    #led2012とは何か 先日、#led2012というハッシュタグを利用している授業でちょっとしたトラブルがありました。端的に言うと、授業用ハッシュタグが荒らされました。#led2012というハッシュタグは、2010年から年度ごとに数字を変えて利用してきたハッシュタグで、まあ言ってみれば去年の時点でほぼほぼ利用することが決まっていたハッシュタグです。多少、同じハッシュタグを英語圏で利用されている様子も伺えたのですが、明らかに書かれている言語も違うのでぶっちゃけ同一ハッシュタグの多言語利用は可能なのでは?と僕自身は思ってました。この件はひとまず置いておいて、今回書きたいのは、よくわからないアニメアイコンさんたちが多数来訪なさって、意味不明な言葉を書き残していったという事例についてです。どんなツイートが来たのかという簡易分類と、一部リプライによるインタビューを行ったのでその結果を書いてみたいと

    授業用ハッシュタグを大量のアニメアイコンが占拠しに来た件。 - sageszk's blog
    nhayato
    nhayato 2012/11/01
  • 【大河原克行の「パソコン業界、東奔西走」】 ジャストシステム創業者が30年ぶりに挑戦した新たな日本語入力システム ~MetaMoJi・浮川社長に7notes for iPadの狙いを聞く

    nhayato
    nhayato 2012/11/01
  • ITmedia +D LifeStyle:「補償金もDRMも必要ない」——音楽家 平沢進氏の提言 (1/4)

    録音・録画補償金やDRMのあり方など、著作物の意義や対価システムが見直されようとしている。消費者にしてみれば、もちろん補償金もDRMもいやだということだけははっきりしているわけだが、権利者の団体はそれによって著作権者の利益が守られるのだと主張する。 だがちょっと待って欲しい。権利者といっても、いつも議論の舞台に登場するのはJASRACを始めとする権利団体だ。当の意味での著作権者である音楽家達は、補償金やDRMなどのことをどう考えているのかという話は、ちっとも伝わってこないのである。 これはどう考えても、議論の席に座る人のバランスとしておかしいだろう。その権利者団体が、果たして正しくミュージシャンなど芸術家の総意を代表していると言えるのかがはっきりしないことには、権利者団体と話し合いをして意味があるのかも、実はわからないのではないか。 実際のプロの音楽家が今日の状況をどのように考えているの

    ITmedia +D LifeStyle:「補償金もDRMも必要ない」——音楽家 平沢進氏の提言 (1/4)
    nhayato
    nhayato 2012/11/01
  • 京都・滋賀の紅葉情報 2013:京都新聞

    京都・西光寺で「六斎念仏」(2024年8月16日 京都府南丹市) "Rokusai Nembutsu" at Saikoji Temple in Kyoto

    京都・滋賀の紅葉情報 2013:京都新聞
    nhayato
    nhayato 2012/11/01
  • 第1回 機械学習 ことはじめ | gihyo.jp

    次のサービスや製品はどれも身近にありますが、これらに共通していることはなんでしょう。 Amazonの「この商品を買った人はこんな商品も買っています」 はてなブックマークの「関連エントリー」 Google 翻訳 Google 日本語入力 メールクライアントのスパムフィルタ デジタルカメラの自動顔認識 ニンテンドーDSの手書き文字認識 買い物履歴、ユーザが書いたコメントやタグ、Webに無数にあるページ、メール、画像や動画と対象はそれぞれ異なっていますが、どれも「データから有益な情報を取り出す」ということを行っています。 これらは「機械学習」という技術を使って実現されているのです。 機械学習の応用範囲 機械学習は冒頭で挙げた以外にも、様々な分野で使われています。 例えば、ノイズ除去や特徴の抽出を目的とした利用パターンがあります。音声認識や画像認識、文字認識(OCR)などはその代表格です。それらも

    第1回 機械学習 ことはじめ | gihyo.jp
  • JUMAN メモ

    黒橋研究室で開発している日形態素解析器 JUMAN についてのメモ。 何をしているのか。他の解析器 (ChaSen と Mecab) との比較など。 最近だと Yahoo! JAPAN の形態素解析 API なんてものがあるけど、仕様がよくわからない。 タスク: 日語の形態素解析 文を形態素に区切る 各形態素に品詞を割り当てる 「名詞」や「動詞」など 内容物 プログラム デフォルトの文法辞書 デフォルトの形態素辞書 プログラムは放置で、実質的に辞書のみの更新。誰かどうにかしてほしいレガシーコード。 文法辞書と形態素辞書は利用者が自由に定義できるとマニュアルではうたっているが、デフォルト以外の辞書が配布されている例を知らない。 ChaSen と MeCab は配布のレベルで、プログラムと辞書を分離している。 IPAdic, NAIST jdic, UniDicなど エンコーディング デ

    nhayato
    nhayato 2012/11/01
  • 研究者を目指す普通の学生諸君に

    『卒業論文は努力賞でもよい,修士論文はうまくいかなかった内容でもまあよい,しかし,博士論文には努力賞はない.失敗したものや説得力のないものはダメ.』これは,小生が論文審査に設けている大雑把な基準である.  ・・・と書き始めてしまったので,編集委員の意に反して真面目な文章になりそうだ.研究観ならまだしも,結婚観とか,子供は何人いるか,果ては女の子のくどき方まで,居酒屋で話すような柔らかい話をさせようとしたけらいがあるが,今回は許されよ.おじさんも年を取ってきた.  ちなみに,物理的に許す限り,子供は多ければ多い方がいいんじゃないでしょうか.今の世の中,たくさん生んだが故に育たないという話は聞かない.多難な人類の未来も彼らが切り開くのだから切り開く彼らが存在しなければ未来の人類も存在しない.5歳ともなればもう全く別の人間,彼の人生は彼のものである.子離れの方が大きな課題である.  諸君の

  • Expired

    Expired:掲載期限切れです この記事は,産経デジタル との契約の掲載期限(6ヶ月間)を過ぎましたのでサーバから削除しました。 このページは20秒後にITmedia ニュース トップページに自動的に切り替わります。

    nhayato
    nhayato 2012/11/01