2012年12月6日のブックマーク (15件)

  • ReliefF または RReliefF アルゴリズムを使用した予測子の重要度のランク付け - MATLAB relieff - MathWorks 日本

    [idx,weights] = relieff(X,y,k) は、ReliefF または RReliefF アルゴリズムのいずれかと k 最近傍法を使用して、予測子をランク付けします。入力行列 X には予測子変数が含まれており、ベクトル y には応答ベクトルが含まれています。関数は、最も重要な予測子のインデックスが含まれている idx と、予測子の重みが含まれている weights を返します。 y が数値である場合、既定では relieff は回帰用の RReliefF 分析を実行します。それ以外の場合、relieff はクラスごとに k 最近傍法を使用して、分類用の ReliefF 分析を実行します。ReliefF および RReliefF の詳細については、アルゴリズムを参照してください。

    naaam
    naaam 2012/12/06
  • http://www.kentmiyajima.com/document/pagerank.pdf

    naaam
    naaam 2012/12/06
  • 第2回 検索アルゴリズムを分析してみよう! (1) 基本原理とYahoo!検索アップデート | gihyo.jp

    こんにちは。ディーボの藤沢です。この連載の偶数回目は、「⁠検索アルゴリズムを分析してみよう!」と題して、Yahoo!Googleの検索アルゴリズムについて、最新の検索アルゴリズムの動向や検索アルゴリズム分析ツール「ALGO Buster(アルゴバスター⁠)⁠」の紹介などを交えてお伝えしていきたいと思います。 Yahoo!Googleの検索結果の順位がどのように決まるのか、詳細は公表されていませんが、この順位決定ルールを検索アルゴリズムといいます。この順位決定ルールを完全に知ることはできないのですが、より深く、より正しく理解すれば、それだけSEO対策の精度も上がり上位表示の可能性が高まります。 検索アルゴリズムはYahoo!やGoogleによって改良が続いており、検索順位決定ルール自体もどんどん変化をしています。あるキーワードの検索結果で今日1位だったサイトが明日1位である保証はありませ

    第2回 検索アルゴリズムを分析してみよう! (1) 基本原理とYahoo!検索アップデート | gihyo.jp
    naaam
    naaam 2012/12/06
  • HITS(Hypertext Induced Topic Selection)アルゴリズムとは

    HITS(Hypertext Induced Topic Selection)アルゴリズムとは
    naaam
    naaam 2012/12/06
  • 重要文抽出によるWebページ要約のためのHTMLテキスト分割 | CiNii Research

    naaam
    naaam 2012/12/06
  • 実践! 「MapReduceでテキストマイニング」徹底解説

    青空文庫」をテキストマイニング! 前回の「いまさら聞けないHadoopとテキストマイニング入門」では、Hadoopとテキストマイニングの概要や構成、MapReduceの仕組み、Hadoopの活用場面などを解説し、Hadoopの実行環境を構築しました。今回から、Hadoopを使い、テキストマイニングのMapReduceプログラムを作成していきます。 「青空文庫」というサイトをご存じでしょうか。青空文庫は、著作権が切れた日の文学作品を掲載しているWebサイトで、青空文庫の全データをDVDや、BitTorrentによる配信で入手できます。今回は、このデータを使ってテキストマイニングを行いましょう。 前回、テキスト分類で、著者の性別、年齢、地域、職業などの属性も推定できると書きましたが、青空文庫は、他のデータにはない、著者属性があります。青空文庫の作品は、著作権が切れて、作者がなくなっている場

    実践! 「MapReduceでテキストマイニング」徹底解説
    naaam
    naaam 2012/12/06
  • テキストマイニングの基礎

    〜準備編〜 まずRをインストールしておくこと(不慣れな人は丁寧に解説したRインストールのページを参照のこと)。 Rでテキストマイニングをするために石田基広氏のウェブサイトよりRMeCab_0.90.zipというファイルをダウンロードする。ファイル名は変更されるかもしれないし、0.90というバージョンも変わるかもしれないので最新のものをダウンロードすること。なおダウンロードされた.zipファイル(圧縮されたファイル)は解凍する必要がなく、.zipファイルをそのまま適当なディレクトリ(フォルダ)に置いておけばよい。 Rのワークディレクトリ(getwd()とコマンドすれば確認できる)に、例えばzip_packagesという名前のフォルダを作成しておき、その中に保存しておくと分かりやすいだろう。 〜R上での準備〜 R上でRMeCabを利用するためには [パッケージ] -> [ローカルにあるzip

    naaam
    naaam 2012/12/06
  • [ThinkIT] 第1回:テキストマイニングとは (1/3)

    近年多くの企業において、様々なチャネルから集めた顧客からの直接の問い合わせやクレームをデータベースに蓄積することが可能となっている。この蓄積された膨大なテキストデータのデータベースについて、その傾向と変化を把握し、戦略の確認・検証、課題の発見、さらには解決するための施策を抽出する分析を行うことがテキストマイニングだ。 連載では、顧客の声(テキストデータ・定性情報)を分析するテキストマイニングという技術・ツールについて紹介していく。扱うテーマとしては、企業に集まる顧客の声や声の活用状況とテキストマイニング技術、成功事例と失敗しないためのポイントなどを取り上げていく。 さて、連載の原稿を書くために、筆者はとあるファンミリーレストランに立ち寄った。店内に入ると、店員呼び出しベルの横にあったハガキサイズの用紙にふと目がとまった。そこには、こう書かれていたのである。 「お客様の声をお聞かせくださ

    naaam
    naaam 2012/12/06
  • 2012年 はてブ数ランキングベスト50 – 今年中に見ておきたい良記事まとめ | Web活メモ帳

    2012年にはてなで話題になった記事やWEBサービスを 1位から50位までブクマ数順にランキングを付けてみました。 2012年はてなブックマーク数ランキング50 僕は自分が思っていたほどは頭がよくなかった – しのごの録 クックパッド史上、最もはてなブックマークのついたおかず&ご飯系レシピ25選 | little_shotaro’s blog 無料で聴けて、もう作業用BGMに困らない。ミュージックビデオを次々に流してループしてくれる個人的に超オススメサイト / Maka-Veli .com 仕事Excel使うなら必ず読んでおきたい記事まとめ – NAVER まとめ アイデアを大量生産できる最強のフレームワーク「オズボーンのチェックリスト」 | お土産屋さんブログ Excelの使い方 – NAVER まとめ 女子力アップ!男子も必見!絶対チェックすべき人気まとめのまとめ – NAVER ま

    naaam
    naaam 2012/12/06
  • 少ない手間と知識でそれなりに見せる、ズルいデザインテクニック

    少ない手間と知識でそれなりに見せる、ズルいデザインテクニック:ズルいデザイン(1)(1/2 ページ) デザインが自分でイイ感じに作れたらいいなあというプログラマのみなさん。少ない手間で簡単に、ちょっといい感じのデザインに見せるための、ちょっとした小ズルいTipsを紹介します Webプログラマ、Webエンジニアの皆さんが、個人で作るWebサービスやハッカソンなどで、短期間に集中してサービス開発してローンチしたいときに、もうちょっと自分でイイ感じにデザインできるといいなあという声をよく聞きます。 この企画は、そんなプログラマが、少ない手間で簡単に、ちょっといい感じのデザインに見せるための、ちょっとした小ズルいTipsを紹介します。 (注)このページでは、個々のデザイン要素を分かりやすく説明するために、実寸サイズより画像を拡大して使用しています。 ズルいデザインはSassとCompassを利用し

    少ない手間と知識でそれなりに見せる、ズルいデザインテクニック
    naaam
    naaam 2012/12/06
  • width:100%なのにはみ出す理由と回避策。CSSを触るなら必ず理解しなくてはいけないボックスモデルの話。(CSS おれおれ Advent Calendar 2012 – 05日目) | Ginpen.com

    CSS おれおれ Advent Calendar 2012 – 05日目 横幅いっぱいに広げようとしてwidth:100%を指定したら横スクロールバーが出ちゃった、という経験ありませんか? その原因と仕組み、回避策についてお話しします。 わりとFAQな感じ。これは是非覚えておいてもらいたいです。というか知っておいてください。 はみ出した例 position:absoluteないしposition:fixedを使った際にこうなっちゃう事が多いと思います。 上部から出てきたメッセージ欄、横にはみ出てますね。 でも指定はちゃんとwidth:100%です。「幅いっぱい」を指定しているのに、どうしてはみ出てしまったんでしょうか。 「幅」が意味するところ 実はCSSの仕様が定めるところの「幅」というのが、我々が視覚的に認知している「幅」と異なっているのが原因です。 CSSではこんなものを定めています。

    width:100%なのにはみ出す理由と回避策。CSSを触るなら必ず理解しなくてはいけないボックスモデルの話。(CSS おれおれ Advent Calendar 2012 – 05日目) | Ginpen.com
    naaam
    naaam 2012/12/06
  • NY地下鉄で死ぬ直前の男の写真が撮られたとき、他の乗客は何をしていたか

    ニューヨークのタブロイド紙『ニューヨークポスト』が火曜、前日に地下鉄駅で起きた事故を報じた。いや、正確には事故になる瞬間を報じたと言った方が正しいだろう。 乗客同士の言い争いで50代の男性がホームから突き飛ばされ、そこに入ってきた電車に挟まれて死亡した。ニューヨークポストが1面で大きく掲載した写真は、ホームに手をかけ数メートル先に迫った電車のほうを振り返った男性の姿を捉えている。タイトルは、「万事休す、線路に突き落とされた男が死に行く瞬間」。 この事件は、いくつもの意味でいたたまれない気持ちにさせる。 まずジャーナリズムの観点から、こんな写真を載せる必要があったのかという点。数秒後に死のうとしている人間の姿を晒すことに、センセーショナリズムを煽る以外の意味があるのか。 もし事故の様子を伝えることが目的だったのならば、文章で説明し、写真は意図的に掲載しないという選択肢もあっただろう。だが同紙

  • 全身を強く打って←これが隠語だと知ったときの衝撃

    1 以下、名無しにかわりましてVIPがお送りします :2012/12/05(水) 17:43:46.57 ID:EwUO5JS40 2 以下、名無しにかわりましてVIPがお送りします :2012/12/05(水) 17:44:15.71 ID:ka2EF1u00 どういう真意があるのよ 3 以下、名無しにかわりましてVIPがお送りします :2012/12/05(水) 17:44:33.05 ID:khsDR3G/0 バラバラか 4 以下、名無しにかわりましてVIPがお送りします :2012/12/05(水) 17:45:17.84 ID:u1FIXc6y0 行方不明者 保護されました→生きてました 発見されました→ 5 以下、名無しにかわりましてVIPがお送りします :2012/12/05(水) 17:45:39.48 ID:jZQc/Od60 木端微塵 6 以下、名

  • 404 Page Not Found. - GMOインターネット

    404 Error - Page Not Found. 指定されたページ(URL)は見つかりません GMOインターネットのページへ戻る Copyright (c) 2020 GMO Internet, Inc. All Rights Reserved.

    naaam
    naaam 2012/12/06
  • 平均と標準偏差

    ある集団についてのデータがどのように分布しているかを表すものとして、その集団の代表値★(中心の値)を示す平均値及びそのばらつき具合を示す散布度がある。平均には算術平均が、散布度には標準偏差がよく用いられている。 1.度数分布表・ヒストグラム データがどのように分布しているかその実態を把握するには、データをその大きさによりいくつかの階級に区分し、その階級ごとの個数 (度数) をカウントして表にした度数分布表、あるいは、それを棒グラフにして表わしたヒストグラムが適している (表1、図1) 。 例えば、年齢別人口や従業者規模別事業所数など多くの統計表は度数分布表の形で作成され、また、年齢別人口をヒストグラムにした人口ピラミッドは人口構造の分析等によく用いられている。 2.平均値★ 一般に平均値には、単純平均 が多く使われている。平均値は通常μ(ミュー) と表示される。 3.標準偏差

    naaam
    naaam 2012/12/06