タグ

データマイニングに関するkimutanskのブックマーク (8)

  • 時系列分析I ――ARMAモデルと時系列分析

    連載バックナンバー はじめに 今回は時系列分析について紹介します。ビジネスで生成されるデータの多くが“時間“の項目を含む時系列データで、1週間の傾向や季節変動などを分析する際など、さまざまな場面で時系列の分析が必要となります。 時系列分析(Time Series Analysis)とは? 時系列分析(Time Series Analysis)は、株価や為替レートなど金融関連の時間とともに変化するデータを分析し予測するために発達してきました。「時系列計量経済学(Time Series Econometrics)」などの学問の中で論じられているデータ分析の中では、比較的歴史のあるテーマです。それだけに、定式化するためのさまざまなモデルが提案されていて、1つの変量を分析するためのモデルだけでも、表1のように多くのモデルがあります。 略称 説明 AR

    時系列分析I ――ARMAモデルと時系列分析
    kimutansk
    kimutansk 2014/06/24
    簡単な式でも実際に値を当てはめてプロットしてみるとそれはそれで面白いですね。
  • データマイニングで理想の彼女をGetだぜ! - 発声練習

    ある国際会議のkeynote Speechの中で紹介されていた話。非常に面白かった。 Wired: How a Math Genius Hacked OkCupid to Find True Love 「いまどきの若い男は、なんでもコンピュータか!」とか思われるかもしれないけど、何をしたのかを読んでみると「これって、単なるナンパの方が楽だったんじゃないか?」と思わされる。 登場人物のスペック この人の経歴がアメリカ的。 名前:Chris McKinlay (35歳) 経歴 2001年:Middlebury College を卒業。専攻は中国語 同年:世界貿易センターで中国語から英語への翻訳のアルバイト。アルバイトを辞めた5週間後に9・11。 〜2002年:その後、友達に誘われて、an offshoot of MIT’s famed professional blackjack team に

    データマイニングで理想の彼女をGetだぜ! - 発声練習
    kimutansk
    kimutansk 2014/05/17
    これは・・なかなかすごいですね。ここまでやってのけること自体にシビれます。ただ、統計の先に88人とデートしたあたり、統計の問題化、理想が高すぎるのか・・
  • ComputerworldとCIO Magazineは閉鎖しました

    ComputerworldとCIO Magazineは 2023年5月23日で閉鎖しました。 長らくのご購読ありがとうございました。 日経クロステック TOPページ

    ComputerworldとCIO Magazineは閉鎖しました
    kimutansk
    kimutansk 2013/11/26
    犯罪を事前に防ぐ、という用途であれば非常に良さそうですねぇ 予防的に逮捕するとかに使われると中々恐ろしいですが
  • みんなビックデータビックデータって言ってるけど 名寄せとかどうしてんの?

    自由診療クリニック向けのオールインワンSaaS「medicalforce」、警備事業者向けオールインワンSaaS「警備フォース」を提供する株式会社メディカルフォース。フルスクラッチでの開発を実現させるスクラムの構築をまとめました Developer eXperience Day 2024 株式会社メディカルフォース CTO 畠中 翔一(@punk_punx)登壇スライド

    みんなビックデータビックデータって言ってるけど 名寄せとかどうしてんの?
    kimutansk
    kimutansk 2013/10/06
    性別にきちんとコード割り振られていたんですねぇ。性別を区別するシステムやってないからさっぱりでした(汗 名寄せの問題は・・・ま、色々とありそう
  • FIT2012招待講演「異常検知技術のビジネス応用最前線」

    FIT2012で行われた「ビジネスで生きる機械学習技術」セッションの招待講演資料です。 http://www.ipsj.or.jp/event/fit/fit2012/program/data/html/event/event_A-7.html 【講演概要】 世の中で得られる知見の多くは、何らかの観測対象の時間変化や、観測対象グループにおける珍しい個体の出現を捉えたものと考えることができます。特に急速な変化や異常な個体の検出するための異常検知技術は、ビジネスにおけるデータ収集・蓄積インフラの浸透とともに応用が広がっています。従来は、蓄積されたデータを目で見て確認する、閾値を設けてアラートを出す、あるいは経験に基づいて異常パターンをルール化する、などのアプローチが主流でした。しかしながら、収集できるデータの変数と量が飛躍的に増大する中で、比較的単純かつ過去に起きた異常のみ扱えるルールベース手

    FIT2012招待講演「異常検知技術のビジネス応用最前線」
    kimutansk
    kimutansk 2013/08/20
    分類や回帰問題と違い、異常検知はデータを削減することができないからこそ、処理する基盤が重要になってくるというわけですか。
  • 進撃の巨人を読んだことない人がデータだけでキャラを推測してみる - あんちべ!

    はじめに 最近超人気の漫画として私のTwitter TLを賑わす作品、その名も「進撃の巨人」。 これだけ人気なんだからきっと面白いに違いないのですが、 なんか絵が怖そうだし、人がバンバン死んでてグロいっぽいという噂を聞くので、 なんとか漫画を読まずに、それでいて進撃の巨人のキャラについては知りたい、 そう願う潜在的進撃の巨人ファンも全国に70万人くらいいらっしゃると思います。 そこで、データから進撃の巨人にどんなキャラが登場するか推測してみましょう。 扱うデータとして、pixivのタグ情報を利用します。 商品レビューコメントなどとは違い、ファンの創作活動がダイレクトに反映されるサービスなので、 そこに付与されるタグ情報は、ファンの熱(過ぎる)いメッセージが込められているに違いありません。 今回、以下のような縛りを入れています。 1.勿論原作は見ない 2.pixivのタグ情報は参照するけど、

    進撃の巨人を読んだことない人がデータだけでキャラを推測してみる - あんちべ!
    kimutansk
    kimutansk 2013/08/04
    大体あっているあたりがすごいですね。 そしてよくわからない世界の内容も含まれています・・・
  • ローソン「31位の菓子パンを売り続ける理由」 -人知を超えるビッグデータの底力【6】

    1勝3敗1引き分け。今年4月の「第2回電王戦」でプロ棋士はソフトに負け越した。コンピュータのデータ解析能力は、将棋のような複雑な世界でも人間を上回りつつある。こうした「ビッグデータ」はビジネスではどう活かされているのか。各社の最新事例を探った──。 一方、ローソンでも「POSデータ」をさらに深めたデータ分析が進んでいる。最大の要因は10年3月に導入した共通ポイントサービス「Ponta(ポンタ)」だ。ポンタの会員数は昨年末に5000万人を突破。提携企業数は13年5月現在で66社にのぼる。 ポンタの導入により、「1割のヘビーユーザーが6割の売り上げを占めている」といったことがわかるようになった。そうした中で、最も重視されている指標の1つがリピート率だ。ローソンではFC店向けに発注の目安となる「商品力指数」を示しているが、これもリピート率を基準にしている。 たとえば「ほろにがショコラブラン」とい

    ローソン「31位の菓子パンを売り続ける理由」 -人知を超えるビッグデータの底力【6】
    kimutansk
    kimutansk 2013/07/29
    何度も買ってるパンが出たと思ったら、「一部の女性から頻繁にリピートされている」・・・そーですか。私は男ですが。
  • 第28回 データマイニング+WEB@東京( #TokyoWebmining 28th) −データマイニング・機械学習とビジネス展開 祭り− を開催しました - hamadakoichi blog

    2013/7/27 "第28回 データマイニング+WEB@東京−データマイニング・機械学習とビジネス展開 祭り−"を開催しました。 第28回 データマイニング+WEB@東京 ( #TokyoWebmining 28th)−データマイニング・機械学習とビジネス展開 祭り−: Eventbrite Google グループ 会場提供し運営を手伝って下さった ニフティ株式会社 のみなさん、どうもありがとうございました。素敵なトークを提供してくれた講師メンバーに感謝します。会場参加、USTREAM参加ともに多くの方々の参加を嬉しく思っています。 参加者ID・バックグラウンド一覧: 参加者Twitter List: Twitter List TokyoWebmining 28th 参加者セキココ:第28回 データマイニング+WEB @東京 セキココ (作成してくれた @komiya_atsushi

    第28回 データマイニング+WEB@東京( #TokyoWebmining 28th) −データマイニング・機械学習とビジネス展開 祭り− を開催しました - hamadakoichi blog
    kimutansk
    kimutansk 2013/07/28
    画像認識にソーシャル、ゲノム解析に介護と、適用する様々な分野があるんですねぇ
  • 1