タグ

データに関するGlnのブックマーク (14)

  • 「幸せは加速度センサで測れる」:日経ビジネスオンライン

    矢野:そうですか。 店舗の中で、居場所と体の動きを検知できるセンサを従業員が身に着けて、来店したお客様にも買い物の間だけ身に着けてもらい、毎秒20回ずつひたすらデータを取り続けるわけですが、それを解析した人工知能コンピュータがすごく意外な影響要因をはじき出した。 店内のいくつかの「ある特定の場所」に従業員が「いる」だけで顧客単価が向上するというんですね。そこでの滞在時間を1.7倍にしただけで顧客単価が15%も増えたとか。でもそれがどういう理由なのか言葉ではうまく説明できない。これは、具体的にはどういうことをコンピュータでやっているんですか。 矢野:ごく単純に言うと、1人のお客さんがいくらお金を使うかという売り上げというマクロな量に対して、影響を与えるかもしれない要因はものすごくたくさんあります。そのたくさんの要因の中で、影響がありそうな候補を何千個、何万個と自動で作り出し、かつそれらを絞り

    「幸せは加速度センサで測れる」:日経ビジネスオンライン
  • 『データサイエンティスト養成読本』はゼロからデータサイエンティストを目指す人なら絶対に読むべき一冊 - 渋谷駅前で働くデータサイエンティストのブログ

    執筆陣12人中8人が直接の知人友人というこの新刊書でございますが。 データサイエンティスト養成読 [ビッグデータ時代のビジネスを支えるデータ分析力が身につく! ] (Software Design plus) 作者: 佐藤洋行,原田博植,下田倫大,大成弘子,奥野晃裕,中川帝人,橋武彦,里洋平,和田計也,早川敦士,倉橋一成出版社/メーカー: 技術評論社発売日: 2013/08/08メディア: 大型この商品を含むブログ (4件) を見る もちろん僕も発刊が決まってAmazonに予約ページができた時点でポチりまして、読んでみたところあまりにも内容が素晴らしかったので早速現職場の図書コーナーに持ち込んだ次第です(笑)。ということで、僭越ながら書評など書かせて頂こうかと思います。 ざっくり内容紹介 正直言って、ものすごーーーく網羅的で非常によく出来ています。1ページ目から順に読んでいっても初学

    『データサイエンティスト養成読本』はゼロからデータサイエンティストを目指す人なら絶対に読むべき一冊 - 渋谷駅前で働くデータサイエンティストのブログ
  • データ分析というお仕事のこれまでとこれから(HCMPL2014)

    ハッカーズチャンプルー2014でお話してきた内容です。「データサイエンティスト(カナ)はオワコン」 http://hackers-champloo.org/program.htmlRead less

    データ分析というお仕事のこれまでとこれから(HCMPL2014)
  • 【書評】『シグナル&ノイズ 天才データアナリストの「予測学」』:シロクマ日報:オルタナティブ・ブログ

    ネイト・シルバーの"The Signal and the Noise: Why So Many Predictions Fail – but Some Don’t"をご紹介したのが昨年の10月。それから1年が経ち、いよいよ邦訳が出版されることになりました。その名も『シグナル&ノイズ 天才データアナリストの「予測学」』です。 ネイト・シルバーって何者?という方のために、書の紹介文を引用しておきましょう: ネイト・シルバー (Nate Silver) 1978年生まれ、ニューヨーク・ブルックリン在住の統計専門家。『マネー・ボール』で有名になった野球データ分析会社ベースボール・プロスペクタスの予測モデル「PECOTA」の開発者。2008年の米大統領選挙の結果を予測し、ほぼ完ぺきに(50州のうち49州)的中させたことで一躍脚光を浴びた(2012年の大統領選は50州すべて的中)。タイム誌の「世界で

    【書評】『シグナル&ノイズ 天才データアナリストの「予測学」』:シロクマ日報:オルタナティブ・ブログ
  • データ・サイエンスのプログラミング言語はRからPythonに置き換わる | readwrite.jp

    これまでデータ・サイエンティストの選ぶプログラミング言語はRだったのだが、急激にPythonに置き換わろうとしている。 このシフトの理由はいくつかあるようだが、第一にはPython自体が汎用的で比較的学びやすい言語であるのに対し、Rが習得するにあたってやや複雑であることがあげられるだろう。 データにますます依存しつつある現代社会とデータに飢えたサイエンティストにとっては「簡単さ」こそが鍵となるのだ。 Rは実際にはプログラミング言語ではないRを覚えることに苦労する人が多い理由として考えられるのは、Rが実際にはプログラミング言語ではないからかもしれない。R専門家のジョン・クックいわく、Rとは「統計のためのインタラクティブな環境」であり、厳密にはプログラミング言語ではないのだ。彼はさらに「Rをプログラミング言語だと考るのではなく、Rがプログラミング言語を内包しているのだと考えた方が良いと分かった

    データ・サイエンスのプログラミング言語はRからPythonに置き換わる | readwrite.jp
  • あなたの知らないグーグルのツール集

  • ドコモ、ビッグデータ販売へ…基地局機能活用 : ニュース : ネット&デジタル : YOMIURI ONLINE(読売新聞)

    NTTドコモは6日、携帯電話利用者の位置情報などが分かるビッグデータを10月に企業向けに販売すると発表した。 携帯電話基地局が、エリア内の携帯電話の位置情報などを自動的に把握している特性を生かし、特定エリアの時間帯ごとの人口の変化などのデータを販売する予定だ。 基地局が収集するデータには、位置情報だけでなく契約者の年齢や性別、住所も含まれる。7月にJR東日がICカード乗車券「Suica(スイカ)」の乗降履歴を利用者に無断で企業に販売していた問題が発覚したことから、ドコモは、携帯電話番号や生年月日を除くなどして個人の識別ができないようにする。 さらに、契約者が申請すれば、個人データをデータとして利用できないようにする。 ドコモは、企業などにデータを販売する際、顧客の要望に応じたデータを子会社の調査会社に提供し、データをもとに分析したリポートを渡す。

  • Webデータ分析&データサイエンスで役立つ統計学・機械学習系の分析手法10選 - 銀座で働くデータサイエンティストのブログ

    追記 2016年3月に以下の記事によってこの内容はupdateされています。今後はそちらをお読み下さい。 主に自分向けのまとめという意味合いが強いんですが(笑)、僕が実際に2013年6月現在webデータ分析&データサイエンスの実務でツール・ライブラリ・パッケージを利用しているものに限って、統計学・機械学習系の分析手法を10個挙げて紹介してみようと思います。 追記 回帰分析(特に線形重回帰分析) 独立性の検定(カイ二乗検定・フィッシャーの正確確率検定) 主成分分析(PCA) / 因子分析 クラスタリング 決定木 / 回帰木 サポートベクターマシン(SVM) ロジスティック回帰 ランダムフォレスト アソシエーション分析(バスケット分析・相関ルール抽出) 計量時系列分析 おわりに おまけ1:「素性ベクトル+分類ラベル」なるデータ前処理 おまけ2:グラフ理論*10 {igraph}パッケージでグラ

    Webデータ分析&データサイエンスで役立つ統計学・機械学習系の分析手法10選 - 銀座で働くデータサイエンティストのブログ
  • サービス終了のお知らせ - NAVER まとめ

    サービス終了のお知らせ NAVERまとめは2020年9月30日をもちましてサービス終了いたしました。 約11年間、NAVERまとめをご利用・ご愛顧いただき誠にありがとうございました。

    サービス終了のお知らせ - NAVER まとめ
  • 直観を超えた何かが組み上がることを目指して→考える道具としてのdot言語 / Graphviz

    digraph{ //ノードにリンクをつける 孔子 [href="http://ja.wikipedia.org/wiki/孔子"]; 子路 [href="http://ja.wikipedia.org/wiki/子路"]; //エッジにリンクをつける 孔子 -> 子路 [label = "師弟関係", href="http://ja.wikipedia.org/wiki/師弟" ]; } dot言語で書かれたスクリプトを、グラフに変換する(図示する)ソフトGraphvizで、描かれたダイアグラムをクリックすると、リンク先のサイトがブラウザで開かれる。 またsvgpdfで書き出したファイルでも、このリンクは生きている。 このブログからだと直接飛べないようなので、上の画像をクリックして別窓で開いてから、図の中の「孔子」「子路」「師弟関係」をそれぞれクリックしてほしい。 この機能を使えば、た

    直観を超えた何かが組み上がることを目指して→考える道具としてのdot言語 / Graphviz
  • NTTデータがツイート販売権取得 | web R25

    あなたのツイートもすべて販売対象に。データ販売がスタート ※この画像はサイトのスクリーンショットです NTTデータが11月19日、米Twitter社とツイートデータ提供に関する契約を締結。ツイートのデータを販売する新たなビジネスが誕生した。 今回NTTデータが取得したのは、日語のツイートデータおよび日国内で書き込まれたすべてのツイートデータを提供できる権利。同社は取得したデータを有料で提供し、想定顧客として、ソーシャルメディア関連企業や研究機関、自社製品に関するツイート内容を把握したい一般企業などを挙げている。 価格は、任意のキーワードでフィルタリングしてストリーム配信する「フィルターホース」が月15万円から、当日+過去31日分のデータを任意のキーワードで検索できる「リアルタイムサーチ」が月額50万円に設定されている。年齢、性別、好評・不評などを機械判別したオプションサービスも設

  • 図録▽寿命をちぢめているもの(未婚、喫煙、左利きなど)

    1979年6月刊とやや古いが、放射線医学の雑誌に載った「リスク・カタログ」という論文が米国において寿命をちぢめているもののカタログを提供している。 米国人の放射能に対する非科学的な恐れ、及びそれをあおるマスコミに対して、放射能より大きなリスクはこんなに沢山あるよと啓蒙するための論文であるが、著者はさらに一般化して、様々なリスクを寿命の短縮日数に換算して示し、「世の中の人はいつも種々のリスクに対する長広舌をふるい、これが政府の意志決定に大きな影響を与えている」現状に対して、適切な参照基準を提供しようとしている(論文紹介資料による)。 米国では1979年3月28日にスリーマイル島原子力発電所事故がおこり、それ以降、最近まで新規の原子力発電所の建設が凍結されていたほどであるから、この論文の発表時期に放射能に対する恐れが世間にあふれていても当然だったといえよう。 寿命に影響を与える最も大きなリスク

  • あなたの人生にかかわる衝撃的事実リスト【英語編】

    世界の2人に1人は英語をしゃべる時代。英語力のあるなしは企業の収益力にも影響するの? 所得への影響は? TOEICのスコアと利益、収入の関係をデータを基にひも解きます。 連載は「人生の大問題を図解する!」(光文社)の内容からポイントだけをピックアップしています。読者の皆さんのライフプランを見直し、後悔しない人生を送るための手助けになればと願っています。 人生の重大事の中から「お金」「語学力」「仕事」「家族」「思考力」という5つのテーマで衝撃的かつ客観的なデータを幾つか紹介します。今回は「人生の大問題、衝撃的な事実リスト<英語編>」です。 ニュースなどで取り上げられたものもありますが、あらためてこの世の中に起こっている大きなトレンドをつかんでみてください。 英語(語学力)の大問題ヘッドライン アジア諸国の英語力ランク、日は30位中27位。トップはシンガポール、2位はインド、3位はマレーシ

    あなたの人生にかかわる衝撃的事実リスト【英語編】
  • 食品の放射能検査データ

    上記における「ベクレル(Bq/kg)」は、放射性物質そのものが放射線を出す能力(放射能)の強さを表す単位です。 放射性物質をたき火にたとえると、火の強さに相当します。 暫定規制値は、放射線から身を守るためのひとつとして、飲を控えた方がよいと判断される目安として示されたものです。 (詳細、原子力安全委員会の指標 「原子力施設等の防災対策について」のP.108、資料6、参考) 暫定規制値を超えた品は販売できないことが法律で決まっています(品衛生法第6条第2号)。 暫定規制値を超えた場合はその場合は、出荷制限が行われ、当該農作物等については、現在、市場に流通しておりません。(原子力災害対策特別措置法) 出荷制限対象となった農産物については毎週放射線量の検査を実施し、3週連続で規制値を下回った 場合は市町村などの単位で制限を解除できるようになりました。 サイトにおきましても、科学的・客観

  • 1