タグ

分析に関するlocked_dogのブックマーク (50)

  • Engadget | Technology News & Reviews

    How to watch Polaris Dawn astronauts attempt the first commercial spacewalk

    Engadget | Technology News & Reviews
  • 全くのゼロから「駆け出しデータサイエンティスト」を育てる方法論 - 渋谷駅前で働くデータサイエンティストのブログ

    (Image by Pixabay) 「データサイエンティスト」の第一次ブーム勃興から6年余り、人工知能ブームに便乗した第二次ブームで人口に膾炙してから3年余り、気が付いたら何やかんや言われながらもデータサイエンティスト及びその類似職が、じわじわと日国内の産業各分野・企業各社に広まりつつあるように僕の目には映ります。 そういう背景がある中で、ここ1年ぐらいの間にそこかしこで目立つようになってきたのが「ゼロからデータサイエンティストを育てたいのだがどうしたら良いか」という相談や議論。割とあるあるなのが「取引先がデータサイエンティストを採用して商談の席に同席させるようになって、彼らがデータサイエンスの知識を駆使してビシバシ突っ込んでくるのだが、こちらにデータサイエンティストがいないので対応できない」みたいなお話。これは実はUSでも同様だと聞くので*1、案外洋の東西を問わない課題なのかもしれま

    全くのゼロから「駆け出しデータサイエンティスト」を育てる方法論 - 渋谷駅前で働くデータサイエンティストのブログ
  • SQLってなんだ?「だれでもわかる」教え方とは:朝日新聞デジタル

    ","naka5":"<!-- BFF501 PC記事下(中⑤企画)パーツ=1541 --><!--株価検索 中⑤企画-->","naka6":"<!-- BFF486 PC記事下(中⑥デジ編)パーツ=8826 --><!-- /news/esi/ichikiji/c6/default.htm -->","naka6Sp":"<!-- BFF3053 SP記事下(中⑥デジ編)パーツ=8826 -->","adcreative72":"<!-- BFF920 広告枠)ADCREATIVE-72 こんな特集も -->\n<!-- Ad BGN -->\n<!-- dfptag PC誘導枠5行 ★ここから -->\n<div class=\"p_infeed_list_wrapper\" id=\"p_infeed_list1\">\n <div class=\"p_infeed_list\">

    SQLってなんだ?「だれでもわかる」教え方とは:朝日新聞デジタル
  • CALC×wired | INNOLAB

    CALCとは? 「CALC(カルク)」は、全く新しい大規模データ解析サービスです。 既存の、相関関係を用いたデータ解析ツールでは難しかった、データ間の因果関係を導くことが出来ます。CALCを利用することで、課題を解決するための施策を、大量の仮説の中から客観的に、圧倒的に素早く検討できるようになります。 大規模データ解析システムCALC について、詳しくはこちら 相関と因果の違い 例えば、ある地域・1日あたりのアイス販売量と、海で溺れる人数の間には、多くの場合、相関関係が見られます。 ただし自治体が溺れる人数を減らす方法を考えたとして、「アイス販売量を減らそう」という施策は意味を持ちません。 これは、アイス販売量と海で溺れる人数の間の関係が、因果関係ではなく気温や遊泳人数を媒介した間接相関だから。 相関だけではわからない因果関係を、CALCは客観的に推計します。 CALCから導かれた若者のク

    CALC×wired | INNOLAB
  • 相関関係で面白い例はある?「マーガリンの消費量」と「離婚率」の相関性などを紹介

    「すべてのものに因果関係があり、世界は見えないところで繋がっている」。 インターネットの普及により人や情報の流動性が増す中、こうした視点がまことしやかに語られます。誰でも膨大な情報にアクセスできる現代では、様々な事象に相関関係と因果関係を見出すことができるからです。最近発見された意外な説には、腸内細菌の量がやメンタルヘルスに影響するというものがありますね。 意外と言えば、マーガリンの消費量と離婚率に相関関係があるのをご存知ですか? アメリカ・メイン州の10年間のマーガリンの消費量と離婚率を見比べてみたところ、両者のあいだに99%の相関関係があることが分かったのです。 ここまで高い相関関係があると、そこに因果関係を見出したくなりますよね。では実際、マーガリンの消費量と離婚率のあいだに因果関係はあるのでしょうか? そもそも相関関係とは?前提の確認をしておきましょう。相関関係とは、2つの事柄が関

    相関関係で面白い例はある?「マーガリンの消費量」と「離婚率」の相関性などを紹介
  • カーネル密度推定とは何か? - 俺、サービス売って家買うんだ

    こんにちは、Hayatoです。年末ですね。 カーネル密度推定をおさらいしようと何度かググったのですが良い感じの記事が見当たらなかったので、書き落としておきます。 Index カーネル密度推定って? どういうときに使うといいの? カーネル密度の算出方法 (実際にPythonで) 2次元でカーネル密度推定 カーネル密度推定って? カーネル密度推定は、一言で表すと「なめらかなヒストグラム」です。 なめらかなヒストグラムを利用して、実際のいくつかのデータ(標)から、全体の分布を推定する事ができます。 左がヒストグラムで、右がそれを元にして作成したカーネル密度分布のグラフです。 参照:Kernel density estimation - Wikipedia どういうときに使うといいの? ヒストグラムとは違い曲線になっているので、X値に対応するYを取ることが出来ます。あくまで推定ではありますが、お

    カーネル密度推定とは何か? - 俺、サービス売って家買うんだ
  • ビッグデータ時代とデータ活用技術の最先端(1)

    これまで2回に分けて、社会インフラの管理におけるセンサー情報の利活用の方向性を考えてきた。今回は、「ビッグデータ」(これまでのようなデータベース管理では取り扱うことができない極めて大量のデータ)と、代表的なデータ活用技術である「データマイニング」技術について紹介しながら、そのインフラ維持管理への活用について考えたい。 ビジネスや生活の中で流通する電子データ量は爆発的に増加している。米国IDCは、2009年に0.8ゼタバイト(8000億GB)であった生成データ量が、2020年には35ゼタバイトにまで達すると予測している。また、矢野経済研究所は、2020年には、ビッグデータに関する市場規模は1兆円を超えるという推計を発表している。 社会インフラの維持管理データはもちろん、スマートグリッドやデジタルサイネージ、プローブカー・システム(自動車をセンサーとして情報を収集するシステム)といった新しい取

    ビッグデータ時代とデータ活用技術の最先端(1)
  • 読者がメディアを購読する理由とは何か? 米大学の調査が発見した衝撃のパラドクス

    ページビュー至上主義は、「購読者」を離反させる 驚くべきは、多くの記事の精読を追求することさえ、離反を招く 衝撃的な研究結果から、メディアの採るべき選択を探る 国内では、もちろん日経済新聞 電子版、米国では New York Times 電子版が示した、「ペイウォール」「サブスクリプション」(電子版購読制)での躍進。いまや多くのメディア運営者にとり、購読制は、あたかも新大陸、希望の地とさえ映っているかもしれません。 けれど、広告主を頼みとするメディア運営と、購読制、つまり読者からの直接的な支出に頼むメディア運営とは、共存もしくは全面的な転換は可能なのでしょうか? 広告を基盤とするメディア運営については、その知見やノウハウが蓄積されてきています。もっといえば、広告収益へとメディア運営を最適化したアプローチに、われわれメディア運営者は、知らず知らずに水浸しにさえなっているかもしれません。 そ

    読者がメディアを購読する理由とは何か? 米大学の調査が発見した衝撃のパラドクス
  • データサイエンティストの定義は?必要スキルは?現役データエンジニア/アナリストと考えた結論 - エンジニアHub|若手Webエンジニアのキャリアを考える!

    データサイエンティストの定義は?必要スキルは?現役データエンジニア/アナリストと考えた結論 需要が高まるデータサイエンティストというロールですが、業務の定義や、必要スキルは一体どのようなものでしょうか。3名のデータエンジニア/アナリストに実践から得た答えを聞きました。 データエンジニアとデータアナリストの違い 分析と実装。データサイエンティストに求められる要件 数学の素養が重要。技術仕事で身につけられる! データエンジニア/アナリストが考える必要なスキルセット データアナリスト・データエンジニアにとっての「事業貢献」 「データサイエンティスト」という肩書を耳にすることが増えています。 データの蓄積はとどまるところを知らず、さらにビジネスにおけるデータの重要度が増し続ける現在、同職が同じく重要になっていることは想像に難くないでしょう。 反面、データサイエンティストが現場で何をしているかは、

    データサイエンティストの定義は?必要スキルは?現役データエンジニア/アナリストと考えた結論 - エンジニアHub|若手Webエンジニアのキャリアを考える!
  • 読めば納得。重回帰分析で失敗しがちな事例10|マーケティングと重回帰分析 − その3 | 株式会社サイカ

    マーケターの必須スキル・プロモーションの分析に、重回帰分析を使ってみましょう。5回にわたって、重回帰分析の基を学びます。重回帰分析で失敗しがちな10パターンを、組み合わせ・構造・データの問題と3つにわけてまとめました。 図で学ぶとわかりやすいんです!|マーケティングと重回帰分析-その1では、重回帰分析の基的な仕組みを説明しました。 実際に分析を進めてみると、慣れないうちは様々な原因で良い分析結果が出ないことがあります マーケティングと重回帰分析-その3では、重回帰分析に起こりがちな失敗を10個のパターンとしてまとめました。業務でつまづいたときに確認するも良いですし、予習として目を通しておくのもOK。 直感的に「何が起きているのか」をとらえ、より早く正しく「どう対処すればよいのか」を判断できるようになれます。 組み合わせの問題要素が少なすぎる代表的な失敗パターンは、モデルに取り入れている

    読めば納得。重回帰分析で失敗しがちな事例10|マーケティングと重回帰分析 − その3 | 株式会社サイカ
  • データ分析とインテリジェンス

    ご案内 このブログはデータ分析やデータ整備をテーマにしています。詳しくは「データ分析とインテリジェンス」についてをご覧ください。 理想的なメタデータ管理の仕組みとは何だろう どんな仕組みならメタデータが使いやすく、更新し続けられるようになるか

    データ分析とインテリジェンス
  • Yahoo! JAPANビッグデータレポート - Corporate Blog - ヤフー株式会社

    ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社のコーポレートサイトはこちらです。 当ページに記載されている情報は、2023年9月30日時点の情報です。

    Yahoo! JAPANビッグデータレポート - Corporate Blog - ヤフー株式会社
  • データサイエンティスト・マルチリンガル論|樫田光 | Hikaru Kashida

    Hikaru Kashidaです。 僕が誰かというと、2018年時点ではざっくりこういう者です。 Twitter / 取材1 / 取材2 / 取材3 / 登壇1 / 登壇2 ↓ 書きました。他の共著さんも結構面白いのでよかったらどうぞ ↓ とても昔に、データサイエンティストの定義について語る文章を書いたことがあるのですが、その内容を少しリメイク&加筆してnoteに載せてみたものがこちらです。 定義についてはとかく色々と言われがちな職種のようなのですが、ココでは僕の自分なりに思うことを書いていきます。 半ば独り言と思ってもらって大丈夫です。 お断り上記の通り、"データサイエンティスト" は其の定義や存在についてとかく色々と言われがちな職種だと思います。 それは結構なことなのですが、ひとつ僕がこの文章を書くにあたって避けたいと思っているのが『定義警察』的な人の議論に巻き込まれることです。 『

    データサイエンティスト・マルチリンガル論|樫田光 | Hikaru Kashida
  • 株式会社ALBERT(レコメンドエンジン)

    データ分析から導き出されたインサイト無しにAI人工知能)の活用は始まりません。私たちは、各業界知識とデータ・アナリティクス技術を駆使しデータドリブン経営を強力に支援します。 データ、アナリティクス、AIは企業にとって競合他社との差別化を図るかつてないほど大きな要因になっています。今日の経営幹部が効率を向上しながら新たな収益源を開拓し、新しいビジネスモデルをタイムリーに構築する方法を模索する中、価値を生み出し成長を続ける企業には「データ活用」という共通項があります。私たちは、無数のデータから企業にとって当に必要なデータを活用するための方法を知っています。 将来を見据えたオペレーション体制を備えている企業の半数以上(52%)は、すでにデータとアナリティクスを大規模に活用しています。データとAIに関する取り組みをビジネス戦略に沿って実施することで投資利益率を迅速に最大化し、最終的にはAIをビ

    株式会社ALBERT(レコメンドエンジン)
  • [SQL] 最強の分析ツールと言われるWindow関数について私が学んだこと | DevelopersIO

    はじめに Window関数とはなんなのか? 分析関数とも言われる比較的新しい機能で、分析SQLを書く上で最強の武器だそうです。 ただ理解をするのが難しく Windowとは何か? Windowは何を分けているのか? 自分が学んだ時に理解に苦労したPartitionBy句とOrderBy句、frame定義について僕が理解していることや影響範囲について書こうと思います。 今回もいつものサンプルデータを使います。 手を動かしながら動作を確認したい方はこちらをどうぞ! Window関数は以下のような物があります。個々の関数についての説明は今回は割愛します。 集約関数をWindow関数として使うことができる - sum() Window内の合計値を算出 - min() Window内の最小値を算出 - max() Window内の最大値を算出 分析関数 - row_number() Window内での

    [SQL] 最強の分析ツールと言われるWindow関数について私が学んだこと | DevelopersIO
  • データマート - Wikipedia

    この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。出典を追加して記事の信頼性向上にご協力ください。(このテンプレートの使い方) 出典検索?: "データマート" – ニュース · 書籍 · スカラー · CiNii · J-STAGE · NDL · dlib.jp · ジャパンサーチ · TWL(2016年2月) データマート (Data Mart) は、データウェアハウスの中から特定の目的に合わせた部分を取り出したもの。通常は利用部門が利用目的に合ったデータのみを所持するものである。 利点[編集] 利用部門ごとに使用するデータや分析内容が異なることが多いため、その利用部門が必要とするデータのみをデータウェアハウスから抽出したり、その利用部門が必要とする分析データをあらかじめ集計することにより、分析レスポンスを向上できる。これは、データ容量が小さくなることやリクエストの

  • ディシジョンツリー分析 | リサーチ・市場調査ならクロス・マーケティング

    「市場」の動向だけでなく、市場の中身、顧客や満足度に至るまでを調査。データや数値のみでは計れない潜在的なニーズも察知・予測し、明確な目的と正しい手法で調査することで、正確なデータをビジネスに有効活用できます。

  • エモエロ

    三葉ちはる(るんるん月野)のプロフィールや経歴をはじめ、名や出身校(中学/高校/大学/専門学校)、元彼氏や両親(父母)兄弟姉妹などについて調べて紹介したいと思います。

    エモエロ
  • data.ai

    data.ai
  • 株式会社パスコ

    1度毎の経線と2/3度毎(40')の緯線によって、全国を分割して作られたのが、第一次メッシュ(1/200000地形図の通常の区画に相当する範囲、約6400km2)です。標準メッシュコードは、1:区画南端の緯度を1.5倍した2桁の数字と、2:西端経度から100を引いた2桁の数字を1、2の順に並べ、4桁の数字で定義されます。 第二次メッシュ 第一次メッシュを縦横に8等分して作られたのが、第二次メッシュ(1/25000地形図の通常の区画に相当する範囲、約100km2)です。8等分された区画には、南から経線方向に、西から緯線方向に、それぞれ0から7の数字が振られており、このA:経線方向の数字とB:緯線方向の数字をA、Bの順に並べ、第一次メッシュの数字の後ろにつけたものが、標準メッシュコードとして定義されます。( 1 2 - A B ) 第三次メッシュ 第二次メッシュを縦横に10等分して作られたのが

    株式会社パスコ