タグ

dataに関するblueribbonのブックマーク (12)

  • 機械学習を使って東京23区のお買い得賃貸物件を探してみた - データで見る世界

    さて、改めて今回の目的を確認しておくと、機械学習を使って東京都23区のお買い得賃貸物件を発見しよう、というものです。前回までの記事で、お買い得賃貸物件を発見するためのデータを収集し、分析にかけられるよう前処理してきました。 www.analyze-world.com www.analyze-world.com 今回の記事では、いよいよ機械学習を使って分析していきましょう。前回まではPythonを使っていましたが、この分析ではRを用いています。なお、コードはGitHub(https://github.com/ShoKosaka/Suumo)に上げておきますので興味ある方は参照ください。 最初に、データの中身をざっくり見ていきます。具体的には、分析のキーになるポイントをグラフにしながら、賃貸物件の現状や変数同士の関係性を把握していきます。 データ探索 まず、23区の中でどこが物件数が多いのかを

    機械学習を使って東京23区のお買い得賃貸物件を探してみた - データで見る世界
  • 「生活保護急増」というシャレにならない現実〜自治体別データで見る(高橋 亮平) | 現代ビジネス | 講談社(1/4)

    先日、小田原市の生活保護担当職員が、「生活保護なめんな」と印刷されたジャンパーを受給世帯訪問の際に着ていたことが問題となり、大きなニュースとなった。 これを受け小田原市は、担当部署の部長以下7人を厳重注意処分とし、謝罪会見を行った。 社会福祉法では、ケースワーカーの配置は、受給者80世帯当たり1人を標準としている。ところが、小田原市の場合、約2,320世帯が生活保護を受給しているため標準数は29人のところを、現在は25人となっていた。 1人が担当する世帯数が多く現場が疲弊していることも問題の背景にあるとして、市は新規採用や他部署からの配置転換などで、新年度には4人程度増員する方針を示した。 この「生活保護なめんなジャンパー」問題をニュースだけで見ていると、「なんて非常識な市役所なんだ!」「人権侵害も甚だしい!」といった声が多くの人から出てきそうだ。 もちろん、役所としてあるまじき問題であり

    「生活保護急増」というシャレにならない現実〜自治体別データで見る(高橋 亮平) | 現代ビジネス | 講談社(1/4)
    blueribbon
    blueribbon 2017/02/06
    ・1世帯で年間23万5,320円も負担している(福岡県嘉麻市) ・生活保護の自治体負担はこの10年の間に極端に増えている ・年金額よりも生活保護費の方が高い構造になっている
  • [速報]顧客のデータセンターに大型トラックで乗り付け、100PBのデータを吸い上げる「AWS Snowmobile」発表。AWS re:Invent 2016

    [速報]顧客のデータセンターに大型トラックで乗り付け、100PBのデータを吸い上げる「AWS Snowmobile」発表。AWS re:Invent 2016 AWSは大容量のデータを顧客のデータセンターからAWSのクラウドへ物理ストレージを利用して効率よく転送するために「Amazon Snowball」を2015年に発表しました。 今回のAWS re:Invent 2016では、このAmazon Snowballの進化形として「AWS Snowball Edge」が発表されました。 Snowball Edgeは100TBの頑丈なストレージにコンピュート機能などを内蔵したことで、処理中のサーバに接続し、ストレージとして直接データを受け取るといったことが可能になります。 しかし「企業が保存しているデータがエクサバイトだったらどうだろう?」と、AWS CEOのAndy Jassy氏。「エクサバ

    [速報]顧客のデータセンターに大型トラックで乗り付け、100PBのデータを吸い上げる「AWS Snowmobile」発表。AWS re:Invent 2016
    blueribbon
    blueribbon 2016/12/04
    「エクサバイトのデータを10Gbpsのネットワークで転送すると26年かかるところ、10台のAWS Snowmobileでは6カ月程度でクラウドへ転送できる」
  • Googleの無料BIツール「Google Data Portal(グーグルデータポータル)」の使い方 | 解析レポート作成時間がゼロに! | Ledge.ai

    Top > ラーニング > Googleの無料BIツール「Google Data Portal(グーグルデータポータル)」の使い方 | 解析レポート作成時間がゼロに!

    Googleの無料BIツール「Google Data Portal(グーグルデータポータル)」の使い方 | 解析レポート作成時間がゼロに! | Ledge.ai
    blueribbon
    blueribbon 2016/11/19
    「「何をするべきか」を考える”人にしかできないこと”に時間を使いなさい」(Google)
  • 日本の産業分類別年収/労働時間ヒートマップ - A Successful Failure

    2016年06月07日 日の産業分類別年収/労働時間ヒートマップ Tweet 厚生労働省は毎年産業分類別に賃金や労働時間の調査を行っている。10名以上の従業員を抱える5万余の民間事業所に対する調査をまとめたものであり、最新の調査結果は今年2月に公表された平成27年賃金構造基統計調査だ。 そこで同調査にもとづき、産業分類別の年収、月間労働時間をヒートマップにしてみた。男性・女性の降順にソートしたバージョンも用意しているのでそちらも見て欲しい。サムネイルをみるだけで、男女に厳然とした差があることが一目瞭然だ。 産業分類別年収テーブル(男性ソート版・女性ソート版) 産業分類別月間労働時間テーブル(男性ソート版・女性ソート版) 産業別明細票 さらに産業分類ごとに調査結果を確認できる検索フォームも用意した。上部のプルダウンメニューを選択することで、所望の産業の給与/労働時間テーブルを参照すること

    日本の産業分類別年収/労働時間ヒートマップ - A Successful Failure
    blueribbon
    blueribbon 2016/06/11
    「日本は世界的に見ても膨大な統計がきちんと整備されている国であるらしい。…日本は昔から多くの統計調査を行ってきた。しかし、それが活用されているかというと話は別だ。」
  • ハイテク・バブル崩壊か?卓球台が鳴らす警鐘

    This copy is for your personal, non-commercial use only. Distribution and use of this material are governed by our Subscriber Agreement and by copyright law. For non-personal use or to order multiple copies, please contact Dow Jones Reprints at 1-800-843-0008 or visit www.djreprints.com. http://jp.wsj.com/article/SB12692037482832534161104582049233582016986.html

    ハイテク・バブル崩壊か?卓球台が鳴らす警鐘
    blueribbon
    blueribbon 2016/05/22
    「卓球台などの売り上げはハイテク経済の動きに追随する」
  • 日本の神主らが700年前から集めていた「氷」のデータから地球温暖化と産業革命の強い関連を示す事象が明らかに

    By Sakae Baba 地球の気候変動を研究するために世界中で気温や水温、降水量などさまざまなデータが集められているわけですが、日とフィンランドには過去数世紀にまたがって記録されてきた「氷」に関する貴重な気象データが存在しています。そこからは、地球の気温が18世紀に興った産業革命と強い関連を持つことを示す事実が明らかになっています。 Direct observations of ice seasonality reveal changes in climate over the past 320–570 years : Scientific Reports http://www.nature.com/articles/srep25061 Japanese Priests Collected Almost Seven Centuries of Climate Data | Smart

    日本の神主らが700年前から集めていた「氷」のデータから地球温暖化と産業革命の強い関連を示す事象が明らかに
    blueribbon
    blueribbon 2016/04/30
    「御神渡りは、その年の作物の稔り(みのり)や吉凶などを占うものとされてきたため、諏訪湖にほど近い諏訪大社では1442年から神主らによって記録されるようになり、「御渡帳」などの書物が残されてきました。」
  • 「パナマ文書」解析の技術的側面

    世界中で話題になっているパナマ文書。各国で政権を揺るがすような事態にもなっていますが、純粋にデータとしてみた場合、これは計算機やデータ解析に関わる人々にも面白いものだと思います。データの中身や背景などについてはさんざん報道されていますのでここでは触れません。一方、現場でどのような作業が行われているのかはあまり報道されていません。現実的な問題として、人力ではどうしようもない量のリークデータを手に入れた場合、調査報道機関はどんなことを行っているのでしょうか?私も以前から疑問に思っていたのですが、先日あるデータベース企業と、データ分析アプリケーションを作成する会社のブログにて、その実際の一端を窺うことができる投稿がありました: Panama Papers: How Linkurious enables ICIJ to investigate the massive Mossack Fonseca

    「パナマ文書」解析の技術的側面
    blueribbon
    blueribbon 2016/04/12
    「機械的にこのようなデータを作り出す仕組みを整えれば、凄まじい量のデータであってもキーワードで検索したり関係性を機械に描かせて人間が理解しやすい形にできる」
  • 地図アプリの開発を爆速化する「Webマッピング」サービスの活用術を大公開! - paiza times

    どうも、まさとらん(@0310lan)です。 今回は、地図上にデータをマッピングすることで、さまざまな情報を「見える化(可視化)」できるWebサービスの活用法についてご紹介しようと思います! マッピングが出来るようになると、単なる「データの集まり」だったものが視覚的にとても分かりやすくなるので非常に便利です。 誰でも簡単に扱える定番のマッピングサービスから、地図アプリなどの開発に役立つモノまで取り上げてご紹介しようと思います。 ちなみに、マッピングをするのに必要な「データ」に関しては、無償で利用できるオープンデータをまとめたサイト「LinkData」に公開中のモノを利用しているので、みなさんもぜひ一緒にトライしてみてください! ■「Googleマイマップ」を活用しよう! まずは、誰でも扱いやすいGoogleの「マイマップ機能」を使って、簡単なマッピングに挑戦してみましょう! データは、Li

    地図アプリの開発を爆速化する「Webマッピング」サービスの活用術を大公開! - paiza times
    blueribbon
    blueribbon 2016/03/20
    LinkData:無償で利用できるオープンデータをまとめたサイト 1.「Googleマイマップ」を活用しよう 2.「CartoDB」でオシャレな地図を作ろう 3.「Mapme」でマッピングサービスを作ろう 4.LinkDataのAPIを活用してみよう
  • まだAPIで消耗してるの? サクッとデータが欲しいなら「Blockspring」を使おう! – GUNMA GIS GEEK

    各サービスのAPIの仕様なんて覚えてらんねぇ!という人は是非。 Blockspringとは Blockspringは、TwitterやFacebookなどのソーシャルメディアをはじめ、Amazon、Youtubeなど様々なサービスからのデータを、プログラマがAPIを直接触ることなく表データとして取得することができるサービスです。サービスごとに規格の異なるWebAPIを利用するには学習コストが結構かかるわけですが、Blockspringはそういったサービスとプログラマーの間に立ち、データ取得のインターフェイスを抽象化してくれます。 非常に沢山のサービスに対応しています。 「ちょこっとデータが欲しいだけなのに、サービス毎のWebAPIを勉強するのもう疲れた」 そんな時はBlockspringを利用してみてください。 インストール BlockspringはGoogle スプレッドシートとエクセル

    まだAPIで消耗してるの? サクッとデータが欲しいなら「Blockspring」を使おう! – GUNMA GIS GEEK
    blueribbon
    blueribbon 2015/09/25
    使用例 ・Facebookからユーザーを検索してその結果を取得 ・Youtubeからキーワード検索した内容を取得 ・Google Map上にヒートマップを作ったり、ストリートビューから画像を取得してdropboxへインポート
  • ビッグデータの本質は過去データの分析ではない | データ経営|DIAMOND ハーバード・ビジネス・レビュー

    ビッグデータの技術を駆使し膨大なデータを集め活用することから、有効な打ち手が見えてくる。しかし過去データの分析からイノベーションは生まれるのか。こんな疑問を解消するような方法論が、ビジネス実験である。 ビッグデータで実現する事業の効率化 以前、ビッグデータの特集を編集した際、疑問に残ったのは、過去のデータの分析からイノベーションは起きるかということでした。過去のデータは、過去の企業活動の成績のようなものです。このデータを集めることから、どのような状況なら有効でどのような状況なら無効かを突き止めることができるようになります。 小売店での天気とおにぎりの売上げとの相関関係が分かれば、より細やかな生産量の決定が可能となり、売れ残りも売り逃しも減らすことができます。これがビッグデータの典型的な活用例で、さらに高度なアナリティクスを導入することで、どの商品と並べると売行きが上がるか、店内の空調とおに

    ビッグデータの本質は過去データの分析ではない | データ経営|DIAMOND ハーバード・ビジネス・レビュー
    blueribbon
    blueribbon 2015/06/02
    「さまざまな多数の仮説を低コストで検証できる。この方法論を導入することで、企業は机の上で仮説の有効性を考える時間を短縮し、試してみて、その有効性を検証することが容易になります。」
  • 「東京から何時間で行けるのか」日本全国19万エリア調査 ヤフー、地図データ使い交通シミュレーション

    最北端の宗谷岬までは4時間56分だが、納沙布岬はさらに2時間も遠い──ヤフーは4月9日、「Yahoo!地図」を使ったビッグデータレポートを公開した。東京駅から日各地への所要時間マッピングや、リニア中央新幹線が開通した場合の変化をシミュレーション。必ずしも一致しない実際の距離と「時間的距離」を浮き彫りにしている。 任意の出発地点と目的地から最適なルート、所要時間を割り出す「Yahoo!地図」の「ルート探索」機能を利用し、東京駅から全国各地への到達時間をマッピングしている。飛行機、新幹線、鉄道、フェリーなどの交通機関から最も効率的なものを選んだ結果になっているのが特徴だ。 全国の住所を「○○町○○丁目」まで細分化し、約19万エリアに分割。川の中や人が到達できない場所を避けるアルゴリズムで各エリア内に自動で目的地点を定め、総当たり的にすべての場所への所要時間を算出している。 北海道では日

    「東京から何時間で行けるのか」日本全国19万エリア調査 ヤフー、地図データ使い交通シミュレーション
    blueribbon
    blueribbon 2015/04/11
    リニア新幹線の破壊力が凄い。
  • 1