タグ

データに関するmotowotaのブックマーク (20)

  • 企画書で使える!無料で統計データが手に入るサイト11選|SUKIMANO

    市場調査の結果など、客観的な統計データがあると企画書やプレゼン資料の信頼感がぐっとアップしますよね。 しかし、統計データを企画書やプレゼンの資料として使いたいと思っても、個人でできる調査には限りがありますし、格的に調査するとそれなりに費用や時間がかかるのがネックです。 実はネット上には無料で統計データを公開しているサイトがあるので、企画書やプレゼンのテーマに沿った資料が手に入るなら活用しない手はありません。 無料で統計データが閲覧できるサイトを11個まとめましたので、企画書やプレゼンの資料に活用してみてはいかがでしょう。 ①総務省統計局 出典 http://www.stat.go.jp/index.htm 統計データといえば総務省統計局です。 国勢調査、人口推計、住宅・土地統計調査、家計調査、全国消費実態調査、小売物価統計調査、労働力調査などなど、さまざまな統計データを無料で閲覧できます

    企画書で使える!無料で統計データが手に入るサイト11選|SUKIMANO
  • データサイエンティストを目指すというかデータ分析を生業にするなら読んでおきたい初級者向け5冊&中級者向け12冊(2015年冬版) - 渋谷駅前で働くデータサイエンティストのブログ

    (Photo via VisualHunt) 追記 2017年3月現在の最新書籍リストはこちらです。 最近になってまた色々とデータサイエンティストを目指す人向けのお薦め書籍リストとか資料リストとかが出てきてるんですが、個人的には何かと思うところがあるので僕も適当にまとめておきます。偏りありまくり、完全に主観で決めたリストなので文句が出まくるかと思いますが、もはや毎回のことなのでご容赦を。 なおこちらのリストはあくまでもビジネスの現場でデータ分析を生業にする(しようとしている)人たち向けのものであり、研究者含めたガチ勢の方々向けのものではありませんのでどうか悪しからずご了承下さい。 ちなみに毎回言ってますが、アフィリエイトは全くやっていないのでここに貼られたリンクを踏んで皆さんが購入されても僕の懐には一銭も入りません。拙著だけはそもそも例外ですが(笑)。*1 初級者向け5冊 一応初級者向けと

    データサイエンティストを目指すというかデータ分析を生業にするなら読んでおきたい初級者向け5冊&中級者向け12冊(2015年冬版) - 渋谷駅前で働くデータサイエンティストのブログ
    motowota
    motowota 2015/12/23
    TJOふぜいが上からかよ
  • 1日に100万レコード増える場合のテーブル設計

    MySQL(マイエスキューエル)は、TCX DataKonsultAB社などが開発するRDBMS(リレーショナルデータベースの管理システム)です。世界で最も人気の高いシステムで、オープンソースで開発されています。MySQLデータベースサーバは、高速性と信頼性があり、Linux、UNIX、Windowsなどの複数のプラットフォームで動作することができます。 PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

    1日に100万レコード増える場合のテーブル設計
  • 弊社社員による個人的なソーシャルメディアの不適切な利用とされている件について - F-Secure

    F-Secureは世界中で3,000万人以上の人々に信頼されています。なぜなら、35年間、家族のデバイス、プライバシー、アイデンティティ、オンラインライフを保護することを簡単にしてきたからです。

    弊社社員による個人的なソーシャルメディアの不適切な利用とされている件について - F-Secure
    motowota
    motowota 2015/11/05
    何をもって、アクセスないとしたのか、心配ないと言うのか。日本市場から撤退してね。
  • AKB48総選挙、ビッグデータ分析で結果を予測した担当者に会ってきた

    AKB48総選挙、ビッグデータ分析で結果を予測した担当者に会ってきた:入手可能なデータでどこまでやれるか見せる(1/2 ページ) AKB48は41枚目のシングル「ハロウィン・ナイト」を発売した。センターに立つのはHKT48の指原莉乃。6月の選抜総選挙でトップに返り咲いた。この結果、実はデータ分析で事前に予測されていたという。

    AKB48総選挙、ビッグデータ分析で結果を予測した担当者に会ってきた
    motowota
    motowota 2015/08/27
    岡田さんがかわいい
  • 米アマゾン選定「一生のうちに読むべき100冊」邦訳リスト - YAMDAS現更新履歴

    Boing Boing で知った Amazon.com: 100 Books To Read In A Lifetime だが、まさに「一生のうちに読むべき100冊」を選定している。 「このリストは人生のあらゆる段階を網羅するのを目指したもので(だから児童書も入れてある)、宿題みたいにとってほしくない」とのことで、人気度だけでないちょっと意外なチョイスがある。 Amazon といえば初期は人間によるレコメンドもあったが、徐々に機械(データ)に置き換えられていったと理解している。このリストは人間の編集者が選んだものなのだろうか。 ざっと邦訳リストを作ってみた。順不同。 ジョージ・オーウェル『一九八四年』(asin:4151200533、asin:B009DEMC8W) スティーヴン・W. ホーキング『ホーキング、宇宙を語る―ビッグバンからブラックホールまで』(asin:4150501904)

    米アマゾン選定「一生のうちに読むべき100冊」邦訳リスト - YAMDAS現更新履歴
  • データサイエンティストではない人に知っておいて欲しい事 - hotokuとは

    統計を専門にしている訳ではない人と話していて感じた違和感があったので、書き留めておきたい。 疑うべき順番は モデル → 推定法 データ分析をしていれば、当然、期待を掛けたモデルのデータへの当てはまりそうが悪いという事が度々ある。こういう時、統計屋さんとして自然に浮かぶのは「モデルが間違っている」という発想である。と思うのだが、非統計屋さんと話していると、このような時に「別の推定法を試してみたらどうだろう」と言われる事がある。多分、目の前のモデルに対する過度の期待から来るのだろうと思うが、このような態度では統計的に見ると妥当性を欠いた分析をしてしまう危険を孕んでいる。 ひとつの事例 とある線型状態空間モデルのパラメータを推定した所、どうしてもデータに合わない部分があった。実は、それが合わない理由は簡単で、ある潜在変数は常に正であるはずなのだ。線型状態空間モデルでは、潜在変数の分布は正規分布で

    データサイエンティストではない人に知っておいて欲しい事 - hotokuとは
  • 高速な安定ソートアルゴリズム "TimSort" の解説 - Preferred Networks Research & Development

    先日、TimSortというソートアルゴリズムが話題になりました。TimSortは、高速な安定ソートで、Python(>=2.3)やJava SE 7、およびAndroidでの標準ソートアルゴリズムとして採用されているそうです。 C++のstd::sort()よりも高速であるというベンチマーク結果1が話題になり(後にベンチマークの誤りと判明)、私もそれで存在を知りました。実際のところ、ランダムなデータに対してはクイックソート(IntroSort)ほど速くないようですが、ソートというシンプルなタスクのアルゴリズムが今もなお改良され続けていて、なおかつ人々の関心を引くというのは興味深いものです。 しかしながら、オリジナルのTimSortのコードは若干複雑で、実際のところどういうアルゴリズムなのかわかりづらいところがあると思います。そこで今回はTimSortのアルゴリズムをできるだけわかりやすく解

    高速な安定ソートアルゴリズム "TimSort" の解説 - Preferred Networks Research & Development
  • 決して主流になることは無く、歴史の表舞台から姿を消した非常に個性的な記録媒体いろいろ

    HDDやフラッシュメモリ、そしてBlu-rayディスクなど、今日さまざまな大容量の記録媒体が普及していますが、決して主流になることは無く、歴史の表舞台から姿を消していった非常に個性的な記録媒体いろいろです。 多くの人が一度は見かけたことがあるようなものから、人の目に触れることもほとんど無いままひっそりと消えていったものまで幅広くラインナップされており、興味深い内容となっています。 詳細は以下から。 1:2インチのフロッピーディスク(ビデオフロッピーディスク) 1981年にソニーが試作し、その後他社からもリリースされた「電子スチルビデオカメラ」用の記録媒体。記録容量は720KBで、1989年に登場したノートパソコン「Zenith Minisport」の記録媒体としても採用されました。 2:マイクロドライブ(Microdrive) 2003年にコンパクトフラッシュと同じサイズで発売された超小型

    決して主流になることは無く、歴史の表舞台から姿を消した非常に個性的な記録媒体いろいろ
    motowota
    motowota 2011/04/06
    日立のテレビの記録媒体は何がしたかったんだろう。名前が思い出せない
  • TechCrunch

    Media is a tough game, and wringing value out of words on the Internet is a never-ending battle. We spoke with Medium's CEO Tony Stubblebine about how Medium got itself back on the right path.

    TechCrunch
    motowota
    motowota 2011/01/27
    NFSと空目
  • SI業界からはさっさと抜けだしたほうがいい - ひがやすを技術ブログ

    SI業界(日)のJavaプログラマーにはオブジェクト指向より忍耐力が求められている? - 達人プログラマーを目指して http://d.hatena.ne.jp/ryoasai/20110109/1294581985 をうけて自分の考えを書いておきます。 二年前なら、自分もどうしたらSI業界をよく出来るか真剣に考えていたし、NTTデータの人達と実際に話し合いもしています。 NTTデータとの真昼の対決シリーズ http://d.hatena.ne.jp/higayasuo/20080612/1213241779 http://d.hatena.ne.jp/higayasuo/20080828/1219901392 でも、ソーシャル、クラウド、スマフォの時代になって、考えが変わりました。 今は、世の中の動きがかなり速くなっているので、その中で素早くチャンスを捕まえたものだけが生き残ります。受

    SI業界からはさっさと抜けだしたほうがいい - ひがやすを技術ブログ
    motowota
    motowota 2011/01/14
    基幹系をやれオープンソースだ、クラウドだ、に切り替えるためには、コーディング以外にも、セキュリティ、サポート、堅牢性、社内制度の転換などいろんな仕組みの変更が必要
  • 自殺にみる男女格差 - Chikirinの日記

    自殺に関するデータを見ていたら、自殺って男女差がすごく大きいんだと知って驚きました。 下記のグラフは、1978年から2009年まで、過去30年ほどの男女の自殺比率です。縦軸は「人口10万人当たりの自殺者数」で単位は“人”、青線が男性、赤線が女性です。一目で「男性は女性より圧倒的に自殺率が高い」とわかります。男性は女性の倍以上の比率で自殺するのです。 (2009年の自殺者実数では、男性23,472名、女性9,373名の合計32,845名) しかも女性の自殺率は過去30年で、大きく変ってはいません。最近よく「自殺が異常なペースで増えている!」と聞きますが、実際には「日では、男性の自殺が異常なペースで増えている」というべきなのです。男性の自殺率は過去30年で6割増であり、特に1998年くらいからは男性だけ急増しています。*1 「なぜ男性の自殺がこんなに増えているのか」、同じ資料に男女別の自殺理

    自殺にみる男女格差 - Chikirinの日記
  • 日本人はなぜ自殺するのか? – 橘玲 公式BLOG

    では、毎年3万人を超えるひとたちが自らの意思で死を選んでいる。これは、「市場原理主義」による改革により、日人の安心が奪われてしまったからだと説明される。 だが国際的な自殺率の比較を見ると、日の自殺率(10万人あたりの自殺者数)が24.4なのに対し、市場原理主義の国アメリカの自殺率は11.0、イギリスにいたっては6.4だ。この統計を素直に解釈すれば、日をアングロサクソン型の市場原理主義国家にすれば、年間1~2万人のひとが自殺から救われることになる。市場原理と改革を声高に批判するひとたちは、これをどのように説明するのだろう。 年功序列と終身雇用は真面目に働く労働者にやさしいシステムで、それを「市場原理主義者」が成果主義で破壊したために、追い詰められたサラリーマンが自殺していく、というのが定番のストーリーだ。でもかつて、サラリーマンはほんとうにそんなに幸せだったのだろうか。 『残酷な世

    日本人はなぜ自殺するのか? – 橘玲 公式BLOG
    motowota
    motowota 2010/12/06
    これだけのデータで既存の常識をひっくり返すのか!?
  • 「社員から愛されている企業」や「愛されていない企業」が一挙公開、社員の悲痛すぎる声も

    旧来の終身雇用制度が崩れ、働くことに対する若者の価値観の変化などもあり、「愛社精神」という言葉は薄れつつあるように思える昨今ですが、社員から愛されている企業と愛されていない企業がランキング形式で公開されました。 愛される会社であるかどうかは、社員の士気を測る上で大きな指標となりそうですが、はたしてどのような結果となったのでしょうか。「愛されていない企業」で働く社員の生の声なども公開されています。 ランキングや社員の声は以下から。 愛社されている企業、愛社されていない企業 主要133社ランキング年収、給料、評判、企業クチコミ情報キャリコネ 企業のクチコミ情報サイト「キャリコネ」によると、キャリコネに登録されているデータをもとに、「年収への満足度」や「仕事のやりがい」「キャリアパスの公平さ」「労働環境」など、7つの指標について満足度を数値化して会社ごとに集計し、「愛社されている企業、愛社され

    「社員から愛されている企業」や「愛されていない企業」が一挙公開、社員の悲痛すぎる声も
    motowota
    motowota 2010/09/22
    キーエンスが満足な方に入ってるのは給料から? ソフトバンクとか入っててもおかしくないのにね。
  • 統計よりも「1人のストーリー」が有効な理由 | WIRED VISION

    前の記事 iPod Nano腕時計のいろいろ:10ドルの自作品も 豪華なプライベートジェット、内部を拝見:ギャラリー 次の記事 統計よりも「1人のストーリー」が有効な理由 2010年9月17日 サイエンス・テクノロジー コメント: トラックバック (0) フィードサイエンス・テクノロジー Jonah Lehrer 米軍のヘリコプターで救済されたパキスタンの洪水被害者たち。画像はWikimedia [チリの鉱山で起きた事故は、人々の高い関心をひきつけている。一方で、パキスタンの洪水は、大規模な被害であるにもかかわらず十分な関心が喚起されていない。その背景についての考察。] 筆者の著書『How We Decide』[邦訳は一流のプロは「感情脳」で決断する(アスペクト刊)]から、ある研究を引用しよう。(人間の判断や意志決定について研究する非営利機関Decision Researchの創設者である

    motowota
    motowota 2010/09/19
    感情に訴えるメソッド
  • Google Sites: Sign-in

    Not your computer? Use a private browsing window to sign in. Learn more about using Guest mode

  • [次世代DB編]分散KVSに重要なデータを置いてはいけない

    分散KVS(キーバリューストア)は、RDBMSの代わりになると思ってはいけない。RDBMSでは当たり前だった機能の一部は、あきらめる必要がある。このため、重要なデータをむやみやたらと分散KVS上に置くのはやめた方がよい。 分散KVSであきらめなければならない機能には、次の四つがある、 ・トランザクション機能 ・排他制御機能 ・読み取り一貫性を保証する機能 ・スプリットブレイン対策機能 逆にいえば、これらを取り込まないことで、分散KVSはRDBMSではかなわなかった、無尽蔵なスケーラビリティーや、極端に短いレイテンシー(要求が返ってくるまでの遅延時間)による高パフォーマンスを実現できたわけだ。 ところが、使い方を間違えれば、たちまち問題が生じてしまう。とりわけ、業務システムにおける重要なデータを分散KVS上に置く場合は注意が必要だ。 トランザクション処理に支障 重要なデータとは、不整合や損失

    [次世代DB編]分散KVSに重要なデータを置いてはいけない
    motowota
    motowota 2010/07/30
    まぁ集中設置か分散設置か、自動判断してくれるストレージマネージャーがあると嬉しいんだが。
  • はてなブログ | 無料ブログを作成しよう

    来年も作りたい!ふきのとう料理を満喫した 2024年春の記録 春は自炊が楽しい季節 1年の中で最も自炊が楽しい季節は春だと思う。スーパーの棚にやわらかな色合いの野菜が並ぶと自然とこころが弾む。 中でもときめくのは山菜だ。早いと2月下旬ごろから並び始めるそれは、タラの芽、ふきのとうと続き、桜の頃にはうるい、ウド、こ…

    はてなブログ | 無料ブログを作成しよう
  • MySQLでサービス停止のないALTER TABLEの検討 - SH2の日記

    MySQLでテーブルへのカラム追加、インデックス追加やテーブルの再編成などを行うと、その間テーブルに共有ロックがかかってしまいます。そのためこれらのメンテナンス処理は、通常利用者の少ない深夜早朝帯にサービスを止めて実施する必要があります。日はそれを無停止、オンラインのままでできないかという話題です。 基的なアイデア メンテナンス対象の元テーブルをコピーして、作業用の仮テーブルを作ります 仮テーブルに対して、カラム追加などの変更を加えます その間、元テーブルに対して行われる更新処理について差分を記録しておきます 仮テーブルの変更が終わったら、記録しておいた差分データを仮テーブルに反映します 差分データの反映が終わったら、元テーブルと仮テーブルを入れ替えます これと似たようなことを考えた方は結構いらっしゃるのではないでしょうか。ただ、言うは易し、行うは難しです。整合性がきちんと取れるかどう

    MySQLでサービス停止のないALTER TABLEの検討 - SH2の日記
    motowota
    motowota 2010/07/04
    オープンソースとはいえ、alter table の仕様がこわい
  • 東京23区 データで分かる区の実力 | ダイヤモンド・オンライン

    世界一の都市圏である東京。特にその中心となる23区は、データや知識を積み重ねると、それぞれの区が特徴や「区民性」を持ちながら、それぞれの土地に人やビジネスを惹きつけていることがわかる。そんな各区のデータを見ながら、歴史や周辺情報と共に、23区それぞれの特徴、「実力」を明らかにしていく。 最終回 港区――思わず「ビバ!」と叫びたくなる高級街の驚くべきセレブぶり 池田利道,小口達也,東京23区研究所,フィルモア・アドバイザリー 「東京23区」の最終回は、東京の中で最も東京らしい街・港区の実像を紹介。高所得層の数が全国一となる港区には、女性をはじめトレンドに敏感な人… 2010.10.12 第22回 江戸川区――「陸の孤島」と言われる水の街は、なぜ子どもの数が最も多い? 池田利道,小口達也,東京23区研究所,フィルモア・アドバイザリー 江戸川区は、高齢者の数が多いと共に、若いカップルや子どもの数

    東京23区 データで分かる区の実力 | ダイヤモンド・オンライン
  • 1