タグ

データに関するvelvetgrouseのブックマーク (12)

  • リレーショナルデータベースの仕組み (1/3) | POSTD

    リレーショナルデータベースが話題に挙がるとき、私は何かが足りないと思わずにはいられません。データベースはあらゆるところで使われており、その種類も、小規模で便利なSQLiteからパワフルなTeradataまで様々です。しかし、それがどういう仕組みで機能しているかを説明したものとなると、その数はごくわずかではないでしょうか。例えば「リレーショナルデータベース 仕組み」などで検索してみてください。ヒット数の少なさを実感できると思います。さらにそれらの記事は短いものがほとんどです。逆に、近年流行している技術(ビッグデータ、NoSQLJavaScriptなど)を検索した場合、それらの機能を詳しく説明した記事はたくさん見つかると思います。 リレーショナルデータベースは、もはや大学の授業や研究論文、専門書などでしか扱われないような古くて退屈な技術なのでしょうか? 私は開発者として、理解していないものを

    リレーショナルデータベースの仕組み (1/3) | POSTD
  • 【基本】平均値・中央値・最頻値はどう使い分ける? | なかけんの数学ノート

    主なデータの代表値に、平均値、中央値、最頻値の3つがあります。どれも、データ全体の特徴を表すものですが、どうして代表値が3つもあるのでしょうか。「1個なら覚えるのも楽なのに!」と言いたい人もいるでしょう。また、結局どれを使えばいいのかわからないという人もいるかもしれません。 ここではそういった疑問について考えていきます。3つの代表値のメリット・デメリットや、使い分けについて考えていきます。 各代表値の得意・不得意 代表値とは、データ全体の特徴を表した値のことです。平均値は、「すべての数値を足して、数値の個数で割ったもの」、中央値は、「数値を小さい方から並べたときに、真ん中に来るもの」、最頻値は、「一番個数が多いもの」です。どれも「データを特徴づける値」ですが、それぞれの代表値には、得意・不得意があります。 データが次のようにきれいな左右対称の山の形に分布していた場合は、平均値も中央値も最頻

    【基本】平均値・中央値・最頻値はどう使い分ける? | なかけんの数学ノート
  • 言語処理100本ノック 2015

    言語処理100ノックは,実践的な課題に取り組みながら,プログラミング,データ分析,研究のスキルを楽しく習得することを目指した問題集です 実用的でワクワクするような題材を厳選しました 言語処理に加えて,統計や機械学習などの周辺分野にも親しめます 研究やデータ分析の進め方,作法,スキルを修得できます 問題を解くのに必要なデータ・コーパスを配布しています 言語はPythonを想定していますが,他の言語にも対応しています

  • 東洋経済、月間1億PVの秘密 「ヒットの法則はデータが語る」・上 - withnews(ウィズニュース)

    体制は変えず、手法を変えた ――昨年5月、東洋経済オンラインの当時の編集長だった佐々木紀彦さんにインタビューしました。その時は「PVは月間5千万が現体制での限界だ」と。それが山田編集長になって半年で倍増し、1億PVに届こうとしています。編集部の人員増など、なにか体制を変えたのでしょうか。 「オンライン編集部員の数は、当時も今も8人で変わりません。ちなみに当時の8人のうち、佐々木君を含め3人がニューズピックスで活躍中です(笑)。佐々木君についていったので」 ――人員を増やさないのにPV倍増は驚きです。外部ライターが増えたんでしょうか。 「記事の数は多くても1日15。少ないと10もない。そのうち、外部筆者が書く記事が3分の2というのも、従来から変わっていません」 ――データを見ると、UU(ユニークユーザー=サイトの訪問者)1人あたり、8ページを読んでいます。この数字は佐々木さん時代と変わ

    東洋経済、月間1億PVの秘密 「ヒットの法則はデータが語る」・上 - withnews(ウィズニュース)
  • マクドナルドの月次売上・客数・客単価を10年分まとめてみた

    ※ 全て2004年の月次を100とする ※ 既存店の定義は「少なくとも13ヶ月以上開店している店舗」 全店売上高1月2月3月4月5月6月7月8月9月10月11月12月2004年100.0100.0100.0100.0100.0100.0100.0100.0100.0100.0100.0100.02005年112.497.5111.4103.696.3100.1104.1101.099.1104.4108.9108.62006年111.4102.5114.7109.9106.9113.6114.9113.2112.9109.2115.2112.72007年122.6116.8126.4129.4119.6130.7125.0128.5128.6115.4127.9126.32008年126.7123.8134.4129.9124.2137.7126.4134.8130.2124.2148.4

    マクドナルドの月次売上・客数・客単価を10年分まとめてみた
  • “女性が消える社会”いま何が|特集まるごと|NHKニュース おはよう日本

    近田 「『DATAFILE.JPN』。 データから、今、日で何が起きているかが浮かび上がります。 『おはよう日』では、人口動態調査などのデータを読み解き、社会の実相を明らかにするシリーズをネットとも連動してスタートします。」 和久田 「第1回のテーマは、『女性が消える社会』。 いったい、何が起きているのか。 まずは、こちらのデータからご覧ください。 こちら、皆さんもよくご存じの出生数の減少を示すデータです。 第2次ベビーブーム以降、右肩下がりが続いて、人口減少に歯止めがかからない状態が続いています。 では、これを別の角度から見ます。 こちらは全国47都道府県ごとの出生率を示したものです。 グラフが短い上の方ほど出生率が低いことを意味しています。 見てみますと、東京や京都、北海道も含まれていますが、埼玉、神奈川と、主に都市部で低く、そして地方では比較的高い傾向にあります。 つまり、都市

    “女性が消える社会”いま何が|特集まるごと|NHKニュース おはよう日本
  • TechCrunch | Startup and Technology News

    VCs are clamoring to invest in hot AI companies, willing to pay exorbitant share prices for coveted spots on their cap tables. Even so, most aren’t able to get into such deals at all. Yet, small, unknown investors, including family offices and high-net-worth individuals, have found their own way to get shares of the hottest…

    TechCrunch | Startup and Technology News
  • 職業別の生涯未婚率

    生涯未婚率という指標をご存知でしょうか。読んで字のごとく,生涯,未婚の状態にとどまる者がどれほどいるかです。 これは,全人口の人生を死ぬまで追跡して出すような,込みいったものではありません。生涯未婚率としては,50歳時点の未婚率が用いられます。この年齢以降は,結婚する者はほとんどいないであろう,という仮定に立つわけです。 なお,多くの官庁資料の年齢統計は5歳刻みのものですが,5歳刻みの統計から生涯未婚率を出す場合,40代後半と50代前半の未婚率を平均するという便法がとられます。 私は,この方式に依拠して,男女の生涯未婚率を職業別に計算してみました。こういうデータは見かけないので,興味を持った次第です。正規・非正規の影響を除くため,正規職員男女の率を出すこととします。資料は,2012年の総務省『就業構造基調査』です。 http://www.stat.go.jp/data/shugyou/2

    職業別の生涯未婚率
  • 最近Chromeが重いと感じたら…軽さを取り戻すための6つの爆速化設定 | 教えて君.net

    Google Chromeが「軽さ」を売りにしていたのは過去の話。最近は先進的な機能を盛り込んだ分、重くなっており、ちょっと古いマシンで重いページを開くと、固まってしまうこともしばしば。軽量化のためのチューンアップが欠かせないのだ。基である初級編から、ちょっとリスクのある上級編まで、Chrome軽量化のテクニックをおさらいしよう。 Chromeが重いときの対処法としては、まず、履歴やキャッシュが溜まっていないかを確認しよう。これらのデータを全て削除し、ネットワークの自動検出の設定を無効化する。ここまでが基の設定。パソコンのスペックが充分な場合は、これでChromeは快適に動くようになるはず。 それでもまだ重い場合は、ブラウザ動作の体感速度をアップさせる工夫が必要だ。Chrome標準の「先読み」機能を有効にして、ウェブの読み込み時間を短縮。さらに、タブを複数開いているときに、使っていない

  • オバマ大統領の再選を勝ち取ったITチームは、どんなメンバーで構成されていたのか?

    2012年のアメリカ大統領選挙は、バラク・オバマ現職大統領の勝利に終わりました。アメリカ大統領選挙とは、いわば米国でもっとも巨大なマーケティングキャンペーンであり、明確な期限があり失敗できないプロジェクトの1つです。 今回のオバマ氏のキャンペーンで話題になったのは、ITの活用とその効果でした。 詳細を報じたTIME誌の記事「Inside the Secret World of the Data Crunchers Who Helped Obama Win」によると、オバマ氏の地元シカゴに置かれた選挙対策部にある「The Cave」と呼ばれる部屋では、効果的な手を打つために各州の有権者のデータを統合、その嗜好や動向を把握、分析。その結果ジョージ・クルーニー氏の影響力が高いと判断して彼による事会を設けて資金集めに成功したり、スイングステート呼ばれ、勝敗の鍵を握る激戦州での選挙結果をさまざま

    オバマ大統領の再選を勝ち取ったITチームは、どんなメンバーで構成されていたのか?
  • Googleアナリティクスで解析をレベルアップさせる「アドバンスセグメント」のオススメ設定7つ - nanapi Web

    アドバンスセグメントを活用しよう! 無料アクセス解析ツール「Google アナリティクス」を利用していますか?使い始めたけどどう活用したらよいのか分からないという方も多いのではないでしょうか。 ここでは、Googleアナリティクス活用術という形で、5つの活用方法を紹介いたします。第1回目は「アドバンスセグメント」という機能を活用することによって、サイトの課題を見つける方法を紹介いたします。 そもそも「アドバンスセグメント」とは? アドバンスセグメントとはGoogleアナリティクスに用意されている「機能」の一つです。 アクセス解析のデータを特定の条件で「絞り込み」その絞り込まれた状態でレポートを確認することが出来るのが特徴です。 例えば、サイト全体の訪問者数や流入キーワードではなく、初めて訪れた人だけの訪問者数や流入キーワードを確認することが出来ます。以下はサイト全体・初めて訪れた人・複数回

  • TechCrunch | Startup and Technology News

    Yellow, an asset financier for solar energy and digital devices in Africa has raised $14 million series B funding in a round led by Convergence Partners with participation from the Energy Entrepreneur Fisker, the electric carmaker founded by the Danish auto designer Henrik Fisker, is gearing up to enter the Chinese market where competition is increasingly cut-throat, following in the footsteps of

    TechCrunch | Startup and Technology News
  • 1