タグ

データに関するlusakaのブックマーク (18)

  • 統計学を勉強するときに知っておきたい10ポイント - Issei’s Analysis ~おとうさんの解析日記~

    googleさんやマイクロソフトさんは「次の10年で熱い職業は統計学」と言っているようです。またIBMは分析ができる人材を4,000人増やすと言っています(同記事)。しかし分析をするときの基礎的な学問は統計学ですが、いざ統計学を勉強しようとしてもどこから取りかかればいいか分からなかくて困るという話をよく聞きます。それに機械学習系のは最近増えてきましたが、統計学自体が基礎から学べるはまだあまり見かけないです。 そこで今回は、統計学を初めて勉強するときに知っておいた方が良い10ポイントを紹介したいと思います。 1. 同じ手法なのに違う呼び名が付いている 別の人が違う分野で提案した手法が、実は全く同じだったということがあります。良く聞くのは、数量化理論や分散分析についてです。 数量化理論 数量化I類 = ダミー変数による線形回帰 数量化II類 = ダミー変数による判別分析 数量化III類 =

    統計学を勉強するときに知っておきたい10ポイント - Issei’s Analysis ~おとうさんの解析日記~
  • ソーシャルアプリ 大橋直久

    SNS(ソーシャル・ネットワーキング・サービス)向けソーシャルアプリの開発が急ピッチで進められています。 2009年6月、日経コンピュータ 米ロックユー SNS(ソーシャル・ネットワーキング・サービス)向けアプリで急成長 2005年11月に設立した米ロックユー。設立当初は知名度のない小さなソフト開発会社の1社に過ぎなかったが、SNS(ソーシャル・ネットワーキング・サービス)向けアプリケーション開発で急成長を遂げている。英語圏や中国語圏の大手SNS向けに提供する米ロックユー社のアプリケーションは、2008年時点で月間利用者数が1億800万人、月間閲覧数は20億ページビュー。ヤフーやグーグルへの投資実績があるベンチャーキャピタルの米セコイアキャピタルなどからは、2000万ドル(約20億円)以上の出資を受けたとされる。インターネット関連ベンチャー企業としては、最も注目の1社と言える。 米ジンガ、

  • TwitterとFacebook,自社公表された最新統計値のまとめ:In the looop:オルタナティブ・ブログ

    4月14日,Twitterデベロッパー・コンファレンス「Chirp」がサンフランシスコで開催された。 共同創業者であるBiz Stone氏,Evan Williams氏などが登壇し,開発者向けの様々な試みとともに,今までベールに包まれていたTwitterに関する各種統計値が発表され,話題になっている。 【共同創業者,Biz Stone氏】 【共同創業者,Evan Williams氏】 ■ Twitter社が自社発表した統計数値 このカンファレンスで一挙に公開された統計数値は次のようなものだ。 登録アカウント数は1億600万,毎日30万人増加 月間訪問者(ユニークビジター)数は1億8000万人 うち,37%の訪問者はモバイル経由 ツイート数は毎日5500万 トラフィックの75%はAPI経由(Twitter.com以外の)アクセス APIからのリクエスト数は毎日30億件,対前年成長率は1500

    TwitterとFacebook,自社公表された最新統計値のまとめ:In the looop:オルタナティブ・ブログ
  • 選択理由はコストメリット

    現在利用しているサービスを選んだ理由についても聞いた(図7)。ランニングコスト、導入初期コストが安いという回答が全体の1~2位になった。どちらも30%以上の回答者が理由に挙げている。ただ、基幹業務系と非定型業務系のユーザーに分けてみると、基幹業務系ではランニングコストを選択の理由にした回答者は22.2%にすぎず、4番目に下がった。 この結果は、回答者のSaaS/ASPサービスに対する利用開始前の期待とマッチしている。基幹業務系ではシステムを稼働させるまでのコストが大きく、そうしたコストの削減期待が大きい一方で、管理・運用費は比較的重視されていない。非定型業務系では逆に管理・運用フェーズが重視されており、ランニングコストが選択の第一理由になる。 また、基幹業務系では「事業者の他社での実績がある」「経営上層部の指示」が同率2位だったことも注目される。特に、基幹業務系の回答者を上場企業の回答者と

    選択理由はコストメリット
  • 非定型業務の負荷削減は期待以上

    ネットワークを通じてソフトウエアの機能をサービスとして提供するSaaS(ソフトウエア・アズ・ア・サービス)が注目されている。米グーグルや米アマゾン・ドット・コムなどのベンダーが「クラウドコンピューティング」に取り組んでいるが、これもインターネットを通じてコンピュータ資源をサービスとして使えるようにするものであり、SaaSと親和性が高い。 SaaSの前身として1990年代末に始まったASP(アプリケーション・サービス・プロバイダ)がある。名前の通り、アプリケーションをサービスとして提供する。SaaSはASPよりもカスタマイズが容易だったり、サーバー資源をユーザーが共有する形態だったりという違いがあるが、質はASPと同じであり、ASPが時代に合わせて進化していった形がSaaSであると言える。 SaaS/ASPの注目度は高いが、実際に使っているユーザーはまだまだ少なく、どこにどれだけ効果がある

    非定型業務の負荷削減は期待以上
  • 導入前は可用性に大きな不安

    「サービスの可用性が十分かわからない」というのが得点147点と、ほかの不安要因に大差をつけた。2位以下4位までは横一線。5位の「セキュリティ面の危険が大きい」と6位の「アプリケーションが使いにくい」は、基幹業務系のアプリケーションを使っている回答者では得点が高くなった。一方、非定型業務系のアプリケーションを使っている回答者では下位の7位、8位とそれほど変わらない得点だった。 セキュリティ面の不安で大きな違いが出たのは、業務の内容に理由がありそうだ。非定型業務系のアプリケーションの場合、メールなどもともとインターネットを利用するものが多く、SaaS/ASPでインターネットを経由してデータをやり取りすることはセキュリティ上のマイナスにはならない。一方、基幹業務系の場合、これまではLAN内に閉じた環境で利用するのが普通だったので、インターネット上にサーバーがさらされ、データが流れることに不安を感

    導入前は可用性に大きな不安
  • 第1回 ユーザー多いコミュニケーション系サービス,コストは基幹業務系が非定型業務系の4倍

    『日経マーケット・アクセス』は,「SaaS/ASP利用実態調査2008」という特別調査報告書をこのほど発行した。ITpro Research会員などITの先進ユーザーのSaaS/ASPの利用実態を2008年8月に調べた結果をまとめた。回答者は予備調査によって選別し,SaaS/ASPを既に使っているユーザーおよび,現在利用を計画しているユーザーに限定して調査した。この中から主な結果を抜き出して4回にわたって報告する。 初回はユーザーが使っているサービスの種類と実際にかかっているコスト,サービス稼働までの期間といったユーザーの利用状況を分析する。 調査ではSaaS/ASPの利用分野を10個に分けている。これらのうち,既に使っているユーザーがどの分野で利用しているかを尋ねた(図1)。なお,複数利用している場合は一番重要な分野について回答してもらっている。 電子メール,SNSなどのコミュニケーシ

    第1回 ユーザー多いコミュニケーション系サービス,コストは基幹業務系が非定型業務系の4倍
  • グーグル運営のウェブサイト数は1050万--Netcraft調査

    Googleがインターネット上で大きな影響力を持っていることに疑問の余地はない。しかし、同社がウェブサイトのホスティングに独自ソフトウェアを使っていることから、その影響力の大きさを垣間みることができる。 例えば、Googleは10月、1050万のウェブサイトを運営し、9月と比べて41万1000増加しているという。ウェブサイトのホスティングで使われるソフトウェアを調査するNetcraftが米国時間10月30日に公開した統計で明らかになった。 この数字は、ウェブページをブラウザに送信するために使われるウェブサーバソフトウェアを調査した結果から得られている。上位2パッケージは「Apache」とMicrosoftの「Internet Information Services(IIS)」だが、Googleが追い上げを見せている。 Netcraftの調査によれば、全ウェブサイト1億8200万のうち、1

    グーグル運営のウェブサイト数は1050万--Netcraft調査
  • グーグル、「Google Apps Premier Edition」でサービスレベル保証を拡大

    Googleの「Gmail」を有料で利用している顧客は、電子メールサービスが99.9%の稼働率で保証され、達成できなければ返金を受けることになっている。同社はこの保証を「Google Calendar」や「Google Docs」など、「Google Apps Premier Edition」のそのほかのサービスにも拡大すると発表した。 「日われわれは、Premier Editionの顧客を対象に提供しているGmailの99.9%サービスレベル保証(SLA)を、Google Calendar、Google Docs、『Google Sites』『Google Talk』に拡大することを発表する」と、Google Enterprise製品管理のディレクターを務めるMatthew Glotzbach氏は、米国時間10月30日付けのブログでGoogle Appsに関するサービス保証を明らかにし

    グーグル、「Google Apps Premier Edition」でサービスレベル保証を拡大
  • 「iPhone」がアップルの最重要製品になった理由--第4四半期決算を読み解く

    iPhone」の圧倒的な成功により、Appleとその財務状況を監視している人々は、同社の価値を再評価せざるを得なくなっている。 AppleiPhone事業が「無視できないほど大きくなった」と述べた、Appleの最高経営責任者(CEO)のSteve Jobs氏は、米国時間10月21日に行われた決算発表の電話会議に珍しく出席し、iPhoneAppleの財源にどのくらいの売り上げをもたらしているのかを説明した。Appleは初めて、財務状況を補足する資料を使って、iPhoneの売上高が「Mac」の売上高と同様に処理された場合、iPhoneAppleの収支にもたらしたであろう貢献を明らかにした。その数字は驚くべきものだ。 iPhoneは現在、Appleの事業の39%を占めており、第4四半期中に690万台を売り上げ、46億ドルの売り上げを生み出した(この数字には「Apple TV」の売上高が含

    「iPhone」がアップルの最重要製品になった理由--第4四半期決算を読み解く
  • グーグル、電子メール保管サービス「Google Message Discovery」を拡大

    Googleは、電子メッセージの保管を求める連邦政府の規則に悩まされる組織向けに、電子メールをユーザーあたり年間45ドルで最大10年間保管するアーカイブサービスを提供する。同サービスは、企業の既存の電子メールインフラストラクチャと連動し、ストレージ容量の上限はない。 製品マーケティングを担当するBill Kee氏はブログ「Official Google Enterprise」の10月8日付けの投稿において、企業がオンサイトで電子メールを7年間保管する場合、ユーザーあたり年間推定200ドルのコストがかかることを考えると、これはお得なサービスであると記している。 この新しい保管サービスは、「Google Message Discovery」の一部として提供される。ここでは、スパムやウイルスフィルタリングなども提供されている。 企業は、ユーザーあたり25ドルで電子メールを最大1年間保管し、その後

    グーグル、電子メール保管サービス「Google Message Discovery」を拡大
  • 「マルチ・クラウド」という選択肢

    「天下の大勢,合一して久しくなれば必ず分かれ,分かれて久しくなれば必ず合一する」---14世紀の作家である羅貫中は「三国志演義」の中で,「集中と分散の繰り返し」が歴史の理(ことわり)と指摘した。IT業界でも今,新しい集中の動きが起きている。ご存じの通り,クラウド・コンピューティングである。 米国では,クラウド・コンピューティングを「コンピューティングの集中化の動き」と捉える見方が主流的である。代表的な論客が,2003年に「IT doesn't Matter」という論文を発表して話題になった評論家のNicholas Carr氏である。 Carr氏は2008年1月に出版した「The Big Switch: Rewiring the World, From Edison to Google」という著書で,「コンピュータは発電機と同じ。発電機がそうであったように,コンピュータもGoogleのような

    「マルチ・クラウド」という選択肢
  • システム障害で実態が明らかに,Web 2.0企業を支えるAmazonのクラウド・サービス

    Amazonのクラウド・サービスに障害,Web 2.0企業を脅かす」――。米国時間2008年2月15日,海外メディアでこんな見出しが躍った。同日,太平洋標準時午前5時ごろから米Amazon.comのオンライン・ストレージ・サービスに障害が起き,数時間にわたってアクセス不能になった。これにより,いわゆるWeb 2.0系と呼ばれるネット新興企業のサービスが一斉にストップ。New York Timesによれば影響を受けた企業は数十万社。これら企業が抱える多くのユーザーがサービスを利用できなくなった(New York Timesの記事)。 当初Amazonの対応が迅速でなかったことから,ブログやWeb上のフォーラムなどで動揺が起きた。のちに同社が明らかにした説明によれば,認証アクセスが一時的に急増したのが原因。想定外だったとのことだ。Amazonはこのサービスを2006年から提供しているが,こん

    システム障害で実態が明らかに,Web 2.0企業を支えるAmazonのクラウド・サービス
  • Designing a Better Tomorrow -- Danish Design Competition

    Connecting decision makers to a dynamic network of information, people and ideas, Bloomberg quickly and accurately delivers business and financial information, news and insight around the world

  • 米ネット・ユーザーの69%がクラウド・コンピューティングを利用

    インターネットの社会的影響力を調査する非営利団体である米Pew Internet & American Life Projectは2008年9月12日,米国におけるクラウド・コンピューティング利用実態に関する調査結果を公表した。それによると,米国のインターネット・ユーザーの約69%が,Webメールやオンライン・ストレージ,ホスティング型の文書作成/表計算アプリケーションなどのクラウド・コンピューティング・サービスを利用している。 最も人気のあるクラウド・コンピューティング・サービスは,HotmailやGmailなどのWebメール・サービスで,回答者全体の56%が利用していると答えた。2位は写真をオンラインに保存できるフォト・ストレージ・サービス(34%),3位はGoogle DocumentsやAdobe Photoshop Expressなどのホスティング型アプリケーション(29%)だっ

    米ネット・ユーザーの69%がクラウド・コンピューティングを利用
  • 米ガートナーのハイプ曲線でWeb2.0と仮想世界がどん底近くにプロット:ナレッジ!?情報共有・・・永遠の課題への挑戦:オルタナティブ・ブログ

    米ガートナーグループから毎年公表している「新規テクノロジのハイプ・サイクル」の2008年版のプレスが出たようだ。プレスリリースにはハイプ曲線の図が含まれていなかったが、こちらのサイトには画像があったので以下にリンクを画像の貼ってみた。あと、CNETには速報記事も載っている(※) 昨年の同じハイプ曲線には36個の技術があったが今年は27個に減少。半数以上が入れ替わっているが、私から見て今年のハイプ曲線で注目すべきポイントをいくつか挙げてみる。 まず最初はPublic Virtual Worlds(仮想世界:昨年はVirtual Environment/Virtual Worldsと表記)が昨年の過剰な期待のピークポジションから一気に幻滅期のどん底近くまで落下したこと。まあセカンドライフの失速はしばらく前に多くの人が指摘していたのでこのポジション自体には納得するし、今年の後半から来年にかけて新

    米ガートナーのハイプ曲線でWeb2.0と仮想世界がどん底近くにプロット:ナレッジ!?情報共有・・・永遠の課題への挑戦:オルタナティブ・ブログ
  • C-NEWS 生活者情報マーケティングデータ 調査結果・リポート配信サービス〜

    This domain may be for sale!

  • オリジナル調査レポート(自主企画調査)/MDBネットサーベイ

  • 1