タグ

統計に関するm_shige1979のブックマーク (31)

  • 猛暑日の増加

    [2018-07-20] as.POSIXct() を as.Date() に変えました。 東京管区気象台の東京における雷日数や真夏日等の日数の変化というページを見ると,猛暑日(日最高気温35℃以上)の日数が1876年以来著しく増加していることがわかる。ところが,平均気温を見ると,地球温暖化・都市化の影響で徐々に増加しているが,激しく変わっているようには見えない。平均ではなくて猛暑日の日数を見るべきであるという議論もある。しかし,「猛暑日」(日最高気温35℃以上)や「真夏日」(日最高気温30℃以上)のような分布の裾の日数は,何℃で切るかによって印象が大きく異なる。気温変化を誇張することにならないか。 「東京」の観測地点は2014年12月2日に約900m離れた地点に移転している。詳しくは「東京」の観測地点の移転について(PDF,2014年11月14日,気象庁観測部)を参照されたい。 東京の日

  • 初心者でもほぼ無料でR言語を勉強できるコンテンツ10選 - paiza開発日誌

    Photo by Hermann Kaser こんにちは。谷口がお送りします。 ITエンジニアの方の中には「R言語を学習したい」という方も多くいらっしゃるかと思います。 R言語は、データ分析やデータ処理に特化したオープンソースのプログラミング言語です。システムを開発をする他のプログラムミング言語とは位置付けが異なり、統計解析機能が付いていて、解析処理やその結果をグラフィカルに表示することができます。 そのため、多量のデータ解析が求められるソーシャルゲームの解析や、リサーチ、データマイニング、アソシエーション分析が必要な業務の求人が増えています。 また近年データサイエンティストが注目されていることもあり、今後求人が増えることが予想されます。 そこで今回は、プログラミング未経験~初心者の方が、なるべくコストをかけずにR言語に触れられて、学習に役立てられるコンテンツを10件ご紹介していきます。

    初心者でもほぼ無料でR言語を勉強できるコンテンツ10選 - paiza開発日誌
  • 日本の若者のコンピュータスキルが低いという話 | Intermittent Diary

    「Young Japanese have terrible computer skills. No, really – Quartz」という記事が一部で話題になってる.ざっと読むと「んな訳ないだろ」と思うのだが,素直に受け取り,シェア/RTする人もいたりして,何だかなぁと思う訳です. こういうときは元資料にあたるのが一番なので,ちょっと読んでみた. 結論を先に言えば,このデータは日の若者の現状を正確にあらわしていない可能性があり得ると思う.しかしそういうデータが出てしまった原因は明らかではない. 追記: 致命的な誤り(読み違い)が1点あったので文修正しました.誤っていたのは,ICT基礎テストの合否は事前質問(background questionnaire)の結果から決めるのではなく,コンピュータ・ベースの調査の一番最初に行われる「ICT test (stage 1)」の結果によって判

    日本の若者のコンピュータスキルが低いという話 | Intermittent Diary
  • HTML5 Experts.jpはなぜこんなにパフォーマンスが悪いのか…全てお見せします!ーWebパフォーマンス改善企画(解析編)

    ちなみに後日談…計測対象の個別記事ですが、計測のためのアクセスがかなりの頻度あるため、PVランキングでは常に1位を独占していました(笑)。また、Google Analyticsについても、計測開始前に除外設定しておかないと、正確なデータが得られなくなりますので、ご注意下さい。 計測して問題点を洗い出す ファーストバイトダウンロードタイムの遅延問題 ということで、竹洞さんに一定期間サイトのパフォーマンスデータを計測してもらいました。その結果を見ながら、早速現在のHTML5 Experts.jpの問題点を洗い出します。 竹洞:これがある日の、ブロードバンド回線でChromeを用いてアクセスした時の計測結果です。 見ての通り、ID1のhtmlの取得にすごく時間がかかっていることがわかります。この水色は、ファーストバイトダウンロードタイム(Time To First Byte、以下、TTFB)とい

    HTML5 Experts.jpはなぜこんなにパフォーマンスが悪いのか…全てお見せします!ーWebパフォーマンス改善企画(解析編)
  • UbuntuとCentOSどっちがいいの?正しいサーバOSの選び方 - lamichの日記 - 海外でイラスト制作を行う社長のブログ

    サーバOSを選定する上で一番大切なことは何か、それはもちろん安定性とセキュリティである。それも将来に渡ってのということになる。 セキュリティに関しては、万が一OSにセキュリティホールが見つかったとしても、それが世界で最も使われているOSでオープンソースであればすぐにパッチが用意され重要アップデートを自動更新する設定(Ubuntu においてもインストール後に設定するのが定石)によってすぐに適用される。 では将来にわたっての安定性とはなにか、これは今世界中の特にオープンソースコミッタ達の間で最も使われているものなのかどうか、世界中の企業のサーバで使われているものなのかどうか。これが将来にわたっての安定性を左右するということにつながる。OSのトレンドが変わればそのとき乗り換えばいいという人がいるかもしれない。 ただし、もしOSを乗り換えなければならない時にあなたのサービスが巨大なユーザーを抱えて

    UbuntuとCentOSどっちがいいの?正しいサーバOSの選び方 - lamichの日記 - 海外でイラスト制作を行う社長のブログ
  • 「まとめサイト」ユーザー数ランキングと人気コンテンツ

    ◆ユーザー数では「NAVERまとめ」が他を圧倒するも、対前年比では「MERY」や「Rettyグルメ」が躍進 ◆集客は広告ではなく自然検索流入がメイン。季節感や深層心理をタイミング良く捉えたコンテンツが人気 昨今、「まとめサイト」や「キュレーションメディア」と言われる、WEB上のコンテンツを特定のテーマや切り口で編集したサイトが、複数立ち上がり急成長しています。ネット行動分析サービスを提供する株式会社ヴァリューズ(社:東京都港区、代表取締役社長:辻 秀幸)では、一般ネットユーザーの行動ログとデモグラフィック(属性)情報を用いたマーケティング分析サービス「VALUES eMark+」を使用し、ユーザーが情報収集・編集・投稿した記事をテーマ別に集約した「まとめサイト」について、2015年2月度のサイト訪問者数を集計。また、上位サイトについて、ユーザー属性、集客構造や、よく閲覧される人気コンテ

    「まとめサイト」ユーザー数ランキングと人気コンテンツ
  • データサイエンティストというかデータ分析職に就くための最低限のスキル要件とは - 渋谷駅前で働くデータサイエンティストのブログ

    追記(2017年7月) こちらのスキル要件ですが、2017年版を新たに書きましたので是非そちらをご覧ください。 「データサイエンティストというかデータ分析職に就くためのスキル要件」という話題が某所であったんですが、僕にとって馴染みのあるTokyoR界隈で実際に企業のデータ分析職で活躍している人たちのスキルを眺めてみるに、 みどりぼん程度の統計学の知識 はじパタ程度の機械学習の知識 RかPythonでコードが組める SQLが書ける というのが全員の最大公約数=下限ラインかなぁと。そんなわけで、ちょろっと色々与太話を書いてみます。なお僕の周りの半径5mに限った真実かもしれませんので、皆さん自身がどこかのデータサイエンティスト()募集に応募して蹴られたとしても何の保証もいたしかねますので悪しからず。 統計学の知識は「みどりぼん以上」 データ解析のための統計モデリング入門――一般化線形モデル・階層

    データサイエンティストというかデータ分析職に就くための最低限のスキル要件とは - 渋谷駅前で働くデータサイエンティストのブログ
  • 機械学習によるデータ分析まわりのお話

    2. データサイエンティスト 2 今世紀でもっともセクシーな職業 ハーバード・ビジネス・レビュー 2013年年2⽉月号 2018年年までに⽶米国で14〜~19万⼈人不不⾜足 マッキンゼー 2011年年5⽉月 求められるスキル ビジネススキル,機械学習/ビッグデータ, 数学/OR,プログラミング,統計 Analyzing the Analyzers, O’reilly 2013 4. ⽇日お話すること 4 1. データのこと Keywords: ダミー変数,⽋欠損値,正規化,次元の呪い 2. 機械学習のこと Keywords: 機械学習の分類,アルゴリズム,注意点 3. 評価のこと Keywords: 混同⾏行行列列,適合率率率,再現率率率,F値,ROC曲線 4. 分析のこと Keywords: 過学習,交差検証,学習曲線,バイアス・バリアンス 教師あり学習(後述)寄りの内容が多いです

    機械学習によるデータ分析まわりのお話
  • これがマジならGoogleもFacebookもプロブロガーもユーチューバーも吹き飛ぶ話|More Access! More Fun

    LINE@は実店舗オンリーのサービスでした。 しかし、2/13にこんなリリースが ビジネスや情報発信に! 誰でも利用可能なオープンなLINELINE@アプリをリリース 店舗用はPCからの配信だったが、こちらはアプリで個人にも解放されたので、さっそくアカウント作ってみました、普通のLINEの個人アカウントではなくて、わたくしの公式のお知らせ用にします。友達申請ヨロ。勝手についたID変えたいんだが変えられない。どうすればいいんでしょ。↓スマホからコレをクリックすると友達になれます。 一昨日ですが、ネット広告の広告代理店とかが見たら失神しそうな記事が出ました。 ネット広告のクリック数のうち88~98%はボットによるものだと判明 元ネタは、oxford-biochronというところで、オックスフォードと言うから大学機関なのかなと思ってちょっと調べた。どうもオックスフォード大学ではなく、オックスフ

    これがマジならGoogleもFacebookもプロブロガーもユーチューバーも吹き飛ぶ話|More Access! More Fun
  • 政府統計の総合窓口(e-Stat)−API機能 | 政府統計の総合窓口(e-Stat)−API機能

    API機能をご利用いただくには、e-Statでのユーザ登録が必要です。登録がお済みでない方は、最初にユーザ登録を行ってください。

    政府統計の総合窓口(e-Stat)−API機能 | 政府統計の総合窓口(e-Stat)−API機能
  • 統計局ホームページ

    分析レポート 統計ヘッドライン - 統計局月次レポート -令和6年10月15日更新 令和6年10月(統計ヘッドライン No.176) 統計Today - 統計をめぐる新しい動きやメッセージ -令和6年9月25日更新 我が国の共同住宅の移り変わり~住宅・土地統計調査の結果から~(統計Today No.202)(PDF:1,254KB) 統計トピックス - 「国民の祝日」や季節にちなんだ統計データ -令和6年9月15日更新 統計トピックスNo.142 統計からみた我が国の高齢者-「敬老の日」にちなんで- 労働力調査ミニトピックス - 労働力調査結果に関する分析レポート - 家計ミニトピックス - 家計調査結果に関する分析レポート - 小売ミニトピックス - 小売物価統計調査結果に関する分析レポート - 統計を学ぶ ・児童・生徒向け学習サイト ・先生向け学習サイト (授業モデル・補助教材等) ・

  • 「アメリカのプログラマの給料が高い」は本当か? - NomoLog

    こんな記事を見つけました。 アメリカプログラマーの言語別年収wwwwwwwww で、上の記事で引用されている表がこちら 1$=100円とすると、大体1000万円から800万円のレンジですね。 で、こちらが日のプログラマの言語別年収 プログラミング言語別!求人給与額ランキング 大体400万円から300万円のレンジですね。夢も希望もありません。 訂正 プログラミング言語別!求人給与額ランキング に表記してある給与は下限金額であるというご指摘を受けました。 つまり、Pythonプログラマを雇う会社は平均して最低380万円程度払っているということです。私がソースをきちんと読んでいませんでした。大変申し訳ありませんでした。 プログラミング言語別給与のソースは他に発見できませんでしたが、”プログラマ”として一括りにしたソースはいくつかありました。 プログラマーの平均年収 プログラマーの給料・年収

    「アメリカのプログラマの給料が高い」は本当か? - NomoLog
  • Google Trends

    Google トレンドが、ニュース編集室や慈善団体などによって世界中でどのように利用されているかをご確認ください

    Google Trends
  • 統計をグラフにあらわそう(種類と特徴)|なるほど統計学園

    統計は、データを集めて集計しただけでは、単なる数字の集まりであり、そこから何が読み取れるか必ずしも明らかではありません。 統計を作成するときは、必ず、「○○について知りたい!」という目的があるはずですから、得られた結果を、その目的に合わせて上手に使うことが重要です。グラフは、結果を視覚的に表す便利な道具であり、グラフをうまく使うことによって、自分の考えていることを相手に的確に伝えることができます。 グラフにはいくつかの種類があり、それぞれ、得手・不得手があります。自分が伝えたい目的に応じて、適切なグラフを使うことにより、説明力もぐっと高まります。ここでは、そういったグラフの種類やそれぞれの用途、注意点について説明します。 グラフの種類 棒グラフ:棒の高さで、量の大小を比較する。 折れ線グラフ:量が増えているか減っているか、変化の方向をみる。 円グラフ:全体の中での構成比をみる。 帯グラフ:

  • 代表的な4つのグラフの使い分けのポイント(第2回) | データをざくざく処理するためのグラフの読み方、使い方 | Web担当者Forum

    前回の第1回では、なぜグラフ化のスキルが重要であるかという点をお話ししました。これから派生形を含めて最終的には9種類のグラフについて順に解説していきますが、第2回となる今回では、よく利用される4種類のグラフの特徴をまず概観してみます。円グラフ、折れ線グラフ、棒グラフ、散布図の4つです。 それぞれのグラフは、何を表現したいかに応じて使い分けることになりますが、いざ表を目の前にしてグラフを作ろうとしたときに、どのグラフを使うのがベストなのかがすぐには判断がつきにくいこともあります。判断のポイントとなるのは、「系列数」「質的視点」「量的視点」という3つの見方です。 チェックポイント1 系列数(数値の列が1つか、複数か?)まずはベースとなる表の「系列数」を見ます。系列数という言葉はあまり耳慣れない言葉ですが、わかりやすくいうと、グラフ作成のベースとなる表において、数値が1列なのか複数列あるのかとい

    代表的な4つのグラフの使い分けのポイント(第2回) | データをざくざく処理するためのグラフの読み方、使い方 | Web担当者Forum
  • 政府統計の総合窓口 GL01010101

    統計データを探す すべて 分野から探す国土・気象人口・世帯労働・賃金農林水産業鉱工業商業・サービス業企業・家計・経済住宅・土地・建設エネルギー・水運輸・観光情報通信・科学技術教育文化・スポーツ・生活行財政司法・安全・環境社会保障・衛生国際その他 組織から探す 内閣官房人事院内閣府公正取引委員会警察庁消費者庁こども家庭庁総務省公害等調整委員会消防庁法務省外務省財務省国税庁文部科学省文化庁スポーツ庁厚生労働省中央労働委員会農林水産省林野庁水産庁経済産業省資源エネルギー庁特許庁中小企業庁国土交通省観光庁海上保安庁環境省防衛省 主要な統計から探す 50音から探す あ い う え お か き く け こ さ し す せ そ た ち つ て と な に ぬ ね の は ひ ふ へ ほ ま み む め も や ゆ よ ら り る れ ろ わ すべて見る 分野から探す 国土・気象人口・世帯労働・賃金農林

    政府統計の総合窓口 GL01010101
  • 総務省|報道資料|API機能で利用できる統計データの拡充

    総務省は、統計データの高度利用環境を充実させるため、日から、API機能で利用できる統計データを拡充しました。これにより、政府統計のオープンデータ化を推進させ、地域振興やビジネスの活性化など様々な分野に貢献できるものと考えております。

    総務省|報道資料|API機能で利用できる統計データの拡充
  • 平均貯蓄1658万円は「“回答率”0.02%」の調査で算出した代物だった!

    2人以上世帯約3000万のうち、サンプル数はたった6363世帯 新聞を読んでいると、定期的に「家計調査」に関する記事が出てくる。ご存じの通り総務省が毎年行っているもので、毎年のように「1世帯あたりの平均貯蓄額は……」というタイトルが立つ。 「6363」 いきなり意味不明な数字を載せた。この数字は何だと想像するだろうか。実はこれ、「家計調査」のサンプル数である。総務省のサイトには2012年の家計調査結果が載っていて、その中に貯蓄に関するデータがあるのだが、「サンプル数(2人以上の世帯の集計世帯数)」がこの6363だったのだ。 著者は、データを見ながら気になった。 この「2人以上の世帯の集計世帯数」の単位は何だろうか? 「1千件」だろうか? 表に単位がなかったので、総務省の担当部署に電話を入れてみた。 「あのー、集計世帯数が載っていますが、これは単位は何ですか? 1千件ですか?」 それに対して

    平均貯蓄1658万円は「“回答率”0.02%」の調査で算出した代物だった!
  • 10分で分かるr言語入門ver2.5

    第35回R勉強会@東京(#TokyoR) ATND: http://atnd.org/events/45114 Read less

    10分で分かるr言語入門ver2.5
  • 統計学・データサイエンスの勉強法

    ここ数年、私はデータサイエンスについて学んでいます。おすすめの学習資料を紹介したいと思います。 教師用の教科書と初心者用の教科書 私自身、データサイエンスを学ぼうとして色々なソースを試してみました。残念なことに、日語の良い学習資料は見つけられませんでした。どこかのブログで読んだことがありますが、教科書は教師用と学生用の二週類があるそうです。一つめは内容が既に分かっている教師の為の教科書で、日はこのタイプです。もう一つのタイプの教科書は自学自習を目的に作られているので、教師なしで学ぶできる教科書になっているということで、アメリカはこのタイプの教科書が多いです。私自身、他の文系・理系の教科書を探した時もアメリカの教科書の方が分かりやすく、そのだけを読めば分かるようになっていると同じ印象を持ちました。 オンライン教育(MOOC) アメリカは科学教育に熱心であり、最近はやりのMOOCでも豊富

    統計学・データサイエンスの勉強法