タグ

データに関するjusticewoodsのブックマーク (45)

  • 【GEE】ランダムフォレストで土地被覆分類を行う【衛星データ解析】 - LabCode

    土地被覆分類とは? 衛星画像や航空写真などのリモートセンシングデータを分析し、地表のさまざまなカバータイプ(例えば、森林、農地、水域、都市地域など)を識別するプロセスです。土地被覆分類は地球環境のモニタリング、土地利用計画、生態系の管理、気候変動の研究など、多くの応用分野で利用されます。 以前の記事で利用した環境省生物多様性センターの植生図をはじめ、国土地理院の地理院地図、産総研のシームレス地質図などが作成され公開されています。 GEEには土地被覆分類を行うためのオブジェクトとしてee.Classifierというものが用意されています。これを利用することで機械学習を利用した土地被覆分類を行うことができます。 ee.Classifierが対応している主要な機械学習モデルは以下の通りです。 決定木(Decision Tree):条件分岐によってグループに分けられる木の構造をしたものです。回帰に

    【GEE】ランダムフォレストで土地被覆分類を行う【衛星データ解析】 - LabCode
  • 人口減少の日本 2050年にはどうなる 最新データからわかること | NHK

    「国立社会保障・人口問題研究所」は5年ごとに人口の将来推計をまとめていて、今回は3年前、2020年の国勢調査の結果をもとに、自治体別の推計を公表しました。 それによりますと、2050年には日の人口は1億400万人余りになり、東京を除くすべての道府県で2020年より減少する見通しです。 2050年までの30年間で人口の減少率が最も大きいのは ▽秋田で42%、 ▽青森が39%、 ▽岩手と高知が35%などとなっていて、 全体の2割にあたる11の県では30%以上減少する見通しです。

    人口減少の日本 2050年にはどうなる 最新データからわかること | NHK
  • 新「nasne」の価格決定にデータサイエンス活用 従来は「勘、経験、度胸で決定」

    ソニー・インタラクティブエンタテインメント(SIE)からノウハウを継承し、バッファローが3月に発売したネットワークレコーダー「nasne」。2万9800円(税込)で販売を始め、すでに3次入荷分までが完売している。この価格は外部の企業とともにデータサイエンスを活用して決めたと、バッファローが自社のWebコンテンツで6月23日に明らかにした。 バッファローはこれまで、製品の価格を「勘、経験、度胸」を基に決めていたが、nasneは価格を決めるに当たっての理論や根拠が社内になく、適正な値が判断できなかった。そこで、過去のデータから価格を算出するため、東京大学発のコンサル企業である東京大学エコノミックコンサルティング(UTEcon)に協力を依頼したという。 まずは2020年12月から21年初頭にかけて、他社製レコーダー製品の過去の販売データや価格データを収集。その後、東大や慶応義塾大学などの経済学

    新「nasne」の価格決定にデータサイエンス活用 従来は「勘、経験、度胸で決定」
    justicewoods
    justicewoods 2021/06/24
    予めの標準価格ってどのように収益に影響を与えるんでしょうかね.結局,量販店で実際の需要と供給を反映して決まるんじゃね(素人み).
  • 【政府データの見方】本当に霞ヶ関の『若手の自己都合退職者』は増えているのか? - 官民共創メディアPublingual

    2020年11月18日、河野太郎 行政改革担当大臣が「危機に直面する霞ヶ関」という記事を自らのブログに投稿しました。 2019年度の20代の霞ヶ関の総合職の自己都合退職者数は6年前より4倍以上に増えています。 2019 87人 2018 64 2017 38 2016 41 2015 34 2014 31 2013 21 ※引用:危機に直面する霞ヶ関 | 衆議院議員 河野太郎公式サイト ※人事院公式サイトなどを参考に編集部にて制作確かにこの数字を見る限りで”絶対値”は、非常に増えています。 一方、離職数のソース元が示されておらず、また”離職率”への言及はないため、全体に占める影響度合いも分かりません。 そこで今回は、Pro Publingalの畑田 康二郎さん(元経産省)に、公表されている政府統計データを基に国家公務員の離職を別の角度から解説をしていただきます。 京都大学大学院でエネルギー

    【政府データの見方】本当に霞ヶ関の『若手の自己都合退職者』は増えているのか? - 官民共創メディアPublingual
  • 食べログの得点計算についてのポジティブな可能性を考えるー操作されたデータを検証する難しさー(井上明人) - エキスパート - Yahoo!ニュース

    久しぶりのyahoo個人への投稿となりますが、この記事を公開するのは、正直、気が重いな、と思いつつ、公開します。 というのも、今、べログに対して非常にネガティブな解釈が広がっているわけですが、何かしらポジティブな材料を提供するとなると、確実にいろいろ言われるだろうなあと思って気が重くて仕方がないのですが、ただ、人生の一時期、べログにハマっていた人間として、論点として提供されるべきポイントが、提供されていないと感じましたので、記事を公開する次第です。 ◆べログの評価点数分布の「不自然さ」 さて、近年、べログの点数評価アルゴリズムは、頻繁にその不正を疑われ議論になっています。 2016年には、評価アルゴリズムのリセットがあった際には、いくつかの店舗がいきなり3.0の点数にリセットされるなどといったことがあり、記事にもなりました。 そして10月8日に、藍屋えんさんという方が、ご自身のブ

    食べログの得点計算についてのポジティブな可能性を考えるー操作されたデータを検証する難しさー(井上明人) - エキスパート - Yahoo!ニュース
  • 戸籍の正本をデジタルデータに変更する戸籍法改正が官報告示 | スラド IT

    5月31日付の官報号外第23号で、戸籍法の一部を改正する法律が告示された。デジタルファースト法による住民基台帳法改正とマイナンバー法改正に伴うもので改正が非常に多岐に渡るのだが、勘所は以下のようなものである。 戸籍法改正では戸籍の正が紙の「帳簿」(第七条)からデジタルデータに変更される。第百十八条の改正と附則第三条の経過措置により、紙の戸籍には戻れなくなる。また、新設された第百二十条の二により、これまで籍地でしか取得できなかった「戸籍謄」(戸籍全部事項証明書)が「戸籍電子証明書」の形で全国どこの市区町村でも取得できるようになる。 住民基台帳法改正の目玉は「戸籍の附票」のデジタルネットワーク化である。第三十条の四十一~第三十条の四十四の十二を新設し、戸籍の附票ネットワークを住民基台帳ネットワークと同様に全市区町村と全都道府県とJ-LIS(地方公共団体情報システム機構)の間で構築す

  • インフルエンザワクチン肯定派vs否定派

    名取宏(なとろむ) @NATROM インフルエンザワクチンの有効率は(報告によって差があるけど)40-60%ぐらい。ワクチンを打たなかったら10人がインフルエンザに罹るところ、ワクチンを摂取したら4~6人で済む。逆に言えばワクチンを摂取しても4~6人はインフルエンザに罹る。 twitter.com/nihon_koutei/s… 2019-01-21 23:55:17 日国黄帝 @nihon_koutei 正しい。インフルエンザワクチンの予防接種をしても罹るのは誰でも知っている筈。それにもし予防接種に効果があるのならば年々、接種率が上がって4割にも達しているのに大流行する筈がない。予防接種は気休めですらなく、単なる金儲けの為の道具だ。 twitter.com/kimuratomo/sta… 2019-01-19 10:56:37

    インフルエンザワクチン肯定派vs否定派
  • 外国人実習生の「死者数」を削除 内閣府所管の機構サイトで

    Search, watch, and cook every single Tasty recipe and video ever - all in one place! News, Politics, Culture, Life, Entertainment, and more. Stories that matter to you.

    外国人実習生の「死者数」を削除 内閣府所管の機構サイトで
  • 全人類に告ぐ。セル結合をやめろ。 - hibitの技術系メモ

    (12/13追記 タイトルや表記に過剰な表現があり、セル結合を全否定するかのような印象を与えてしまいました。そのような意図はなかったのですが、補足記事を書きましたので、併せて読んでいただけると幸いです。すみませんでした。) 人類よ、なぜそんなにセル結合を使いたがる? それが罪深い行為とも知らずに……。 思わず神視点になってしまいましたが、この世界にはExcelのセル結合を無意味に使いたがる人が多すぎます。いや、メリットがないことはないのですが、それを余裕で上回るデメリットがあることを意識している人が少ないように思われます。データというのは、コピペしやすいこと、集計しやすいこと、数え間違いをしづらいことが第一なので、それを損ねるような行為は許されざる大悪というべきでしょう。断固として弾劾していきます。 綺麗なデータとは ここにエクセルで作った、同じソースから作成した3種類のデータ(東京都の区

    全人類に告ぐ。セル結合をやめろ。 - hibitの技術系メモ
  • 政府統計、信頼に揺らぎ GDPなど日銀が不信感  :日本経済新聞

    の現状を映す統計を巡り、内閣府と日銀が綱引きしている。国内総生産(GDP)など基幹統計の信頼性に日銀が不信を募らせ、独自に算出しようと元データの提供を迫っているのだ。内閣府は業務負担などを理由に一部拒否しているが、統計の精度をどう高めるかは、日経済の行く末にも響きかねない大きな問題をはらんでいる。「基礎データの提供を求めます」。10月11日、政府統計の改善策などを話し合う統計委員会の下部

    政府統計、信頼に揺らぎ GDPなど日銀が不信感  :日本経済新聞
  • 千田さんが「炎上している」と書いた時、キズナアイは「炎上」していたか? - データをいろいろ見てみる

    千田さんは、ヤフー個人ニュースとして、「ノーベル賞のNHK解説に「キズナアイ」は適役なのか? ネットで炎上中【追記あり】」という記事を、10/3 10:09に書いた。 ノーベル賞のNHK解説に「キズナアイ」は適役なのか? ネットで炎上中【追記あり】(千田有紀) - 個人 - Yahoo!ニュース その時、実際のところキズナアイは炎上していたのか?このエントリーは、この疑問を検証する。実際に、10月01日から10月03日までのツイートを収集して、どのくらい炎上していたのかを集計した。実際このニュースのあと炎上したが、千田さんがニュースを書いた時点で炎上していたか?を調査する。その後のことに関しては、こちらのブログが詳しい。 キズナアイ関連ニュースまとめ - まなめはうす 時間がない人向けまとめ 10/01にキズナアイのノーベル賞まるわかり授業が公開されたあと、太田さんがツイートするまで批判ツ

    千田さんが「炎上している」と書いた時、キズナアイは「炎上」していたか? - データをいろいろ見てみる
  • 統計所得、過大に上昇 政府の手法変更が影響 補正調整されず…専門家からは批判も(西日本新聞) - Yahoo!ニュース

    政府の所得関連統計の作成手法が今年に入って見直され、統計上の所得が高めに出ていることが西日新聞の取材で分かった。調査対象となる事業所群を新たな手法で入れ替えるなどした結果、従業員に支払われる現金給与総額の前年比増加率が大きすぎる状態が続いている。補正調整もされていない。景気の重要な判断材料となる統計の誤差は、デフレ脱却を目指す安倍政権の景気判断の甘さにつながる恐れがある。専門家からは批判が出ており、統計の妥当性が問われそうだ。 高めになっているのは、最も代表的な賃金関連統計として知られる「毎月勤労統計調査」。厚生労働省が全国約3万3千の事業所から賃金や労働時間などのデータを得てまとめている。1月に新たな作成手法を採用し、調査対象の半数弱を入れ替えるなどした。 その結果、今年に入っての「現金給与総額」の前年比増加率は1月1・2%▽2月1・0%▽3月2・0%▽4月0・6%▽5月2・1%▽6月

    統計所得、過大に上昇 政府の手法変更が影響 補正調整されず…専門家からは批判も(西日本新聞) - Yahoo!ニュース
  • 都道府県別の平均歩数

    今日は,先月に受けた健康診断の結果を聞いてきました。年に一回受けるよう促される,横須賀市の特定健診です。 結果は異状なし。去年は胸部健診で引っ掛かり,悪玉コレステロール値も高すぎという判定だったのですが,今年の診断シートは異常値(赤字)なしでした。腹囲も5センチ縮まってうれしい。まあ,まだ出っ腹であることに変わりはなく,お腹を凹ませるよう指導されましたが…。 去年の秋に保健指導を受けてから,毎日の夕刻,1時間半ほどウォーキングをしているのですが,その成果かなと思います。海あり坂ありの横須賀は,ウォーキング(ジョギング)コースがたくさんあります。海風に吹かれながら歩くのは心地いい。 自宅仕事の自営業は「座りっぱなし」になりがちですが,それだと体力は低下する一方です。毎日一定時間は運動しないといけません。 https://twitter.com/hifumix_0123/status/9774

    都道府県別の平均歩数
  • 総務省|「田園回帰」に関する調査研究会|平成29年度 第2回 「田園回帰」に関する調査研究会

    開会 議事 (1)過疎地域の人口移動について (2) 過疎地域への移住者に対するアンケート調査結果について (3) 過疎市町村に対する調査結果について 閉会

    総務省|「田園回帰」に関する調査研究会|平成29年度 第2回 「田園回帰」に関する調査研究会
  • 中国、相次ぐGDP水増し 地方「暴露」で揺らぐ統計

    中国は2018年年初め、2017年の実質経済成長率が6.9%となり、7年ぶりに成長率が前年を上回ったと発表した。6.5%前後としていた目標を達成した。日では、目標達成の原因について、2017年に共産党大会を前に拡大した公共投資が寄与したとの見方があり、2018年は減速が予想されると『朝日新聞』(1月19日社説)などは報道した。 ただし、2016年におけるGDPの水増しが明らかになっている中国では、ほんとうのGDPはどのぐらいなのか、データの修正が必要となってきており、最終的に経済成長が減速するのか、二ケタのプラスになるか、見通しがつかない。 遼寧省に続き、天津市、内蒙古自治区が 2018年1月11日、天津市浜海新区は、統計方法を見直した結果、2016年の1兆元の生産総額が6654億元となり、GDPは3300億元減少し、3分の1近い減少となった。 それにさかのぼる1月3日、内蒙古自治区は財

    中国、相次ぐGDP水増し 地方「暴露」で揺らぐ統計
  • Rによるデータクリーニング実践――政府統計からのグラフ作成を例として|Colorless Green Ideas

    データクリーニングが繁雑な作業であることを示すために、政府の統計データから日の男のみの高校と女のみの高校の数の推移をグラフ化する事例を紹介する。クリーニングの作業にはR言語を用い、複数のファイルを統合し、整然データに変え、グラフを作成する。 はじめに データクリーニングは、データ分析の際に非常に重要なプロセスの1つであるが、データ分析の教科書では必ずしも十分に扱われていない。そこで、現実のデータクリーニングがどのように行われるかについて、一事例を紹介したいと思う。具体的には、統計処理に適したプログラミング言語のRを用いて、粗悪なデータから簡単な折れ線グラフが作成できる程度のきれいなデータにするまでのデータクリーニングを実施していく。 記事の対象読者 記事は、既存のデータに対して自らの手でデータ分析を実施している人、または実施しようと考えている人を主な対象にしている。データ分析の際にど

    Rによるデータクリーニング実践――政府統計からのグラフ作成を例として|Colorless Green Ideas
    justicewoods
    justicewoods 2018/04/23
    “データクリーニングの負荷が少ないデータを提供する”
  • なぜ新潟や石川が「人口日本一」だったのか? 都道府県の人口推移から見る、日本近代化の歴史 (1/4) - ねとらぼ

    はじめに 日の人口は2017年10月1日時点で1億2670万人ほど。都道府県の人口1位はもちろん東京都で、1372.4万人。最下位となる47位は鳥取県で、56.5万人。その差は約24倍にもなります。 現在ではあまりにも当たり前の東京の人口1位。しかし、かつては東京が人口1位ではなかった時代が続いたことは、あまり知られていません。 現在は東京が1372万人、ぶっちぎり 逆に人口ワーストは山陰と四国、北陸の県。 元来日はここまで東京一極集中ではなく、その地方に応じた産業が活発で、今より地方が元気な時代がありました。 人口の統計がはじまった1872年から見てみると、実は東京ではなく、意外な都道府県がトップに立っていることが分かります。そんな思わぬ再発見の多い「歴代人口ランキング」(※)を見ていきましょう。 ※:採用する人口データは、1872~83年までは籍人口。1884~1907年までは乙

    なぜ新潟や石川が「人口日本一」だったのか? 都道府県の人口推移から見る、日本近代化の歴史 (1/4) - ねとらぼ
  • 地方紙の「おくやみ」欄は研究データとして使えるか | スラド サイエンス

    地方紙の「おくやみ」欄に掲載された情報について調査した論文が日公衆衛生学会の学会誌に掲載されている(論文概要、論文全文)。 この論文では、栃木の地方紙「下野新聞」の「おくやみ」欄に掲載された死亡者データを収集・分析している。この「おくやみ」欄は遺族が新聞社に対して情報掲載を行うもので、故人の氏名や経歴などの情報が掲載される。今回の論文はこの情報を公衆衛生に関する情報として利用できる可能性について調査したものとなっている。 結論としては、人口動態統計と比較した場合の死亡者の掲載割合は67.6%で、データベースとしては一定の価値があるものの、掲載された死因の妥当性は低いという結論となっている。

  • CRAN にある R パッケージへのリンクとして選ぶべきURL|Colorless Green Ideas

    CRAN 上の R パッケージへのリンクをするときには、“Linking”という節に挙げられているURLを使えばよい。 1つのパッケージに複数のURL CRAN では複数のURLが同じ R パッケージの紹介ページを示すことがある。例えば、2017年3月30日現在、以下の3つのURLのどれを選んでも Nippon というパッケージの紹介ページに行き着く。 https://CRAN.R-project.org/package=Nippon https://cran.r-project.org/web/packages/Nippon/index.html https://cloud.r-project.org/web/packages/Nippon/ 要するに、1つのパッケージの紹介ページに対して、複数のURLが割り当てられるのである。 それでは、CRAN にある R パッケージにリンクする場合

  • R の ave 函数|Colorless Green Ideas

    このデータについて、男女それぞれの中央値からの偏差を求めてみよう。 まずはデータをRのデータフレームの形にしよう。以下のコードを実行することで、性別と身長についてのデータが入った physical というデータフレームができる。 sex <- c("M", "M", "F", "F", "M", "F", "F", "M", "M", "F") height <- c(168, 175, 153, 162, 171, 148, 172, 182, 158, 158) physical <- data.frame(Sex = sex, Height = height) このデータから、男女それぞれの身長の中央値を求めるにはどうすればよいだろうか? 単に中央値を求めるだけならば、tapply 函数を使うだけである。以下のコードでは、第1の引数である physical$Height を計算の対象

    R の ave 函数|Colorless Green Ideas