タグ

ブックマーク / okumuralab.org/~okumura (11)

  • ラーメン店と脳卒中

    EARL先生がラーメン店の店舗数の多い都道府県ほど年齢調整脳卒中死亡リスクが高いという論文を紹介しておられたので、調べてみた。 ラーメン店舗数は都道府県別統計とランキングで見る県民性サイトの都道府県別ラーメン店舗数によれば次の通り: ramen = [1384, 399, 301, 618, 342, 619, 580, 726, 718, 556, 975, 1081, 2437, 1178, 831, 326, 343, 173, 228, 620, 333, 776, 1070, 247, 165, 396, 1016, 594, 148, 125, 124, 156, 383, 603, 239, 195, 158, 250, 138, 962, 178, 157, 335, 219, 275, 398, 182] 都道府県人口はe-Statの人口推計 / 各年10月1日現在人口か

    peketamin
    peketamin 2024/06/07
  • 「視覴」の謎

    ChatGPTが「視覴」という新語を発明したらしいことをフガクラさんのツイート(2023-06-08 08:51:02 JST)で知る。 すでに「視覴」は、いくつかの最近書かれたWebページで使われていた。ChatGPTで生成されたページらしい。ざっと検索して見つけたページを列挙しておく。いずれも最近作られたか修正されたページである(1件だけ2020年のページがあるが、最近修正されたものかどうか不明)。 映像・音声編集におけるノーマライズの重要性!(2023-05-11)「視覴的・聴覚的な一貫性」「視覴的な効果を最大化」「視覴的な混乱を避け」(2回)なお、このページは現在消えて視覴とは?AIChatGPT)が出力した新しい言葉なのか?(2023-06-08)にリダイレクトされ、「弊社では、2023年3月より用語集作成に際しAIライティングの試験運用を行っておりますが、この度、「視覚」の誤

    peketamin
    peketamin 2023/06/12
  • Zipファイルのクラック

    メールでZipファイルを送って次のメールでパスワードを送るという無意味より悪いセキュリティ対策が問題になっている。なぜ無意味より悪いかというと,Zip暗号化は強度が十分でない上に,次のメールで送るパスワードは無意味で,さらにゲートウェイでのウイルス対策ができなくなるのでウイルス送付に利用されやすいためである。 PythonZipファイルを展開する方法は文字コードのところに書いたが,同様にしてパスワードをブルートフォースで破ることも原理的には可能である。4桁数字のパスワードで暗号化した test.zip をクラックするには次のようにすればよいであろう: from zipfile import ZipFile with ZipFile('test.zip') as z: for i in range(10000): pw = f'{i:04d}' try: z.setpassword(pw.

    peketamin
    peketamin 2020/12/05
  • 東京都のCOVID-19

    東京都の情報は2021-05-24以降は毎日16:45に東京都福祉保健局からPDFで発表されているが,手作業での更新のようで,うまくスクレープできないこともあった。そうこうしているうちに厚労省が16:00ごろ全国の都道府県についてオープンデータを更新することになったので、そちらを取得して COVID-tokyo.csv を作成し,自動ツイートしている(描画部分のコード:COVID-tokyo.py)。そのグラフ: 実効再生産数を,(直近7日間の陽性数/n日前7日間の陽性数)**(5/n)で近似したもの。東洋経済オンラインでは n=7 としているが,ここでは 1 から 7 までの7のグラフを示した。 全区間にわたってプロットしたもの: 縦軸を対数目盛にしたもの: 奥村 晴彦 Last modified: 2022-12-31 16:26:39 JST

    peketamin
    peketamin 2020/02/17
    奥村先生だ
  • ポアソン回帰

    最小2乗法(復習) $x = (1,2,3,4)$ のとき $y = (2,3,5,4)$ になったとします(図)。このデータを例えば $y \sim ax + b$ というモデルでフィットしたいというのが回帰の問題です。ここでの「$\sim$」は「あてはめる」とか「なるべく等しくする」というつもりの記号です(詳しい意味はその都度決めます)。 念のため,右の図を描いたコード: par(mgp=c(2,0.8,0)) plot(x, y, type="p", pch=16, xlim=c(0,5), ylim=c(0,6), asp=1) abline(1.5, 0.8) text(x, y, pos=1, labels=c("(1,2)","(2,3)","(3,5)","(4,4)")) 最も一般的なフィットのしかたは,残差 $y - (ax + b)$ の2乗和 \[ \sum_{i=

    peketamin
    peketamin 2019/02/28
  • macOS

    macOS M1 Mac 音声合成(読み上げ) MacBlu-ray 参考リンク: Macセキュリティシステム、実はかなり強固だった...! 古い情報

    peketamin
    peketamin 2017/08/22
  • 猛暑日の増加

    [2018-07-20] as.POSIXct() を as.Date() に変えました。 東京管区気象台の東京における雷日数や真夏日等の日数の変化というページを見ると,猛暑日(日最高気温35℃以上)の日数が1876年以来著しく増加していることがわかる。ところが,平均気温を見ると,地球温暖化・都市化の影響で徐々に増加しているが,激しく変わっているようには見えない。平均ではなくて猛暑日の日数を見るべきであるという議論もある。しかし,「猛暑日」(日最高気温35℃以上)や「真夏日」(日最高気温30℃以上)のような分布の裾の日数は,何℃で切るかによって印象が大きく異なる。気温変化を誇張することにならないか。 「東京」の観測地点は2014年12月2日に約900m離れた地点に移転している。詳しくは「東京」の観測地点の移転について(PDF,2014年11月14日,気象庁観測部)を参照されたい。 東京の日

    peketamin
    peketamin 2015/08/10
  • 統計・データ解析

    『Rで楽しむ統計』が出ました。サポートページ 『Rで楽しむベイズ統計入門』が出ました。サポートページ,第7章のRコードをStanで書き直したRで楽しむStan 全国学力・学習状況調査の個票の疑似データがこちらで公開されています。データ分析の練習に使えそうです。SSDSE(教育用標準データセット)も。 R 4.x では stringsAsFactors=FALSE がデフォルトになりましたが,サイトの古い記事ではそうなっていないところがあるかもしれません(read.csv() などで as.is=TRUE は不要になります(あってもかまいませんが))。 R 4.2 ではWindowsでもMac同様UTF-8がデフォルトになりました。もう fileEncoding オプションに "UTF-8","UTF-8-BOM" を指定する必要はなくなりそうです。一方で、SJIS(CP932)データの場

    peketamin
    peketamin 2015/06/07
  • 和文と欧文の間に半角スペースを入れるか | Okumura's Blog

    Moodleのフォーラムで英単語の前後に空白をという提案がされている。「Moodleは」より「Moodle は」のほうが読みやすいから半角スペースを入れようということである。 もともと和文とプロポーショナル欧文の間には,テキストの段階では何も入れなくても,組版の段階で四分アキ(全角の1/4の幅の空白)を入れる習慣があり,先日出たW3Cの Requirements for Japanese Text Layout(日語組版処理の要件)の3.2.6のdにもそう書いてある。日語のブラウザがこれに対応してくれれば余分のスペースを入れる必要がなくなるのだが。 もっとも,「四分アキ」もだんだん狭くなってきて,最近の雑誌類ではほとんど入れていないように見える。スタイルシートで調節ができるのがベストかも。

    peketamin
    peketamin 2014/11/17
    とは言っても現状、対応出来てないので、少なくともプレーンテキストで見やすくしたいために、仕方なくスペースを空けるのであった…
  • 奥村晴彦 Haruhiko Okumura

    自己紹介 / English Twitter (𝕏) / Twilog / GitHub / researchmap HTMLCSS / PHP / JavaScript / 統計 / Python / C言語 macOS / Project 311 / 雑記 / コンピュータと情報 旧ブログアーカイブ / Linux Wikiアーカイブ / 情報教育Wikiアーカイブ Flickr / Mastodon / Bluesky / Nostr npub1xh80z9zen62ayly5n87rkatm5nqeww7u57glaw70hkehrszpht5qagzhun E-mail: okumura あっと okumuralab どっと org PGP Public Key (expires: 2024-06-28, Fingerprint: 6B99 3E71 B219 138F D0

    奥村晴彦 Haruhiko Okumura
  • データ作法

    [2019-02-04] ざっと改訂した。 [2020-10-03] 最後に追記を設けた。 [2023-10-13] Excelの問題はかなり改良された。詳しくはExcelCSV ファイルを扱う場合の注意参照。 はじめに 例えば日の人口は1.26億人であるといった個々の「事実」は自由に伝達できる(著作権法第十条2「事実の伝達にすぎない雑報及び時事の報道は、前項第一号に掲げる著作物に該当しない」)が,事実を集めたデータベースは一般に著作権法で保護される(著作権法第十二条の二「データベースでその情報の選択又は体系的な構成によつて創作性を有するものは、著作物として保護する」)。 政府統計の総合窓口(e-Stat)にはたくさんのデータが収められているが,そのご利用にあたってには「商用目的で複製する場合は、予め個々の情報に関する著作権を有している各府省等までご相談下さい」と書かれており,一定

  • 1