ブックマーク / okumuralab.org/~okumura (5)

  • 「視覴」の謎

    ChatGPTが「視覴」という新語を発明したらしいことをフガクラさんのツイート(2023-06-08 08:51:02 JST)で知る。 すでに「視覴」は、いくつかの最近書かれたWebページで使われていた。ChatGPTで生成されたページらしい。ざっと検索して見つけたページを列挙しておく。いずれも最近作られたか修正されたページである(1件だけ2020年のページがあるが、最近修正されたものかどうか不明)。 映像・音声編集におけるノーマライズの重要性!(2023-05-11)「視覴的・聴覚的な一貫性」「視覴的な効果を最大化」「視覴的な混乱を避け」(2回)なお、このページは現在消えて視覴とは?AIChatGPT)が出力した新しい言葉なのか?(2023-06-08)にリダイレクトされ、「弊社では、2023年3月より用語集作成に際しAIライティングの試験運用を行っておりますが、この度、「視覚」の誤

    onionskin
    onionskin 2023/06/12
  • ゼンリン混雑度データ

    全体的なこと ゼンリンの混雑度データは,関東(甲信越は含まず,東京都の島嶼を含む)・東北の250mメッシュの混雑度を,2011年3月8〜17日について1時間ごとに与えたものである。データの行は例えば次のようになっている: 2011-03-08,0,95895000,511762500,95902500,511773750,161 各欄は,年月日,時,左下隅の緯度・経度,右上隅の緯度・経度,混雑度である。緯度・経度は1/1000秒単位(60×60×1000で割れば度になる)で,混雑度はそのメッシュ内の人数(小数部分は切り捨て)らしい。メッシュ内にまったく人がいなければメッシュそのものがなく,0.999人が滞在していたならば0人のメッシュとなる。 @tmir1010 さんに指摘していただいたことであるが,全データをプロットすると,平常は真夜中の2時台にピークがあり,通勤時刻の7時台と18時台に

    onionskin
    onionskin 2014/04/12
  • 東京の雪

    今度は15日のうち10日が土日だ。 binom.test(10, 15, 2/7) p = 0.002446,うーん。やっぱり有意だ。 ちなみに,独立ではない(雪の日の次も雪の日が多いという自己相関がある)ので,これらの検定はウソです。 追記:2014年2月9日までのデータの時点で,中澤先生から次のコメントをいただいた:「じゃあ土日は平日の何倍大雪になりやすいのかと考えて、 fisher.test(matrix(c(9, 4, 1258*2-9, 1258*5-4),2)) したら、オッズ比は5.64 (95%CI: 1.57-25.09)でした。 坂さんからは「大雪が28日あったうち16日が土日なので実際多いのですが、土日気温が低めなのか?とかの関連データも気になります。」(2014年2月9日までのデータの時点)というご意見をいただいた。tokyo_temp.csv に整形したものを置

    onionskin
    onionskin 2014/02/10
  • 統計・データ解析

    『Rで楽しむ統計』が出ました。サポートページ 『Rで楽しむベイズ統計入門』が出ました。サポートページ,第7章のRコードをStanで書き直したRで楽しむStan 全国学力・学習状況調査の個票の疑似データがこちらで公開されています。データ分析の練習に使えそうです。SSDSE(教育用標準データセット)も。 R 4.x では stringsAsFactors=FALSE がデフォルトになりましたが,サイトの古い記事ではそうなっていないところがあるかもしれません(read.csv() などで as.is=TRUE は不要になります(あってもかまいませんが))。 R 4.2 ではWindowsでもMac同様UTF-8がデフォルトになりました。もう fileEncoding オプションに "UTF-8","UTF-8-BOM" を指定する必要はなくなりそうです。一方で、SJIS(CP932)データの場

    onionskin
    onionskin 2012/01/18
  • 信頼区間って何?

    「95%信頼区間とは,真の値が入る確率が95%の区間のことです」というような説明をすることがあります。私も,一般のかたに説明するときは,ついそのように言ってしまうことがあります。でも当は真っ赤なウソです。主観確率を扱うベイズ統計学はここでは考えません。 正規分布では,ウソの考え方をしても結論が同じになることがあるので,ここではわざと,左右非対称なポアソン分布を考えます。 ポアソン分布とは,1日に起こる地震の数,1時間に窓口を訪れるお客の数,1分間に測定器に当たる放射線の数などを表す分布です。平均 $\lambda$ のポアソン分布の確率分布は次の式で表されます: \[ p_k = \frac{\lambda^k e^{-\lambda}}{k!} \] $\lambda = 10$ のポアソン分布の確率分布をグラフにすると次のようになります(当は右に無限に延びるのですが,$k = 30

    onionskin
    onionskin 2012/01/18
  • 1