タグ

ブックマーク / okumuralab.org/~okumura (3)

  • 厚労省ホームページ自動翻訳の品質

    [2022-07-03 追記] 以下を書いたのは 2020-02-08 で、その後厚労省サイトからは自動翻訳は消えたようだ。ところが、たまたまkeijiさんのまとめてくださった表にあった東京都の新型コロナウイルス感染症にかかる相談窓口についてで右上のEnglishをクリックしたところ、例の半ば意味不明なJ-SERVERの自動翻訳が! なお、都内の最新感染動向については Updates on COVID-19 in Tokyo というすばらしい英訳をボランティアで作っておられるとのこと。 毎日新聞の厚労省HP、新型肺炎の外国語情報で誤訳多発 「手洗い重要」が「トイレ重要」という記事によれば,厚労省の新型コロナウイルス感染症についてのホームページ自動翻訳が,「例えば「手洗いが重要」が韓国語で「トイレが重要」、「水際対策」が中国語で「水辺の対策」と誤訳されている。韓国語も「物価の対策」とも読める

    厚労省ホームページ自動翻訳の品質
    remcat
    remcat 2020/02/09
    >意味不明なのは厚労省のホームページ自動翻訳だけである。 >追記:Excite翻訳…も試してみる: >細かな違いを除いて,ほぼ同じである
  • 効果量,Cohen's d,検出力,検出限界

    効果量,Cohen's d,検出力,検出限界 未定原稿です。 効果量(effect size) ある薬の効果を調べたら $p < 0.05$ で有意だった。有意差でた! よかった♡ でも,これでは,$p = 0.049$ なのか $p = 0.0000001$ なのかわからない。どうせ $p$ 値を書くのなら,$p < 0.05$ のような不等式ではなく,具体的に $p = 0.023$ などと書くほうがよい(例えば Publication Manual of the American Psychological Association 参照)。 さらに言えば,そもそも,$p$ 値は効果の大きさを表す量ではない。具体的に,例えば「高血圧症の人の収縮期血圧が平均 5mmHg だけ下がった。95% 信頼区間は [1, 9] だった」と書くほうがよい([1, 9] は $1 \leq x \le

    remcat
    remcat 2016/06/23
    >科学者が最終的に知りたいのは,具体的な量(効果量)とその不確かさ(信頼区間)
  • 統計・データ解析

    『Rで楽しむ統計』が出ました。サポートページ 『Rで楽しむベイズ統計入門』が出ました。サポートページ,第7章のRコードをStanで書き直したRで楽しむStan 全国学力・学習状況調査の個票の疑似データがこちらで公開されています。データ分析の練習に使えそうです。SSDSE(教育用標準データセット)も。 R 4.x では stringsAsFactors=FALSE がデフォルトになりましたが,サイトの古い記事ではそうなっていないところがあるかもしれません(read.csv() などで as.is=TRUE は不要になります(あってもかまいませんが))。 R 4.2 ではWindowsでもMac同様UTF-8がデフォルトになりました。もう fileEncoding オプションに "UTF-8","UTF-8-BOM" を指定する必要はなくなりそうです。一方で、SJIS(CP932)データの場

    remcat
    remcat 2015/06/07
  • 1