タグ

2019年3月26日のブックマーク (2件)

  • 【13個掲載】 機械学習に使える日本語のデータセットまとめ - Qiita

    記事は、Lionbridge AI発の連載記事を再編集したものです。他の機械学習に使えるオープン・データセットまとめ記事は、こちらからご覧ください。 記事は、日語のデータセットを紹介いたします。日語の公開データセットを無料ダウンロードできるポータルサイトや、自然言語処理に使える日語のテキストデータセットを含みます。 機械学習に使える日語のデータセットポータル DATA GO JP: 日政府のデータカタログサイト。日政府は、公共データを広く公開することにより、国民生活の向上、企業活動の活性化等を通じ、我が国の社会経済の発展に寄与する観点から、機械判読に適したデータ形式を、営利目的も含めた二次利用が可能な利用ルールで公開する「オープンデータ」の取組を推進しています。このウェブサイトは、二次利用が可能な公共データの案内・横断的検索を目的としたオープンデータの「データカタログサイ

    【13個掲載】 機械学習に使える日本語のデータセットまとめ - Qiita
    kananote
    kananote 2019/03/26
  • 「統計的有意」には弊害があるとして800人以上の科学者が反対を表明

    By bialasiewicz 「真実はいつもひとつ」のはずですが、真実を確かめるために実験したとしても、必ず1つの結果が得られるわけではありません。例えば薬を投与したとして、効果があるのかないのか実験するとき、「薬の効果は偶然ではない」と統計学的に判断できたとき、その結果を「有意」と呼びます。しかし、この「有意」という言葉に振り回されていると科学者800人が反対意見を表明しています。 Scientists rise up against statistical significance https://www.nature.com/articles/d41586-019-00857-9 'Statistical Significance' Is Overused And Often Misleading : Shots - Health News : NPR https://www.np

    「統計的有意」には弊害があるとして800人以上の科学者が反対を表明
    kananote
    kananote 2019/03/26