タグ

ブックマーク / srad.jp/~yasuoka (2)

  • Re: 書写言語研究におけるサンプルデータの重要性と妥当性 | yasuokaの日記 | スラド

    一昨日の日記の読者から、松谷創一郎の『立命館大学の研究者による「pixiv論文」の論点とは──“晒し上げ”批判はどれほど妥当なのか』(Yahoo!ニュース、2017年5月27日)を読んでほしい、との御連絡をいただいた。読んでみたのだが、この記事の問題意識が、私(安岡孝一)にはサッパリ理解できなかった。特に以下の部分。 私には、そうは思えない。少なくとも、近江龍一・西原陽子・山西良典の『ドメインにより意味が変化する単語に着目した猥褻な表現のフィルタリング』(人工知能学会第31回全国大会論文集, 2M2-OS-34a-1, 2017年5月24日)は、人工知能の研究者というコミュニティを代表している論文ではなく、それを「理工系」の「領域」などと一括りにするのは、あまりに議論が雑すぎる。また、

    Re: 書写言語研究におけるサンプルデータの重要性と妥当性 | yasuokaの日記 | スラド
  • 書写言語研究におけるサンプルデータの重要性と妥当性 | yasuokaの日記 | スラド

    私(安岡孝一)の2016年2月26日の日記の読者から、近江龍一・西原陽子・山西良典の『ドメインにより意味が変化する単語に着目した猥褻な表現のフィルタリング』(人工知能学会第31回全国大会論文集, 2M2-OS-34a-1, 2017年5月24日)という論文を読んでほしい、との御連絡をいただいた。読んでみたのだが、書写言語研究におけるサンプルデータの重要性を全く理解していない論文で、正直、頭が痛くなった。 研究では猥褻な表現に関する文を集めるために,pixivに投稿されているR-18小説を用いた.R-18小説に分類される小説の中から,2016年10月のウィークリーランキングTop10の小説を選択し,分析に用いた. そんな偏ったサンプルデータ10で、まともな結果が出るわけが無いだろう。しかも、なぜpixivに限定しなければいけないのか、pixivに限定する意図は何なのか、この論文には全く書

    書写言語研究におけるサンプルデータの重要性と妥当性 | yasuokaの日記 | スラド
  • 1