タグ

ブックマーク / srad.jp/~yasuoka (3)

  • 著作権法における「引用」と「技術の開発又は実用化のための試験の用に供するための利用」と「情報解析のための複製等」 | yasuokaの日記 | スラド

    昨日の日記の読者から、「引用」は「著作権法第三十二条」であって「著作権法第三十条の四」ではない、という御指摘をいただいた。実を言うと私(安岡孝一)個人は、近江龍一・西原陽子・山西良典の論文『ドメインにより意味が変化する単語に着目した猥褻な表現のフィルタリング』(人工知能学会第31回全国大会論文集, 2M2-OS-34a-1, 2017年5月24日)が、引用要件を満たしているとは考えていない。だから、昨日の日記で「著作権法第三十条の四」と書いたのだ。当該論文を少し見てみよう。 10個の小説の中に文は全部で7,009文あった.そのうち猥褻な表現に関する文は3,199文あった.クラス1に分類された文は615文,クラス2に分類された文は575文,クラス3に分類された文は8文,クラス4に分類された文は2,130文であった.いずれにも分類されないものはなかった.なお,同時に2クラス以上に属する文もある

    著作権法における「引用」と「技術の開発又は実用化のための試験の用に供するための利用」と「情報解析のための複製等」 | yasuokaの日記 | スラド
    notae
    notae 2017/05/29
  • 書写言語研究におけるサンプルデータの重要性と妥当性 | yasuokaの日記 | スラド

    私(安岡孝一)の2016年2月26日の日記の読者から、近江龍一・西原陽子・山西良典の『ドメインにより意味が変化する単語に着目した猥褻な表現のフィルタリング』(人工知能学会第31回全国大会論文集, 2M2-OS-34a-1, 2017年5月24日)という論文を読んでほしい、との御連絡をいただいた。読んでみたのだが、書写言語研究におけるサンプルデータの重要性を全く理解していない論文で、正直、頭が痛くなった。 研究では猥褻な表現に関する文を集めるために,pixivに投稿されているR-18小説を用いた.R-18小説に分類される小説の中から,2016年10月のウィークリーランキングTop10の小説を選択し,分析に用いた. そんな偏ったサンプルデータ10で、まともな結果が出るわけが無いだろう。しかも、なぜpixivに限定しなければいけないのか、pixivに限定する意図は何なのか、この論文には全く書

    書写言語研究におけるサンプルデータの重要性と妥当性 | yasuokaの日記 | スラド
    notae
    notae 2017/05/26
  • 日本感性工学会の考えるキラキラネームと人名用漢字 | yasuokaの日記 | スラド

    山西良典・大泉順平・西原陽子・福淳一の論文『人名の言語的特徴の分析に基づくキラキラネーム判定』が、無事「日感性工学会論文誌」最新号(Vol.15, No.1)pp.31-37に掲載された、との御連絡を、大学入試業務の真っ最中にいただいた。掲載にあたって、「訂正」は全くおこなわれなかったらしい。つまり、この論文の早期公開版に対する私(安岡孝一)の以下の指摘は、ムダに終わったということである。 常用漢字表と人名用漢字表を元にしたにもかかわらず、データベース内の漢字が13389個となっている点。(ここやここ参照) 「史料編纂所データベース異体字同定一覧」に基づいてしまったことによる問題点。(ここ参照) 「漢字の音訓読みと人名の読み方の部分一致判定アルゴリズム」中の定数(CNumberc ・PNumberp ・PCNumberp )に関する定義の混乱と、アルゴリズムそのものの崩壊。(ここ参照)

    日本感性工学会の考えるキラキラネームと人名用漢字 | yasuokaの日記 | スラド
    notae
    notae 2017/05/26
  • 1