タグ

ブックマーク / srad.jp/~yasuoka (3)

  • 書写言語研究におけるサンプルデータの重要性と妥当性 | yasuokaの日記 | スラド

    私(安岡孝一)の2016年2月26日の日記の読者から、近江龍一・西原陽子・山西良典の『ドメインにより意味が変化する単語に着目した猥褻な表現のフィルタリング』(人工知能学会第31回全国大会論文集, 2M2-OS-34a-1, 2017年5月24日)という論文を読んでほしい、との御連絡をいただいた。読んでみたのだが、書写言語研究におけるサンプルデータの重要性を全く理解していない論文で、正直、頭が痛くなった。 研究では猥褻な表現に関する文を集めるために,pixivに投稿されているR-18小説を用いた.R-18小説に分類される小説の中から,2016年10月のウィークリーランキングTop10の小説を選択し,分析に用いた. そんな偏ったサンプルデータ10で、まともな結果が出るわけが無いだろう。しかも、なぜpixivに限定しなければいけないのか、pixivに限定する意図は何なのか、この論文には全く書

    書写言語研究におけるサンプルデータの重要性と妥当性 | yasuokaの日記 | スラド
    ad2217
    ad2217 2017/05/26
    研究としてのレベルは低いが、その時代の話題を拾ってうまく注目を集めるタイプの研究者なんでしょうな。
  • 新たな元号はJIS X 0213に入るのか | yasuokaの日記 | スラド

    いつか遠い未来に新たな元号が決まったとして、それはJIS X 0213に収録されるのか、という趣旨の質問をいただいた。現在、1-13-77「㍾」、1-13-78「㍽」、1-13-79「㍼」、1-13-63「㍻」がJIS X 0213に収録されているので、これに新たな元号が追加されうるのか、という疑問である。私(安岡孝一)個人の意見としては、かなり難しそうだと思う。というのも、これらの『国内実装互換文字』は、以下のような経緯で選定されたからだ(JIS X 0213:2000解説p.511)。 4.4.12 国内実装互換文字 この規格では,過去の資産との互換性を維持するため,国内のパーソナルコンピュータなどで広範に実装されていた1面13区のJIS外字については,非漢字の選定の規準の適用を除外することととし,JIS X 0208と重複しているものを除いた73文字を,面区点位置を保存して採録するこ

    新たな元号はJIS X 0213に入るのか | yasuokaの日記 | スラド
    ad2217
    ad2217 2016/08/10
    入れずに済むなら、これほど素晴らしいことはない。
  • Re: 武雄市内の小学生 保護者各位 | yasuokaの日記 | スラド

    武雄市において「武雄市内の小学生 保護者各位」と題する怪文書が配布されたらしい。結構、面白い文書なので、一部、引用してみることにする。 このたび、武雄市内児童の読書推進を目的として武雄市図書館の利用カードの一斉作成をすることになりました。 ◇作成にあたりご確認いただきたいこと ・平成25年4月1日の図書館リニューアル以後、すでにお子様が図書館カードを作成されている方はお申し込みの必要はありません。 ・作成いただくカードは2種類のタイプからお選びいただけます。 A. 図書利用カード B. 図書利用カード(ポイント付き) ※それぞれのタイプにより規約がございますので、ご確認の上、お選び下さい。 ・2種類のタイプとも「登録申込書」と「保護者同意書」のご提出が必要となります。 で、「B. 図書利用カード(ポイント付き)」を選んだ場合は、小学生人の名前と年齢、および、保護者の名前と住所と電話番号が

    ad2217
    ad2217 2015/03/01
    怪しいところでは怪しいことが起こるものだなぁ。
  • 1