ブックマークしました ここにツイート内容が記載されます https://b.hatena.ne.jp/URLはspanで囲んでください Twitterで共有
人工知能研究者。人工知能学会にも参加したし、件の論文の著者の1人ともご挨拶した。倫理的な問題はあるとは思っているが、色々な批判の中で、次の的外れな批判をよくみる。根本的に、機械学習が理解されていないのだなぁ、と感じる。機械学習は、平たく言えば、人間の判断を機械に真似させる手法の総称だ。まず、人間が判断の模範を示してやって、どれだけ正確に人間の真似が出来たか、が性能評価になる。これだけわかっていれば、下記の2つが的外れであると分かるはず。 わざわざゾーニングされている小説を対象にする必要があったのか批判ゾーニングは人力でなされている。つまり、そこに、人の判断が入っている。誰かが判断して、これはR-18だね、青少年にはみせちゃいけないね、と判断している。ゾーニングされている小説だからこそ、人間の判断が反映されていると言える。機械にゾーニングすべきかゾーニングするべきでないか判断させるために、人
結論として、フィルタリングの研究はこの国に必要とされていない。要は、人工知能研究者は悪者なんでしょ? ちょっとしたミスで「事実と意見の峻別も出来ないのか」とまで言われたし。まぁ、この国はせいぜい人海戦術でフィルタリングして苦しんでください。この問題に従事できる国内の若手「研究者」は、そんなにいないと思うけど、少なくとも、私はこれで、フィルタリングの研究はしたくなくなりました。人工知能は、他にもお金儲けられる話たくさんありますし、企業就職もいいですし、外資の誘いもたくさんあります。今回の炎上事件で、フィルタリングの研究がガガーっと大学の人工知能研究のテーマから外れるだけだと思いますよ。まぁ、今回は明らかに研究者側にも配慮が足りなかったので、配慮できるという自信がある企業はやるでしょうけど。 腐女子と人工知能を2択にかけて、腐女子の方を選ぶのも、この国の選択だと思いますよー。 追記 やっぱり、
ドメインにより意味が変化する単語の抽出 立命館の学生さんが発表して、炎上した論文を、わたしもJSAI2017に参加していた関係で、公開が停止する前に入手することができました 論文中では、幾つかのPixivに公開されているBL小説に対して定性的な分類をして、終わりという、機械学習が入っていないような論文でしたので、わたしなりに機械学習を使ってできることを示したいという思いがあります。(そんなに大変な問題でないように見えて、かつ、問題設定も優れていたのに、なぜ…) 炎上に対して思うところ(主観です) PixivのBLのコンテンツを参照し、論文にハンドル名を含めて記述してしまっており、作家の方に精神的な不可をかけてしまうという事件がありました。 非常にRTされている代表的なツイートは、以下のようになっています。 (該当ツイートは盗用との指摘を受けたので消しました、検索すれば出るものなで、大乗だと
星杜 @hosimori025 そいや、またまた話は変わって、例の論文の件。解析対象の中に二次創作について許可でていたジャンルの作品が存在したそうで。となるとどうなるの??あ、でもまって引用の用件は満たしていた??から著作権関連では問題なかったんだっけ?? 2017-05-28 23:21:50 星杜 @hosimori025 その辺の違いがよくわからんのだけど、文言抽出のビッグデータとして、例えば一万や二万の作品群全部に使用許諾を貰うのは確かに難しいとは思うのだけど、それでも倫理的指針に従うとなんらかの通知や連絡は必要ってことなの??それとも匿名性に配慮していれば許諾はいらないの?? 2017-05-28 23:24:05 星杜 @hosimori025 自分の作品を使用されたと考えた時。文章中に含まれる文言を抽出して使うが、出展元については膨大な作品群に埋もれているという状態なら、確か
批判とか出尽くしたとは思うので、自分が気になってることを書き残しておく。 ・件の学生は発表したのか、その上できちんと研究方法とか色々粗雑なところを指摘されているのか。 ていうか、言葉が粗雑すぎてこういう人達がフィルタリングに関わっていくのが怖いので、何かアクションが欲しい。 猥褻の定義もそうだけどさ、男女カップリングの事をNL(ノーマルカップリング)と無批判に使ってたと思うんだけど、著者の中では同性カップルはどう捉えてるの?と突っ込みたくなった。 本当に同人とかに無知なら、何でわざわざ地雷原に突っ込んできたのか……。 あと、なんでpixiv選んだのか書いてないらしい(私は一回PDFのスクショを読んだだけなのでそこは覚えてない)んだけど、そこら辺も質疑応答で突っ込まれたのか。 今ググったんだけど、「エロ 小説」「セックス 小説」で1ページ目にpixiv出てこない。その代わり、登録しなくても見
他にも、サンプルデータの取扱に関する、プライバシー関連の議論がある。いわゆる、ひろみちゅ案件的な話題。名寄せその他で特定できるようなデータをどのように扱うかという情報倫理的課題。 これは、ビッグデータやAIの学習データセットうんぬんでホットな話題やね。 後は、SNS内部のデータの取扱に関する、SNS事業そのものへの議論がある。これはSNS黎明期にサーチエンジンが内部をクロールすることの是非が問われたことがあったような気がする。これは、2000万のアカウントがあるから実質的に公表されてるとは、ちょっと違う話であって、SNS事業の事業価値とはナニかというところで、私企業の競争優位に立つための財産であるコミュニティを荒らすことの是非。 ここらへんを成文法がないからといって、ないがしろにしてると酷い目に合うのは間違いない。 雑な反論は潰す必要があるけど、正直あれは学術側で石ぶつけて学術内部で殺しと
日本文学研究における引用についていろいろ知ることができる。勉強になる。 hibi.hatenadiary.jp 本文でなく、終わりの余談のところにちょっと補足したい。 最後にいいたいのは、この立命館大の研究は、フィルタリングの自動化の研究ですよね?(読めていないので、間違っていたら、指摘してください) これは、言い方を変えると、機械による自動検閲(につながる)装置の開発です。 「有害」な情報から未成年者を守るというような目的があるのはわかります。 しかし、検閲による情報の規制が、私たちの社会の風通しを悪くしたり、知りたいことを知れなくなったり、議論の分かれる問題について、その問題となる原因の資料そのものへのアクセスを遮断することにつながる、という自覚を、この手の研究開発をしている人々には持ってほしいと思います。 技術として可能性を追求するのはいいけれど、それを社会に適応したとき、社会の中で
アイドルが生理用品使っていることに対して非処女認定してる男がいてヤベェ みたいな話を見て思ったんだけど 逆に男性が生理について知る機会ってあるか?と思った 実際俺だって二十歳すぎまで生理というものは 「女性特有の尿漏れしやすくなる現象」 だと思っていた 理由はだいたい想像つくと思うが 赤ちゃん用のおむつと同じ色の液体を吸収する「生理用品」のCMをよく目にしていたからだ 「女の人って寝てる間とか動いたときに尿漏れしちゃうんだー。チンチンないと大変だなー」 とか思ってた 男性の生理に対する無理解を糾弾する声は インターネット(Twitter等)でよく見かけるが 現実社会では 「妊娠能力のある女性は毎月子宮からの出血、腹痛が起こる時期があります」 みたいな声は当の女性からも聞いたことがない なのでいきなり大人になって 「生理がどんなものか知っている前提」で 「女性は生理で大変なんだ!なんで男性は
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く