ブックマーク / tihara.hatenadiary.org (6)

  • google翻訳の技術倫理に悩む。 - IHARA Note

    今日の日記はgoogle翻訳で日中国に関する要らぬ議論が出ているという話です。多少政治的な話題が入りますが、政治的な話題はメイントピックではないです。 google翻訳で、「中国が日を侵略した」を英語に訳しても、「日中国を侵略した」を英語に訳しても、どちらも "Japan invaded China"となってしまうので、これはgoogleの陰謀に違いないという話が出ています。google中国の味方をしているという見方です。 統計的機械翻訳という概念を知っていれば、この誤訳は「まあそういうこともあるだろうな」で済んでしまう話ではありますが、中身をまるで知らない人にとってみれば、なるほどgoogleが意図的に日をおとしめているように見えても仕方がないところですね。 googleというのは、いかに意図を持たずに情報を処理するかということに全力を注いでいる会社なので、まあ意図を持つと

    google翻訳の技術倫理に悩む。 - IHARA Note
  • 物語自動生成と報道戦略。 - IHARA Note

    昨日から松原さんの「きまぐれ人工知能プロジェクト 作家ですのよ」が話題になっています。ITメディアや日経済新聞で採り上げられています。 おそらくそのあたりの記事を読んだ方には、あたかも小説の自動生成が新しいプロジェクトのように映ると思うのですが、実のところかなり前からある人工知能のトピックだったりします。 私も2005年前後に物語生成周辺を調べたことがあるのですが、日人の中で論文をたくさん書いていたのは小方孝さんでした。どうやら今は岩手県立大学に研究室を持っているようですが、私が調べた頃は山梨大学にいました。 山梨大学の「研究活動」のページに論文一覧があり、それを見ると小方さんはすでに1995年に物語生成に関する博士論文を書いていたことが分かります。その後、ずっと物語生成にかかわり続けています。 そういうことを踏まえての感想なのですが、報道戦略って大切ですね。松原さんが悪いわけではない

    物語自動生成と報道戦略。 - IHARA Note
  • 母音のよくある図。 - IHARA Note

    だからといってどうということもない話。分かる人だけ分かってください。 世界中の母音を語る上でこの図がよく出てきます。口を開いているとか、前の方で喋っているとか、口が丸いとか、あの図です。 現在、別の目的のために母音をちょこちょこといじっているのですが、この図の存在とまるでかみあわないんですよ。そのうちかみあうのかもしれませんが、とりあえず今はこの図の存在が私の中で否定されつつあります。 まあ、音声認識とか音声合成とか工学系の技術はこの図とあまり関係がないので困らないんですが。

    母音のよくある図。 - IHARA Note
  • 弱いコンピュータ将棋「こまお」について。 - 2012-04-18 - IHARA Note

    今日の日記は周回遅れの技術で作ったコンピュータ将棋の話です。 先日、「こまお」(移転先はこちら)というコンピュータ将棋を公開しました。こまおの特徴はとにかく弱いことです。攻めは遅く、受けはほとんどできず、筋は悪く、一手詰すら見つけられません。その上、平手から10枚落ち(玉と歩だけ)まであるので、10枚落ちを選べばほとんどの人が勝てるでしょう。アルゴリズム的にも数世代前のものを使っており、しかも、わざわざ駒損する筋を選んだりします。 なぜ、そんなコンピュータ将棋を作ったのか。それが今日の日記の題です。昨年末だったと思いますが、プロ棋士の遠山五段がニコニコ動画の生放送で、コンピュータ将棋について「人を育ててくれるようなコンピュータ」について言及していた憶えがあります(ちょっと記憶が曖昧なのですが)。そのときは、将棋の道場は人手不足でルールから教えなければならない人はさすがに教えていられないこ

    弱いコンピュータ将棋「こまお」について。 - 2012-04-18 - IHARA Note
  • 人工知能が東大に入るときの難所。 - IHARA Note

    一部で話題になっている「ロボットは東大に入れるか」(国立情報学研究所「人工頭脳プロジェクト」)であるが、私の周りでは専門外の方々の反応の大多数は「当然入れる」というものだった。私の直感では「難しい」ということになっているので、ここでは何が難しいのかということを簡単に書く。具体的に書くつもりはない。 おそらく「当然入れる」と思っている人は、無意識のうちに「コンピュータを使えば当然入れる」と思ってしまっているのだろうと思う。さらにいえば、「人間がコンピュータを使えば当然入れる」と思っているはずである。その上で、「人間がいてもいなくてもコンピュータなら当然入れる」と推論してしまって、結論として「コンピュータなら当然入れる」と思ってしまうのだろう。でも、人間がいるかいないかというのは非常に大きな問題であり、その部分こそがこのプロジェクトの肝である。 仮に、人間がコンピュータを使って受験することを考

    人工知能が東大に入るときの難所。 - IHARA Note
  • 音声認識の得意なことと苦手なこと。 - 2011-11-11 - IHARA Note

    年に数回くらい「音声認識でこんなことはできますか」という趣旨のメールが来るので、やりやすいこととやりづらいことを書いておこうと思う。なお、これは現時点での技術状況であり、将来どうなっているかは分からない。 1.大量データは得意。 やはり機械なので、大量のデータの処理には向いている。別に少量のデータでも精度が変わることはないが、少量のデータなら人間がやった方が精度がいいので音声認識の導入はあまり意味がない。 2.雑音に弱い。 マイクと口の距離が近ければ周りの音はさほど問題にならないが(携帯電話など)、距離が離れると相対的に周りの音が大きくなるので精度が落ちる。ただし、雑音の種類が分かっている場合には(車の走行音など)、事前に準備ができるため、そこまでひどく精度が落ちることはない。 3.話し手が分かっていると助かる。 機械にとって別の人の声は同じことを喋っていても別の音なので、人による声の違い

    音声認識の得意なことと苦手なこと。 - 2011-11-11 - IHARA Note
  • 1