タグ

nlpに関するnikkoroのブックマーク (3)

  • nix in desertis:「ロボットは東大に入れるか」発表会(11/23)レポート

    通称「東ロボくんプロジェクト」。NHKでも報道があった通り,発表会があったので参加してきた。以下にレポートを書いたが,超長くなったので,簡潔に先にまとめておく。 ・入試は「暗記とパターン」だが,パターン作りというのは,実際には高度な人間の知的能力。だから大学入試を選んだ。 ・最終的にコンピュータに身につけて欲しい能力(=東大入試突破に必要な能力)は3つ。「深く正確な(自然言語の)構文解析と意味合成」・「パラフレーズ同定」・「文章の要約」。これらは現在の人工知能ではできない。 ・ただし,今回は初回なので,挑戦する入試をセンター試験(模試)に絞った。また,最終的に欲しい能力を目指す質的な研究ではなく,今回は,小手先の,現状可能なアプローチだけで,どれだけセンター試験で得点できるかに挑戦した。そのセンター模試の結果は約4割の得点率(387/900)。足切り回避まで,まだまだ先は長い。 (筆者注

    nikkoro
    nikkoro 2014/04/30
  • GeoNLPプロジェクト - 地名情報基盤のためのオープンなソフトウェア・データ・サービス

    識別子の付与 地名語辞書に登録した地名語をLODに接続するためには、地名語に対してGeoLODシステム内でユニークなIDを付与しなければならない。GeoNLPの基方針は、辞書制作者が独自に制作した複数の地名語辞書を組み合わせて利用する、というものである。しかし、この方針を前提とすると、地名語辞書内でユニークなIDを与えても、システム全体でユニークなIDとなる保証はないという問題が生じる。 この問題の解決策としてよく用いられる方法は、フィールド内の文字列を連結した文字列をキーとし、それをハッシュ関数に与えて固定長のIDを生成するなど、フィールド内容を変換することでIDを生成する方法である。もしフィールド内の文字列にユニーク性があれば、この方法でもIDを生成できる。しかし、この方法はフィールド内容の修正に弱く、内容の微修正を越えて永続性のあるIDを生成する目的には適していない。 そこで2段階

  • 「自然言語処理とWatson、ソーシャルデータ活用」をIBM 村上明子氏が語る

    EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けに、EnterpriseZine Day、Security Online Day、DataTechという、3つのイベントを開催しております。それぞれ編集部独自の切り口で、業界トレンドや最新事例を網羅。最新の動向を知ることができる場として、好評を得ています。

    「自然言語処理とWatson、ソーシャルデータ活用」をIBM 村上明子氏が語る
  • 1