タグ

nlpに関するrgfxのブックマーク (4)

  • MNTSQの契約書解析を支える技術|Yotaro Katayama

    こんにちは!リーガルテックベンチャーのMNTSQの取締役をしている堅山と申します。 面接等で、そもそもリーガルテックってどんなタスクを解いているの?という疑問をいただくことが多いです。今回は、前回の記事に続き、MNTSQでどのような問題に取り組んでいるかを書こうと思います。 MNTSQでは、法律事務所向けに「法務デューデリジェンス」という業務を効率化するプロダクトを作っています。法務デューデリジェンスとは、M&Aなどをするにあたって、対象となる会社のリスクを法的な面から評価する作業です。具体的には会社の結んでいる契約書などの法的な効果を持つ書類をまるっと読み込んでリスクである内容をまとめていきます。ほとんどの契約書は紙で締結されていますので、これらをスキャンしてもらい、主にPDFなどでデータを受領します。ある程度のサイズの会社であればドキュメントの数は数千に達し、負荷のかかる作業です。多く

    MNTSQの契約書解析を支える技術|Yotaro Katayama
    rgfx
    rgfx 2020/02/12
    「契約書解析の役割はあくまで、そのための判断材料をいかに高速に精度よく提供できるか、だと考えています。」おもしれえ
  • 可変次数 N-gram デコードのアルゴリズム - アスペ日記

    前に書いた N-gram 漢字-かな変換 - アスペ日記 のアルゴリズムについて。 かなり縦に長いエントリになると思う。途中までは一般的な日語自然言語処理にかかわること。 例として、「かれがくるまでまつ」というひらがなの文をデコードして、対応する漢字かな混じり文にすることを考える。 こういう時に使われるのが「ラティス構造」。こういうやつ↓ (この図は一回しか出てきません。ちなみにこのために Keynote 買ったようなもの) それぞれのノードで、そこに入ってくるエッジの中で一番確率が高いものとその確率を覚えていくことで、動的計画法によって最適なパスを導くことができる。 これをプログラム上でどう実現するか。 まず、共通接頭辞検索というものを使う。 これは、あるキーを渡すと、そのキーに前から一致するようなキーを持つ候補を列挙してくれるというもの。 例えば、「くるまで」をキーとして使うと、「く

    可変次数 N-gram デコードのアルゴリズム - アスペ日記
    rgfx
    rgfx 2011/08/07
  • 自然言語処理

    rgfx
    rgfx 2011/03/01
  • 自然言語処理・データマイニング系の求人まとめ - nokunoの日記

    最近、いろいろな企業で自然言語処理やデータマイニングに関する求人が出ていますね。とても良いことだと思いますが、多すぎて把握しきれません。というわけで、国内の自然言語処理・データマイニング系の求人情報をまとめてみました。職種詳細(【開発部門】楽天技術研究所 研究者系職種) | 【楽天株式会社】中途採用募集要項 データマイニングエンジニアエンジニア募集職種一覧|エンジニア特集│社員を知る|株式会社ディー・エヌ・エー キャリア採用サイトグリー株式会社 | 採用情報 | キャリア採用 | 募集職種 | データマイニングエンジニア自然言語処理専門家 / Web 開発 セレゴ・ジャパン株式会社|IT・外資系の転職・求人情報なら【121転職】データマイニングエンジニア | クックパッド株式会社採用情報|Fringe81株式会社職種詳細|株式会社ブレインパッドピクシブ株式会社 | 採用情報 参考:htt

    rgfx
    rgfx 2011/02/28
  • 1