2020年6月8日のブックマーク (11件)

  • AI自動契約書チェック「LawFlow」にコメント編集機能追加

    LawFlow株式会社(社:東京都新宿区、代表取締役・弁護士:則竹理宇)は、AI契約書チェックサービス「LawFlow」において、表示されるコメントを自由に編集できるコメント編集機能を追加致しました。チェック結果に表示されるコメントを自社用にカスタマイズしたり、契約や取引上の注意点を追加することができるので、契約ノウハウ共有による精度向上、法務メンバー交代の際の安定性向上、新人教育の負担軽減につながります。契約書チェックに費用と時間をとられている企業様は是非ご活用下さい。 ■AI自動契約書チェックサービス「LawFlow」 自然言語処理に特化した人工知能(AI)を用いた契約書チェックが無料から始められるリーガルテックサービスです。AIが、いつでも契約書の全条文を自動チェックし、瞬時にリスクや必要な条文を教えてくれます。いつでもオンライン上でファーストチェックが出来るため、 企業や個人事業

    AI自動契約書チェック「LawFlow」にコメント編集機能追加
  • Googleが公開した自然言語処理の最新技術、BERTとは何者なのか

    3つの要点 ✔️ 自然言語の発展に大いに貢献 ✔️ 学習しなくても前に接続するだけで精度が向上 ✔️ 入出力に新規性 BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding written by Jacob Devlin, Ming-Wei Chang, Kenton Lee, Kristina Toutanova (Submitted on 11 Oct 2018 (v1), last revised 24 May 2019 (this version, v2)) Comments: Published by NAACL-HLT 2019 Subjects: Computation and Language (cs.CL) はじめに 2019年2月に自然言語処理のトップカンファレンス

    Googleが公開した自然言語処理の最新技術、BERTとは何者なのか
  • 自然言語処理を用いたテキスト自動要約の手法

    こんにちは、mergyです。3月まで大学院生で今は港区のIT企業に勤務しています。 blog投稿は初めてになります。よろしくお願いします。 今回はテキスト自動要約の手法について書かせていただきます。 intronworksの判決文検索サービスleaglesプロジェクトで用いられている技術です。 とりあえず、今回はソースコードなどは出てきませんので、非エンジニアの方も是非読んでいただければと思います。 テキスト自動要約とは まず、例を見てみましょう これはlivedoorニュースですが、皆さんも上記の画像のようなニュースサイトを見たことがあるのではないでしょうか?テキスト自動要約はこのように、「長い文章も読まなくても良いように、最低限の必要な情報だけを自動で抽出する」技術です。(livedoorニュースが手動か自動かはわかりませんが) テキスト自動要約手法 実際にどのようにテキスト要約を自動

  • 自然言語処理勉強結果「日本語の構造」

    前回まで、自然言語処理の中で使用する 機械学習に焦点を当てて解説してきた。 具体的には、 学習時に正解データも与えて学習する教師あり学習、 その中でも二つ以上のラベルに分類する分類器 というものを扱ってきた。 しかし、これはあくまで手段だ。 そろそろ、大元の自然言語処理の方を進めたい。 というわけで、今回は メインとなる自然言語処理の詳細に入っていこう。 まずは、(恐らく)解析対象となる日語の構造と、 解析処理の概要を解説する。 その後、解析した自然言語の意味理解と、 その現実問題への応用、という流れだ。 その中でも、まず今回は 日語の構造がどうなっているかを見ていこう。

    自然言語処理勉強結果「日本語の構造」
  • あまりに高精度のテキストを作り出してしまうため「危険すぎる」と問題視された文章生成言語モデルの最新版「GPT-3」公開

    人間が書いたものと見分けが付かないぐらいに精度の高い文章を生成できる言語モデル「GPT-2」の後継である「GPT-3」が、人工知能を研究する組織・OpenAIにより公開されました。 GitHub - openai/gpt-3: GPT-3: Language Models are Few-Shot Learners https://github.com/openai/gpt-3 [2005.14165] Language Models are Few-Shot Learners https://arxiv.org/abs/2005.14165 OpenAI debuts gigantic GPT-3 language model with 175 billion parameters https://venturebeat.com/2020/05/29/openai-debuts-giga

    あまりに高精度のテキストを作り出してしまうため「危険すぎる」と問題視された文章生成言語モデルの最新版「GPT-3」公開
  • (論文)BERTによる日本語構文解析 - 機械学習・自然言語処理の勉強メモ

    今日は以下の論文についてまとめます。 BERTによる日語構文解析の精度向上(柴田ら 2019) 昨年の「言語処理学会」で発表されたものです。 日語で分かりやすいのですが、整理もかねてまとめます。 BERT自体の解説はググれば分かりやすい説明があります。 また、以前にまとめましたので、詳細は割愛します。 kento1109.hatenablog.com なにがスゴい? 「BERTを使って既存の構文解析器の精度を大幅に上回った」という点です。 ここでは、既存の構文解析器として「KNP, Cabocha, J.depP」と比較しています。 従来Shift-Reduce 法やチャンキング段階適用により、係り受け関係を特定する手法が知られています。 「SVMを用いた 統計的日語係り受け解析」の手法では「係り元(A)」と「係り先(B)」の素性を利用して、 「(A)が(B)に係るか」という二値分類

    (論文)BERTによる日本語構文解析 - 機械学習・自然言語処理の勉強メモ
  • Jupyter notebookでsisterを使った自然言語処理の開発環境をDockerで構築する - Qiita

    概要 コマンド2行で、jupyter notebookと自然言語処理のライブラリsisterを使っての開発環境が起動します。 普通に設定すると、Docker起動毎に、sisterの辞書ダウンロードが発生するので、辞書データを 永続化 する設定を加えた docker-compose.yml を書きました。 きっかけ ふだんはRubyメインの開発で、pythonは自然言語処理をする時にしか触らない。 開発環境の構築で楽をしたいので、すぐに使えるrepositoryをつくりました。 コード 使い方 dockerをインストール https://docs.docker.com/compose/install/ dockerのメモリを増加 これしないとsisterが使えません。 Docker preferences -> Resources >= 6.00 GB to Memory. ダウンロード 好

    Jupyter notebookでsisterを使った自然言語処理の開発環境をDockerで構築する - Qiita
  • 【言語処理100本ノック 2020】Pythonによる解答例まとめ - Qiita

    はじめに 自然言語処理の問題集として有名な言語処理100ノックの2020年版が公開されました。 この記事では全100問のPythonによる解答例を紹介します。間違いやより良い方法など、お気づきの点があればぜひお気軽にコメントください。 編は以下のリンク先に移転しました。 https://amaru-ai.hatenablog.com/entry/2022/10/15/204035

    【言語処理100本ノック 2020】Pythonによる解答例まとめ - Qiita
    gengohouse
    gengohouse 2020/06/08
    早い。なんか予備校がセンター試験当日にやっている解答速報みたい。
  • 伊藤詩織さんが漫画家はすみとしこさんらを提訴 ツイッターのイラスト巡り | 毎日新聞

    SNS上で誹謗中傷を受けたとして提訴し、記者会見で質問に答える伊藤詩織氏=東京都中央区で2020年6月8日午後2時42分、北山夏帆撮影 性暴力被害を訴えたジャーナリストの伊藤詩織氏(31)が8日、ツイッター上の侮辱的なイラストや言葉で名誉を傷つけられたとして、漫画家はすみとしこ氏とはすみ氏の投稿をリツイートした2人を相手取り、計770万円の慰謝料、弁護士費用の支払いを求めて東京地裁に提訴した。 伊藤氏側は、性暴力被害を訴えたことを巡って、はすみ氏から「精神障害からくる虚言」「『枕営業』の失敗からくる恨み」「金銭目当ての虚偽」などと愚弄(ぐろう)されたことは「セカンドレイプ(2次被害)」にあたると主張し、一連の投稿の削除と謝罪の掲載を求めた。伊藤氏側は5月14日付の内容証明郵便で、提訴と同趣旨の内容を請求している。 はすみ氏は同月23日、ユーチューブ上の番組に出演し、この請求を受けたことを明

    伊藤詩織さんが漫画家はすみとしこさんらを提訴 ツイッターのイラスト巡り | 毎日新聞
    gengohouse
    gengohouse 2020/06/08
    一時「すみとしこ」がTwitterのトレンドに入ったらしい。漫画家は/すみとしこさんと単語分割することも確かに可能だが、「伊藤詩織さんが」が直前にあるのでこの分割は人間には不自然。何とかしたい。
  • 中国、5秒で記事10本 AIが自動作成 - 日本経済新聞

    人工知能AI)の重要分野であるNLP(自然言語処理)。その活用分野として最も大きな潜在力を秘めているのがAIライティング(自動作文)だ。中国でも2015~16年にかけてテンセント、新華社、バイトダンス傘下のニュースアプリ「今日頭条(Toutiao)」が報道分野でこの技術を活用するようになったが、ここでの競争のカギを握ったのが、AIライティングの独創性と読みやすさだった。こうした中で注目されるの

    中国、5秒で記事10本 AIが自動作成 - 日本経済新聞
    gengohouse
    gengohouse 2020/06/08
    以前に紹介したような気がしますが、もう一度。
  • 言語処理100本ノック 2020 (Rev 2)

    言語処理100ノック 2020 (Rev 2) 言語処理100ノックは,実用的でワクワクするような課題に取り組みながら,プログラミング,データ分析,研究のスキルを楽しく習得することを目指した問題集です. 詳細 ツイート

    言語処理100本ノック 2020 (Rev 2)
    gengohouse
    gengohouse 2020/06/08
    言語処理100本ノック2020年版の改訂版(Rev 1)が公開されました。この問題集の分野への貢献は多大だと思います。