2021年6月23日のブックマーク (6件)

  • TECH-MI-103- Research Engineer, LegalForce Research - 株式会社LegalForce

    gengohouse
    gengohouse 2021/06/23
    #自然言語処理の求人求職
  • 自動文章生成ツールで架空の魚を作った話-AIのchar-rnn、exe化- – 名も無き冒険譚

    ブログが自動で生成できたらと思うポテト神です。 最近、AIで〇〇だとかAIで××だとか話を聞きますが、私も興味がある次第です。 でも、AIって「そこに知識があるのか?」「知能はどうなるのか?」と細かい話をすると、だんだんAIからかけ離れてっていく気がします。 人間の解釈から抱えきれない膨大なデータから、組み合わせ計算をさせて新たなルールを発見するってことに近いんじゃないでしょうか? やっぱり、統計学に近いものがあって、生まれた結果から何かを論じて結論付ける形なのかなぁ・・・って思います。 個人的には、AI大喜利のような人間が手広く受け取って、人間が知識として形にしてあげるモノを自動生成するのが一番しっくりくるんじゃないかと考えてます。 さて、ポテト神が日頃感じますのは、AIとか統計のプログラムってPythonとかAnaconda前提であまり手広くない印象です。 そこで、皆さんが触れられる形

  • 形態素解析の精度向上を頑張った話 - Leverages データ戦略ブログ

    はじめに こんにちは。データ戦略室データエンジニアリンググループの森下です。 普段はデータエンジニアとして、主にデータ活用基盤の保守運用や機能追加、ツール開発やデータ抽出・可視化といった業務を行っています。もともと機械学習への興味はありましたが、記事の内容以前では、業務で使用したことはありませんでした。今回、初めて機械学習の業務を経験する事ができ、非常に多くのことを学ぶことができました。記事は未経験者の奮闘記となりますので、これから機械学習を学ぶ方・業務に活かす方にとって参考になれば幸いです。 経緯について データエンジニアとしてデータ活用基盤の構築や保守運用をしていく中で、機械学習へのデータ活用は自然と考える部分です。しかし、書籍やチームの勉強会で機械学習について少しずつ学んではいるものの、業務で機械学習を使用したことはありませんでした。 そのような状況の中で、機械学習の業務に携わり

    形態素解析の精度向上を頑張った話 - Leverages データ戦略ブログ
  • 医療ドメインの自然言語処理に飛び込んで1年経って見えてきたこと

    医療スタートアップのUbieに入社して1年が経ちました。これまでの人生で一番短かったんじゃないかというくらいのスピードで月日が過ぎ去っていき、主体的に携わるプロジェクトも1.5周くらいしたところかなと思います。この記事では機械学習エンジニアの私が、医療というドメインの自然言語処理に携わるなかで考えたことを紹介したいと思います。 最近ではリーガルテックをはじめ、HR、ファイナンス、そして医療など、様々な領域で自然言語処理の活用が広がっています。そうした専門ドメインでの自然言語処理に携わる人も増えてきていると思いますので、その中の一例として何かしら参考になれば幸いです。 【目次】 - 医療という専門領域の知識は必要 - 分野が違っても手法は同じ、研究が扱う題材を知っておく - 医療という特殊なデータ事情 - なぜ私はいま医療言語処理をやるのか? - まとめ 医療という専門領域の知識は必要 機械

    医療ドメインの自然言語処理に飛び込んで1年経って見えてきたこと
  • 【AI】LSTMでサンドウィッチマンの漫才を学習して予測させてみた

    当ページのリンクには広告が含まれています。 記事では、LSTM(Long short-term memory)というRNNの拡張モデルを活用して、サンドウィッチマンさんの漫才ネタを学習させて、もっともらしい単語の予測をさせてみました。 目次 LSTMとは 入力データの準備 データの読み込み 時系列の数、バッチサイズ、エポック数、中間層のニューロン数の設定 各文字のベクトル化 文字の重複を省きlist化 文字がキーでインデックスが値の辞書を作成 インデックスがキーで文字が値の辞書を作成 時系列データと予測する文字の抽出 入力と正解をone-hot表現で表す LSTMモデルの構築 文書を生成するための関数を記述し学習 まとめ LSTMとは以下の記事で詳細にまとめられています。 https://qiita.com/t_Signull/items/21b82be280b46f467d1b LST

    【AI】LSTMでサンドウィッチマンの漫才を学習して予測させてみた
  • NLP4J ™ - Javaで自然言語処理 Index - Qiita

    NLP4J Index NLP4J™ はテキストマイニングや自然言語処理に必要な以下の機能を提供するJavaライブラリです。 データ収集機能 (クローラー Crawler) 自然言語処理呼び出し機能 (アノテーター Annotator) 形態素解析 構文解析 辞書 構文マッチ機能 統計インデックス作成機能 (インデクサー Indexer) Crawler, Annotator, Indexer の三立てという基的な概念と構造は、日で最も大規模に使われているエンタープライズテキストマイニングソフトウェアである IBM Watson Explorer (旧TAKMI, IBM Content Analytics)と似たものになっています。 NLP4J では基的な機能から提供を始めて日曜大工的に時間をかけて提供していくつもりです。 公開済記事 データの読み込み Wikipedia, Wi

    NLP4J ™ - Javaで自然言語処理 Index - Qiita