2023年6月29日のブックマーク (3件)

  • 情緒的AIと形態素解析のおはなし - Chienomi

    序 Erinaは情緒的AIである。 当然ながら「会話する」という機能は重要であり、Surtrにとっても「相手の言っていることを理解する」ということは非常に重要な要素であり、実のところ「一番最初に実装された機能」である。 私がErinaを「文系AI」と呼ぶ最大の理由がこの解析機能である。 Erinaは大した統計機能を持っていない。その理由は、私に統計学に関する十分な知識がないためだ。 そこで、私は膨大な会話や文章を読みながら、「片っ端から触れたテキストを解析できるように」解析エンジンを改良していったのである。 ここで紹介するのは実装ではなく、考え方やアプローチについてだが、ここに書いてあることを元にすれば(労力を厭わなければ)Erinaと同じようなエンジンを実装することが可能である。 Erinaと形態素解析 いきなりタイトル詐欺のようだが、実はErinaに形態素解析が使用されはじめたのは20

    NLPer
    NLPer 2023/06/29
  • Mozcdic-UT (Mozc-UT)が終わった話と、代替品を開発してる話 - Chienomi

    2023-01-12にLinux界隈に激震が走ったらしい。 Linux環境(Unix環境を含む)の日本語入力を支えていた、Mozcdic-UTプロジェクトが終了したからだ。 まず、前提として私の立場を明確にしよう。 私は2017年から、従来のMozc-UTに代わる新しい(ライセンス上の懸念のない)Mozc辞書として誕生したMozc-NEologd-UTのFcitxバインディング、fcitx-mozc-neologd-utのAURパッケージをメンテナンスしてきた。 その後新生Mozc-UTが誕生してからはfcitx-mozc-ut-unifiedとfcitx-mozc-ut-unified-fullというふたつのパッケージを加え、計3つパッケージをメンテナンスしてきた。 その後、mozcdic-ut自体がfcitx4をサポートしなくなったこと、fcitx5は既にメンテナーがいたことから私

    NLPer
    NLPer 2023/06/29
    とても興味深い内容だった。自分は自然言語処理を生業としているが、漢字変換については知識もなく、少し調べてみようかと思った。
  • 社内勉強会で生成AIについて発表したので70ページの資料を公開する! - Qiita

    前置き 毎週金曜日夕方に行われる社内勉強会にて、先日生成AIについて発表しました。折角なので少し加筆修正した資料を公開します。進化のスピードが早く、一時期傷気味に陥ってましたが改めて昨今の生成AI関連の基となるインプットを目指しました。 ※資料内冒頭に記載してますが、AIの専門家ではないので認識や説明に誤りがある可能性があります。 当方も勉強中なので、「ここ違うよ」や「これの説明もあるといいんじゃない」など様々なコメント大歓迎です! 資料 資料目次 AIの基 機械学習について 深層学習について 機械学習の種類 教師あり学習の得意なこと 教師あり学習のイメージ 教師なし学習の得意なこと 教師なし学習のイメージ 強化学習の得意なこと 生成AIについて 生成AIとは 生成AIの位置付け 生成AI利用例 代表的なサービス例 日における盛り上がり 生成AI市場規模 AGIとは AGIは近い?

    社内勉強会で生成AIについて発表したので70ページの資料を公開する! - Qiita
    NLPer
    NLPer 2023/06/29