並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 3 件 / 3件

新着順 人気順

ipadicの検索結果1 - 3 件 / 3件

  • WSLのUbuntuにMeCabをインストールする

    こんにちは、$@(ダラ~っと)です(๑Ò﹃ Ó๑)ゝ はじめに WSLのUbuntuに形態素解析のMeCabをインストールした時のメモです。 何がわかる? MeCabのインストール方法 mecab-ipadic-neologdのインストール カスタム辞書登録 環境 windows 11 Pro WSL:Ubuntu 22.04.2 LTS MeCabのインストール 下記を実行して、MeCabをインストールします。

      WSLのUbuntuにMeCabをインストールする
    • ナイーブベイズ分類器を使って求人情報から業種を推測する - Qiita

      キュウサクという求人検索エンジンを運営しているサーチメディア株式会社の望月と申します。 弊社では大量の求人データを取り扱っているのですが、それらを分析する際に様々な機械学習を取り入れています。 今回は求人データの求人名や仕事内容などから業種を推測する分類器を作ってみようかと思います。 ご興味がある方はぜひ参考にしてみてください。 使用するデータ ここではハローワークのデータを使用する事にします。 求人データの入手方法についてはこちらでは記載しませんが、各自スクレイピングやダウンロード(申請を行えば可能です)などをしてご用意ください。 ハローワークの求人票には様々な項目があります。 その中の1つに産業分類コードというものがあるのですが、今回はこれを求人企業の業種として学習させます。 産業分類コードの種類については、こちらをご覧ください。 https://www.hellowork.mhlw.

        ナイーブベイズ分類器を使って求人情報から業種を推測する - Qiita
      • SageMaker で学習 - 推論間の前処理を共通化する

        こんにちは。エンジニアチームの山岸 (@yamagishihrd) です。 SageMaker を使用した機械学習(以下、「ML」)における前処理の実装方式について検討してみたので、今回はその内容について紹介したいと思います。 1. ML における前処理 a. バッチ前処理(学習データ作成時) 通常、ML で利用する学習データには前処理が必要になります。例えば、自然言語処理のユースケースの場合、少なくとも単語列からなる文章に対して「単語埋め込み (Word embedding)」を適用し、数値配列として扱えるようにする必要があるでしょう。 他にも、ML モデルの学習に有効な特徴量を作成するための前処理が必要になるかもしれません。(例: 「文章が特定の単語を含んでいるか否かを示すフラグを付与する」) これら学習用データセット作成のための前処理を、まとめて「バッチ前処理」と呼ぶことにします。S

          SageMaker で学習 - 推論間の前処理を共通化する
        1