タグ

機械学習に関するkazkunのブックマーク (4)

  • 社内の会議情報を機械学習して有識者検索エンジンを開発するというHRTechしてみた - Qiita

    TL; DR 社内に眠るダークデータ、会議関連のデータを活用することで、有識者検索エンジンを作ります。 こんなやつ これで、社内の有識者やその有識者へのコンタクトパスを探せるようにします。 1. 背景。。。 1.1 働き方改革とはなんぞ 働き方改革あるあるとして、ジタハラがよく言われますね。 ジタハラ: 残業時間削減のための具体策がないまま、社員に「残業をするな」「定時に帰れ」などと退社を強要すること とあります。真面目な皆さんは、言われたとおりに帰ります 持ち帰ってサービス残業することになります。 んなアホな!!! 1.2 会議・・・減らしてみる? 朝日新聞によると、 大企業でのムダな会議の損失 年間67万時間と15億円 だそうですよ。単刀直入に聞きます。 あなた、会議減らせます? 15億円削減できたら、ゴーン氏くらい報奨があってもいいんじゃない? 世の中には、こんなにたくさんのノウハウ

    社内の会議情報を機械学習して有識者検索エンジンを開発するというHRTechしてみた - Qiita
  • 機械学習で使用する手法を全公開 - Qiita

    株式会社デジサク がお送りするプログラミング記事、 今回はAI(機械学習)について扱っていこうと思います。 ※ 無料セミナーも開催中なので、ぜひご覧になってみて下さい。 はじめに kaggleや学習サイトなど誰でも機械学習を学べる機会が増えてきました。 その反面、情報量が多すぎて全体感を掴めていない人が多いと感じています。 そこで、様々な参考書や記事で紹介されている機械学習で使用する手法を全公開しようと思います。 細かなコーディングはリンクを貼っておくので、そちらを参照されてください。 SNS でも色々な情報を発信しているので、記事を読んで良いなと感じて頂けたら Twitterアカウント「Saku731」 もフォロー頂けると嬉しいです。 機械学習の一連手順 まず、機械学習を習得するために必要なスキルは下記です。 実務の場では数段細かな作業が必要になりますが、最初は下記を勉強するだけで十分で

    機械学習で使用する手法を全公開 - Qiita
  • [Python]機械学習などでテキストデータを特徴量にする際のソースコード集 – かものはしの分析ブログ

    都内の事業会社で分析やWebマーケティングの仕事をしています。大学・大学院では経済学を通じて統計解析を行うなどしておりました。企業に勤めてからは、機械学習やテキストマイニング、クローリング技術などに関心を持っています。 Twitterアカウント Mr_Sakaue( SKUE ) GitHub 読書メーター ほしいものリスト テキストデータの特徴量化について 仕事ではテキストデータを多用するので、機械学習などで扱うためにテキストデータを特徴量にするためのアプローチを色々と整理してソースコードを残しておきたいと思います。今回はあくまでも私の知っているものだけなので、網羅性はないかもしれませんが悪しからず。 (2019/08/18 追記)Stackingをカジュアルに行えるvecstackというモジュールを用いた予測も試してみました。下の方の追記をご覧ください。 アプローチ テキストデータを特

    [Python]機械学習などでテキストデータを特徴量にする際のソースコード集 – かものはしの分析ブログ
  • 【13個掲載】 機械学習に使える日本語のデータセットまとめ - Qiita

    記事は、Lionbridge AI発の連載記事を再編集したものです。他の機械学習に使えるオープン・データセットまとめ記事は、こちらからご覧ください。 記事は、日語のデータセットを紹介いたします。日語の公開データセットを無料ダウンロードできるポータルサイトや、自然言語処理に使える日語のテキストデータセットを含みます。 機械学習に使える日語のデータセットポータル DATA GO JP: 日政府のデータカタログサイト。日政府は、公共データを広く公開することにより、国民生活の向上、企業活動の活性化等を通じ、我が国の社会経済の発展に寄与する観点から、機械判読に適したデータ形式を、営利目的も含めた二次利用が可能な利用ルールで公開する「オープンデータ」の取組を推進しています。このウェブサイトは、二次利用が可能な公共データの案内・横断的検索を目的としたオープンデータの「データカタログサイ

    【13個掲載】 機械学習に使える日本語のデータセットまとめ - Qiita
  • 1