タグ

機械学習に関するKesinのブックマーク (49)

  • Gemini 2.5 Proと取り組んだデータ分析のリアルな道のり - Nealle Developer's Blog

    はじめに はじめまして。Analyticsチームの清水です。 2024年12月に入社しまして、約4ヶ月が経過しました。今回が初めてのテックブログになります。 ▼先日、入社エントリも公開しました。 稿のテーマは、自由記述のテキストをラベリングして分類する分析タスクに対し、Geminiと共に取り組んで分かったことの共有です。 私は生成AIをそれほどたくさん使った経験があるわけではないので、これが最良の使い方というわけではないと思いますが、どのようにプロンプトを組み立て、どう効率的に分析を進められたのかを可能な限りリアルに書いていきます。 ※今回利用したモデルは、Gemini 2.5 Proです。 はじめに Geminiを活用したデータ分析の進め方 フェーズ0: アプローチの模索 - Notebook LMや教師なし学習の試行 フェーズ1: データ理解とラベルチェック - コード生成と探索的分

    Gemini 2.5 Proと取り組んだデータ分析のリアルな道のり - Nealle Developer's Blog
    Kesin
    Kesin 2025/05/01
    この手の泥臭い作業は実は専門知識の塊だったのだけど、ある程度の知識があればAIに補助してもらいながら独力で可能になったことが分かって面白かった
  • AIシステム開発におけるQA/QA in AI System development

    これまで私がAIに対するテストで経験したことから得た知見です。 どういった問題があって、どういった対応をしたかを4つのChapterで説明しています。 This is the knowledge I have gained from my experience with testing AI thu…

    AIシステム開発におけるQA/QA in AI System development
    Kesin
    Kesin 2023/06/03
    再学習した後に以前と振る舞いが変わってしまっていないかを確認するためにAI同士の会話ログを見るというやり方は面白い
  • 七声ニーナを支えるバックエンド技術 | BLOG - DeNA Engineering

    データ統括部AI基盤部の竹村( @stakemura )です。記事では、このたびリリースされた、自分の声をキャラクターの声に変換できるWebサービス VOICE AVATAR 七声ニーナ を支えるバックエンド技術についてお話しします。 サービスはDelight Boardという部署横断型のプロジェクトにて、1000人を超える社員投票により自分の案がまさかの採択となったことがきっかけとなります。幸運にも、百戦錬磨のプロジェクトメンバーに助けられ今日のリリースを迎えましたが、採択当時は人脈も信用貯金も何もない入社一年目の思いつきにすぎず、言い出しっぺである自分の力不足によりタイトなスケジュールでの開発となってしまいました。記事では、その限られた開発期間の中で、自分が何を考えて実装したかを中心にお伝えします。 サービングに求められる要件 七声ニーナの音声変換はブラウザから受け取った入力音声

    七声ニーナを支えるバックエンド技術 | BLOG - DeNA Engineering
    Kesin
    Kesin 2021/05/13
    機械学習フレームワークって何であんなに巨大なのか。実際にプロダクションで使っているところはこういう工夫をどこもしてるのかな
  • スプラトゥーン2のプレイ動画から、やられたシーンだけをディープラーニングで自動抽出する - Qiita

    手っ取り早く、やられたシーンを抽出したい人向け OBSと連携するWebアプリを作成しました 詳細はこちらの記事をご参照ください。 スプラトゥーン3で、やられたシーンをOBSのリプレイバッファで自動保存する 以前のWebアプリ スプラトゥーン2 やられたシーン自動頭出しツール「iKut」 Dockerイメージ こちらでDockerイメージを配布しています。 はじめに スプラトゥーン2を発売日からやりこんで3年になります。2年かけて全ルールがウデマエXに到達しましたが、そこからXパワーが上がらずウデマエX最底辺で停滞しています。最近は自分のプレイ動画を見て対策を立てるのですが、すべての動画を見るのは大変です。そこで敵にやられたシーンは特に修正すべき自分の弱点があると考え、そこだけを自動で抽出するシステムを作ってみました。 ↑このシーンを切り出します。 画像の引用 この記事では任天堂株式会社のゲ

    スプラトゥーン2のプレイ動画から、やられたシーンだけをディープラーニングで自動抽出する - Qiita
    Kesin
    Kesin 2021/03/07
    タグ付け支援と学習フェーズを自前で構築しないでサービスに任せて個人でも好きなモデルを作れる時代になったんだなー
  • DeNAのマシンラーニングをささえるアノテーションシステム | BLOG - DeNA Engineering

    この記事では、DeNAでのコンピュータービジョン関連の機械学習のためのデータ生成処理方法について説明します。 主に、内製のアノテーションシステム「Nota」の開発とそのシステムと全体のMLワークフローに統合する方法について取り上げます。現在のソリューションに到達するため、私たちが行ったいくつかの決断、および解決しなければならなかった課題について説明します。 はじめまして、アラマ・ジョナタンです。現在DeNAのシステム部で、分析推進部ソリューションエンジニアリンググループとAIシステム部MLエンジニアリンググループを兼務しているメンバーです。小さいチームでデータ関連の課題を解決するためのアプリケーションやツールの開発と運用をしています。 正確なデータを取得する問題 近年、AIには多くの進歩があり、それらの多くはコンピュータビジョンに関連しています。コンピュータは画像や動画にある内容を理解で

    DeNAのマシンラーニングをささえるアノテーションシステム | BLOG - DeNA Engineering
    Kesin
    Kesin 2020/06/08
    以前知り合いが機械学習をちゃんとやろうとしたときにアノテーションのためのツールから整備していたのを見たことがあるので、本気でやる場合にはそこから始めるのだなと思ってる
  • 機械学習システムの運用課題とコンテナオーケストレーションがもたらすもの - yubessy.hatenablog.com

    最近仕事では機械学習を使ったアプリケーションをKubernetes上で運用することが多くなっています。 MLOpsのような言葉も次第に浸透してきたりと、システムとしての機械学習をどう運用していくかが活発に議論されるようになってきました。 運用に頭を悩まされてきた身としては心強い限りです。 この記事ではKubernetes(以下k8s)のようなコンテナオーケストレーション技術が、機械学習システム(以下MLシステム)の実行基盤としてなぜ適しているのかについて考えてみました。 注意点として、私はMLアルゴリズムの専門家ではなく、またLinuxやコンテナ技術の専門家でもありません。 あくまで仕事としてMLシステムを運用するためにk8sを利用している立場からの考察です。 TL; DR: MLシステムの運用には次のような課題が存在する 目的によって求められるワークロードの形態が異なる 一時的・断続的に

    機械学習システムの運用課題とコンテナオーケストレーションがもたらすもの - yubessy.hatenablog.com
  • わかるLSTM ~ 最近の動向と共に - Qiita

    Machine Learning Advent Calendar 2015 第14日です。去年のAdvent Calendarで味をしめたので今年も書きました。質問、指摘等歓迎です。 この記事の目的 ここ2~3年のDeep Learningブームに合わせて、リカレントニューラルネットワークの一種であるLong short-term memory(LSTM)の存在感が増してきています。LSTMは現在Google Voiceの基盤技術をはじめとした最先端の分野でも利用されていますが、その登場は1995年とそのイメージとは裏腹に歴史のあるモデルでもあります。ところがLSTMについて使ってみた記事はあれど、詳しく解説された日語文献はあまり見当たらない。はて、どういうことでしょうか。 記事ではLSTMの基礎をさらいつつ、一体全体LSTMとは何者なのか、LSTMはどこに向かうのか、その中身をまとめ

    わかるLSTM ~ 最近の動向と共に - Qiita
  • 自然言語処理における畳み込みニューラルネットワークを理解する · けんごのお屋敷

    最近、畳み込みニューラルネットワークを使ったテキスト分類の実験をしていて、知見が溜まってきたのでそれについて何か記事を書こうと思っていた時に、こんな記事をみつけました。 http://www.wildml.com/2015/11/understanding-convolutional-neural-networks-for-nlp 畳み込みニューラルネットワークを自然言語処理に適用する話なのですが、この記事、個人的にわかりやすいなと思ったので、著者に許可をもらって日語に翻訳しました。なお、この記事を読むにあたっては、ニューラルネットワークに関する基礎知識程度は必要かと思われます。 ※日語としてよりわかりやすく自然になるように、原文を直訳していない箇所もいくつかありますのでご了承ください。翻訳の致命的なミスなどありましたら、Twitterなどで指摘いただければすみやかに修正します。 以下

  • 機械学習アルゴリズムまとめ | 株式会社フルスピード - Growth Seed

    みなさんこんにちは。アナリストの荒木です。近い将来さまざまな仕事がロボットに置き換わっていくと多くの人が予想しており、そのコアテクノロジーの一つが機械学習です。GoogleがDeepMindを買収したことで機械学習という言葉も身近になりつつありますが、すでにamazonレコメンドや画像認識などで活躍しています。 そこで今回は、ウェブ担当者が「機械学習ってどんなことをやっているのだろう?」という場合に勉強できるスライドをまとめました。 ↓【無料DL】「SEO内部対策チェックシート」を無料ダウンロードする 機械学習によるデータ分析まわりのお話機械学習でどんなことをしているのかをまとめたスライドです。データのこと・機械学習のこと・評価のこと・分析のことの4部構成で、データマイニングの一連の流れを学ぶことができます。 Deep LearningGoogle認識例で有名になった手法を紹介したスラ

    機械学習アルゴリズムまとめ | 株式会社フルスピード - Growth Seed
  • Non-negative Matrix Factorization(非負値行列因子分解) - あらびき日記

    この記事は abicky.net の NMF: Non-negative Matrix Factorization(非負値行列因子分解) に移行しました

    Non-negative Matrix Factorization(非負値行列因子分解) - あらびき日記
  • pythonでGPUとMCMC(とR) - xiangze's sparse blog

    GPUでモンテカルロ法の計算をしたくなったりした場合には普通CUDA,OpenCLを使うことになります。 C++でプログラミングする必要があるのですが、変数の確保、解放などで記述が長くなりがちです。pythonを用いると記述を簡潔にできるところが多いらしいので関連するライブラリを紹介します。 実務的にはPyMCからTheanoが呼べるらしいのでそれを使用するのが良さそうですが、現段階では実装されていない機能もあります。 @beroberoさん http://heartruptcy.blog.fc2.com/blog-entry-152.html id:breakbeeさん http://breakbee.hatenablog.jp/entry/2014/05/20/121722 がインストール、実行に関して解説されているのでここでは実装面を少し説明します。というか備忘録です。 PyCUDA

    pythonでGPUとMCMC(とR) - xiangze's sparse blog
  • Jubatusにおける機械学習のテスト@MLCT

    2012/12/7にComSysで招待講演した際のプレゼン資料です。2013/1時点でのJubatusに関する全部入り資料になっています。 概要:Hadoopは非常に成功した大規模データの分散処理基盤である一方、データを貯めないリアルタイム処理や、統計的な手法で知見や予測モデルを得る機械学習技術のサポートは限定的である。Jubatusは、それらHadoopに足りない「分散・リアルタイム・機械学習」を実現するためのOSSフレームワークとして2011年にリリースされた。その技術的特徵は、オンライン学習アルゴリズムを分散化し、かつ分散環境でコストの高いデータ共有を排除してコンパクトな機械学習モデルのみを緩やかに共有するMix操作を中心とした計算アーキテクチャを採用していることにある。講演ではその動作原理を中心にJubatusの裏側を紹介する。

    Jubatusにおける機械学習のテスト@MLCT
  • 情報系主要国際会議2013のチュートリアルまとめ1: 機械学習、データマイニング、人工知能 | ぱろすけのメモ帳

    情報系の国際学会の多くでは、研究発表に加えてチュートリアル・セッションが設けられています。チュートリアルではホットなテーマの基礎から応用までが扱われ、要点を絞ってわかりやすく解説されており、初心者の入門には最適です。 学会に参加してチュートリアルを受けなくても、多くの場合はその内容を知ることができます。その概要は必ず会議のプログラムに掲載されますし、発表者がスライドを Web にアップロードすることも多く、発表の様子がビデオ配信されることもあります。 オンラインに情報があることは多いとはいえ、それらは基的には分散しています。会議のウェブサイトにはチュートリアル一覧が載っています。しかし、そこから発表者によるチュートリアルサイトにリンクが貼られていることは少なく、スライドの情報もないことが多い。これは非常に不便です。 というわけで、2013年の情報系主要国際会議で行われたチュートリアルのタ

    情報系主要国際会議2013のチュートリアルまとめ1: 機械学習、データマイニング、人工知能 | ぱろすけのメモ帳
  • サービス終了のお知らせ - NAVER まとめ

    サービス終了のお知らせ NAVERまとめは2020年9月30日をもちましてサービス終了いたしました。 約11年間、NAVERまとめをご利用・ご愛顧いただき誠にありがとうございました。

    サービス終了のお知らせ - NAVER まとめ
  • 統計的機械学習入門

    統計的機械学習入門(under construction) 機械学習歴史ppt pdf 歴史以前 人工知能の時代 実用化の時代 導入ppt pdf 情報の変換過程のモデル化 ベイズ統計の意義 識別モデルと生成モデル 次元の呪い 損失関数, bias, variance, noise データの性質 数学のおさらいppt pdf 線形代数学で役立つ公式 確率分布 情報理論の諸概念 (KL-divergenceなど) 線形回帰と識別ppt pdf 線形回帰 正規方程式 正規化項の導入 線形識別 パーセプトロン カーネル法ppt pdf 線形識別の一般化 カーネルの構築法 最大マージン分類器 ソフトマージンの分類器 SVMによる回帰モデル SVM実装上の工夫 クラスタリングppt pdf 距離の定義 階層型クラスタリング K-means モデル推定ppt pdf 潜在変数のあるモデル EMアル

  • Perlでレコメンデーション - YAPC::Asia Tokyo 2013

    ユーザに対して情報を推薦する機能は、全ての新しく生まれたデータを目視で確認し続けるのが辛い規模なサービスにとって欠かせない機能の一つです。 この発表では「レコメンデーション」という便利な言葉でくくられてしまいがちな、さまざまな種類の違う情報推薦の手法のうち鉄板なものについてサラっと解説し、おもにその手法を実現するためのライブラリやその使い方を紹介します。 お手軽に使えるCPANモジュールだけでなく、Jubatusというオンライン機械学習向け分散処理フレームワークをPerlから利用する方法や、「Pythonを使うのはNumPyとSciPyがあるから」という方のためにPDL(Perl Data Language)という行列演算に便利なPerlモジュールを使ったり使わなかったりして計算結果を得る方法についても紹介すると思います。

  • Deep Learning技術の今

    第2回全脳アーキテクチャ勉強会での講演スライドです。Deep Learning の基礎から最近提案されている面白トピックを詰め込んだサーベイになっています。

    Deep Learning技術の今
  • Machine Learning Cheat Sheet (for scikit-learn)

    As you hopefully have heard, we at scikit-learn are doing a user survey (which is still open by the way). One of the requests there was to provide some sort of flow chart on how to do machine learning. As this is clearly impossible, I went to work straight away. This is the result: [edit2] clarification: With ensemble classifiers and ensemble regressors I mean random forests, extremely randomized

    Machine Learning Cheat Sheet (for scikit-learn)
    Kesin
    Kesin 2014/01/18
    Scikit-learnのアルゴリズムを選ぶためのチートシート
  • Charming Python: Functional programming in Python, Part 3

    IBM Developer is your one-stop location for getting hands-on training and learning in-demand skills on relevant technologies such as generative AI, data science, AI, and open source.

    Charming Python: Functional programming in Python, Part 3
  • テキストからの評判分析と 機械学習

    テキストからの評判分析と 機械学習 鍜治伸裕 東京大学 生産技術研究所 講演の前に • 想定している聴衆 – 評判分析について専門的なことを知らない – 機械学習(ML)の素養を持っている • 講演の内容 – 評判分析という分野の解説 – 評判分析における ML の適用事例の紹介 • お断り – 自然言語処理(NLP)の話に特化 – ML を使っている論文を私の好みで選んで紹介 評判分析を概観する 評判分析はこんな技術 • 例: Yahoo!ブログ検索における「VAIO」の検索結果 肯定的評判と否定的評判の 書き込み数を集計して表示 肯定的な書き込みと否定的 な書き込みを分類して提示 背景: CGMの出現 • CGM – Consumer Generated Media のこと – 例えば Amazon に投稿されたレビューやブログなど – 一般人が作成,発信するコンテンツである点がポイン