タグ

2022年12月15日のブックマーク (9件)

  • 機械学習システム開発と運用の落とし穴

    クローズドで行われた勉強会の資料です、画像認識まわりでありがちなハマりどころについて解説しています

    機械学習システム開発と運用の落とし穴
    misshiki
    misshiki 2022/12/15
    66ページのスライド資料。
  • 夫婦で納得の土地探しをするためにLINE Bot作ったりデータサイエンスした話 - ABEJA Tech Blog

    皆さんこんにちは! ABEJAでデータサイエンティストをしている服部といいます。 記事はABEJA Advent Calendar2022の10日目の記事になります。 背景 引っ越しから2年.... データサイエンティストとしてのリベンジ 前回の反省を踏まえて.... 1. お得そうに見える土地には絶対に理由がある 2. 土地の数はせいぜい限られていて全部探すのも難しくない 今回解く課題 土地探しにおける意見の違いとは? どうやってデータサイエンスを使って夫婦の擦り合せを行う? アプローチ 実装 1. 架空の土地条件をランダムに沢山作る 土地条件の項目数や取りうる範囲が増えすぎないようにする 自分たちにとって関連性が高い項目を入れる 2. 作った土地に対して夫婦それぞれで値段をつける LINE Botの概要 バックエンド 土地情報の作成とFireStoreに登録 からのフィードバック

    夫婦で納得の土地探しをするためにLINE Bot作ったりデータサイエンスした話 - ABEJA Tech Blog
    misshiki
    misshiki 2022/12/15
    “妻と納得した土地選びをするためにデータサイエンスが支援”
  • What is Evidently? | latest | Evidently Documentation

    Evidently is an open-source Python library for data scientists and ML engineers. It helps evaluate, test, and monitor data and ML models from validation to production. It works with tabular, text data and embeddings. New to Evidently? Check out the "Hello world" example (1 min) or go through the Tutorial (15 min): pageEvidently OSS TutorialWant a dashboard to track metrics over time? Get started w

    What is Evidently? | latest | Evidently Documentation
    misshiki
    misshiki 2022/12/15
    “Evidentlyは、データ サイエンティストと ML エンジニア向けのオープンソースの Python ライブラリです。検証から本番環境まで、ML モデルのパフォーマンスを評価、テスト、監視するのに役立ちます。”
  • Evidentlyというデータドリフト検知ライブラリについて - Qiita

    はじめに Evidentlyはリファレンスが用意されているので、詳細を知りたい場合は公式のリファレンスを訪れましょう。ここでは、Evidentlyのデータドリフトに関する入り口程度を記載します。 Evidentlyとは Evidentlyとはデータドリフトを検知するPythonライブラリになります。基的にはDataFrame型のデータ形式を与えるだけで、様々な差分を見つけることができる便利なライブラリです。感想としては、PyCaretを使っている感覚でした。 データドリフトとは データドリフトとは、初期段階のデータの分布が次第に変化していくことを指します。 よく例に挙げられるのは機械学習の場面で、時期の古いデータで学習したモデルが最近のデータにも適切に対応できるだろうか、という場面ですかね。新古の2つのデータがどの程度ズレているかを見てあげることで、モデルの性能を確認することができます。

    Evidentlyというデータドリフト検知ライブラリについて - Qiita
    misshiki
    misshiki 2022/12/15
    “Evidentlyとはデータドリフトを検知するPythonライブラリ”
  • Vertexで3ヶ月で作る運用可能なML API基盤 - CADDi Tech Blog

    こんにちは。CADDiのAI LabでMLOpsエンジニアをやっている中村遵介です。 MLOpsチームは今から3ヶ月前に立ち上がったばかりの新しいチームなのですが、その前身としてAPI基盤を作っていた時期があったので、そこで得られた知見を書いていこうと思います。 背景 CADDiのAI Labは2021年の12月に立ち上がった今月1才になったばかりの組織です。その若さにも関わらず、日々有用なMLモデルが作成されていっています。 そのような中で、「新しく作ったMLモデルを素早くユーザにデリバリーしたい」という話が上がるようになりました。ここでいうユーザとはCADDi社員や社内システム、公開アプリケーションなどを指します。 そのため、AI Lab内で簡単に使用できるAPI基盤を作成することにしました。具体的には以下の体験を作ることを目指しました。 開発者に提供するAPIデプロイ体験 推論コード

    Vertexで3ヶ月で作る運用可能なML API基盤 - CADDi Tech Blog
    misshiki
    misshiki 2022/12/15
    “得られた知見”
  • 自然言語処理のゲームへの応用サーベイ

    創作+機械学習 Advent Calendar 2022 6日目の記事です。 ゲームへの自然言語処理応用は、大別して、 1.ゲーム製作時の支援を行う用法と、 2.ゲーム自体に自然言語処理モデルを組み込む用法があるように思います。 この2つの観点別に、主に国内で自然言語処理をゲームに応用している事例を紹介していきます。 自然言語処理によるゲーム製作支援 自然言語処理をゲーム制作支援に応用する事例としては、校正やシナリオライター感のキャラ振れ防止、キャラクターの感情を自動推定することによる演出作業設定の効率化などが行われています。 ゲームシナリオの自動校正(Cygames) AIによる自然言語処理を活用したゲームシナリオ制作術――誤字検出だけでなく訂正候補の提示まで行うCygamesのシナリオ執筆ツールの内側を解説【CEDEC2022】 | ゲームメーカーズ Cygamesさんは自然言語処理を

    自然言語処理のゲームへの応用サーベイ
    misshiki
    misshiki 2022/12/15
    “主に国内で自然言語処理をゲームに応用している事例を紹介”
  • Pythonで学ぶデータラングリング――文字抽出、フィルタリングを試してみよう

    Pythonで学ぶデータラングリング――文字抽出、フィルタリングを試してみよう:個人情報の除外など、データ分析でも重要 データ分析や自然言語処理タスクなどでは「データラングリング」が欠かせません。稿では、なぜデータラングリングが重要なのか、Pythonを利用したテキスト抽出例や特定文字列のフィルタリング、Unicode文字への対応など幾つかのユースケースを交えながら解説します。 八楽のNLP(自然言語処理)エンジニアリングチームに所属するGiovanni Gatti De Giacomo(ジョバンニ・ガッティ・デ・ジャコモ)、Vipul Mishra(ビプル・ミシュラ)です。 八楽はAI人工知能)の自動翻訳プラットフォーム「ヤラクゼン」の企画、開発、運用を通じて、翻訳業務の効率化と翻訳品質の向上、翻訳チームのナレッジ共有を支援しています。ヤラクゼンはソニーや帝人、コニカミノルタなどの大

    Pythonで学ぶデータラングリング――文字抽出、フィルタリングを試してみよう
  • 進化するAI、人間がこの先生きのこるには? AIが描いた“コレジャナイ絵”を改良しながら考えた

    進化するAI、人間がこの先生きのこるには? AIが描いた“コレジャナイ絵”を改良しながら考えた(1/3 ページ) AIの進化が止まらない。その能力は「人間を超えるかもしれない」と思わせるレベルに高まってきており、人間の仕事が奪われる懸念もリアルに迫ってきている(関連記事:AIスゴっ! 下手な漫画が秒で“プロ並み”に 「ネームだけで原稿完成」の時代に?)。 だが、現状のAIには限界がある。自分で判断できない“指示待ち”だし、その指示が適切でなければ、良い結果は期待できない。 指示が雑だと悲劇が起きる。例えば、画像生成AI「Midjourney」に「いい感じのクリスマスの絵」(a nice xmas picture)を描いてもらった。 薄暗い室内で、疲れた顔のサンタ(?)が、ツマミ片手にビールを飲んでいる。 全然いい感じじゃない……。 同じプロンプト(指示、いわゆる“呪文”)で何度か出力を試し

    進化するAI、人間がこの先生きのこるには? AIが描いた“コレジャナイ絵”を改良しながら考えた
  • PFN、深層学習を高速化するプロセッサーMN-Core 2の開発および、MN-Coreシリーズのクラウドサービス構想を発表 - 株式会社Preferred Networks

    株式会社Preferred Networks(社:東京都千代田区、代表取締役 最高経営責任者:西川徹、プリファードネットワークス、以下、PFN)は、深層学習を高速化するディープラーニング・プロセッサー MN-Core™ 2(エムエヌ・コア・ツー)を、東京ビッグサイトで開催されている SEMICON Japan 2022のキーノート講演において日発表しました。 深層学習の実用化は様々な分野で進展しており、それに応じてこれまで以上に多様かつ、大規模な計算処理が求められるようになっています。 PFNでは、2020年から稼働しているMN-Coreを搭載したスーパーコンピュータMN-3を活用して、材料化学やロボティクスなどの新分野において深層学習を応用した革新的な技術の開発および高速化に取り組んできました。今後、現実世界のより複雑な課題を解決していくには、深層学習モデルの精度と演算速度をさらに向

    PFN、深層学習を高速化するプロセッサーMN-Core 2の開発および、MN-Coreシリーズのクラウドサービス構想を発表 - 株式会社Preferred Networks
    misshiki
    misshiki 2022/12/15
    “深層学習を高速化するディープラーニング・プロセッサー MN-Core™ 2”