misshikiのブックマーク / 2022年12月15日

機械学習システム開発と運用の落とし穴

クローズドで行われた勉強会の資料です、画像認識まわりでありがちなハマりどころについて解説しています

misshiki 2022/12/15

66ページのスライド資料。

リンク

夫婦で納得の土地探しをするためにLINE Bot作ったりデータサイエンスした話 - ABEJA Tech Blog

皆さんこんにちは！ ABEJAでデータサイエンティストをしている服部といいます。本記事はABEJA Advent Calendar2022の10日目の記事になります。背景引っ越しから2年.... データサイエンティストとしてのリベンジ前回の反省を踏まえて.... 1. お得そうに見える土地には絶対に理由がある 2. 土地の数はせいぜい限られていて全部探すのも難しくない今回解く課題土地探しにおける意見の違いとは？どうやってデータサイエンスを使って夫婦の擦り合せを行う？アプローチ実装 1. 架空の土地条件をランダムに沢山作る土地条件の項目数や取りうる範囲が増えすぎないようにする自分たちにとって関連性が高い項目を入れる 2. 作った土地に対して夫婦それぞれで値段をつける LINE Botの概要バックエンド土地情報の作成とFireStoreに登録妻からのフィードバック

misshiki 2022/12/15

“妻と納得した土地選びをするためにデータサイエンスが支援”

データサイエンス

リンク

What is Evidently? | latest | Evidently Documentation

Evidently is an open-source Python library for data scientists and ML engineers. It helps evaluate, test, and monitor data and ML models from validation to production. It works with tabular, text data and embeddings. New to Evidently? Check out the "Hello world" example (1 min) or go through the Tutorial (15 min): pageEvidently OSS TutorialWant a dashboard to track metrics over time? Get started w

misshiki 2022/12/15

“Evidentlyは、データサイエンティストと ML エンジニア向けのオープンソースの Python ライブラリです。検証から本番環境まで、ML モデルのパフォーマンスを評価、テスト、監視するのに役立ちます。”

リンク

Evidentlyというデータドリフト検知ライブラリについて - Qiita

はじめに Evidentlyはリファレンスが用意されているので、詳細を知りたい場合は公式のリファレンスを訪れましょう。ここでは、Evidentlyのデータドリフトに関する入り口程度を記載します。 Evidentlyとは Evidentlyとはデータドリフトを検知するPythonライブラリになります。基本的にはDataFrame型のデータ形式を与えるだけで、様々な差分を見つけることができる便利なライブラリです。感想としては、PyCaretを使っている感覚でした。データドリフトとはデータドリフトとは、初期段階のデータの分布が次第に変化していくことを指します。よく例に挙げられるのは機械学習の場面で、時期の古いデータで学習したモデルが最近のデータにも適切に対応できるだろうか、という場面ですかね。新古の2つのデータがどの程度ズレているかを見てあげることで、モデルの性能を確認することができます。

misshiki 2022/12/15

“Evidentlyとはデータドリフトを検知するPythonライブラリ”

リンク

Vertexで3ヶ月で作る運用可能なML API基盤 - CADDi Tech Blog

こんにちは。CADDiのAI LabでMLOpsエンジニアをやっている中村遵介です。 MLOpsチームは今から3ヶ月前に立ち上がったばかりの新しいチームなのですが、その前身としてAPI基盤を作っていた時期があったので、そこで得られた知見を書いていこうと思います。背景 CADDiのAI Labは2021年の12月に立ち上がった今月1才になったばかりの組織です。その若さにも関わらず、日々有用なMLモデルが作成されていっています。そのような中で、「新しく作ったMLモデルを素早くユーザにデリバリーしたい」という話が上がるようになりました。ここでいうユーザとはCADDi社員や社内システム、公開アプリケーションなどを指します。そのため、AI Lab内で簡単に使用できるAPI基盤を作成することにしました。具体的には以下の体験を作ることを目指しました。開発者に提供するAPIデプロイ体験推論コード

misshiki 2022/12/15

“得られた知見”

リンク

自然言語処理のゲームへの応用サーベイ

創作+機械学習 Advent Calendar 2022　6日目の記事です。ゲームへの自然言語処理応用は、大別して、１．ゲーム製作時の支援を行う用法と、２．ゲーム自体に自然言語処理モデルを組み込む用法があるように思います。この２つの観点別に、主に国内で自然言語処理をゲームに応用している事例を紹介していきます。自然言語処理によるゲーム製作支援自然言語処理をゲーム制作支援に応用する事例としては、校正やシナリオライター感のキャラ振れ防止、キャラクターの感情を自動推定することによる演出作業設定の効率化などが行われています。ゲームシナリオの自動校正（Cygames） AIによる自然言語処理を活用したゲームシナリオ制作術――誤字検出だけでなく訂正候補の提示まで行うCygamesのシナリオ執筆ツールの内側を解説【CEDEC2022】 | ゲームメーカーズ Cygamesさんは自然言語処理を

misshiki 2022/12/15

“主に国内で自然言語処理をゲームに応用している事例を紹介”

自然言語処理

リンク

Pythonで学ぶデータラングリング――文字抽出、フィルタリングを試してみよう

Pythonで学ぶデータラングリング――文字抽出、フィルタリングを試してみよう：個人情報の除外など、データ分析でも重要データ分析や自然言語処理タスクなどでは「データラングリング」が欠かせません。本稿では、なぜデータラングリングが重要なのか、Pythonを利用したテキスト抽出例や特定文字列のフィルタリング、Unicode文字への対応など幾つかのユースケースを交えながら解説します。八楽のNLP（自然言語処理）エンジニアリングチームに所属するGiovanni Gatti De Giacomo（ジョバンニ・ガッティ・デ・ジャコモ）、Vipul Mishra（ビプル・ミシュラ）です。八楽はAI（人工知能）の自動翻訳プラットフォーム「ヤラクゼン」の企画、開発、運用を通じて、翻訳業務の効率化と翻訳品質の向上、翻訳チームのナレッジ共有を支援しています。ヤラクゼンはソニーや帝人、コニカミノルタなどの大

misshiki 2022/12/15

リンク

進化するAI、人間がこの先生きのこるには？　AIが描いた“コレジャナイ絵”を改良しながら考えた

進化するAI、人間がこの先生きのこるには？　AIが描いた“コレジャナイ絵”を改良しながら考えた（1/3 ページ） AIの進化が止まらない。その能力は「人間を超えるかもしれない」と思わせるレベルに高まってきており、人間の仕事が奪われる懸念もリアルに迫ってきている（関連記事：AIスゴっ！　下手な漫画が秒で“プロ並み”に　「ネームだけで原稿完成」の時代に？）。だが、現状のAIには限界がある。自分で判断できない“指示待ち”だし、その指示が適切でなければ、良い結果は期待できない。指示が雑だと悲劇が起きる。例えば、画像生成AI「Midjourney」に「いい感じのクリスマスの絵」（a nice xmas picture）を描いてもらった。薄暗い室内で、疲れた顔のサンタ（？）が、ツマミ片手にビールを飲んでいる。全然いい感じじゃない……。同じプロンプト（指示、いわゆる“呪文”）で何度か出力を試し

misshiki 2022/12/15

人工知能

リンク

PFN、深層学習を高速化するプロセッサーMN-Core 2の開発および、MN-Coreシリーズのクラウドサービス構想を発表 - 株式会社Preferred Networks

株式会社Preferred Networks（本社：東京都千代田区、代表取締役最高経営責任者：西川徹、プリファードネットワークス、以下、PFN）は、深層学習を高速化するディープラーニング・プロセッサー MN-Core™ 2（エムエヌ・コア・ツー）を、東京ビッグサイトで開催されている SEMICON Japan 2022のキーノート講演において本日発表しました。深層学習の実用化は様々な分野で進展しており、それに応じてこれまで以上に多様かつ、大規模な計算処理が求められるようになっています。 PFNでは、2020年から稼働しているMN-Coreを搭載したスーパーコンピュータMN-3を活用して、材料化学やロボティクスなどの新分野において深層学習を応用した革新的な技術の開発および高速化に取り組んできました。今後、現実世界のより複雑な課題を解決していくには、深層学習モデルの精度と演算速度をさらに向

misshiki 2022/12/15

“深層学習を高速化するディープラーニング・プロセッサー MN-Core™ 2”

ディープラーニング

リンク

はてなブックマーク

タグ

2022年12月15日のブックマーク (9件)

機械学習システム開発と運用の落とし穴

夫婦で納得の土地探しをするためにLINE Bot作ったりデータサイエンスした話 - ABEJA Tech Blog

What is Evidently? | latest | Evidently Documentation

Evidentlyというデータドリフト検知ライブラリについて - Qiita

Vertexで3ヶ月で作る運用可能なML API基盤 - CADDi Tech Blog

自然言語処理のゲームへの応用サーベイ

Pythonで学ぶデータラングリング――文字抽出、フィルタリングを試してみよう

進化するAI、人間がこの先生きのこるには？　AIが描いた“コレジャナイ絵”を改良しながら考えた

PFN、深層学習を高速化するプロセッサーMN-Core 2の開発および、MN-Coreシリーズのクラウドサービス構想を発表 - 株式会社Preferred Networks

お知らせ

今週のはてなブックマーク数ランキング（2025年4月第3週）

今週のはてなブックマーク数ランキング（2025年4月第2週）

今週のはてなブックマーク数ランキング（2025年4月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス