クローズドで行われた勉強会の資料です、画像認識まわりでありがちなハマりどころについて解説しています
皆さんこんにちは! ABEJAでデータサイエンティストをしている服部といいます。 本記事はABEJA Advent Calendar2022の10日目の記事になります。 背景 引っ越しから2年.... データサイエンティストとしてのリベンジ 前回の反省を踏まえて.... 1. お得そうに見える土地には絶対に理由がある 2. 土地の数はせいぜい限られていて全部探すのも難しくない 今回解く課題 土地探しにおける意見の違いとは? どうやってデータサイエンスを使って夫婦の擦り合せを行う? アプローチ 実装 1. 架空の土地条件をランダムに沢山作る 土地条件の項目数や取りうる範囲が増えすぎないようにする 自分たちにとって関連性が高い項目を入れる 2. 作った土地に対して夫婦それぞれで値段をつける LINE Botの概要 バックエンド 土地情報の作成とFireStoreに登録 妻からのフィードバック
Evidently is an open-source Python library for data scientists and ML engineers. It helps evaluate, test, and monitor data and ML models from validation to production. It works with tabular, text data and embeddings. New to Evidently? Check out the "Hello world" example (1 min) or go through the Tutorial (15 min): pageEvidently OSS TutorialWant a dashboard to track metrics over time? Get started w
はじめに Evidentlyはリファレンスが用意されているので、詳細を知りたい場合は公式のリファレンスを訪れましょう。ここでは、Evidentlyのデータドリフトに関する入り口程度を記載します。 Evidentlyとは Evidentlyとはデータドリフトを検知するPythonライブラリになります。基本的にはDataFrame型のデータ形式を与えるだけで、様々な差分を見つけることができる便利なライブラリです。感想としては、PyCaretを使っている感覚でした。 データドリフトとは データドリフトとは、初期段階のデータの分布が次第に変化していくことを指します。 よく例に挙げられるのは機械学習の場面で、時期の古いデータで学習したモデルが最近のデータにも適切に対応できるだろうか、という場面ですかね。新古の2つのデータがどの程度ズレているかを見てあげることで、モデルの性能を確認することができます。
こんにちは。CADDiのAI LabでMLOpsエンジニアをやっている中村遵介です。 MLOpsチームは今から3ヶ月前に立ち上がったばかりの新しいチームなのですが、その前身としてAPI基盤を作っていた時期があったので、そこで得られた知見を書いていこうと思います。 背景 CADDiのAI Labは2021年の12月に立ち上がった今月1才になったばかりの組織です。その若さにも関わらず、日々有用なMLモデルが作成されていっています。 そのような中で、「新しく作ったMLモデルを素早くユーザにデリバリーしたい」という話が上がるようになりました。ここでいうユーザとはCADDi社員や社内システム、公開アプリケーションなどを指します。 そのため、AI Lab内で簡単に使用できるAPI基盤を作成することにしました。具体的には以下の体験を作ることを目指しました。 開発者に提供するAPIデプロイ体験 推論コード
創作+機械学習 Advent Calendar 2022 6日目の記事です。 ゲームへの自然言語処理応用は、大別して、 1.ゲーム製作時の支援を行う用法と、 2.ゲーム自体に自然言語処理モデルを組み込む用法があるように思います。 この2つの観点別に、主に国内で自然言語処理をゲームに応用している事例を紹介していきます。 自然言語処理によるゲーム製作支援 自然言語処理をゲーム制作支援に応用する事例としては、校正やシナリオライター感のキャラ振れ防止、キャラクターの感情を自動推定することによる演出作業設定の効率化などが行われています。 ゲームシナリオの自動校正(Cygames) AIによる自然言語処理を活用したゲームシナリオ制作術――誤字検出だけでなく訂正候補の提示まで行うCygamesのシナリオ執筆ツールの内側を解説【CEDEC2022】 | ゲームメーカーズ Cygamesさんは自然言語処理を
Pythonで学ぶデータラングリング――文字抽出、フィルタリングを試してみよう:個人情報の除外など、データ分析でも重要 データ分析や自然言語処理タスクなどでは「データラングリング」が欠かせません。本稿では、なぜデータラングリングが重要なのか、Pythonを利用したテキスト抽出例や特定文字列のフィルタリング、Unicode文字への対応など幾つかのユースケースを交えながら解説します。 八楽のNLP(自然言語処理)エンジニアリングチームに所属するGiovanni Gatti De Giacomo(ジョバンニ・ガッティ・デ・ジャコモ)、Vipul Mishra(ビプル・ミシュラ)です。 八楽はAI(人工知能)の自動翻訳プラットフォーム「ヤラクゼン」の企画、開発、運用を通じて、翻訳業務の効率化と翻訳品質の向上、翻訳チームのナレッジ共有を支援しています。ヤラクゼンはソニーや帝人、コニカミノルタなどの大
進化するAI、人間がこの先生きのこるには? AIが描いた“コレジャナイ絵”を改良しながら考えた(1/3 ページ) AIの進化が止まらない。その能力は「人間を超えるかもしれない」と思わせるレベルに高まってきており、人間の仕事が奪われる懸念もリアルに迫ってきている(関連記事:AIスゴっ! 下手な漫画が秒で“プロ並み”に 「ネームだけで原稿完成」の時代に?)。 だが、現状のAIには限界がある。自分で判断できない“指示待ち”だし、その指示が適切でなければ、良い結果は期待できない。 指示が雑だと悲劇が起きる。例えば、画像生成AI「Midjourney」に「いい感じのクリスマスの絵」(a nice xmas picture)を描いてもらった。 薄暗い室内で、疲れた顔のサンタ(?)が、ツマミ片手にビールを飲んでいる。 全然いい感じじゃない……。 同じプロンプト(指示、いわゆる“呪文”)で何度か出力を試し
株式会社Preferred Networks(本社:東京都千代田区、代表取締役 最高経営責任者:西川徹、プリファードネットワークス、以下、PFN)は、深層学習を高速化するディープラーニング・プロセッサー MN-Core™ 2(エムエヌ・コア・ツー)を、東京ビッグサイトで開催されている SEMICON Japan 2022のキーノート講演において本日発表しました。 深層学習の実用化は様々な分野で進展しており、それに応じてこれまで以上に多様かつ、大規模な計算処理が求められるようになっています。 PFNでは、2020年から稼働しているMN-Coreを搭載したスーパーコンピュータMN-3を活用して、材料化学やロボティクスなどの新分野において深層学習を応用した革新的な技術の開発および高速化に取り組んできました。今後、現実世界のより複雑な課題を解決していくには、深層学習モデルの精度と演算速度をさらに向
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く