タグ

ブックマーク / cyberagent.ai (6)

  • ONNXモデルのチューニングテクニック (基礎編)

    基礎編 / 応用編1 / 応用編2 サイバーエージェント AI Lab の Conversational Agent Teamに所属している兵頭です。今回は私が半年ほど蓄積したONNXのチューニングテクニックを全てブログに残したいと思います。皆さんが既にご存知であろう基的なことから、かなりトリッキーなチューニングまで幅広くご紹介したいと思います。長文になりますがご容赦願います。 このブログのメインターゲット層は「リサーチャーが実装したモデルを実環境へデプロイするタスクを有する方々」です。一部リサーチャーの方々の参考になる情報が混じっていることもあるかもしれませんが、あまり興味を引かない内容だとは思います。リサーチャーメインの組織に属しながらリサーチエンジニアの立ち位置で身を投じていますので、研究の観点の少し手前あるいは少しその先の部分を担っている立場からこのブログを記載しているものとご認

    ONNXモデルのチューニングテクニック (基礎編)
  • テキストの多様性を測る評価指標 | AI tech studio

    こんにちは。リサーチサイエンティストの村上(@ichiroex)です。 現在、AI Lab NLPチームで広告文生成の研究に取り組んでいます。 はじめに 近年、GPT-3やT5などの事前学習された大規模言語モデルの登場により、言語生成技術は飛躍的な進歩を遂げています。最近では、Hugging Face社のTransformersを活用して、様々な研究者・団体から事前学習済みモデルが公開されるようになり、我々の研究やプロダクト開発においても言語生成技術がより身近になっています。 生成モデルの研究開発では、生成したテキストを様々な観点で評価することが一般的です [1]。例えば広告文生成では、評価指標の1つとして、商品やサービスの魅力をより豊かな言い回しで伝えるために、生成テキストの多様性が重要視されています。 具体的には以下のように、同じ広告訴求(商品数の豊富さ、送料無料)でも言い回しが異なれ

    テキストの多様性を測る評価指標 | AI tech studio
    misshiki
    misshiki 2022/02/07
    “テキストの多様性を測る評価指標であるdistinct-N、Self-BLEU、Pairwise-BLEUを紹介”
  • PyTorchで深層学習データセットを効率的に取り扱うために | | AI tech studio

    AI Labの大田(@ciela)です。近頃はリサーチエンジニアとして研究成果を最大化するためのエンジニアリングに責任を持って日々活動しています。昨年もPyTorchに関する記事を書かせていただきましたが、今回もPyTorch、特にPyTorchでの学習データセットの取り扱いについてのお話になります。これまで部署内のプロダクトと関わる上でTensorFlowに浮気することも何度かありましたが、PyTorchに対する感覚を鈍らせたくはなく、今後もPyTorch関連の話題には頑張ってキャッチアップしていく所存です。 深層学習データセット取扱の課題 昨今の深層学習に用いられるデータセット内のデータ数は一般的に大規模です。実際に学習する上ではデータセットをシャッフルしつつ繰り返しロードし、場合によっては適切な前処理やData Augmentationだってしなくてはなりません。それらの処理を並列化

    PyTorchで深層学習データセットを効率的に取り扱うために | | AI tech studio
    misshiki
    misshiki 2021/04/06
    大規模なデータセットを効率的に扱うために使えるWebDataset(TensorFlowでのTFRecordに相当する仕組み)についてまとめられ、実際のデータセットでの利用例が紹介されている。
  • ハイパーパラメーター最適化フレームワークOptunaの実装解説 | | AI tech studio

    AI Lab AutoMLチームの芝田です (GitHub: @c-bata)。 ハイパーパラメーター最適化は、機械学習モデルがその性能を発揮するために重要なプロセスの1つです。Pythonのハイパーパラメーター最適化ライブラリとして有名な Optuna [1] は、様々な最適化アルゴリズムに対応しつつも、使いやすく設計的にも優れたソフトウェアです。記事ではOptunaの内部実装についてソフトウェア的な側面を中心に解説します。 Optunaの内部実装を理解するためには、主要コンポーネントの役割と全体の動作の流れを押さえる必要があります。しかしOptunaの開発は活発で、コード量も多くなり、全体の流れをコードから読み取ることは難しくなってきました。そこで今回Minitunaという小さなプログラムを用意しました。Minitunaには全部で3つのversionがあり、それぞれ100行、200行

    ハイパーパラメーター最適化フレームワークOptunaの実装解説 | | AI tech studio
    misshiki
    misshiki 2020/09/15
    小さなプログラム「Minituna」を使って説明。“Minituna v2まで写経し、全体の流れがつかめた方であればOptunaのコードは読めると思います。”素晴らしい。使う人は内部実装は知っておいた方がいいのかな。
  • エッジAI用デバイスの種類と仕様、処理速度を比較してみた | | AI tech studio

    AI Labの尾崎です。 主に人間とロボットとのインタラクションに関する技術開発を担当しております。 さて、ロボットといえば、コミュニケーションロボットや自動運転車など、自律的に動いてもらって人の労働を助けるものが多いと思います。人の労働を助けるほど、ロボットに人並みに自律的で賢く動いてもらうためには、たとえば、ロボットに視覚を与える必要が出てきます。このときに役立つのがロボットビジョンを始めとした人工知能 (AI) です。特にロボットのAIのようなインターネットの末端 (エッジ) にいるAIをエッジAIと呼びます[1,22]。 最近では深層学習と呼ばれる技術が生まれ、このエッジAIの分野も革新的に進歩しました。深層学習のおかげでロボットは、目の前の歩行者を画像から認識したり、部屋のものを認識できるようになったりしました。しかし、この深層学習で作られたモデルを使うには莫大な量の計算をしなけ

    エッジAI用デバイスの種類と仕様、処理速度を比較してみた | | AI tech studio
    misshiki
    misshiki 2020/07/15
    “Edge TPUは速いですね。処理速度と消費電力の兼ね合いに優れています。”市販のエッジAI用デバイスの種類を比較:シングルボードコンピュータ(SBC)/ミニPC/コプロセッサ/スマートフォン
  • 小さく始めて大きく育てるMLOps2020 | | AI tech studio

    AI Labの岩崎(@chck)です、こんにちは。今日は実験管理、広義ではMLOpsの話をしたいと思います。 MLOpsはもともとDevOpsの派生として生まれた言葉ですが、稿では番運用を見据えた機械学習ライフサイクル(実験ログやワークフロー)の管理を指します。 https://www.slideshare.net/databricks/mlflow-infrastructure-for-a-complete-machine-learning-life-cycle 参考記事のJan Teichmann氏の言葉を借りると、 エンジニアがDevOpsによって健全で継続的な開発・運用を実現している一方、 多くのデータサイエンティストは、ローカルでの作業と番環境に大きなギャップを抱えている クラウド含む番環境でのモデルのホスティングが考慮されないローカルでの作業 番のデータボリュームやス

    小さく始めて大きく育てるMLOps2020 | | AI tech studio
    misshiki
    misshiki 2020/06/02
    “2020年有力であろうMLOpsのためのツールをかいつまんで紹介”
  • 1