並び順

ブックマーク数

期間指定

  • から
  • まで

441 - 480 件 / 533件

新着順 人気順

*algorithmの検索結果441 - 480 件 / 533件

  • 『これならわかる機械学習入門』(富谷 昭夫) 製品詳細 講談社BOOK倶楽部

    【道具として使いこなす!】 膨大な観測データから普遍的な法則を抽出する手法とは? 高校数学レベルから始まり、Python入門、TensorFlowによる実装、最新の論文まで踏み込む入門書。 【著者サポートページ】 https://github.com/akio-tomiya/intro_ml_in_physics 【目次】 第1章 データとサイエンス 1.1 物理学とデータサイエンス/1.2 最小2乗法とオーバーフィット/1.3 テイラー展開と振り子の等時性/コラム:武谷の三段階論 第2章 行列と線形変換 2.1 ベクトル、行列と線形変換/2.2 変換としての行列/2.3 行列に関する色々/コラム:計算量のオーダー 第3章 確率論と機械学習 3.1 確率の基礎事項/3.2 教師あり学習と教師なし学習、強化学習/3.3 確率変数と経験的確率、大数の法則/3.4 大数の弱法則の証明/3.5 カ

      『これならわかる機械学習入門』(富谷 昭夫) 製品詳細 講談社BOOK倶楽部
    • 【論文読み会】Deep Clustering for Unsupervised Learning of Visual Features

      2. ©2018 ARISE analytics 2 概要 タイトル: Deep Clustering for Unsupervised Learning of Visual Features 著者: Mathilde Caron, Piotr Bojanowski, Armand Joulin, Matthijs Douze https://arxiv.org/abs/1807.05520 一言で言うと すごい点 感想 CNNで特徴抽出してK-meansを繰り返す 教師なしでもCNNで特徴抽出ができる DeepClusterを使って教師なしで pre-training → 少量の画像で fine-tuning というやり方は現実の問題でも使えそう モチベーション 学習データへのラベルづけが大変なので教師なしでやりたい

        【論文読み会】Deep Clustering for Unsupervised Learning of Visual Features
      • 会社訪問アプリ「Wantedly Visit」のデータで見る相互推薦システム / deim2021-rrs-wantedly-visit

        2021年3月2日 DEIM2021 (https://db-event.jpn.org/deim2021/) における技術報告の資料です。 [F21] 情報検索・情報推薦④ 3月2日 10:00 ~ 11:40 https://cms.deim-forum.org/deim2021/progr…

          会社訪問アプリ「Wantedly Visit」のデータで見る相互推薦システム / deim2021-rrs-wantedly-visit
        • Deep Neural Networks and Tabular Data: A Survey

          Heterogeneous tabular data are the most commonly used form of data and are essential for numerous critical and computationally demanding applications. On homogeneous data sets, deep neural networks have repeatedly shown excellent performance and have therefore been widely adopted. However, their adaptation to tabular data for inference or data generation tasks remains challenging. To facilitate fu

          • AtCoder黄色になりました|Yuta Fukazawa

            割と初期(茶〜水くらいのころ)この記事の150問・典型90問(最後の1問のFPSパート以外)を埋めました。特に典型は2周しました。 その後鉄則も復習的な感じで全部、EducationalDPも全部、PASTを8回分くらい埋めました。 https://atcoder.jp/contests/typical90 https://atcoder.jp/contests/tessoku-book https://atcoder.jp/contests/dp hamamuさん、社会人になってから始めた勢の先輩でもありますし、ライブラリや問題を解く部分以外での向き合い方など色変記事の中でもとりわけ参考にさせていただきました。 意識していることなどコンテストに出られるだけ出る発熱や遅刻以外のタイミングでは基本ratedで、参加できるコンテストは全部出ていました。解けなかった問題+1問くらいも(難易度によ

              AtCoder黄色になりました|Yuta Fukazawa
            • 日本語向け教師なしキーフレーズ抽出の検証 - ABEJA Tech Blog

              ABEJAでデータサイエンティストをしている藤原です。 先月開催された 言語処理学会第31回年次大会(NLP2025) に参加し、その際に 埋め込みモデルベースの教師なしキーフレーズ抽出における長文に対する抽出精度の改善 というタイトルで発表を行いました。今回はその発表内容について改めて紹介させていただきます。 発表概要としては、日本語のテキストに対して種々の教師なしキーフレーズ抽出手法を統一したインターフェースで実行できるようにツールを整備し、評価用データセットを構築して各種手法の性能比較を行いました。本記事では開発したツール・評価データセットなど原稿であまり触れられなかった部分や、より詳細な実験結果についても記載します。 開発したツール・評価データセットはこちらからご利用いただけます。GitHub - flatton/keyphrase_extraction_tools はじめに キー

                日本語向け教師なしキーフレーズ抽出の検証 - ABEJA Tech Blog
              • BigQuery MLのARIMAモデルで時系列データを扱う | DevelopersIO

                はじめに データアナリティクス事業本部のkobayashiです。 先日Google Cloud 認定資格の一つであるProfessional Machine Learning Engineerを受験しました。Google Cloudの認定試験では模擬試験としてサンプル問題を解くことができるので今回も模擬試験を解いて勉強したのですが、その中で出てきたアーキテクチャで気になったものを実際に試してみたいと思います。 Professional ML Engineer 認定資格  |  Google Cloud Professional ML Engineer の試験問題のサンプル  |  認定  |  Google Cloud Google Cloud 認定資格の模擬試験 Google Cloud 認定資格の試験では模擬試験を無料で受けることができます。出題される問題は固定ですが、解説と関連ドキュ

                  BigQuery MLのARIMAモデルで時系列データを扱う | DevelopersIO
                • Tabnetはどのように使えるのか - Qiita

                  はじめに 最近、KaggleでTabnetというニューラルネットワークモデルが流行っていると知りました。 テーブルデータコンペといえばGBDT最強のイメージでしたが、ここでもニューラルネットワークモデルが台頭しつつあるようです。そこで今回は、Tabnetについて どんな嬉しさがあるのか どのように使うのか という観点から、論文の要点とリポジトリの使い方について調べてみました。 Tabnetとは 概要 Tabnetは、テーブルデータ向けのニューラルネットワークモデルです。 決定木ベースのモデルの解釈可能性を持ちつつ、 大規模なテーブルデータに対して高精度な学習が可能です。 特徴量の作成を必要としないエンドツーエンドの学習モデルです。 リファレンス 論文 Tabnetの論文は、Google Cloud AIチームによって発表されました。 TabnetはGoogle Cloud AI Platf

                    Tabnetはどのように使えるのか - Qiita
                  • PodcastをWhisperで文字起こしして、BERTで句読点抜きの文章に句読点を付与する(その2) - Qiita

                    はじめに 前回の記事では、Podcast配信の仕組みを踏まえて、各エピソードの音声ファイルのURLを取得し、Whisperで文字起こしするところまでを書きました。このとき、文字起こしはできたものの、なぜか句読点が入らないという問題がありました。 そこで今回は、句読点のない文章に句読点を入れる方法を取り上げます。先にお伝えしておきますが、私はこの領域には知見が浅く、「句読点の無い文章に句読点を挿入する(BERTによる予測)」の記事を大いに参考にさせていただきました。 こんな方におすすめ 文字起こしをしたものの句読点が入らず困っている あまり詳しくないもののとりあえずBERTを動かしてみたい 句読点付与の成果 先にどのような結果となったのかをお見せしましょう。正直精度が微妙なのですが、その点に関する考察は後述します。 【入力文章】 始めるを応援するポッドキャスト スタートFMおはようございます

                      PodcastをWhisperで文字起こしして、BERTで句読点抜きの文章に句読点を付与する(その2) - Qiita
                    • 画像向けAI異常検知で間違い探しを解いてみた - Insight Edge Tech Blog

                      はじめまして、今年の1月にInsight Edgeへ参画したData Scientistの山科です。 まだ加入して数ヶ月ですが、画像を用いた異常検知や予兆保全、オペレーションの最適化、生成AI用いたDX案件など、幅広い技術・分野に携わらせてもらっており、日々、調査にデータ分析の試行錯誤と四苦八苦しながら業務に取り組んでいます。 今回は、画像を用いた異常検知に関する案件でPatchCoreという手法を用いたのですが、使い勝手が良く様々なことに使えそうだなと感じましたので、間違い探しを題材にパラメータのケーススタディをした結果を評価し、どういったことに使えるかを考察していきたいと思います。 目次 画像に対する異常検知手法 AIで間違い探しを解く! 考察 画像に対する異常検知手法 画像認識技術を用いた異常検知の重要性については、藤村さんの記事 でも紹介されている通りで、製造業や農業など幅広い分野

                        画像向けAI異常検知で間違い探しを解いてみた - Insight Edge Tech Blog
                      • 日本語ModernBERTの開発: 開発と評価編 (1/3) - SB Intuitions TECH BLOG

                        概要 こんにちは、SB Intuitions株式会社インターンの塚越です。 日本語・英語合わせて約4.4T tokensを学習した日本語ModernBERTというモデルを構築・公開しました。 本記事では、その開発過程や評価結果についてお話しします。 我々が開発した日本語ModernBERTは、30m, 70m, 130m, 310mと4つの異なるパラメータサイズをもち、それぞれのモデルが同パラメータ規模のモデルと比較して、本記事公開時点では最も高い性能を達成しています。 開発した一連のモデルはHuggingFaceにてMITライセンスのもと公開しておりますので、商用・研究用問わず自由にお使いいただけます。 https://huggingface.co/sbintuitions/modernbert-ja-30m https://huggingface.co/sbintuitions/mod

                          日本語ModernBERTの開発: 開発と評価編 (1/3) - SB Intuitions TECH BLOG
                        • 月刊 競技プログラミングをお仕事に役立てるには

                          2025/1/12(日)に行われた競プロ新年会( https://kyopro.connpass.com/event/341443/ )のテックトークで使用したスライドです。

                            月刊 競技プログラミングをお仕事に役立てるには
                          • [論文紹介] wav2vec 2.0: A Framework for Self-Supervised Learning of Speech Representations

                            [論文紹介] wav2vec 2.0: A Framework for Self-Supervised Learning of Speech Representations

                              [論文紹介] wav2vec 2.0: A Framework for Self-Supervised Learning of Speech Representations
                            • TabPFN - Qiita

                              初めに このシリーズでは、機械学習や数理最適化などの数理モデルのざっくりとした理論と実装コードを紹介します. 今回紹介するのは,TabPFNというテーブルデータのためのTransformerモデルです.論文では「小さな表形式データに対して1秒以内に教師あり分類タスクを実行でき,ハイパーパラメータのチューニングがいらない高精度のモデル」と紹介されています.精度としてはOpenML-CC18というデータセットの中の30個のデータセットでGBDTの性能を上回ったほか,AutoMLに対して同等の精度を70倍の速度で達成したそうです. 論文:TabPFN: A Transformer That Solves Small Tabular Classification Problems in a Second 目次 1. 概要 2. ざっくり理論 3. 実装 4. おわりに 5. 参考文献 1. 概要

                                TabPFN - Qiita
                              • GitHub - oracle/tribuo: Tribuo - A Java machine learning library

                                Tribuo is a machine learning library in Java that provides multi-class classification, regression, clustering, anomaly detection and multi-label classification. Tribuo provides implementations of popular ML algorithms and also wraps other libraries to provide a unified interface. Tribuo contains all the code necessary to load, featurise and transform data. Additionally, it includes the evaluation

                                  GitHub - oracle/tribuo: Tribuo - A Java machine learning library
                                • GitHub - exadel-inc/CompreFace: Leading free and open-source face recognition system

                                  You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                    GitHub - exadel-inc/CompreFace: Leading free and open-source face recognition system
                                  • DEIM2021報告

                                    皆さんこんにちは.北山です.研究室としては毎年参加しているDEIM(データ工学と情報マネジメントに関するフォーラム)に今年も参加しましたので,その報告です.今年は昨年に引き続き,完全オンラインの開催ということで,私は運営側でもなかったので自宅からの参加をしていました.ちなみに昨年は運営側だったのと,初のオンライン開催でてんやわんやだったのを思い出します. 北山研としては11件の発表を行いました.共著の発表がもう1件あるので,北山の名が入っている発表は12件ということになります.こうなってくると,ほぼすべての時間帯が,発表 or コメンテータのお仕事という状態で,一日中張り付いているような形になりました…ちょっとやりすぎ感もありますので,来年からは考えたいと思います.これ,いつも言ってるような…まあええか. ありがたいことに,そのうち「ユーザのシチュエーションと振る舞いに基づく提示タイミング

                                      DEIM2021報告
                                    • HuggingFace(BERT)モデルをtransformers-interpretで解釈する - Qiita

                                      0. はじめに 今回はBERTの解釈としてtransformers-interpretを試したのでメモがてら記載しておく。 動作環境 OS : Windows10 pro python: 3.9.6 transformers: 4.23.1 Pytorch: 1.12.1 (+cu116) transformers-interpret: 0.9.5 GPU: RTX 2060 jupyter notebook(vscode) 1. transformers-interpretでBERTのマルチクラス分類を解釈する transformers-interpretとは、PyTorch用のモデル解釈ライブラリ 「Captum」を使用したTransformers専用のライブラリ。 SHAP等の解釈モデルと違い、Transformers専用にチューンされているので使いやすい 1-1. Captumとは

                                        HuggingFace(BERT)モデルをtransformers-interpretで解釈する - Qiita
                                      • DQNの進化史 ①DeepMindのDQN - どこから見てもメンダコ

                                        DeepMindのDQNからR2D2くらいまでの深層強化学習(Q学習)の発展の歴史を、簡単な解説とtensorflow2での実装例と共に紹介していきます。 まずは深層強化学習の新たな時代を切り開いたDeepMindのDQN(2013)です。論文からはわかりにくいatari環境向けの実装上のテクニックとDQNを構成する各要素が後継手法でどのように改良されていったかのレビューに焦点を置いてBreakout(ブロック崩し)向けにtensorflow2での実装例を紹介します。 DQNシリーズ DQNの進化史 ①DeepMindのDQN - どこから見てもメンダコ DQNの進化史 ②Double-DQN, Dueling-network, Noisy-network - どこから見てもメンダコ DQNの進化史 ③優先度付き経験再生, Multi-step learning, C51 - どこから見て

                                          DQNの進化史 ①DeepMindのDQN - どこから見てもメンダコ
                                        • mT5: A massively multilingual pre-trained text-to-text transformer

                                          The recent "Text-to-Text Transfer Transformer" (T5) leveraged a unified text-to-text format and scale to attain state-of-the-art results on a wide variety of English-language NLP tasks. In this paper, we introduce mT5, a multilingual variant of T5 that was pre-trained on a new Common Crawl-based dataset covering 101 languages. We detail the design and modified training of mT5 and demonstrate its s

                                          • GANを使わず画像を綺麗にしたい話(SRFlow) - Qiita

                                            はじめに ABEJA Advent Calendar 2021の8日目の記事です。 この記事では素晴らしい技術のはずなのになかなか日の目を浴びないFlowと呼ばれる技術を使った超解像について書こうと思います。 これを読んだ暁には「そうか、だから日の目を浴びないのか」となっていると思います。 そしてなぜこの人はこんなマニアックな記事を書いているんだろうと思うことでしょう。 超解像の概要 超解像とはざっくりいうと小さい画像を大きくする技術のことを指します。画素数の少ない低解像度な小さい画像を、画素数の多い高解像度の大きい画像にするということは、何かしらの方法で画素を補間してあげる必要があります。 非常にわかりやすいこちらの記事にもあるように、超解像とは不良設定問題です。 画像丸パクで大変恐縮ですが、1x3pixelの画像を2倍拡大して2x6pixelにする場合、以下のように様々なパターンが考え

                                              GANを使わず画像を綺麗にしたい話(SRFlow) - Qiita
                                            • byte列を直接処理する言語モデル

                                              Table of Contents これは何?byte列をpatchに区切る具体例提案手法のメリット学習効率の向上1つの処理単位に押し込める情報量をコントロールするサブトークンの特徴の利用どのように実現したか?byte列の表現の粒度提案手法における「語彙数」の定義言語モデルのアーキテクチャ所感提案手法のアプローチはマルチバイト言語に対しても有効か?ReferenceAppendixA. byte単位の表現とn-gram表現の持ち方 Metaが2024年12月13日に公開した論文 "Byte Latent Transformer: Patches Scale Better Than Tokens" [Pagnoni, 2024] を読んだのでその内容をまとめます。 ここで掲載された図は特に説明がない限り全て[Pagnoni, 2024]からの引用で、著作権は著者らに所属します。 これは何?

                                                byte列を直接処理する言語モデル
                                              • 整数計画問題における実行可能解の分布の可視化 - 数理最適化・進化計算に関する雑記帳

                                                はじめに 整数計画問題における実行可能間の距離とProximate Optimality Principle 可視化方法 インスタンス ソルバ 可視化結果 考察 おわりに 参考文献 はじめに 組合せ最適化問題に対するメタヒューリスティクスの設計では,解くべき問題に対して「良い解同士は似通った構造をもっている」という仮定をしばしばおきます[1].この仮定はProximate Optimality Principle(以降,本文ではPOPと略記)とよばれ,メタヒューリスティクスの基本戦略である「探索の集中化」の前提になっています.多くのメタヒューリスティクスは探索の集中化に加え「探索の多様化」とよばれる戦略を適切に組み込むことで高い探索性能の実現を図っています[1][2]. 本記事では,私がとくに興味をもっている整数計画問題に話を限定し,実行可能解の分布の可視化を通して,POPの成立性とメタヒ

                                                  整数計画問題における実行可能解の分布の可視化 - 数理最適化・進化計算に関する雑記帳
                                                • 旅行記から地図へ:文章から旅の軌跡を取り出して地図上に描く

                                                  国立民俗学博物館主催の国際シンポジウム・ワークショップ「GISを用いて言語情報と非言語情報をつなぐ」( https://www.minpaku.ac.jp/ai1ec_event/46676 )の招待講演で使用したスライド(一部修正版)

                                                    旅行記から地図へ:文章から旅の軌跡を取り出して地図上に描く
                                                  • カーネル法(Kernel method)とは? 次元を変えて分かりやすくするテクニック!!

                                                    カーネル法(Kernel method)とは?カーネル法とは、データを変換して(データの次元を上げて)分析しやすくする手法です。 例えば、下の図のような直線的な赤と青のデータが有り、これを直線で分離させようとしてもできません。 ここで、1次元のデータから2次元のデータに次元を上げてみます。 図では各値にの2乗をとったイメージをしています。 すると、線形分離(直線で分離)が可能になりました。

                                                    • SimSiamで自己教師あり学習(Self-Supervised Learning)に挑戦 - Qiita

                                                      Predictorでペア画像に対するEncoderの出力を予測することになるが、学習が進めば平均的な出力を予想することになり、結果Encoderの出力も平均的な出力に近づいているので、結果的にBackboneも平均的(一般的)な特徴を学習したことになる。というような流れだと筆者は理解している。 図中のstop-gradは勾配計算を止めることで、これで"Collapsing Solutions"を防ぐらしい。 素人考えではProjectorの層を無くしてBackboneとPredictorを直結した方が早いんじゃないかと思うのだが、Projectorを入れてLoss計算用の空間に一旦投影する。この辺は先行研究であるSimCLRの論文で議論されているようだ。 実装 公式実装がありPyTorch派の方はこちらを使えばそれで終わりのように思うが、筆者はtf.keras派なので自前で実装しなければな

                                                        SimSiamで自己教師あり学習(Self-Supervised Learning)に挑戦 - Qiita
                                                      • 第9回全日本コンピュータビジョン勉強会「StyleNeRF: A Style-based 3D Aware Generator for High-resolution Image Synthesis」発表資料

                                                        第9回全日本コンピュータビジョン勉強会にて「StyleNeRF: A Style-based 3D Aware Generator for High-resolution Image Synthesisについてわりかし徹底解説を行う資料になっています。

                                                          第9回全日本コンピュータビジョン勉強会「StyleNeRF: A Style-based 3D Aware Generator for High-resolution Image Synthesis」発表資料
                                                        • metric learning のファッション分野における活躍

                                                          この記事の目的は? ファッションの3つの研究分野において、 metric learning がどう使われているかを説明し、関連文献をいくつか紹介します。 metric learning やファッションの研究に興味を持たれた方が、研究を始めやすくなればと考えています。 street-to-shop image retrieval どんな研究か? ファッションアイテムの自撮り画像から、ECサイトで使われるような商品画像を検索 するための研究です。ファッションに限らない、一般的な呼び方だと cross-domain image retrieval と呼んだりもします。 図:自撮り画像の例 図:商品画像の例 出典: (M. Hadi Kiapour et al., 2015, ICCV) Where to Buy It: Matching Street Clothing Photos in Onl

                                                            metric learning のファッション分野における活躍
                                                          • 2022.2.11 第6回 統計・機械学習若手シンポジウム チュートリアル講演 Vision and LanguageとTransformers

                                                            第6回 統計・機械学習若手シンポジウム 2022年2月9日(水)- 11日(金) オンライン開催 https://sites.google.com/view/statsmlsymposium21/

                                                              2022.2.11 第6回 統計・機械学習若手シンポジウム チュートリアル講演 Vision and LanguageとTransformers
                                                            • 言語と数理の交差点:テキストの埋め込みと構造のモデル化 (IBIS 2024 チュートリアル)

                                                              深層学習の登場以降、機械学習と言語処理の距離はぐっと縮まった。機械学習が問題を抽象化して議論するのに対し、言語処理は言語また言語処理タスクに内在する構造や制約を前提としてモデル化を行う。例えば文の処理では文法的制約を与える木構造を前提とし、対訳辞書構築では単語をノード、対訳関係をエッジとする二部グラフを…

                                                                言語と数理の交差点:テキストの埋め込みと構造のモデル化 (IBIS 2024 チュートリアル)
                                                              • 【論文】Bridging the Human–AI Knowledge Gap: Concept Discovery and Transfer in AlphaZeroを読む - TadaoYamaokaの開発日記

                                                                DeepMindがarXivで発表した、AlphaZeroからチェスの新しい概念を抽出して人間のパフォーマンス向上に使えるようにする方法について述べた「Bridging the Human-AI Knowledge Gap: Concept Discovery and Transfer in AlphaZero」を読んだ際のメモ。 概要 AlphaZeroから隠されたチェスの知識を概念として抽出する 概念は、AlphaZeroの中間層から概念ベクトルとして抽出する 人間が知らずAlphaZeroだけが知っていること発見する 学習可能かつ新規な概念を抽出する 人間のグランドマスターが概念を学習可能か検証した 結果 概念と局面を提示することで、チェスのグランドマスターのテスト局面の正解率が向上した AlphaZeroが学習した知識は、人間の理解を超えるものではなく学習可能な知識であることが示さ

                                                                  【論文】Bridging the Human–AI Knowledge Gap: Concept Discovery and Transfer in AlphaZeroを読む - TadaoYamaokaの開発日記
                                                                • KDD 2024 参加レポート

                                                                  これを見ると、Rec Sys 1、Rec Sys 2などでは、評価指標に関する研究からモバイル端末内で行われる推薦、Cold-start問題への対処に関するものなど幅広い推薦システムに関する研究が発表されていました。 多くの研究は既存の手法の問題点を発見、その問題を解決する手法を提案するような研究でしたが、On (Normalised) Discounted Cumulative Gain as an Off-Policy Evaluation Metric for Top-nnn Recommendationでは推薦問題で一般的に使用されているnDCGがどの程度オンライン実験の結果を近似できるのかを調査し、DCG指標がオフライン実験/オンライン実験に対して不偏となる状況でもnDCGは手法の相対順位が変動する可能性があることを示していました。 DIET: Customized Slimmi

                                                                    KDD 2024 参加レポート
                                                                  • Mandoline: Model Evaluation under Distribution Shift

                                                                    Machine learning models are often deployed in different settings than they were trained and validated on, posing a challenge to practitioners who wish to predict how well the deployed model will perform on a target distribution. If an unlabeled sample from the target distribution is available, along with a labeled sample from a possibly different source distribution, standard approaches such as im

                                                                    • 【2021】次世代サッカー解析に関する研究

                                                                      筑波大学連携大学院(大西研究室)画像認識による人の流れの追跡や シミュレーションによる人の流れの予測の 結果を使って新しいサービスを作り出すことを目的としています. 人の流れの認識,追跡,動作認識のような画像認識や 機械学習を効率的に自動化する AutoML, マルチエージェントシミュレーション, また,計測とシミュレーションの融合であるデータ同化(data assimilation) のような基礎技術から 商業施設でのマーケティング分析,駅などの公共空間での安心・安全管理, 大規模イベントなどでの誘導支援,介護施設での徘徊検出, ミーティングスペースでのコラボレーション計測などの 応用技術までが研究のスコープです. これまでに様々な環境にて取得した大規模な人流ビッグデータがあります. これらのデータを使って世の中の役に立つ研究をしましょう. 詳しくは右のフライヤーをご覧ください. フライ

                                                                        【2021】次世代サッカー解析に関する研究
                                                                      • 生成AIのマルチモーダリティに関する技術調査【技術動向調査】 - Platinum Data Blog by BrainPad ブレインパッド

                                                                        本記事は、当社オウンドメディア「Doors」に移転しました。 約5秒後に自動的にリダイレクトします。 ブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。今回は、生成AI・基盤モデルのマルチモーダリティをテーマに4つの論文をご紹介します。 目次 今回のテーマ 論文1: Multimodal Foundation Models: From Specialists to General-Purpose Assistants 選定理由 論文概要 マルチモーダル基盤モデルの分類 マルチモーダル基盤モデルの流れと今後の展望 レビュー会FB 関連論文 論文2: Tracking Anything in High Quality 選定理由 論

                                                                          生成AIのマルチモーダリティに関する技術調査【技術動向調査】 - Platinum Data Blog by BrainPad ブレインパッド
                                                                        • CLIPにおける編集距離とユークリッド距離の考察と検証 · gojiteji's Blog

                                                                          Stable diffusion[1]では,A road sign with the word "apple" と入力すれば,上の画像のように,文字を画像化することが可能です. 一方で,下の画像のように「意味に対応する文字列っぽいもの」がそれとなく表示されるものの,果たして本当に”文字”として学習しているのか?という疑問を持ったため,簡単に実験してみました. Character-Aware Models Improve Visual Text Rendering.[3]では,画像生成とその画像文字の質に関する精度が大規模に実験されています.中でも,Stable Diffusionや,Imagen[4]では,文字画像生成にはにはミスが多く存在し,画像生成にバイトレベルTransformer(ByT5[5])を用いると,文字の生成クオリティが向上したとの結果が報告されています. 今回は,文字列

                                                                          • RWKVでembedding vectorを計算|Kan Hatakeyama

                                                                            概要背景 最近は、GPTが流行ってます しかしGPT-3.5以降はfine tuningが執筆時点でできません なので、オリジナルデータを学習させるには、少し工夫が必要です 要するに、文章のembedding vectorを計算する必要があります しかし、GPTのAPIは地味に値段が高いため、pdfが100個くらいあったりすると、破産する恐れが出てきます 目的 最終的な推論はGPT-3.5 or 4にやらせるとして、embedding vectorの計算は、もう少しローコスト・低性能なLLMで良いのではないかと、誰しも考えるはずです 或いは、google検索のような、index検索を使うのも手です ただしこの場合は、言語を跨いだ検索などが難しそうです そこで、RNNでTransformer並みの動きをすると話題のRWKVで、embedding vector的なものを計算してみようと考えまし

                                                                            • ディープラーニングは作画監督を見分けられるのか? 〜涼宮ハルヒの憂鬱[エンドレスエイト」より〜 - Qiita

                                                                              ー はじめに ー もし、この記事を読む読者の方がアニメ好きならば、「涼宮ハルヒの憂鬱」の名を知らぬ人はいないでしょう。 今回は後世に名を残した「エンドレスエイト」より、絵コンテ・演出家、作画監督をディープラーニングで認識することができるのかを検証していきたいと思う。 ☆「涼宮ハルヒの憂鬱」を知らない方へ 涼宮ハルヒの憂鬱とは原作者:谷川 流氏、角川スニーカー文庫から刊行されているSF系学園ストーリー(筆者談、諸説あり) 2009年4月から放映されたアニメ2期「涼宮ハルヒの憂鬱」にて、世間を騒がす大事件が起きました。 「エンドレスエイト」 原作である「涼宮ハルヒの暴走」の名が指し示す通り、アニメ涼宮ハルヒの憂鬱が暴走を起こし、全く同じ内容を8週にかけて放映しました。 今回はその8回分の同じ内容のアニメを活用し、ディープラーニングの能力を検証していきたいと思います。 蛇足にはなりますが「涼宮ハ

                                                                                ディープラーニングは作画監督を見分けられるのか? 〜涼宮ハルヒの憂鬱[エンドレスエイト」より〜 - Qiita
                                                                              • 深層学習っぽい用語のメモ 〜 Auxiliary loss、Transformer-XL、axial-attention〜 - magattacaのブログ

                                                                                AlphaFold2はディープラーニングの専門家の視点でみても面白いそうですが、ど素人にはさっぱりです。 というわけで、前回の「Self distillation」に引き続き、深層学習っぽい用語を調べています。 今回取り上げる用語はAuxiliary loss、Transformer-XL、axial-attentionです。 www.nature.com 概要 1. Auxiliary loss 1-1. こまめな中間報告が成功の鍵? ~補助損失~ 1-2. AlphaFoldででてくるAuxiliary loss 1-3. Auxiliary lossの効果はあったの? ~ablation study~ 2. Transformer-XL 2-1. Transformer x Auxiliary lossで文字レベル言語モデルの高性能化 2-2. Transformer-XLと可変長文

                                                                                  深層学習っぽい用語のメモ 〜 Auxiliary loss、Transformer-XL、axial-attention〜 - magattacaのブログ
                                                                                • Tim O’Reilly helped bring us Web 1.0 and 2.0. Here’s why he’s a Web3 skeptic

                                                                                  Tim O’Reilly has been a conversation starter within the tech industry for more than three decades. The company he founded, O’Reilly Media, launched the first true commercial website in 1993, and remains a tech-industry staple that publishes tech books, offers online education, and holds virtual events. O’Reilly saw firsthand the first wave of big dot-com companies swell, crest, and crash in the la

                                                                                    Tim O’Reilly helped bring us Web 1.0 and 2.0. Here’s why he’s a Web3 skeptic

                                                                                  新着記事