タグ

関連タグで絞り込む (291)

タグの絞り込みを解除

*algorithmに関するsh19910711のブックマーク (2,758)

  • 深層学習で部分空間を扱うときは射影行列を考えるとよい - ジョイジョイジョイ

    拙著『グラフニューラルネットワーク』が重版して第 5 刷となりました。皆さまありがとうございます! 【重版速報🎉🎉🎉🎉】 機械学習プロフェッショナルシリーズの重版が決まりました😆ご愛読ありがとうございます‼️ 松井孝太・熊谷亘『転移学習』【4刷】 https://t.co/Qic24KAwxD 佐藤竜馬『グラフニューラルネットワーク』【5刷】 https://t.co/Peqn1ZQavo pic.twitter.com/VBkNp2Uwjj— 講談社サイエンティフィク🖋️📔 (@kspub_kodansha) 2024年8月1日 グラフニューラルネットワーク (機械学習プロフェッショナルシリーズ) 作者:佐藤竜馬講談社Amazon 拡散モデルと最適輸送(最適輸送第 5 刷)や GNN の最新動向(グラフニューラルネットワーク第 3 刷)でもやりましたが、重版に感謝して書き下

    深層学習で部分空間を扱うときは射影行列を考えるとよい - ジョイジョイジョイ
    sh19910711
    sh19910711 2025/08/16
    2024 / "平面とベクトルのコサイン類似度 / n 次元空間中の d 次元部分空間(≈ ランクが d の射影行列)の集合のことをグラスマン多様体 (Grassmannian) といい、幾何学の分野で古くから研究"
  • メタ動画データセットによる動作認識の現状と可能性

    第74回産総研人工知能セミナー「日常生活知識とAI」での講演スライドです。

    メタ動画データセットによる動作認識の現状と可能性
    sh19910711
    sh19910711 2025/08/16
    2024 / "知識グラフを利用したゼロショット動作認識 / ノードが動作ラベル + 各ノードの特徴量は、動作ラベルから得た文埋め込みベクトル / GNNの最終層と動画から得られる特徴量で動作認識"
  • 遺伝的アルゴリズムによる非線形重回帰分析の変数&関数選択

    まず回帰分析とは 回帰分析とは何らかの目的変数を別のパラメータ(説明変数)から導き出すモデルを考えることです。 例えばある人の身長は遺伝によりその人の父親の身長と相関があると考えられます。この時息子の身長を「目的変数」として父親の身長から息子の身長を推定することを考えます。 まず、何人もの人の父親の身長(x(i))と息子の身長(y(i))を調べてデータを作ります(x(1),y(1)), x(2),y(2)), x(3),y(3))...)。それをプロットしたところ下図のようになったとします。 この時、なんとなく以下の直線のような関係があると推測できます。式で書くとy=ax+bです。 ではどのようなa,bを選ぶのが一番いいのでしょう? それは誤差が一番少なくなるa,bです。具体的にはy=ax+bで計算したyの値(理論値)と実際のyの値の差(の2乗)の和( 残差平方和 )が最小になるa,bです

    遺伝的アルゴリズムによる非線形重回帰分析の変数&関数選択
    sh19910711
    sh19910711 2025/08/16
    2022 / "ランダムに500体の遺伝子を生成 + AIC を計算 / 生存競争: 再度AICを計算して小さい方から順に並べ替え + AICの最良値が変化しなくなるまで"
  • 軽量なセグメンテーションモデルのNanoSAM を試す

    こんにちは、HACARUS でインターンをしている山下です。 今回は、Segment Anything Model (SAM)  のような高性能のセグメンテーションモデルを限られたリソース下で利用したい場合の選択肢となる NanoSAM (Apache License 2.0) を紹介します! NanoSAM は通常の SAM とどう違うのか? SAM は Meta によって公開された高性能のセグメンテーションモデルです。SAM の基的な使い方 や 他のモデルと組み合わせて使う方法 は、以前の記事で紹介しました。 SAMは、入力画像を image encoder でテンソルに変換した上で座標指定などのプロンプトと組み合わせ、mask decoder でマスクを出力するという構造になっています。 SAM の構造(パラメータ数は実測値) 上の画像中にも示したとおり、NanoSAM の構造上の

    軽量なセグメンテーションモデルのNanoSAM を試す
    sh19910711
    sh19910711 2025/08/16
    2024 / "NanoSAM: encoder として ResNet18 を使用 + Jetson Orin シリーズなど GPU を搭載したエッジデバイス上での動作に最適化 / リアルタイムでのセグメンテーションにも応用可能"
  • MIRU2025参加レポート: 西野先生の講演「見えないモノを視ようとして」から見えた研究の姿勢

    株式会社SCIEN 機械学習エンジニアの川田です。 先日、画像認識とコンピュータビジョン分野における国内最大の会議、MIRU2025に参加してきました。数多くの刺激的な発表がありましたが、中でも特に私の心に深く刻まれたのが、京都大学 西野恒 先生による講演「見えないモノを視ようとして」です。 この講演は、単に研究事例を紹介するだけでなく、そこから『見るとは何か?』という根源的な問いを私たちに考えさせる内容でした。 CVの研究というと、つい最新のモデルの精度や、斬新なモデルアーキテクチャに目を奪われがちです。しかし西野先生は、その原点に立ち返り、目の前の画像や映像そのものを深く観察することの重要性を説きました。 レポートでは、特に私の心を揺さぶったこの講演の要点を、3つの「見えないモノ」をテーマにご紹介します。 現象の奥に隠された物理法則を視る 「なぜ、風が強く吹く水面は黒く見えるのか?」

    MIRU2025参加レポート: 西野先生の講演「見えないモノを視ようとして」から見えた研究の姿勢
    sh19910711
    sh19910711 2025/08/16
    "CVの研究というと、つい最新のモデルの精度や、斬新なモデルアーキテクチャに目を奪われがち / データやモデルに全てを委ねるのではなく、まず自分の目で世界を観察し、問いを立てる"
  • 論文メモ: Conditional PixelCNN - PixelCNNベースの条件付き画像生成モデル

    論文 Conditional Image Generation with PixelCNN Decoders 表記 LL: log likelihood 概要 PixelCNNをベースにした条件付き生成モデルを提案する。モデルに与えるコンテクストは任意のラベルやタグ、埋め込みベクトルを指定できる。例えばImageNetのクラスラベルをコンテクストに与えた場合は動物、物体、風景、構造物などのリアルかつ多様な画像を生成する。また、未知の特定の人物の埋め込みベクトルを与えた場合はその人物の様々な表情、ポーズ、照明条件の画像を生成する。また、提案モデルをオートエンコーダのデコーダとして用いた場合、高精細かつ多様な画像を生成する。さらに、提案手法はPixelCNNのLLを改善し、PixelRNNと同等のLLのモデルをPixelRNNの半分以下の時間で学習することに成功した。 研究分野における位置付け

    論文メモ: Conditional PixelCNN - PixelCNNベースの条件付き画像生成モデル
    sh19910711
    sh19910711 2025/08/11
    2022 / "PixelCNNは層を深くしても右側に参照されないピクセル(=盲点)がある / これを克服するために、提案手法は垂直方向と水平方向の2つのCNNに分割"
  • NVIDIA Cosmos の世界基盤モデルによる合成データ生成入門 〜 Cosmos Predict 編 - ABEJA Tech Blog

    こんにちは!ABEJA で ABEJA Platform 開発を行っている坂井(@Yagami360)です。 今年の CES2025 にて、 NVIDIA から Cosmos という自動運転やロボティクス用のプラットフォームをリリースしたという発表が大々的にありました。 blogs.nvidia.co.jp CES 2025での NVIDIA 発表動画は、以下を見ていただければと思います(Cosmos以外にも色々発表しています) youtu.be Cosmos は、NVIDIA が提唱している「フィジカル AI」の開発を促進するプラットフォームであり「世界基盤モデル」なるものを使っているとのことで、何やら凄そうな印象を受け、NVIDIA Omniverse との違いも気になったので、実際に Cosmos を動かしながらその機能を確かめてみました。 なお、記事の動画は全体的に画質が悪いです

    NVIDIA Cosmos の世界基盤モデルによる合成データ生成入門 〜 Cosmos Predict 編 - ABEJA Tech Blog
    sh19910711
    sh19910711 2025/08/11
    "Cosmos: WFMを使用して合成データ生成・データ拡張・合成データ評価・ガードレールなどの機能を提供 / Cosmos Predict: テキスト・画像・動画を入力 + 物理的に正確な動画生成(合成データ生成)を行なう"
  • [拡散モデル] 拡散過程を可視化してみる

    はじめに 現在、話題になっている拡散モデルでは、観測データに対して、ノイズを徐々に加えて最終的にノイズのみする拡散過程が使われています。 その拡散過程が実際にどの様にノイズに変換するかを確率分布で可視化してみようと思います。 以下の数式では、拡散モデルの元祖であるDDPM(Diffusion Denoising Probabilistic Models)とそろえます。 以下で使う可視化コードは、こちらにあります。 拡散過程の概要 拡散過程は、観測変数にノイズを徐々に加えていき、最終的にノイズのみの分布( \bold{x}_T)にする過程のことである。 ステップを t として、確率変数 \bold{x}_{t-1} から \bold{x}_t への条件付き確率を以下の式で表す。 \begin{align} q(\bold{x}_t|\bold{x}_{t-1}) := \mathcal{N}

    [拡散モデル] 拡散過程を可視化してみる
    sh19910711
    sh19910711 2025/08/04
    2024 / "拡散過程が実際にどの様にノイズに変換するかを確率分布で可視化 / tが増えると、平均が0に近づき、分散も一定になっていく / Tensorboardでは、ヒストグラムの軌跡を見ることができる"
  • 係り受けに基づく日本語単語埋め込み - LAPRAS Tech Blog

    sh19910711
    sh19910711 2025/08/03
    2019 / "Mikolovらの手法では,「ある語の周りにどのような語が現れやすいか」 + Levy らの手法では「ある語はどのような語と依存関係を持ちやすいか」 / 機能的な類似度(活用形が同じ)が高く評価"
  • Sparse Overcomplete Word Vector Representations - こんな夢を見た

    Sparse Overcomplete Word Vector Representations Manaal Faruqui, Yulia Tsvetkov, Dani Yogatama, Chris Dyer, Noah Smith, 2015, ACL 単語ベクトルのovercompleteなスパース化。 スパースな単語ベクトルは各次元の成分の強さで解釈がしやすいことから好まれているが、この論文では一般的なSparse codingで単語ベクトルを作り出す際に、次元(構成要素)を増やすような行列分解を行う。 つまりは、語彙数V × 次元数N の元の行列を、語彙数V × 次元数M(>N) に変換してしまうということ。このようにして出来た行列はovercompleteと呼ばれ、画像とか通信?とかの他の分野では使われることもあるらしい。言語処理ではまず見ないので面白い。 変換元のベクトルはS

    Sparse Overcomplete Word Vector Representations - こんな夢を見た
    sh19910711
    sh19910711 2025/08/02
    2015 / "一般的なSparse codingで単語ベクトルを作り出す際に、次元(構成要素)を増やすような行列分解 / このようにして出来た行列はovercompleteと呼ばれ、画像とか通信?とかの他の分野では使われることもあるらしい"
  • Visual-Inertial Odometryが自動運転に与えるインパクトと応用への課題 - TIER IV Tech Blog

    こんにちは、ティアフォーでVisual SLAMの研究開発をしている石田です。今回はVisual-Inertial Odometryという、カメラとIMU(慣性計測装置)を用いた経路推定手法を紹介し、これを自動運転に応用できた場合のインパクトと、応用までに乗り越えなければならない課題についてお話します。 走行経路の推定結果 なお、ティアフォーでは、「自動運転の民主化」をともに実現していく様々なエンジニア・リサーチャーを募集しています。もしご興味があればカジュアル面談も可能ですので以下のページからコンタクトいただければと思います。 tier4.jp 自動運転における自己位置推定 自己位置推定とは、名前のとおり車両やセンサーデバイスなどが地図の中でどこにいるのかを推定するための技術であり、自動運転において欠かせない要素のひとつです。自分がどこを走っているか把握できなければ迷子になってしまいます

    Visual-Inertial Odometryが自動運転に与えるインパクトと応用への課題 - TIER IV Tech Blog
    sh19910711
    sh19910711 2025/08/02
    2021 / "公道を走る車両の自己位置推定は少なくとも数十センチの精度 / 計算するのに1秒かかっていたら、その間に車が動いてしまい、周囲の物体にぶつかってしまい / カメラとIMU(慣性計測装置)を使って移動経路を求める"
  • Spherical Average (多点間の球面線形補間)について

    こんにちは。GokRackこと極落にんじんです。 今回は、私が Beatrice VSTの2.0.0-beta.3のアップデートとして話者のモーフィング機能 (Voice Morphing Mode)を実装したときに用いた Spherical Average (多点間の球面線形補間) についてのお話です。 背景 私が Beatrice VST に興味を持ってソースコードを眺めたのは Ver.2.0.0-beta.2 の頃なのですが、その当時のVSTのソースコードを読み解く限り、 Beatrice は話者の特徴量を 256 次元の Embeddings で保持しており、話者切り替えは推論時に与える 256 次元のベクトルの値を複数切り替えることで実現されているということが読み取れました。 そこで、試しに VSTのソースコードに手を加えてそれら話者ごとの特徴量ベクトルの加重平均をとって推論させ

    Spherical Average (多点間の球面線形補間)について
    sh19910711
    sh19910711 2025/08/02
    "試しに VSTのソースコードに手を加えてそれら話者ごとの特徴量ベクトルの加重平均をとって推論させてみたところ、上手いこと話者の特徴が混ざったような変換結果"
  • 機械学習を用いた東西日本の境界線決定

    東日と西日の境界線を機械学習で引いてみました. セキュリティ分野の M1 が機械学習をお勉強する際に,モチベ維持のため面白そうなテーマを選んだらこうなった!というもの. なので体の論文とか,学術的貢献とかはないです...が,そういった視点から見ていただけるのはとても嬉しいです! 市町村単位,藩単位など,県境以外で境界線を引けないか?というコメントを多くいただいていますので,今後そういった方面への掘り下げもやっていきたいです.

    機械学習を用いた東西日本の境界線決定
    sh19910711
    sh19910711 2025/08/02
    2015 / "グレープフルーツの消費量 + 多ければ東日本 / 西日本はみかんの生産が盛ん"
  • 20250226 NLP colloquium: "SoftMatcha: 10億単語規模コーパス検索のための柔らかくも高速なパターンマッチャー"

    sh19910711
    sh19910711 2025/08/02
    "SoftMatcha: パターンマッチングの一致判定に単語埋め込みの類似度 + 転置索引を拡張したアルゴリズムにより、10億語規模のコーパスに対しても、柔らかくも高速に検索 / numba: うまく書くとSIMDの性能を簡単に引き出せる"
  • 自律移動ロボットの安全機構のためのLiDARによる速度推定

    sh19910711
    sh19910711 2025/08/02
    "ISO26262(公道走行モビリティ・ロボット)やIEC61508(機能安全全般)等の規格 / 1フレーム間のLiDAR点群同士を比較して座標変換を計算 + 移動量推定により現在のロボットの車速を推定する"
  • 推薦システムを本番導入する上で一番優先すべきだったこと~NewsPicks記事推薦機能の改善事例を元に~

    記事は、Recommendation Industry Talks #3での登壇資料です。 ソーシャル経済メディアNewsPicksでは、ユーザに価値のある経済情報を届けるための施策の一つとして記事推薦機能を導入しています。発表では、NewsPicks記事推薦機能にて基盤改善がアルゴリズム改善…

    推薦システムを本番導入する上で一番優先すべきだったこと~NewsPicks記事推薦機能の改善事例を元に~
    sh19910711
    sh19910711 2025/07/28
    2024 / "オフライン-オンライン評価が相関しない問題 / CB推薦のモデルは現在稼働中のCF推薦のモデルよりも性能が低いと評価 + A/Bテストを用いたオンライン評価に進む意思決定ができなかった"
  • 機械学習におけるConcept-Driftの対策または検知について - GMOインターネットグループ グループ研究開発本部

    こんにちは、次世代システム研究室のA.Zです。今回はConcept-Driftについて紹介したいと思います。 背景 多くの機械学習の予測モデルは、インプットデータとアウトプットデータに「隠れた因果関係」があると想定されます。その関係は以下のように表わされます。

    機械学習におけるConcept-Driftの対策または検知について - GMOインターネットグループ グループ研究開発本部
    sh19910711
    sh19910711 2025/07/28
    2018 / "Concept-Driftの対策と検知において最も難しい課題は、真のConcept-DriftとNoiseを区別すること / Concept-Drift自体は、繰り返し起こることが多いため、この繰り返しのパターンを素早く検知できることが重要"
  • SCCL:対照学習の応用による文書クラスタリング

    はじめに こんにちは。今回は、こちらのSCCL(Supporting Clustering with Contrastive Learning)という新しいクラスタリング手法について記述します。 Supporting Clustering with Contrastive Learning ※記事にある画像や数式は、当論文より引用しています。 Contrastive Learningは対照学習のことです。正直なところ、対照学習については学び始めたばかりの段階です。ですが、ここ最近画像処理の分野で著名な対照学習が自然言語処理に応用されていることに興味を持ちました。それで、今回知って読んだ論文を記事に起こすことにしました。 今回の記事は特に理論面の記述の割合が高いので、いきなり細部まで理解しようとせずに読んでいただけたらと思います。 クラスタリングについて クラスタリングの要件 当たり前かも

    SCCL:対照学習の応用による文書クラスタリング
    sh19910711
    sh19910711 2025/07/28
    2022 / "クラスタリングはただ複数のクラスターを作れればいいというものではない / 望ましいのは、作成した各クラスターが、他のクラスターとは異なる何かしらの特徴やカテゴリを持っていること"
  • 単眼深度推定のアルゴリズム Depth-Anything を試す

    こんにちは! HACARUS でインターンをしている長野です。 記事では深度推定の最新モデルの一つである Depth-Anything と、その簡単な実行方法を紹介します。 深度推定とは カメラから被写体までの距離のことを深度と言い、画像から深度を推測することを深度推定と呼びます。以下の画像は深度推定を行った例です。右の画像ではカメラから近い物体ほど明るい色で表現されていることがわかります。 元画像: https://github.com/LiheYoung/Depth-Anything/blob/main/assets/examples/demo3.png 人間は過去の経験から物体ごとのおおよそのサイズ感や遠近感などをわかっているため、画像を一目見て大体の距離感が掴めますが、コンピュータにはその判断が非常に難しいです。そのため、以前はステレオカメラなど複数の視点の画像をもとに深度の推定

    単眼深度推定のアルゴリズム Depth-Anything を試す
    sh19910711
    sh19910711 2025/07/28
    2024 / "人間は過去の経験から物体ごとのおおよそのサイズ感や遠近感などをわかっているため、画像を一目見て大体の距離感が掴めますが、コンピュータにはその判断が非常に難しい"
  • 【CVPR'22】物体検出アルゴリズムの新しい評価指標 | | AI tech studio

    Media fundamentalsチームの大谷です。今回は物体検出を評価するための新しい指標を設計したので、その研究について概要を解説します。この研究成果はCVPR2022に採択されています。論文のリンクはこちらです。 Mean Average Precisionはなにを見ている? 物体検出の評価では多くの場合Mean Average Precision (mAP)が使われています。まずAPについて概要を確認しておきましょう。APは検出したオブジェクトをconfidence score順に並べてprecision-recall curveを求め、その曲線の下の面積で求められます。これをカテゴリごとに計算し、全てのカテゴリ上で平均したものがmAPです。ここでは詳細に触れませんが、実際のAPの計算では諸々の実装上の事情があり、それらがAPの振る舞いにおいて少なくない影響を及ぼしています。ここ

    【CVPR'22】物体検出アルゴリズムの新しい評価指標 | | AI tech studio
    sh19910711
    sh19910711 2025/07/26
    2022 / "mAPは物体検出をデータセット全体から見つけたオブジェクトのランキング問題として評価 / クラス識別を重視するという点もAPの特徴的なスタンス / クラス識別が位置推定よりも重視される"