タグ

*algorithmと行列に関するsh19910711のブックマーク (16)

  • Sparse Overcomplete Word Vector Representations - こんな夢を見た

    Sparse Overcomplete Word Vector Representations Manaal Faruqui, Yulia Tsvetkov, Dani Yogatama, Chris Dyer, Noah Smith, 2015, ACL 単語ベクトルのovercompleteなスパース化。 スパースな単語ベクトルは各次元の成分の強さで解釈がしやすいことから好まれているが、この論文では一般的なSparse codingで単語ベクトルを作り出す際に、次元(構成要素)を増やすような行列分解を行う。 つまりは、語彙数V × 次元数N の元の行列を、語彙数V × 次元数M(>N) に変換してしまうということ。このようにして出来た行列はovercompleteと呼ばれ、画像とか通信?とかの他の分野では使われることもあるらしい。言語処理ではまず見ないので面白い。 変換元のベクトルはS

    Sparse Overcomplete Word Vector Representations - こんな夢を見た
    sh19910711
    sh19910711 2025/08/02
    2015 / "一般的なSparse codingで単語ベクトルを作り出す際に、次元(構成要素)を増やすような行列分解 / このようにして出来た行列はovercompleteと呼ばれ、画像とか通信?とかの他の分野では使われることもあるらしい"
  • クリックだけでなく表示の情報も活用したレコメンド論文の紹介と実装・実験 - エムスリーテックブログ

    この記事はエムスリーAdvent Calendar 2019 2日目の記事です。 エンジニアリンググループ AIチームの金山 (@tkanayama_)です。普段の業務では、医療従事者向けWebサイト m3.com のための推薦システムの開発・運用を担当しています。 今回は、 "Sampler Design for Bayesian Personalized Ranking by Leveraging View Data" [Ding et al., 2018] という論文を紹介します。これは、implicit feedbackの代表的な推薦システムBayesian Personalized Rankingを拡張して、「itemが表示されたがclickされなかった」という情報をうまく活用してitemの推薦ができるようにした論文です。 リスの画像です。 この記事の流れ まず、今回紹介したい論

    クリックだけでなく表示の情報も活用したレコメンド論文の紹介と実装・実験 - エムスリーテックブログ
    sh19910711
    sh19910711 2025/07/20
    2019 / "難しい点は、「クリックしなかった」という情報の中に、「興味がない(negative)からクリックしなかった」と「興味はある(positive)が、目に入らなかったからクリックしなかった」の2つが混ざっている"
  • 機械学習のための行列式点過程:概説

    行列式点過程のレビュー論文 "Determinantal point processes for machine learning" から,その概念的な理解にとくに重要と思われる部分を抜き出して紹介したものです.

    機械学習のための行列式点過程:概説
    sh19910711
    sh19910711 2025/07/09
    2022 / "バスケットコート上の選手の位置をモデリングする / DPPでは点(プレイヤー)の数が可変 + 現実では点数(要素数)を固定としてモデル化したいことが多い"
  • 分散共分散行列の固有値問題と主成分分析(PCA)|スクラッチ実装で理解する機械学習アルゴリズム #1 - Liberal Art’s diary

    データ分析機械学習を行う上で、必ずしも全ては必要ないにしても最低限の理論の理解は欠かせません。とはいえ、とっつきづらかったり数学がネックになったりで学習に挫折するケースをよく拝見します。 こういった挫折のケースの要因は読み手の知識不足の際もあるのですが、によっては説明が不十分だったり読みにくかったり誤植があったりと単に理解しやすい文面で書かれていないというのもあります。また、実装の中にはライブラリの使い方の説明がメインのケースもあります。 そこで、シリーズではあえてスクラッチ実装を元に機械学習のアルゴリズムを実装していくことで、アルゴリズムの概要を掴んだり理論の流れを掴んだりできるようにできればと思います。実装のほとんどが車輪の再発明に近くなりますが、ベーシックなアルゴリズムをあえて一から自分で追ってみるというのは引き出しを増やすという意味で非常に有意義です。 #1では主成分分析に

    分散共分散行列の固有値問題と主成分分析(PCA)|スクラッチ実装で理解する機械学習アルゴリズム #1 - Liberal Art’s diary
    sh19910711
    sh19910711 2025/06/06
    2019 / "あえてスクラッチ実装を元に機械学習のアルゴリズムを実装していく / ベーシックなアルゴリズムをあえて一から自分で追ってみるというのは引き出しを増やすという意味で非常に有意義"
  • 【論文要約】Neural Graph Collaborative Filtering

    Wang, X., He, X., Wang, M., Feng, F. and Chua, T.S., 2019, July. Neural graph collaborative filtering. In Proceedings of the 42nd international ACM SIGIR conference on Research and development in Information Retrieval (pp. 165-174). どんな論文? 協調フィルタリングにおいて、ユーザーとアイテムの交互作用から埋め込み表現を獲得するために、二部グラフ構造を利用して埋め込みを伝搬させる Neural Graph Collaborative Filtering という手法を提案した論文。より高次の接続性を表現することができるモデルを作成し、既存手法を上回る性能を示した。

    【論文要約】Neural Graph Collaborative Filtering
    sh19910711
    sh19910711 2025/05/14
    2023 / "ユーザー/アイテム間の高次の相互作用について学習する / モデルベースCFにおけるメッセージパッシングメカニズムを用いた構造的知識の活用の最初の試み / この後LightGCNなどの手法が提案され性能が向上"
  • iALSによる行列分解の知られざる真の実力

    以下では、この表データは \(X\) という行列にまとめられているとします。上記テーブルに含まれる user_id 数を \(N_U\) , item_id 数を \(N_I\) とするとき、 \(X\) は \( N_U \times N_I\) 行列であり、その第 \(i\) 行は user_id として \(\mathrm{user}[i]\) を持つユーザーに、第 \(j\) 列 は item_id として \(\mathrm{item}[j]\) を持つアイテムに対応するとします。このマッピングのもと、 \(X\) の \(i\) 行 \(j\) 列の要素は、以下の式で与えられます。 $$ X_{ij} = \begin{cases} 1 & (\text{if } \mathrm{user}[i] \text{ and } \mathrm{item}[j] \text{ had

    iALSによる行列分解の知られざる真の実力
    sh19910711
    sh19910711 2025/05/09
    2022 / "接触がなかった組み合わせについては、かならずしも興味がなかったのではなくて、ユーザーがアイテムのことを知り得なかった場合など、さまざまな事情がありうる + 0 に近いとは言えなそう"
  • 量子計算のQmod言語の仕様を眺めて少し触ってみた感想 - Insight Edge Tech Blog

    こんにちは! Insight Edge分析チームの梶原(悠)です。 最近ひょんな経緯で量子計算用のQmodという言語のフィジビリ兼ゆる勉強会に顔を出しています。 Qmod言語 1 はclassiq社という量子ベンチャーが提供している無償有償ツール※で、簡便に量子アルゴリズムを実装できる高水準言語をうたっています。 私は量子計算について何も知らない素人ですが、基的なpythonと線形代数の知識があれば使えるとのことで、量子畑の人たちにあれこれ教えていただきながら、すこし触ってみました。 量子計算に興味や前提知識はないが、技術動向はある程度把握しておきたいと考える技術者の読み手を想定して、言語仕様の一部やツールに触れてみた感想などを書きます。 ※ 2025.3.7 classiq社様より無償ツールの記述は誤りであるとのご連絡を頂いた為訂正しました。公式サイト中の"free for non-c

    量子計算のQmod言語の仕様を眺めて少し触ってみた感想 - Insight Edge Tech Blog
    sh19910711
    sh19910711 2025/02/26
    "推定したい積分値の情報を固有値として持つユニタリ行列を構成 + 位相キックバックというトリックを用いて固有値をキュビットの位相として取り出し + 位相を量子フーリエ変換の逆変換等で振幅に反映させて観測"
  • 量子回路シミュレータのノイズモデル - Qiita

    量子コンピュータの実機は、外部からのノイズの影響で計算途中にエラー(誤り)が生じます。 そのため、従来のコンピュータで動作させる、量子回路のシミュレータでの理想的な実行結果との差が生じます。 では、量子回路のシミュレータで、エラーのある実機の動作を真似ることはできるでしょうか。 Qiskitでは、ノイズモデルという形でそれをサポートしています。 エラーのモデルとノイズモデル これらのライブラリでは、量子回路にエラーを入れるために2段階でのモデル化を行っています。 エラー自体のモデル化。どのような確率で量子ビットがどのように変化するかをモデル化する ノイズモデル。量子回路のどこに、上でモデル化したエラーが現れるかをモデル化する まずはQiskitのエラーのモデルを見ていきます。 Qiskitのエラーモデル Qiskitのパートは大体ここを参考にしています。 Qiskitには、エラーは、量子状

    量子回路シミュレータのノイズモデル - Qiita
    sh19910711
    sh19910711 2024/06/13
    "量子回路のシミュレータで、エラーのある実機の動作を真似る / ノイズモデル: エラー自体のモデル化。どのような確率で量子ビットがどのように変化するか + 回路のどこに、上でモデル化したエラーが現れるか" 2022
  • レコメンデーションシステムのキホン

    sh19910711
    sh19910711 2024/06/12
    2019 / "協調フィルタリングではユーザ属性を見ていないのに、見ているかのような動作をすることがよくある / これは、「似た属性の人たちは似たような行動をする」からであり、行動の中から属性が浮き出ている"
  • 量子計算ライブラリの量子回路を相互変換するライブラリ 「naniwa」を作ってみた - Qiita

    はじめに 量子ソフトウェア研究拠点主催の量子ソフトウェア勉強会のグループワークで、量子計算ライブラリの量子回路インスタンスを相互変換するライブラリ 「naniwa」を作成した。この記事では、naniwaの概要とその使い方について説明したいと思う。 対象読者 qiskitやqulacsなどの量子計算ライブラリを使ったことがある人 複数の量子計算ライブラリで回路インスタンスを生成してる人 ある回路インスタンスを別ライブラリの回路インスタンスに変換したい人 naniwaとは pythonには、qiskitやqulacsなどの量子計算ライブラリが充実している。 しかしそれ故に、それぞれのライブラリで同じ回路を使いたくなった時に別のライブラリで量子回路を書き直さなければいけない。 簡単な回路ならすぐかけるが、複雑な量子回路を書き直すのはなかなかに大変である。 この問題を解決するのが、量子回路相互変換

    量子計算ライブラリの量子回路を相互変換するライブラリ 「naniwa」を作ってみた - Qiita
    sh19910711
    sh19910711 2024/06/08
    "量子計算ライブラリ: qiskitやqulacsなど + それぞれのライブラリで同じ回路を使いたくなった時に別のライブラリで量子回路を書き直さなければいけない / Qiskit、Qulacs、Braket間の量子回路の相互変換" 2022
  • 雑誌「Interface」で量子コンピュータの連載を始めました - Taste of Tech Topics

    こんにちは~。 ツカノ@snuffkinです。 6/25(火)に発売されたCQ出版社さんの雑誌「Interface」2019年8月号から、量子コンピュータ入門の連載を始めました! 連載のタイトルは「動かしながら始める量子コンピュータ」です。 連載を始めた背景 量子コンピュータについて興味を持ち、や雑誌記事を読んだ方もいらっしゃると思います。 ただ、次のような感想を持つ方もいるように思います。 ビジネス書だと量子コンピュータの雰囲気は書いてあるが、理解した気になれない。 専門書を手に取ってみたけれど、数式が難しくて理解できない。 この連載では「普通のプログラマ」の方に向けて、手計算やPythonで動作を確認しながら理解する内容にしました。 内容は次のサイトからちらっと確認できます。 interface.cqpub.co.jp 連載を読んで量子コンピュータにもっと興味が出てきた方には、次の

    雑誌「Interface」で量子コンピュータの連載を始めました - Taste of Tech Topics
    sh19910711
    sh19910711 2024/06/08
    "「Interface」2019年8月号から、量子コンピュータ入門の連載を始めました / タイトルは「動かしながら始める量子コンピュータ」 / 手計算やPythonで動作を確認しながら理解する内容" 2019
  • Matrix Factorizationとレコメンドと私 - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? レコメンドにおける次元削減手法の一つであるMatrix Factorizationについてまとめた自分用メモ的なものです。 なおタイトルは「部屋とYシャツと私」にちなんだだけで、ちなんだ意味はありません。 1. レコメンドシステムにおける次元削減 1.1 レコメンドの設定と協調フィルタリング すでにレコメンドをたくさんされている方にとってはとても当たり前の話かもしれませんが一応前提をば。 今回考えるデータセットはMovieLens100kのように「ユーザ×アイテム」の行列でできているもので、例えば以下のような形のものを想定しています。

    Matrix Factorizationとレコメンドと私 - Qiita
    sh19910711
    sh19910711 2024/05/27
    "synonymy: 赤い缶のコーラを買う人と青い缶のコーラを買う人はそれぞれ別の色のコーラを買わないと思われ + 通常の協調フィルタではこの赤い缶ユーザと青い缶ユーザの類似性をうまく捉えることができません" 2019
  • 【推薦システム】レコメンドアルゴリズムまとめ①【入門/協調フィルタリング/NMF】 - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 協調フィルタリング 一言で表すと、ユーザーの行動履歴に基づいた推薦アルゴリズム。 メモリベースの手法とモデルベースの手法の二種類があります。 メモリベース手法 ユーザ間の類似性やアイテム間の類似性に着目して推薦を生成する手法です。 このうち、さらにユーザーベースの手法とアイテムベースの手法に分類されます。 特徴 ドメイン知識を必要としない(商品の内容を知らなくてもレコメンドできる) 異なるジャンルをまたいだ推薦ができる 利用者が多い場合に有利 推定の都度全データに対して計算を行う(類似度を計算する)アプローチをとるのでデータのサイズに比

    【推薦システム】レコメンドアルゴリズムまとめ①【入門/協調フィルタリング/NMF】 - Qiita
    sh19910711
    sh19910711 2024/05/21
    "Cold Start問題: 嗜好に関するデータがある程度集まらないと有意な推薦ができない / NMF: 元行列Vと分解したW,Hの要素の値がすべて非負値 + 基底ベクトルと係数を非負に限定することで、係数が疎になりやすく" 2021
  • Collective Matrix Factorization - 自然言語データのエレガントなデータ探索法 - - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? データ解析を行う上でデータの性質を知ることは欠かせません.データの性質を知ること自体が価値を持つこともありますし,正しい前処理の方法やモデルを選択する為にもデータの性質を知らなければいけません. カテゴリー型の変数なら分布や従属変数との関係などの簡単な統計量を調べるだけでも多くのことがわかります. しかし自然言語データの場合は全く同じ文章が2度現れることはまずありません.文章を単語単位に分解して考えようとしても,単語の種類が膨大なため,データ探索は一筋縄ではいきません. 自然言語データの探索法は色々ありますが,今回の記事ではその中でも

    Collective Matrix Factorization - 自然言語データのエレガントなデータ探索法 - - Qiita
    sh19910711
    sh19910711 2024/04/10
    "CMF; Collective Matrix Factorization: 教師データを活用しながらトピックを抽出 / 文章と教師ラベルを格納する行列 + 文章のトピックの分布を表す行列と各トピックの目的変数への寄与を持つ重み行列の積で近似できるはず" 2018
  • グラフ分割問題 をD-Wave 2000Qで解く(実践編) - T-QARD Harbor

    T-Wave開設以来、いくつかの先行研究や導入事例に関する記事が出ている中で、どのように具体的な問題をD-Waveマシンで解くのかということは皆さん気になっていると思います。記事では グラフ分割問題 を例に、サポートツールであるqbsolvを用いてD-Waveマシンに解かせる過程を示します。 問題を解く過程の概略 一般的にqbsolvを用いてD-Waveマシンで、組合せ最適化を行う際に必要となるステップは以下の通りです。 Step 1. 問題のQUBO表現の確認(二値変数の意味、ハミルトニアンなど) Step 2. QUBO行列$Q_{ij}$の要素の計算 Step 3. quboファイルの生成 Step 4. qbsolvコマンドの実行と結果の解釈 Step 1. グラフ分割問題のハミルトニアンの確認 グラフ中のノードを2つのグループに分割(最小カット)する場合には、あるノードが所属す

    グラフ分割問題 をD-Wave 2000Qで解く(実践編) - T-QARD Harbor
  • 疎行列の格納方式メモ - Negative/Positive Thinking

    はじめに 巨大だけどほとんどの要素がゼロであるような疎行列は、そのまま保持するより、要素がゼロじゃないところだけをうまく保持する事でメモリや計算量を減らせたりする。 扱う行列のタイプによって、効率のよい形式がいくつかあるようなので代表的なものをメモしておく。 Coodinate(COO) Format 非ゼロ要素の(row indices, column indices, value)を要素数分持たせる形式 非ゼロ要素が散らばっている場合に有利 0 4 0 0 2 0 0 0 1 を row 0 1 2 column 1 1 2 value 4 2 1 のように保持する。 compressed sparse row(CSR) Format / compressed sparse column(CSC) Format Coodinate Formatにおいて、左から右、上から下へ順番に要素を

    疎行列の格納方式メモ - Negative/Positive Thinking
  • 1