[B! graph] [4ページ] sh19910711のブックマーク

Bluesky のフォロー推薦モデルを書いた - HackMD

Social Network を活用するには自分の興味にあったアカウントをフォローすることが大事です．そのために重要な役割を果たすのが「おすすめユーザ推薦 (friend recommendation)」です．

sh19910711 2024/01/21

"次数が期待的に閾値以下になるようにサンプリング / GraphSage のサンプリングをデータセット生成時点で行っている / 与えられたグラフの (source_id, target_id) を正例，target_id をシャッフルしたものを負例 + TripletMarginLoss"

リンク

"Detecting Argument Selection Defects" を読んだ - blog.8-p.info

去年に Twitter で Kentaro Hara さんが紹介していた Googleの2億行のソースコードを解析した結果、関数に渡す引数の順番を間違える系のバグは、引数の個数が6個以上になったときに著しく増えるので、引数の個数は5個以下が望ましいことがわかったという話。 Andrew et al. の Detecting Argument Selection Defects を読んだ。題名の通り「引数の渡し間違いによるバグを見つける」ことに挑んだ論文で、著者らは提案しているアルゴリズムを Error Prone のパターンとして実装し、Google 社内のみならず、オープンソースソフトウェアにもバグを報告、実際に修正させている。ここでの「オープンソースソフトウェア」には、なんと OpenJDK の ConcurrentHashMap も含まれている。アルゴリズムはわかりやすい。引数の

sh19910711 2024/01/19

"題名の通り「引数の渡し間違いによるバグを見つける」ことに挑んだ論文 / 宣言されている引数の名前群を一つの集合、実際に渡されているものの名前群をもう一つの集合として、bipartite graph (二部グラフ) を構築" / 2019

リンク

JanusGraphによるグラフDB入門 - Qiita

前置きこの記事を書いているのは、RDBMSすらろくに扱ったことの無いド素人なので、内容はあまり鵜呑みにしないでください。ご指摘は大歓迎です。グラフDBとはグラフ構造(有向グラフ)を格納するのに特化したデータベースのことです。一番有名なものだと Neo4j、その他にはAmazon Neptune、Arango DBなどがあります。グラフDBのなにがうれしいの？グラフから情報を取り出すことに特化したクエリ言語(RDBMSにおけるSQL的なもの)を備えているので、自分でいちいちアルゴリズムを組まなくてもよくなります。 JanusGraphって何？ Linux Foundationの元で開発されているオープンソースのグラフDBです。元はTitanGraphという名前の個人プロジェクトでしたが、そこからforkされ開発が続けられています。2017年4月にversion0.1がリリース、202

sh19910711 2023/12/01

"JanusGraph: Linux Foundationの元で開発されているオープンソースのグラフDB + 元はTitanGraphという名前の個人プロジェクト / バックエンドのデータベース(データの保存先)としてApache Cassandra, Apache HBase,Berkeley DBなどが選べる" / 2020

*data
graph

リンク

大規模グラフデータの可視化：Cosmographの紹介

テラーノベルで機械学習を中心に担当している川尻です。最近、グラフニューラルネットワーク(GNN)に注目しており、サーベイや検証をしております。以前にも以下の記事を書きました。複雑なアルゴリズムを適用する前に、当たりをつけたり、結果を確認したりするためには、可視化が重要です。本記事では、いくつかあるグラフの可視化ツールの中でも、大規模なネットワークでも簡単に使えるCosmographを紹介し、テラーノベルのデータを使って可視化してみます。 Cosmographとはグラフデータを可視化するツールはたくさんありますが、もっとも有名なのはgrapgvizです。graphvizにはsfdp[1]という大規模なデータに対応したアルゴリズムが用意されていますが、ノード数が10k以上のような大規模なグラフになると計算時間もかなりかかって、パラメータ調整も大変になります。 Cosmographは、Web

sh19910711 2023/09/07

"Cosmograph: WebGLを使用して大規模なグラフをレンダリングできる + 100k以上のノードを持つグラフでも計算しながらレンダリング / npmパッケージとして公開されているため、自分でウェブアプリに組み込むことも可能"

リンク

グラフを用いた近似最近傍探索の理論と応用

NLP若手の会 (YANS) 第18回シンポジウム (2023) チュートリアル　https://yans.anlp.jp/entry/yans2023 松井勇佑（東京大学）https://yusukematsui.me/ 近似最近傍探索とは、「似ているベクトルを探す」というシンプルかつ基盤的な技術である。近傍探索技術は古くから様々な分野で研究が進められてきたが、現在でも活発に技術革新が進んでいる。近年ではCLIPを用いたマルチモーダル検索や、埋め込み探索によるLLMへの知識追加方式として、近傍探索技術は注目を集めている。本チュートリアルでは、特に2010年代後半から目覚ましく発展を遂げ、多くのVector Databaseのバックエンドにもなっている「グラフを用いた探索方式」に焦点を当て、その理論と応用について解説する。

sh19910711 2023/09/01

"NSG [Fu+, VLDB 19]: 「HNSWより少し精度良い」ことが多々ある + AlibabaのTaobaoで使われてるらしい + Faissにも実装がある / DiskANN [Subramanya+, NeurIPS 19]: 巨大データでは試す価値アリ + Filtered-DiskANN [Gollapud+, WWW 23]"

リンク

people analytics tokyo #1に参加してきました。 - INPUTしたらOUTPUT!

以前、以下の本を読んで人と人とのつながりが組織のパフォーマンスに影響するということを知り、ちょうど勉強会が開催されたので無理をお願いして参加させていただきました。データの見えざる手: ウエアラブルセンサが明かす人間・組織・社会の法則作者: 矢野和男出版社/メーカー: 草思社発売日: 2014/07/17メディア: 単行本この商品を含むブログ (24件) を見る職場の人間科学: ビッグデータで考える「理想の働き方」作者: ベン・ウェイバー,千葉敏生出版社/メーカー: 早川書房発売日: 2014/05/23メディア: 単行本この商品を含むブログ (3件) を見る以下メモ people analytics tokyo #1 - connpass 趣旨説明: People Analytics Tokyoについてなぜ開催したのか People Analyticsの参考資料 People

sh19910711 2023/09/01

"「感謝ネットワークからみる組織のコミュニケーションの形」 / エンゲージメントの高い社員は「ありがとう」に理由をつける / 「O'Reilly Japan - オープンソースで学ぶ社会ネットワーク分析」" / 2019

リンク

ネットワーク科学研究会2022 での発表報告 | CyberAgent Developers Blog

技術本部 Data Science Center の武内です。普段は、メディアサービスのデータ分析業務に携わっております。今回は、2022年8月23-25日に同志社大学で開催された「ネットワーク科学研究会2022」に弊社から2名が参加しポスター発表を行いましたのでレポートしたいと思います。ネットワーク科学研究会についてネットワーク科学研究会は、「ネットワーク」を研究キーワードにもつ学生・若手研究者を中心に構成され、分野横断的な情報共有の場を提供することを目的とし、毎年開催されています。今回は現地＋オンラインのハイブリッド形式で開催され、約120人の参加登録があり、現地参加は50人を超えたそうです。例年、口頭講演とポスター講演があります。分野横断的な交流を目的に掲げていることもあり、口頭講演では異分野の人にもわかりやすく研究背景が説明され、いつも大変勉強になっています。ポスター講演は

sh19910711 2023/08/27

"オンライン上でのユーザー同士のコミュニケーションネットワークを結合振動子系とみなす / 繋がりのあるユーザー同士の利用リズムが類似していることを示し、実際に同期現象が起きていることが確認できたとのこと"

リンク

SaaSのビジネスモデルがアジャイル開発を促進したという仮説 - プログラマの思索

「ソフトウェア・ファースト」を読んで、改めて、アジャイル開発はSaaSの開発プロセスを発展させたものとみなすのだと考えた。ラフなメモ書き。【参考】ソフトウェア・ファーストの感想: プログラマの思索【1】「ソフトウェア・ファースト」を読むと、製造業などの一般産業は、SaaSのようにどんどんサービス化すべきだ、という主張が背景にあるのが分かる。では、SaaSというビジネスモデルの特徴や本質は何だろうか？この問いに自分なりに考えてみたら、複数の特徴があるように思う。【2】SaaSはScrumと相性が良い。たとえば、パッケージ製品ビジネスや大量生産ビジネスでは、たくさん作って販売してそれで終わり。一括請負契約で作って納品したら終わり。顧客とメーカーは、クライアント-ベンダー-アンチパターンにはまりやすい。「クライアント-ベンダーアンチパターン」という根本問題: プログラマの思

sh19910711 2023/06/16

"ソフトウェア特有のネットワークの経済 / 「告発フェイスブックを揺るがした巨大スキャンダル」によれば、Facebookで、個人に68個のいいねがあれば、その人物に関する非常に具体的な情報をモデルから予測できる" / 2020

リンク

論文の再現実験: Neural Graph Collaborative Filteringを実装してみた - pyhaya’s diary

本記事では「Neural Graph Collaborative Filtering (NGCF)」と呼ばれる、グラフ構造を使った推薦システムの手法を自分で実装して論文の再現実験をしてみたことについて書きます。近年の推薦システムの研究では、ユーザーとアイテムの特徴量だけでなく、ユーザーとアイテム間の関係性を考慮した手法が注目されています。NGCFもその一つで、ユーザーとアイテムのグラフ構造を学習することで、より高い精度で推薦を行うことができます。本記事では、まずNGCFの手法や特徴について解説し、その後に実装と再現実験の方法を紹介します。 Neural Graph Collaborative Filteringとは？ NGCFの特徴実装結果感想おまけ Neural Graph Collaborative Filteringとは？ NGCFは、SIGIR'19 に採択された論文「Ne

sh19910711 2023/06/16

"「Neural Graph Collaborative Filtering」で提案 (SIGIR'19) / ユーザーとアイテムのグラフ構造を学習することで、より高い精度で推薦 / グラフ畳み込みネットワーク (GCN) を用いて、ノード間の情報を交換"

リンク

グラフニューラルネットワーク(GNN)を使ったタグ分類

テラーノベルで機械学習を中心に担当している川尻です。最近、グラフニューラルネットワーク(GNN)に注目してサーベイしています。今回は、実際のテラーノベルのデータを簡単なモデルに適用してみたので報告します。グラフニューラルネットワーク (GNN) グラフニューラルネットワーク（GNN）とは、グラフ理論において対象を「ノード」と「エッジ」からなる「グラフ」として扱うためのニューラルネットワークの一種です。例えば、テラーノベルにおいては、ノードがユーザーや作品の一つ一つを表し、エッジが「読んだ」「いいね」「フォロー」などを表します。ディープラーニングの発展に伴い、GNNの研究も盛んになっており、大規模なデータや様々なタスクに適用されるようになっています[1]。テラーノベルでのグラフの例 arxivで投稿された年ごとの「Graph Neural Network」がタイトルに含まれている件数 G

sh19910711 2023/06/04

"作品についたタグのクラス分類 / 特に二次創作ファン同士だけで通じるような、wrx2、2434、ci、knkz、zmなど、イニシャルで省略されたものも多い / ユーザーや作品との関係性もヒントにグラフとして解くことができるのでは"

リンク

SQL 2023 のグラフ構文を試す - Qiita

次期 Oracle Database 開発者向け無料版「Oracle Database 23c Free」が 2023年4月3日に提供開始されました。このリリースは SQL の最新仕様（SQL:2023）に含まれる Property Graph 文法をサポートしているので、早速使ってみます。ここでは、以前の記事「銀行の送金データをグラフで分析する」のデータを用います。以前の記事では SQL と別の言語である PGQL を用いてクエリを試していますが、この記事では SQL でグラフのパターンを記述します。詳細は Oracle Database 23c Free のドキュメントの Property Graph Release 23.2 に解説されています。SQL Property Graphs の項をご参照ください。 Oracle Database 23c の起動 Docker または

sh19910711 2023/05/19

"次期 Oracle Database 開発者向け無料版「Oracle Database 23c Free」が 2023年4月3日に提供開始 / SQL の最新仕様（SQL:2023）に含まれる Property Graph 文法をサポート"

リンク

グラフラプラシアン - 初級Mathマニアの寝言

この記事では、電力網のネットワーク、交通網のネットワーク、人間関係のネットワーク、神経ネットワーク、遺伝子ネットワークのようなネットワークシステムの性質を解析する際に重要なグラフラプラシアンについて解説します（枝に向きのないネットワークだけ解説します）。グラフ、隣接行列、次数行列下図のように節点と枝から構成されるネットワークを数学的に表現するには、グラフという概念が役立ちます。グラフとは、節点の集合と枝の集合の組のことです。例えば上のネットワークだと節点集合がで枝集合がです。このようにならが成り立つグラフを正確には無向グラフといいます（この記事では、無向グラフだけを説明します）。節点は頂点、枝は辺とも呼ばれます。上のグラフはそれぞれの枝が同等の重要度を持っているとすると、次のような行列で表現できます。つまり、上のグラフは枝が存在するので行列の成分と成分のところ

sh19910711 2023/05/17

"名前はベクトル解析で登場するラプラシアンという作用素に由来 / ベクトル解析の勾配、発散、ラプラシアンがグラフ理論の接続行列の転置、接続行列、グラフラプラシアンにそれぞれ対応しているという解説を参考" / 2018

リンク

GNNとグラフ信号処理 - 理とかなんとか

概要 GNNは, 信号処理の観点でローパスフィルタの効果を持っている. そして, GNNが通常のMLPに比べて高精度となるようなデータでは, 低周波成分に(タスクに関して)有用な情報が多く含まれており, 高周波成分には無駄な情報が多いようなケースになっているように見受けれられる. また, 実際にタスクの精度を様々なフィルタで比較すると, 信号処理の観点での性質が反映された結果を与えている. GNNの最も大きな役割（通常のMLPとの違い）は, ローパスフィルタとしての性質の影響なのではないかと考えられる. 逆に言うと, ローパスフィルタとしての性質が生かせるようなデータが, GNNの効果が最も期待出来るものなのではないかと考えられる. 内容はじめに GNNとはどのようなものだったか？信号処理のいくつか GNNのローパスフィルタとしての役割まとめ 1. はじめに Graph Neural

sh19910711 2023/05/17

"グラフラプラシアン: この行列の固有値と固有ベクトルを求めることで, グラフ上の各周波数成分の波が分かり / タスクの精度を様々なフィルタで比較すると, 信号処理の観点での性質が反映 / T.Kipf & M.Welling(ICLR2017)" / 2019

リンク

https://proceedings-of-deim.github.io/DEIM2021/papers/H21-2.pdf

sh19910711 2023/05/14

"グラフニューラルネットワークを用いたスプレッドシートの見出し認識 / セルの視覚的な情報（文字列や値，罫線など）をノード特徴とするグラフ / 統計表における見出しとその階層関係の認識（見出し認識）" / DEIM2021

リンク

Graph Convolutionを自然言語処理に応用する Part3

Graph Convolutionを自然言語処理に応用するための調査Part3となります。 Part3では理論/実装から少し離れ、グラフ構造を扱うタスクの種類について整理します。具体的には、タスクとそのタスクにおけるinputとoutput(prediction)を整理します。これにより、応用しようとしている問題(自然言語処理)をどんな「グラフ構造を扱うタスク」に変換できるのかを考えられるようにします。理論・実装編であるPart2についてはこちらをご参照ください。グラフ構造を扱うタスクの種類グラフ構造を扱うタスクは、以下のように整理できます。 Structured deep models: Deep learning on graphs and beyond p12よりNode Classification: グラフのノードについて、そのクラスを分類するGraph Classificat

sh19910711 2023/04/12

2018 / "ノード、エッジに関するタスクについてはTransductiveとInductiveという概念があります / 学習データ中にあるけれども、ラベルがついてないデータについて予測するものがTransductive"

リンク

Graphviz で歌詞を可視化してみる - Λάδι Βιώσας

昨日の続きです。Graphviz で何か面白い事を出来ないかなあ、と考えて、ミクシーのマイミクリスト相関図とか、エログサイトのサイト間リンクを可視化とか色々考えて作ってみたりしたものの、どれもありふれてるネタのような気がして今イチな感じ。で、、、今日ふと旧友に会ったら、最近 Perfume を聞いてる、という話を聞きました。そこで、おーそうだ歌詞を可視化（ダジャレ）してみたら面白いんじゃないか（←ダジャレが）と思いついたので、早速作ってみた。コードはこんな感じ。 # -*- coding: utf-8 -*- require 'MeCab' require 'kconv' require 'rubygems' require "graphviz" c = MeCab::Tagger.new("-O wakati") lyrics = open(ARGV[0]).read.toutf8

sh19910711 2023/03/27

2008 / "歌詞を可視化（ダジャレ）してみたら面白いんじゃないか / 歌詞の通り、面白いように繰り返してる様がみてとれます"

リンク

Product Knowledge Graph Embedding for E-commerceを読んだ - Qiita

また、提案手法ではcomplementの関係を複雑に分けていないため、アクセサリーも付属品も拡張もアドオンも全てcomplementになる。 (Remote control, complement, TV): accessory (TV mount frame, complement, TV): structural attachment (Audio speaker, complement, TV): enhancement (HDMI Cable switcher, complement, TV): add-on モデル構造基本的にはword2vecのアナロジーとして考える。 word2vec(skip gram)の場合は、ある単語を入力し、その周辺単語の予測確率が高くなるように学習を行う。提案手法では6つのrelationをタスクとして扱う。商品の入力ベクトルを各タスクで共有し

sh19910711 2023/03/24

2020 / "Walmart LabsがWSDM2020で発表 / word2vec, Transformerを模した構造や、Poincare Embeddingを用いたECに特化したKnowledge Graph Embeddingの手法を提案 / 検索行動などのユーザ行動とdescriptionなどの製品情報の両方から学習 / arXiv: 1911.12481"

リンク

igraph + Pythonによるネットワーク分析

世の中の様々なシステムは、"グラフ"で表現することが可能だ。例えば、SNSにおける人の繋がりは、人を点（ノード）、人との関係を線（リンク）として、グラフが描ける。同様に、交通網、インターネット、プログラムのソースコード、脳内の神経回路なども、ノードとリンクでグラフとして表現することが出来る。システムをグラフとして表現することで、グラフ理論の観点からシステムを解析・分析することが可能となる。その結果、何らかの新しい知見が得られる可能性がある。例えば、人の繋がりでは、最も発言力のある人間を、定量的に示すことが出来るし、交通網では渋滞などを迂回しつつ最短な経路を計算することも可能となる。システムをグラフとして表現し、解析するためのプログラミングライブラリに、igraphがある。igraphは、2006年から開発・公開されている、C/Python/R用のグラフライブラリであり、現在、ハーバード

sh19910711 2023/03/19

2015: Python版あったのか / "igraph: 2006年から開発・公開されている、C/Python/R用のグラフライブラリ / ハーバード大学のGabor Csardi氏と、エトヴェシュ・ロラーンド大学のTamás Nepusz氏の二人によって、開発・保守が行われている"

リンク

数理輪講で Anchor Graph Hashing の紹介をしてきました

今回は来週開催される ICML 2011 の論文 Hashing with Graphs の紹介です。Anchor Graph Hashing (AGH) という近傍探索のための最新のハッシング手法を提案しています (なんでアルゴリズム名をタイトルにしなかったんだろう……)。一応スライドを読めばなんとなくわかるんじゃないかと思います。 AGH は Spectral Hashing (SH) と同じ最適化問題を考えていて、それを解いてから out-of-sample extension の話に持っていくという流れも同じです。違うのは最適化問題を低ランク近似して解くところと、そのおかげで Nyström method という手法が使えて、SH みたいに分布に変な仮定を置いて固有関数問題をガリガリ解かなくて済むところ。データの次元、データ数のそれぞれについて線形時間のアルゴリズムになっています。

sh19910711 2023/03/04

2011 / "Anchor Graph (ICML2010): 良い性質をたくさん持っていて、アンカーを用いたマルコフ連鎖的な解釈もあって、ハッシング以外にもいろいろ使えるんじゃないか"

リンク

ChatGPTでdot言語を使って図解してみた結果ーエヴァンゲリオンの関係図編ー｜AIの使い手

ChatGPTでdot言語を使った手順1. dot言語で図解したい内容を事前に質問まず、いきなりdot言語で図解させると想定外の内容で関係図を書く可能性が高いので、一度テキストでChatGPTに整理してもらいます。今回はエヴァンゲリオンの登場人物の関係図を書いてもらうので、最初に登場人物たちの関係をテキストで質問しました。 ChatGPT2. dot言語で図解するよう指示次に、テキストで聞いた登場人物の関係をdot言語で図解するように指示します。 ChatGPT3. dot言語のコードで図解を表示最後に、ChatGPTが出力したコードをdot言語用のサイトへ貼り付けて表示させます。 dreampuf.github.ioChatGPTでdot言語を使って図解してみた結果エヴァンゲリオン登場人物の関係図ChatGPTでdot言語を使って図解したエヴァンゲリオン登場人物の関係図は以上です。

sh19910711 2023/02/28

"登場人物の関係図 / いきなりdot言語で図解させると想定外の内容で関係図を書く可能性が高いので、一度テキストでChatGPTに整理してもらいます / 次に、テキストで聞いた登場人物の関係をdot言語で図解するように指示"

リンク

はてなブックマーク

タグ

関連タグで絞り込む (72)

graphに関するsh19910711のブックマーク (239)

お知らせ

今週のはてなブックマーク数ランキング（2024年6月第3週）

今週のはてなブックマーク数ランキング（2024年6月第2週）

月間はてなブックマーク数ランキング（2024年5月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス