Social Network を活用するには自分の興味にあったアカウントをフォローすることが大事です.そのために重要な役割を果たすのが「おすすめユーザ推薦 (friend recommendation)」です.
Social Network を活用するには自分の興味にあったアカウントをフォローすることが大事です.そのために重要な役割を果たすのが「おすすめユーザ推薦 (friend recommendation)」です.
去年に Twitter で Kentaro Hara さんが紹介していた Googleの2億行のソースコードを解析した結果、関数に渡す引数の順番を間違える系のバグは、引数の個数が6個以上になったときに著しく増えるので、引数の個数は5個以下が望ましいことがわかったという話。 Andrew et al. の Detecting Argument Selection Defects を読んだ。 題名の通り「引数の渡し間違いによるバグを見つける」ことに挑んだ論文で、著者らは提案しているアルゴリズムを Error Prone のパターンとして実装し、Google 社内のみならず、オープンソースソフトウェアにもバグを報告、実際に修正させている。ここでの「オープンソースソフトウェア」には、なんと OpenJDK の ConcurrentHashMap も含まれている。 アルゴリズムはわかりやすい。引数の
前置き この記事を書いているのは、RDBMSすらろくに扱ったことの無いド素人なので、内容はあまり鵜呑みにしないでください。ご指摘は大歓迎です。 グラフDBとは グラフ構造(有向グラフ)を格納するのに特化したデータベースのことです。一番有名なものだと Neo4j、その他にはAmazon Neptune、ArangoDBなどがあります。 グラフDBのなにがうれしいの? グラフから情報を取り出すことに特化したクエリ言語(RDBMSにおけるSQL的なもの)を備えているので、自分でいちいちアルゴリズムを組まなくてもよくなります。 JanusGraphって何? Linux Foundationの元で開発されているオープンソースのグラフDBです。元はTitanGraphという名前の個人プロジェクトでしたが、そこからforkされ開発が続けられています。2017年4月にversion0.1がリリース、202
テラーノベルで機械学習を中心に担当している川尻です。最近、グラフニューラルネットワーク(GNN)に注目しており、サーベイや検証をしております。以前にも以下の記事を書きました。 複雑なアルゴリズムを適用する前に、当たりをつけたり、結果を確認したりするためには、可視化が重要です。本記事では、いくつかあるグラフの可視化ツールの中でも、大規模なネットワークでも簡単に使えるCosmographを紹介し、テラーノベルのデータを使って可視化してみます。 Cosmographとは グラフデータを可視化するツールはたくさんありますが、もっとも有名なのはgrapgvizです。graphvizにはsfdp[1]という大規模なデータに対応したアルゴリズムが用意されていますが、ノード数が10k以上のような大規模なグラフになると計算時間もかなりかかって、パラメータ調整も大変になります。 Cosmographは、Web
NLP若手の会 (YANS) 第18回シンポジウム (2023) チュートリアル https://yans.anlp.jp/entry/yans2023 松井 勇佑(東京大学)https://yusukematsui.me/ 近似最近傍探索とは、「似ているベクトルを探す」というシンプルかつ基盤的な技術である。近傍探索技術は古くから様々な分野で研究が進められてきたが、現在でも活発に技術革新が進んでいる。近年ではCLIPを用いたマルチモーダル検索や、埋め込み探索によるLLMへの知識追加方式として、近傍探索技術は注目を集めている。本チュートリアルでは、特に2010年代後半から目覚ましく発展を遂げ、多くのVector Databaseのバックエンドにもなっている「グラフを用いた探索方式」に焦点を当て、その理論と応用について解説する。
以前、以下の本を読んで人と人とのつながりが組織のパフォーマンスに影響するということを知り、ちょうど勉強会が開催されたので無理をお願いして参加させていただきました。 データの見えざる手: ウエアラブルセンサが明かす人間・組織・社会の法則 作者: 矢野和男出版社/メーカー: 草思社発売日: 2014/07/17メディア: 単行本この商品を含むブログ (24件) を見る 職場の人間科学: ビッグデータで考える「理想の働き方」 作者: ベン・ウェイバー,千葉敏生出版社/メーカー: 早川書房発売日: 2014/05/23メディア: 単行本この商品を含むブログ (3件) を見る 以下メモ people analytics tokyo #1 - connpass 趣旨説明: People Analytics Tokyoについて なぜ開催したのか People Analyticsの参考資料 People
技術本部 Data Science Center の武内です。普段は、メディアサービスのデータ分析業務に携わっております。 今回は、2022年8月23-25日に同志社大学で開催された「ネットワーク科学研究会2022」に弊社から2名が参加しポスター発表を行いましたのでレポートしたいと思います。 ネットワーク科学研究会について ネットワーク科学研究会は、「ネットワーク」を研究キーワードにもつ学生・若手研究者を中心に構成され、分野横断的な情報共有の場を提供することを目的とし、毎年開催されています。今回は現地+オンラインのハイブリッド形式で開催され、約120人の参加登録があり、現地参加は50人を超えたそうです。 例年、口頭講演とポスター講演があります。分野横断的な交流を目的に掲げていることもあり、口頭講演では異分野の人にもわかりやすく研究背景が説明され、いつも大変勉強になっています。ポスター講演は
「ソフトウェア・ファースト」を読んで、改めて、アジャイル開発はSaaSの開発プロセスを発展させたものとみなすのだと考えた。 ラフなメモ書き。 【参考】 ソフトウェア・ファーストの感想: プログラマの思索 【1】「ソフトウェア・ファースト」を読むと、製造業などの一般産業は、SaaSのようにどんどんサービス化すべきだ、という主張が背景にあるのが分かる。 では、SaaSというビジネスモデルの特徴や本質は何だろうか? この問いに自分なりに考えてみたら、複数の特徴があるように思う。 【2】SaaSはScrumと相性が良い。 たとえば、パッケージ製品ビジネスや大量生産ビジネスでは、たくさん作って販売してそれで終わり。 一括請負契約で作って納品したら終わり。 顧客とメーカーは、クライアント-ベンダー-アンチパターンにはまりやすい。 「クライアント-ベンダーアンチパターン」という根本問題: プログラマの思
本記事では「Neural Graph Collaborative Filtering (NGCF)」と呼ばれる、グラフ構造を使った推薦システムの手法を自分で実装して論文の再現実験をしてみたことについて書きます。近年の推薦システムの研究では、ユーザーとアイテムの特徴量だけでなく、ユーザーとアイテム間の関係性を考慮した手法が注目されています。NGCFもその一つで、ユーザーとアイテムのグラフ構造を学習することで、より高い精度で推薦を行うことができます。本記事では、まずNGCFの手法や特徴について解説し、その後に実装と再現実験の方法を紹介します。 Neural Graph Collaborative Filteringとは? NGCFの特徴 実装 結果 感想 おまけ Neural Graph Collaborative Filteringとは? NGCFは、SIGIR'19 に採択された論文「Ne
テラーノベルで機械学習を中心に担当している川尻です。最近、グラフニューラルネットワーク(GNN)に注目してサーベイしています。今回は、実際のテラーノベルのデータを簡単なモデルに適用してみたので報告します。 グラフニューラルネットワーク (GNN) グラフニューラルネットワーク(GNN)とは、グラフ理論において対象を「ノード」と「エッジ」からなる「グラフ」として扱うためのニューラルネットワークの一種です。例えば、テラーノベルにおいては、ノードがユーザーや作品の一つ一つを表し、エッジが「読んだ」「いいね」「フォロー」などを表します。ディープラーニングの発展に伴い、GNNの研究も盛んになっており、大規模なデータや様々なタスクに適用されるようになっています[1]。 テラーノベルでのグラフの例 arxivで投稿された年ごとの「Graph Neural Network」がタイトルに含まれている件数 G
次期 Oracle Database 開発者向け無料版「Oracle Database 23c Free」が 2023年4月3日 に提供開始されました。このリリースは SQL の最新仕様(SQL:2023)に含まれる Property Graph 文法をサポートしているので、早速使ってみます。 ここでは、以前の記事「銀行の送金データをグラフで分析する」のデータを用います。以前の記事では SQL と別の言語である PGQL を用いてクエリを試していますが、この記事では SQL でグラフのパターンを記述します。 詳細は Oracle Database 23c Free のドキュメント の Property Graph Release 23.2 に解説されています。SQL Property Graphs の項をご参照ください。 Oracle Database 23c の起動 Docker または
この記事では、電力網のネットワーク、交通網のネットワーク、人間関係のネットワーク、神経ネットワーク、遺伝子ネットワークのようなネットワークシステムの性質を解析する際に重要なグラフラプラシアンについて解説します(枝に向きのないネットワークだけ解説します)。 グラフ、隣接行列、次数行列 下図のように節点と枝から構成されるネットワークを数学的に表現するには、グラフという概念が役立ちます。 グラフとは、節点の集合 と枝の集合 の組 のことです。例えば上のネットワークだと節点集合が で枝集合が です。このように なら が成り立つグラフを正確には無向グラフといいます(この記事では、無向グラフだけを説明します)。節点は頂点、枝は辺とも呼ばれます。 上のグラフはそれぞれの枝が同等の重要度を持っているとすると、次のような行列で表現できます。 つまり、上のグラフは枝 が存在するので行列の 成分と 成分のところ
概要 GNNは, 信号処理の観点でローパスフィルタの効果を持っている. そして, GNNが通常のMLPに比べて高精度となるようなデータでは, 低周波成分に(タスクに関して)有用な情報が多く含まれており, 高周波成分には無駄な情報が多いようなケースになっているように見受けれられる. また, 実際にタスクの精度を様々なフィルタで比較すると, 信号処理の観点での性質が反映された結果を与えている. GNNの最も大きな役割(通常のMLPとの違い)は, ローパスフィルタとしての性質の影響なのではないかと考えられる. 逆に言うと, ローパスフィルタとしての性質が生かせるようなデータが, GNNの効果が最も期待出来るものなのではないかと考えられる. 内容 はじめに GNNとはどのようなものだったか? 信号処理のいくつか GNNのローパスフィルタとしての役割 まとめ 1. はじめに Graph Neural
Graph Convolutionを自然言語処理に応用するための調査Part3となります。 Part3では理論/実装から少し離れ、グラフ構造を扱うタスクの種類について整理します。具体的には、タスクとそのタスクにおけるinputとoutput(prediction)を整理します。これにより、応用しようとしている問題(自然言語処理)をどんな「グラフ構造を扱うタスク」に変換できるのかを考えられるようにします。理論・実装編であるPart2についてはこちらをご参照ください。 グラフ構造を扱うタスクの種類グラフ構造を扱うタスクは、以下のように整理できます。 Structured deep models: Deep learning on graphs and beyond p12よりNode Classification: グラフのノードについて、そのクラスを分類するGraph Classificat
昨日の続きです。Graphviz で何か面白い事を出来ないかなあ、と考えて、ミクシーのマイミクリスト相関図とか、エログサイトのサイト間リンクを可視化とか色々考えて作ってみたりしたものの、どれもありふれてるネタのような気がして今イチな感じ。 で、、、今日ふと旧友に会ったら、最近 Perfume を聞いてる、という話を聞きました。そこで、おーそうだ歌詞を可視化(ダジャレ)してみたら面白いんじゃないか(←ダジャレが)と思いついたので、早速作ってみた。 コードはこんな感じ。 # -*- coding: utf-8 -*- require 'MeCab' require 'kconv' require 'rubygems' require "graphviz" c = MeCab::Tagger.new("-O wakati") lyrics = open(ARGV[0]).read.toutf8
また、提案手法ではcomplementの関係を複雑に分けていないため、アクセサリーも付属品も拡張もアドオンも全てcomplementになる。 (Remote control, complement, TV): accessory (TV mount frame, complement, TV): structural attachment (Audio speaker, complement, TV): enhancement (HDMI Cable switcher, complement, TV): add-on モデル構造 基本的にはword2vecのアナロジーとして考える。 word2vec(skip gram)の場合は、ある単語を入力し、その周辺単語の予測確率が高くなるように学習を行う。 提案手法では6つのrelationをタスクとして扱う。 商品の入力ベクトルを各タスクで共有し
世の中の様々なシステムは、"グラフ"で表現することが可能だ。例えば、SNSにおける人の繋がりは、人を点(ノード)、人との関係を線(リンク)として、グラフが描ける。同様に、交通網、インターネット、プログラムのソースコード、脳内の神経回路なども、ノードとリンクでグラフとして表現することが出来る。 システムをグラフとして表現することで、グラフ理論の観点からシステムを解析・分析することが可能となる。その結果、何らかの新しい知見が得られる可能性がある。例えば、人の繋がりでは、最も発言力のある人間を、定量的に示すことが出来るし、交通網では渋滞などを迂回しつつ最短な経路を計算することも可能となる。 システムをグラフとして表現し、解析するためのプログラミングライブラリに、igraphがある。igraphは、2006年から開発・公開されている、C/Python/R用のグラフライブラリであり、現在、ハーバード
今回は来週開催される ICML 2011 の論文 Hashing with Graphs の紹介です。Anchor Graph Hashing (AGH) という近傍探索のための最新のハッシング手法を提案しています (なんでアルゴリズム名をタイトルにしなかったんだろう……)。一応スライドを読めばなんとなくわかるんじゃないかと思います。 AGH は Spectral Hashing (SH) と同じ最適化問題を考えていて、それを解いてから out-of-sample extension の話に持っていくという流れも同じです。違うのは最適化問題を低ランク近似して解くところと、そのおかげで Nyström method という手法が使えて、SH みたいに分布に変な仮定を置いて固有関数問題をガリガリ解かなくて済むところ。データの次元、データ数のそれぞれについて線形時間のアルゴリズムになっています。
ChatGPTでdot言語を使った手順1. dot言語で図解したい内容を事前に質問まず、いきなりdot言語で図解させると想定外の内容で関係図を書く可能性が高いので、一度テキストでChatGPTに整理してもらいます。 今回はエヴァンゲリオンの登場人物の関係図を書いてもらうので、最初に登場人物たちの関係をテキストで質問しました。 ChatGPT2. dot言語で図解するよう指示次に、テキストで聞いた登場人物の関係をdot言語で図解するように指示します。 ChatGPT3. dot言語のコードで図解を表示最後に、ChatGPTが出力したコードをdot言語用のサイトへ貼り付けて表示させます。 dreampuf.github.ioChatGPTでdot言語を使って図解してみた結果 エヴァンゲリオン登場人物の関係図ChatGPTでdot言語を使って図解したエヴァンゲリオン登場人物の関係図は以上です。
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く