タグ

2021年8月7日のブックマーク (11件)

  • グラフの中心でAIを叫んだノード(なおAIは出ない) 〜あるいはnode2vecに至るグラフ理論〜 - Pseudo Theory of Everything

    1 イントロダクション 記事を読む前に、章を読んでください。書いていくごとに、とにかくボリュームが多くなりました。 章では「グラフとは何か?」と「記事で扱うこと・扱わないこと」をまとめています。非常にボリューミーなので、自身の必要な知識・不要な知識を取捨選択して読んでいただくことをお勧めします。 1.1 そもそもグラフ理論とは まず第一に、 グラフ理論は図示とは全く別のもの です。 恥ずかしながら、ある勉強会でグラフ理論のタイトルで話す登壇者の方がいて「より良い図示の方法をまとめたトークかなにかかな。」と思っていました(無事、話を聞いて「あぁ、そっちね。」となりました)。 ブログの著者ふたりとも物理出身の門外漢故広い心で見守ってくれればと思います。 グラフ理論とは相互に関係し合うネットワークを数学的に扱う一学問です。 下記のようなシンプルなグラフネットワークの例を考えます。例えば

    グラフの中心でAIを叫んだノード(なおAIは出ない) 〜あるいはnode2vecに至るグラフ理論〜 - Pseudo Theory of Everything
  • node2vecの論文紹介 - GMOインターネットグループ グループ研究開発本部

    こんにちは次世代システム研究室のJK(男)です。最近グラフデータに興味を持ちつつあるので、今回は気になった論文の簡単な紹介をします。紹介する論文はnode2vecです。 グラフデータとは、ノード(頂点)とノード間の連結関係を表すエッジ(枝)で構成されるデータ構造のことです。エッジに重み(どのくらい強く結びついているか)の情報が付加される場合もあります。たとえば、Facebookのユーザー(ノード)とユーザー間の友達関係(エッジ)をつなげていくと、巨大なグラフができますね。あとよく言われるのは、空港(ノード)とその間をつなぐ航路(エッジ)とか。ハブ空港という単語を聞くこともあると思いますが、たくさんのエッジを持っている空港と解釈できます(=多くの空港からの発着便がある)。グローバル化・IT化による物理空間・デジタル空間でのつながりが広がるなか、グラフデータの理解はこれからますます重要になって

    node2vecの論文紹介 - GMOインターネットグループ グループ研究開発本部
  • 疎行列の表現方法 その1 Matrix Market - xxxxxeeeeeのブログ

    現在疎行列ベクトル積のプログラムを書く途中なので、よく使われる疎行列の表現形式の一つである(らしい)Matrix Market形式(略してMMらしい)のリファレンス*1を参照しつつ適当に翻訳っぽいものをしてみる。 Introduction 疎行列の座標形式(Coordinate Format) 行列の座標形式は非ゼロ成分だけを座標を明示的に示しつつ列挙するもので、疎行列の表現に適している。下に一般の実疎行列の例をあげる。 これをMM座標形式では次のように表す。 %%MatrixMarket matrix coordinate real general % A 5x5 sparse matrix with 8 nonzeros 5 5 8 1 1 1.0 2 2 10.5 4 2 250.5 3 3 0.015 1 4 6.0 4 4 -280.0 4 5 33.32 5 5 12.0 最初

    疎行列の表現方法 その1 Matrix Market - xxxxxeeeeeのブログ
    sh19910711
    sh19910711 2021/08/07
    "よく使われる疎行列の表現形式の一つである(らしい)Matrix Market形式(略してMMらしい) / 行は3つの整数からなり、それぞれ行数、列数、非ゼロ要素数を示す"
  • [UPDATE] Amazon Redshift Concurrency Scailing(同時実行スケーリング)が書き込みクエリをサポート、更に進化したオートスケールを実際に試してみました! | DevelopersIO

    [UPDATE] Amazon Redshift Concurrency Scailing(同時実行スケーリング)が書き込みクエリをサポート、更に進化したオートスケールを実際に試してみました! データアナリティクス事業コンサルティングチームの石川です。先日、Amazon Redshift の Cluster Version 1.0.28965からConcurrency Scailing(同時実行スケーリング)が、INSERT、DELETE、UPDATE、COPYの書き込みクエリを追加サポートしました。書き込みクエリのサポートによって、ワークロードに応じて素早くスケーリングできるので、よりサーバレスのような従量課金に近い利用が可能になりました。今回はELTワークロードで最も利用頻度の高いINSERT INTO SELECTを同時60クエリで試してみます。 Concurrency Scai

    [UPDATE] Amazon Redshift Concurrency Scailing(同時実行スケーリング)が書き込みクエリをサポート、更に進化したオートスケールを実際に試してみました! | DevelopersIO
    sh19910711
    sh19910711 2021/08/07
    "Concurrency Scailing(同時実行スケーリング)が書き込みクエリをサポート / サーバレスのような従量課金に近い利用が可能 / Scailing Clusterよって実行されたクエリは、3倍以上のレスポンスの向上が確認できました"
  • Mr.Childrenの歌詞分析(4): 単語の意味を考慮した、シングル曲のクラスタリング - Tech Blog

    主結果 Mr.Childrenのシングル曲を、歌詞を元にクラスタリングしてみました。 1.単語ベースのクラスタリング 2.概念ベースのクラスタリング 考察 評価 共通する単語や概念を赤字で書いてみました。単語ベースでは、「時代」「社会」や「幸せ」についてきちんとクラスタが形成されていて、いいかんじです。一方で、概念ベースはパッとしないですね。。正解がないので評価はしにくいですが、どちらかと言えば単語ベースのほうがしっくりくる気がします。来であれば、好調/不調、前向き/後向き、恋愛/社会といった形で分かれてほしかったのですが。さらに言えば、「君が好き」と「抱きしめたい」、「Sign」と「しるし」がくっついてほしいところでした。(関係ないですが、「Mr.Children「Sign」から「しるし」についての解説」では、「Sign」と「しるし」の関係が記号論を交えて述べられていて、とてもおもしろ

    Mr.Childrenの歌詞分析(4): 単語の意味を考慮した、シングル曲のクラスタリング - Tech Blog
    sh19910711
    sh19910711 2021/08/07
    "歌詞のクラスタリングの難しさ > テキストが短いため1つのドキュメントにおける情報量が少ない + 結果が「水」や「光」といった分類ではなく「期待」「悲観」「勇気」といったより心理的な分類"
  • UXが生まれる過程とUXがUIにもたらす影響について考えてみる。 - atelier:mitsuba

    「コードは思ったとおりには動かない、書いたとおりに動く」とはよく言われますが、 UIの分野では「ユーザは思ったとおりには操作しない、見えたように操作する」と言えるでしょう。 つまりUIは操作前に「なにをどうしたらどうなるか」を見える化で提示していることだと言えます。 一方でUXは、ユーザの体験を元に、「なにをしたときどうあるべきか」といった期待に応えることであり、行動に依存します。 期待→行動→結果が1つのストーリーになって、体系化されたときに初めて、そのストーリーがUXと呼ばれると思っています。 さらに、UXは行動と結果に繋がるものであって、見た目には依存しません。 なにが言いたいかというと、 「UIは提案したいUXを視覚的に表現して、UXがユーザに一般化されれば、UXを表現してきたUIはもっとシンプルになれる」 ということです。 具体的な例を出してみましょう。 Windows 7の画面

    UXが生まれる過程とUXがUIにもたらす影響について考えてみる。 - atelier:mitsuba
    sh19910711
    sh19910711 2021/08/07
    "「コードは思ったとおりには動かない、書いたとおりに動く」とはよく言われますが、UIの分野では「ユーザは思ったとおりには操作しない、見えたように操作する」"
  • AtCoderでアルゴリズムの勉強をして効率性でつまづいている

    sh19910711
    sh19910711 2021/08/07
    "なかなか解けない問題で、なぜ解けないのかがわからない / 問題を起こす(TLEになる)ようなデータを自分で探り当てることも何度かやったが、異常に時間がかかってしまうし、心が折れやすい"
  • 網設計のためのBGP入門

    Internet Week2015 「できる網設計」 で,クラウドとオンプレミスを接続してハイブリッド構成にしたときのネットワーク設計について話しました. https://internetweek.jp/program/t3/

    網設計のためのBGP入門
    sh19910711
    sh19910711 2021/08/07
    2015 / "BGP: パケット転送先を探すプロトコル / AS_PATH が短い = 近い = そっちに転送したほうがよい / 『インターネット ルーティング入門』"
  • 株式会社ALBERT(レコメンドエンジン)

    データ分析から導き出されたインサイト無しにAI人工知能)の活用は始まりません。私たちは、各業界知識とデータ・アナリティクス技術を駆使しデータドリブン経営を強力に支援します。 データ、アナリティクス、AIは企業にとって競合他社との差別化を図るかつてないほど大きな要因になっています。今日の経営幹部が効率を向上しながら新たな収益源を開拓し、新しいビジネスモデルをタイムリーに構築する方法を模索する中、価値を生み出し成長を続ける企業には「データ活用」という共通項があります。私たちは、無数のデータから企業にとって当に必要なデータを活用するための方法を知っています。 将来を見据えたオペレーション体制を備えている企業の半数以上(52%)は、すでにデータとアナリティクスを大規模に活用しています。データとAIに関する取り組みをビジネス戦略に沿って実施することで投資利益率を迅速に最大化し、最終的にはAIをビ

    株式会社ALBERT(レコメンドエンジン)
  • 人を集めたからといってすぐ機能するわけじゃないという話 | Ryuzee.com

    日々採用や組織がうまく動くように苦労しているみなさんこんにちは。@ryuzeeです。 ひとりで色々な物事を完結できればこんな楽なことはないのですが、特にシステム開発においてそのような規模のものは多くなく、たいていの場合複数人を集めてプロジェクトを遂行することになります。特に案件ベースで体制を作るシステムインテグレーターなんかを思い浮かべて頂くとわかりやすいかもしれません。 さて、そうやって集められた「人たち」はいきなりうまく機能して、プロジェクトのゴールに邁進できるようになるのでしょうか?というと残念ながら答えはノーです。 以下の図は、心理学者のタックマンが提唱する「タックマンモデル」と呼ばれるチーム(集団)の進化形態をあらわしたものです。 これによると、チームは以下のようなステップを経て変遷していきます。 形成期とりあえず人が集められた段階でお互いのことを知らない。なぜ集められたのか、自

    人を集めたからといってすぐ機能するわけじゃないという話 | Ryuzee.com
    sh19910711
    sh19910711 2021/08/07
    "タックマンモデル: チーム(集団)の進化形態 / ステージが前半であるほどスクラムマスターやファシリテーターといった支援者が必要 / 個人的には飲み会でチームビルディングできるとはまったく思っていない"
  • 論文の読み方 - 発声練習

    自分の知識が足りないからわからないというのも正解なのだけれども、もう一つ重要な視点を忘れないようにしてください。あなたが読もうとしている文章自体がろくなものではないという可能性を。卒論や修論はどれぐらい丁寧に指導されていたとしても、ある程度は間違いが含まれている可能性が高いです。ですから、卒論や修論を鵜呑みにする(卒論や修論にかかれていることは絶対に正しいとする)のはいけません。場合によっては、ちゃんと査読を通った国際会議論文や学術雑誌論文でも、間違いが含まれている可能性があります。もちろん、専門書も。 自分のことは一度棚にあげて、「良いか悪いかは別として、わからんもんはわからないんだ。」と考えて文献調査をすることが重要です。「〜がわからないのは恥ずかしい」というのは、まあ、そうでしょうが、わからないもんはわからないですし、今現在わからないんですから、素直に知っている人に教えを請いましょう

    論文の読み方 - 発声練習
    sh19910711
    sh19910711 2021/08/07
    "「良いか悪いかは別として、わからんもんはわからないんだ。」と考えて文献調査をすることが重要 / 概要を一通り読んで理解できない事柄をピックアップ / 理解できない事柄の答えが載っているかどうかを探す"