sh19910711のブックマーク / 2021年5月8日

ネットワーク可視化周辺の現状 1

はじめに最近、私も一章参加した本が出版されましたが、「現在どんなツールがあり、そのツールで何ができるのか？」を紹介することが主眼に置かれています。そのため、本文に収録されている多数のツールを用いて、紹介してあるような図を作成できるようになったのち、さらにその先に進むにはどうすれば良いのか、すなわち、初心者を脱した後にどのように学習すれば良いのか、という部分に関しては、ページ数の関係もあり、あまり踏み込むことはできませんでした。そこで本稿は、私の担当分野であるネットワーク可視化の部分に絞って、基本的な図が作成できるようになったのち、さらに複雑な可視化を行えるようになるにはどうすれば良いのかを学ぶ場合のガイドとして書きました。また、2019年現在におけるツールの整備状況や、ブックガイドとしても利用できるようにする予定です。本稿の対象とする読者この記事は、ネットワーク可視化のごく基本的な部分は

sh19910711 2021/05/08

リンク

はじめての自然言語処理 spaCy/GiNZA を用いた自然言語処理 | オブジェクトの広場

前回は BERT についてその概要と使い方を紹介しました。今回は自然言語処理ライブラリである spaCy と spaCy をフロントエンドとする日本語NLPライブラリの GiNZA について紹介します。 1. 始めに本記事では欧米で有名な自然言語処理ライブラリである spaCy とリクルートと国立国語研究所の共同研究成果である日本語NLPライブラリ GiNZA について紹介します。記事の前半では、spaCy と GiNZA の概要と日本語を処理する際の基本的な機能／操作について説明します。後半では、spaCy で提供される文章分類機能について、前回までに紹介した手法も含めて精度を比較してみます。 2. spaCy と GiNZA の概要 spaCy は Explosion AI 社の開発する Python/Cython で実装されたオープンソースの自然言語処理ライブラリで MIT ライセ

sh19910711 2021/05/08

"異なる言語でも spaCy で解析すれば、その後に続く処理を同一ロジックで対応できる / 2019年4月にリクルートと国立国語研究所の研究成果である GiNZA が登場 / 早い話が spaCy を日本語で利用できるようになった"

リンク

kaggle expertになるために必要だと思うこと｜ざこぷろ

私事ですが、2019 Data Science Bowlで2つ目の銀メダルを獲得しkaggle expertになることができました。(１つ目はIEEE-CIS Fraud Detection) なぜこの記事を書くのか① kagglerが増えてほしいから。 ② - ○ヶ月でkaggleで銀メダルをとった話 - ○ヶ月でkaggle expert(master)になった話 - kaggle expert(master)になるまでの記録などのような記事がググればたくさん出てきますが、自分が実際にやってきてメダルを取るにはもっと大事なことがあるんじゃないかと思ったからです。 ※本記事では具体的な手法や技術については記載しません。 kaggleでメダルを取る上で大事なことは？具体的な手法や取り組んだことが注目されますが私はそれよりも大事なことがあると思ってます。それは、継続するモチベーションです。

sh19910711 2021/05/08

"kaggleは非常に面倒 / 面倒臭がらずに検証をしてみるのが大事 / どこかのkagglerの記事で「思いついたことは全部試す」というのを見たことがありますが、それが本当に大事です"

contest

リンク

月間38億ＰＶを支える“チームの力”とは [片桐孝憲] | ISSUES | WORKSIGHT

起業を思い立ったのは高校生のときなんですよ。親元を離れて一人暮らしをしていたせいか、いつも友だちが家に遊びに来てくれました。みんなで将来のことを考えたり、他愛もない話で盛り上がったり。それが無性に楽しかったんですね。こういう状態をずっと続けるにはどうすればいいだろうと考えて、思いついたのが会社を作ることでした。 23歳で起業して、最初はホームページ制作や企業システムの受諾開発をしていたんですが、営業力や技術力も実績もなかったので、しんどい割に儲からない。このままだと一緒に働いている人が辞めてしまうのではないかと心配になりました。どうせやるなら人気があるモノを作りたかったし、すごいチームを作りたかった。すごいチームを作るためには、すごいプロダクトが必要だと思いました。それでできたのが「pixiv（ピクシブ）」だったんです。コミュニティが少しずつでも着実に成長していくことが重要 pixivは

sh19910711 2021/05/08

"みんなでランチの行き先を考えているとき、「マクドナルドに行こう」と誰かが言うと、みんなが一斉に否決して、別の案が次々に出てくるというセオリー / 的外れな意見とか最悪のアイデアが自由に言える雰囲気が重要"

リンク

どんな映画や本よりも流れる風景こそが時の流れを緩やかなスピードに戻す - yuta25

圧縮アルゴリズムなんかと同様に、人の脳みその中はなるべくたくさんの物事を記憶するために差分以外は極力記憶しないようにできてる。だから記憶の総量が全然増えてない。俺の頭が全部で250GBの容量だとして、在宅勤務始まる2ヶ月ぐらい前まで220GBぐらいの使用率だったところ、この二ヶ月で2byteぐらいしか増えてない。

sh19910711 2021/05/08

"なぜ在宅勤務が続くと時間が早く感じるのか > 景色が変わらなかったり、やること、出会う人、何もかもが少ないので、記憶の差分がマジで減る / This is ワンループ。記憶は使い回せる。時間、一瞬ですぎる"

リンク

ニューラルネットにおける変数の初期化について - nykergoto’s blog

最近 keras をつかって色々とやることにはまってます。 tensorflow や chainer と比較して keras だとネットワーク記述から fit までが完結に記述できてとても気に入っています。そのときにドキュメントや実装を読んだりもしますが、ネットで自分がやりたいタスクで検索をかけて似たようなことをやっている人のコードを参考にしています。その時、keras レイヤーの重みの初期化の引数に he_normal というのを指定しているのを見かけました。ドキュメントを参照すればこの関数の定義式自体はわかりましたが、この関数が何をやってるのか、なぜこの関数にするとうれしいのか、平均0分散1のガウス分布ではだめなのか、ということがわからず困ってしまいました。ニューラルネットワークにおける変数の初期化の方法について全く知らなかったので、ちょうどいい機会とおもい各種論文を読んでみた

sh19910711 2021/05/08

"レイヤーの重みの初期化の引数に he_normal というのを指定しているのを見かけました / この関数が何をやってるのか、なぜこの関数にするとうれしいのか、平均0分散1のガウス分布ではだめなのか"

リンク

マップを書くだけでゲームが作れる環境が欲しかった - ABAの日誌

ので、テキストでタイルマップを書くとゲームになるrj-10ってのを作った。ブラウザで遊べる。これを作ろうと思ったのはPix64っていうファンタジーコンソールを見つけたから。Pix64は画像1枚を描くだけでゲームが作れる。ピクセルの色がプレイヤーとか敵とかの種別を決めているのと、矢印状のパターンを書くと矢印の方向にパターンが進むというルールを使ってゲームを作る。画像を描くのすら面倒な私は単にテキストを使うことにした。以下のようなテキストを書くと、 ----------- | v v o| r r g | | | | | | |@ ^ | c r ----------- 以下のゲームになる。テキストは基本レベルのタイルマップを表しているけど、途中のrとかgとかだけからなる列は特殊で、その上の列のテキストに色を付ける働きをする（redとgreen）。いくつかルールがある。色が付いたテキ

sh19910711 2021/05/08

"これを作ろうと思ったのはPix64っていうファンタジーコンソールを見つけたから / ピクセルの色がプレイヤーとか敵とかの種別を決めているのと、矢印状のパターンを書くと矢印の方向にパターンが進む"

リンク

「ソフトウェア設計とは何か？」がすごい - Lism.in * blog - nekoya (id:studio-m)

結構前のエントリになりますが、cles::blogさんで紹介されている「プログラミングは設計か製造か？」に感銘を受けました。はてブを見ていると、最近になってwebarchiveから発掘されたようです。ソフトウェア設計とは何か？原文はこちらで公開されている模様。 What Is Software Design? by Jack W. Reeves - developer.*, Developer Dot Star 全編にわたって非常に示唆に富んだ内容となっています。印象深かったトピックは以下。ソースコードは設計であり、ドキュメントであるソフトウェア開発における「製造」とはビルドである製造はコンパイラとリンカの仕事であり、コストは非常に小さいテストやデバッグは設計の検証と洗練のプロセスである他の工学分野のそれと等価で手を抜くべきでない「コーディング」「テスト・デバッグ」「（俗に

sh19910711 2021/05/08

"インターネットの発達によって得ることの出来る情報は爆発的に増えましたが、ネットが普及する以前の情報というのは実はそれほど充実していません。ネットに存在する「当時の生の声」はもっと評価されていい"

リンク

開発組織で重要なコンウェイの法則ともう一つの原則

原則を数個決めたら他のことはすべてそれらから導出されるような考え方が好きです。開発組織の設計あたってはコンウェイの法則というのがよく参照されます。コンウェイの法則：システム設計は、組織構造を反映したものになるコンパイラーを3チームで開発すると必ず３パスのコンパイラーになる、みたいな例を読んだことがあります。これが起こる理由は、チーム内でのコミュニケーションコストがチーム間のコミュニケーションコストよりも格段に低いためです。同じチームで開発するシステム内はコミュニケーションコストが低いため密結合になり、チーム間のシステム結合はコミュニケーションコストが高いため疎になっていきます。これを逆手に取って、最終的に実現したいシステムの形に合わせて組織を分けるのが逆コンウェイの法則です。大きな単位のシステム設計は、３年、５年、あるいはそれ以上の長期間に渡って影響を及ぼします。ここを間違うと

sh19910711 2021/05/08

"コンウェイの法則：システム設計は、組織構造を反映 > チーム間のシステム結合はコミュニケーションコストが高いため疎になっていきます / 逆コンウェイ > 最終的に実現したいシステムの形に合わせて組織を分ける"

*work
組織

リンク

BPFについて調べてみた - Toku's Blog

この記事は CyberAgent Developers Advent Calendar 2018 9日目の記事です。今回はBPFについてちょっと調べてみた。それのまとめ。落ちはない。なぜBPFを調べようと思ったのか要はBPFを調べようと思った動機をちょっと。唐突にはなってしまうが、Kubernetesの上に乗っかるService Meshに関するミドルウェア(Istio/Envoyあたり)などでネットワークのレイテンシが問題として話に出ることがそこそこある。基本的にService MeshのツールはコンテナのSidecarとして動作させ、Networkの通信をすべて見えるようにiptablesで自身にルーティングさせて、Proxyするように動作する。これの解説としてよく見るのは以下のような図だ。これ始めてみたときに個人的にはゾッとしたが(latency大丈夫なのか的な。)、実

sh19910711 2021/05/08

"tcpdumpのオプションで -d を使用するとBPFのプログラムが出力される。また、dの数を増やすと機械語まで落としてくれる / 既存のBPFはclassic BPF(cBPF)、拡張されたBPFをextended BPFやinternal BPFと呼ばれる"

リンク

美しいペアプロット図を簡単に作る - My Life as a Mock Quant

美しい描画を行うためのパッケージとして有名なggplot2の仲間？にGGallyパッケージなるものがあるらしく、その中のggpairs関数を使うとふつくしいペアプロットが楽に作成できる。できるのはいいんだが、この関数を使ってplotする際のフォントサイズ変更方法がググってもマニュアル読んでも出て来なかったのでメモっておく。例のごとく、パッケージは install.packages("GGally") でインストールしておく。肝心のフォントサイズの変更については、結論としてparams引数にlistとして入れればよく、各種フォントサイズについては size:散布図の点のサイズ（今回は使用してない） labelSize:各項目（列名）の文字サイズ corSize:相関値の文字サイズと対応しており、これらを所望のサイズに設定してやればOKだ。*1 実際にPLOTしてみると以下のような感じ

sh19910711 2021/05/08

リンク

Joy, Inc.を読んで、幸せなチーム作りを考えてみた - Unknown Error

私は日々、幸せな組織を作りたい、と思っています。幸せな組織とは、笑いに満ち溢れ、物事について真剣に議論し、困難なことも前向きに取り組んでいる組織です。自分の見ているチームメンバーが、主体的に動いて課題を解決していく姿を見ると、うれしくなります。逆に、モチベーションが下がって暗い表情を浮かべている人を見ると、チームに何か問題があるんじゃないか、何も言えない雰囲気になってしまっているんじゃないか、やらされ仕事になってしまっているんじゃないか、といろいろ考えてしまいます。これまでの経験上、良い状態のチームと良くない状態のチームをまとめると、以下の通りです。良い状態のチームお互いを尊敬出来ている特定の人物が特定の機能を担当していない助け合いが出来ている、困っている人を積極的に助けている現状に甘んじないメンバー同士でタスクの進捗に対して突っ込みを入れている自分たちでタスクを定義してい

sh19910711 2021/05/08

"HRTと、固定概念の壁を取り除きつつ適切なガードレールを敷く > コミュニケーションパスの整理、オープンな場で話し合う勇気付け、権限の範囲決め、信頼関係構築促進など、コミュニケーションの道作り"

リンク

チュートリアルの作り方：チュートリアル作成における指標のメモ - 実践ゲーム製作メモ帳2

ゲームのチュートリアルを作る際にヒントになりそうな指標を記す。チュートリアルを考える時、その取っ掛かりとしてあらゆる提示情報を「プレイヤーが知っているもの」「プレイヤーが自発的に試すもの」「こちらから提示する必要があるもの」の３つにフェーズ分けして考えていく。プレイヤーが知っているものゲームのごく基本的な入力の方法（コントローラの存在や、タップの存在）現実世界に即した基本的な物理や常識的なモノの挙動ごく基本的なゲームのお約束ボタンは押せるもの / メニューは選べるものプレイヤーは自分のキャラクターを十字キーで操作できるゲームには敵が存在し、自分に襲いかかってくる ★赤は危険で緑・青は安全ゲームジャンルにおけるお約束→プレイヤーによって大きく異なるパッケージや宣伝文句に書いてあるゲームの目的・コンセプトゲーム要素についてプレイヤーが知っているものはプレイヤーによっ

sh19910711 2021/05/08

ジレンマ / "チュートリアルを作るにはゲームが（ほぼ）完成していなければならない / 良いチュートリアルを作るにはゲームデザインを見直す必要 / 優れたチュートリアルはチュートリアルの存在そのものを意識させない"

リンク

はてなブックマーク

タグ

2021年5月8日のブックマーク (13件)

ネットワーク可視化周辺の現状 1

はじめての自然言語処理 spaCy/GiNZA を用いた自然言語処理 | オブジェクトの広場

kaggle expertになるために必要だと思うこと｜ざこぷろ

月間38億ＰＶを支える“チームの力”とは [片桐孝憲] | ISSUES | WORKSIGHT

どんな映画や本よりも流れる風景こそが時の流れを緩やかなスピードに戻す - yuta25

ニューラルネットにおける変数の初期化について - nykergoto’s blog

マップを書くだけでゲームが作れる環境が欲しかった - ABAの日誌

「ソフトウェア設計とは何か？」がすごい - Lism.in * blog - nekoya (id:studio-m)

開発組織で重要なコンウェイの法則ともう一つの原則

BPFについて調べてみた - Toku's Blog

美しいペアプロット図を簡単に作る - My Life as a Mock Quant

Joy, Inc.を読んで、幸せなチーム作りを考えてみた - Unknown Error

チュートリアルの作り方：チュートリアル作成における指標のメモ - 実践ゲーム製作メモ帳2

お知らせ

月間はてなブックマーク数ランキング（2024年5月）

今週のはてなブックマーク数ランキング（2024年6月第1週）

今週のはてなブックマーク数ランキング（2024年5月第4週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス