タグ

2022年3月25日のブックマーク (10件)

  • 特異値分解・固有値分解系の分析 - データサイエンティスト上がりのDX参謀・起業家

    主成分分析とか因子分析とかの手法は特異値分解系でまとめられますが、調べてみると意外に良い資料がなくてなかなか理解が進まないですorz しかしとりあえず調べれる範囲で理解した部分を記事にしておきます。 教科書はこちら。私が学部4年のときに読んだで、自分にとっては一番分かり易く書かれています。しかし絶版orz 多次元データの解析 (シリーズ入門統計的方法 3) 作者: 鷲尾泰俊,大橋靖雄出版社/メーカー: 岩波書店発売日: 1989/02/21メディア: 単行購入: 2人 クリック: 76回この商品を含むブログ (1件) を見る ※以下記事ですが、まだ曖昧な部分も多いです。間違いがあればご指摘して下されば幸いです。「コレスポンデンス分析」と「多次元尺度法」はもう少し理解を深めるために、別途調査する予定です。 【特異値分解・固有値分解って?】 特異値分解 行列Aを次のように分解する。 A=U

    特異値分解・固有値分解系の分析 - データサイエンティスト上がりのDX参謀・起業家
    sh19910711
    sh19910711 2022/03/25
    "コレスポンデンス分析: 分割表の正準相関分析として研究が始まる?(1930年代〜、Fisher)/ 1960年代あたりからフランスでanalyse des correspondences (correspondence analysis)と命名 → 国際共通語に"
  • GitHub Discussionsでチームの暗黙知を共有する

    Tebiki社のWebアプリケーションエンジニアの中山と申します。前職では、SIerAIアプリの開発を3年弱経験し、現職のTebiki社では、to B向けSaaSの機能開発を行なっています。好きな言語は、C++, Python, Ruby です! この記事では、GitHub Discussionsの運用による知識のストック化と、新人オンボーディング時の負担軽減についてご紹介します! Tebiki社のDiscussionsとは?Tebiki社では、エンジニアチーム内の知識を共有するツールとして、GitHubのDiscussions機能を活用しており、これまでチーム内で議論した内容や暗黙知であった内容をQ&A形式で記録しています。 TebikiのDiscussionsDiscussionsの運用ルールDiscussionsを運用するにあたって、以下のようなルールを作っています。 Discus

    GitHub Discussionsでチームの暗黙知を共有する
    sh19910711
    sh19910711 2022/03/25
    "残しておきたい内容を一問一答形式で書けば良い + ドキュメント化するよりも短時間 / 個人的に記録していたメモをDiscussionsのQ&Aにひたすら転記 / 最初に書いた20件のDiscussionsが他のメンバーが書く時のサンプルになった"
  • コンテナベースシステムのデザインパターンに関する論文紹介 - エムスリーテックブログ

    エンジニアリンググループ AI機械学習チームの笹川です。 今回は、コンテナベースシステムのデザインパターンに関する論文 Design patterns for container-based distributed systems について紹介します。 なお、この記事は、社内勉強会であるM3 tech talkで紹介した内容をまとめたものです。 M3 tech talkは、エムスリー赤坂オフィスで隔週で開催されている5-20分程度のLTを数件行う勉強会で、そのトークテーマの振れ幅は最近の数回でも筋トレ、型システム、3Dプリンタ、量子コンピュータなどこのブログの数段上で、個人的にも毎回楽しみにしています。 M3 tech talkは、外部からの参加・登壇も歓迎しています。興味のある方はぜひ以下からお問い合わせください。 jobs.m3.com 論文の概要 今回紹介する論文は、HotClou

    コンテナベースシステムのデザインパターンに関する論文紹介 - エムスリーテックブログ
    sh19910711
    sh19910711 2022/03/25
    "コンテナ技術を用いた分散環境のシステムの設計について、OOPの文脈でおなじみのデザインパターンの考え方を適用することで、典型的なユースケースに対して設計の「型」を提供しようという提案"
  • Apache HBaseの現在 - 火山と呼ばれたHBaseは今どうなっているのか

    Hadoop / Spark Conference Japan 2019 での講演資料です http://hadoop.apache.jp/

    Apache HBaseの現在 - 火山と呼ばれたHBaseは今どうなっているのか
    sh19910711
    sh19910711 2022/03/25
    2019 / "Apache Ratis: RAFTプロトコルのJava実装 + Apache Hadoop Ozoneでも使われている / Ratis以外の選択肢としてはKafkaとDistributedLogがある / Ratisはライブラリとして提供されていてスタンドアロンなデーモンを立ち上げる必要がない"
  • Rustのパーサーライブラリ、Chumskyの紹介

    はじめに この記事ではRustのパーサーライブラリ、Chumskyに軽く入門していきます。 ChumskyはAriadneと連携することで綺麗なエラー表示を行うことができるのでそれもやっていきます。 参考リンク Chumsky 書で紹介するChumskyのリポジトリ Ariadne エラー表示用のライブラリ。Chumskyと同じ作者が作っている Tao Chumskyと同じ作者が作っているプログラミング言語。パーサーにChumskyを使っているので例を見るのにちょうど良い Chumskyとは ChumskyはRust用のパーサーライブラリで、他のパーサーライブラリと比べると エラー処理に力を入れている Ariadneと連携することでかっこいいエラー表示ができる。(もちろん他のパーサーでもAriadneを使うことはできます) トークン列用のパーサーから元の文字列の範囲(スパン)を取れる。先

    Rustのパーサーライブラリ、Chumskyの紹介
    sh19910711
    sh19910711 2022/03/25
    "Chumsky: Rust用のパーサーライブラリ > エラー処理に力を入れている + Ariadneと連携することでかっこいいエラー表示 / 先にLexerでトークンに分割してそのトークン列に対してさらにパースするというワークフローが強力に"
  • データテクノロジースペシャル:Yahoo! JAPANにおけるメタデータ管理の試み

    Similar to データテクノロジースペシャル:Yahoo! JAPANにおけるメタデータ管理の試み

    データテクノロジースペシャル:Yahoo! JAPANにおけるメタデータ管理の試み
    sh19910711
    sh19910711 2022/03/25
    2017 / "PMBOK → DMBOK / CMMI → DMM (Data Management Maturity) / メタデータ管理 = データ資産化の第一歩 / 模範をめざす"
  • 開発における処理能力欠乏への対処 - Qiita

    「いつも「時間がない」あなたに」を読んで、開発に役立てられることたくさんあるなーと思ったのでまとめる。 "SCARCITY: Why Having Too Little Means So Much" というの日語訳。原題からわかるとおり、「欠乏」についての科学的な実験結果と洞察がまとめられている行動経済学。時間への欠乏について「も」言及されているが、どちらかというと貧困など社会的な欠乏への対処を大目標においた、現在のまとめ的な立ち位置の。「おれたちのたたかいはこれからだ」で締められている。 ただまあ非常に読みづらい。神話的というか、口伝的というか、寓話や例が多く登場するが明快なまとめがなく、主張したいことがわかりづらい。時間がない人は最後に訳者が主張を 3 ページでまとめてるのでそこをまず読んで、目次をたよりに具体例を探していくのがよいかも。 というわけで、書かれていることから実

    開発における処理能力欠乏への対処 - Qiita
    sh19910711
    sh19910711 2022/03/25
    ""SCARCITY: Why Having Too Little Means So Much" という本の日本語訳 / 「欠乏」についての科学的な実験結果と洞察がまとめられている行動経済学の本 / 読みにくいけど、考えるポイントを与えてくれる"
  • 量子オセロというゲームを作りました - Qiita

    はじめに プログラミングを独学で勉強中の大学院生です。 量子オセロというゲームを作ったので、その実装を行いました。 「プログラミング初心者がpythonの勉強がてら、オセロAIを作ってみた」をリファクタリングさせていただいたを一部参考にさせていただきました。 Windows10, Chromeでのみテストしています。 こちらで遊べます。 注:当初はてなブログに書いていた記述をこちらに移動しました。 量子人狼や量子将棋を知っているでしょうか。量子人狼であれば役職や生死を、量子将棋であれば駒を重ね合わせとして扱うような新しいゲームです。詳しくは、各自調べていただくとして、こんな感じの""量子ゲーム""を作りたいなと思いました。 そして一つの可能性に気付きました。オセロです。量子大富豪も考えたのですが、「マスクメン」の劣化にしかならなかったので、諦めました。 ルール 基は通常のオセロ同じです。

    量子オセロというゲームを作りました - Qiita
    sh19910711
    sh19910711 2022/03/25
    "基本は通常のオセロ同じ / 大きく違うのは、石の色が重ね合わせの状態にある / 石は量子化されているので16通りの状態 / 複数の状態の重ね合わせを表わす手段として、それぞれの石が黒である確率(%)を用いています"
  • 【BigQuery】standardSQLのLanguage Serverを公開した(VSCode拡張機能だけどVimもOK) - Qiita

    【BigQuery】standardSQLのLanguage Serverを公開した(VSCode拡張機能だけどVimもOK)VimSQLBigQueryVSCodegooglecloud 最新情報 Version 0.0.27 2022/08/03までのリリースノートに対応 qualify周りのサイレント修正に対応 概要 先日公開した BigQuery Extension for VSCode というVSCode拡張機能の紹介。ほとんどの機能はLanguage Serverとして実装されており、Vimなど他のエディタからも利用可能。legacySQLは守備範囲外で、standardSQLに特化させた。 機能 補完 列名や関数名の補完ができる(現状、列名の補完はSELECT文のみで機能する)。 `を入力するとプロジェクト名・データセット名・テーブル名の順で補完される。 関数については、使い

    【BigQuery】standardSQLのLanguage Serverを公開した(VSCode拡張機能だけどVimもOK) - Qiita
    sh19910711
    sh19910711 2022/03/25
    便利そう / "Language Serverとして実装されており、Vimなど他のエディタからも利用可能 / Dry Runのタイミングでエラーがあれば下線を引き / テーブル名などを補完するために必要な情報を取得し、ローカルのsqlite3に保存"
  • 困らない程度のJDK入門

    14. TieredCompilation JDK6 まで インタプリタ実行時にプロファイリングをして、選択したコ ンパイラで最適化する どっちのコンパイラが良いか考える余地がある JDK7 から インタプリタ、C1、C2 を動的に使い分けられるようになった C1でもプロファイリングできるようになった 4階層の最適化レベルをいったりきたりする →更に考えることが減った コンパイルのしきい値とかもうかつにいじらないほうが良か ったり… 14 15. JDKのオプションに関する余談 ON/OFF にするような設定の場合、以下のような書式になってい ます。 有効にするとき ‐XX:+<フラグ名> 無効にするとき ‐XX:‐<フラグ名> また、バージョンや環境によってオプションのデフォルト設定が 変わることがあるので、その環境で何が設定されているかを確認 したい時があります。 ‐XX:+Print

    困らない程度のJDK入門
    sh19910711
    sh19910711 2022/03/25
    2017 / "オブジェクトが増えるとヤングGCは遅くなる / パラレルGCは停止時間が長くなるが効率は良い / CMSは並行性が高いが断片化するしチューニングが難しい / G1は並行性ではなくソフトリアルタイム性を重視"