pidekazuのブックマーク / 2021年12月15日

基礎線形代数講座

- 線形代数・回転の表現 - 株式会社セガ開発技術部こちらからも↓PDFをダウンロードできます https://tech blog.sega.jp/entry/2021/06/15/100000Read less

pidekazu 2021/12/15

リンク

SageMaker Experimentsを使った機械学習モデルの実験管理 - コネヒト開発者ブログ

皆さん，こんにちは！機械学習エンジニアの柏木（@asteriam）です．本エントリーはコネヒトアドベントカレンダーの15日目の記事になります．今回は機械学習モデルの実験管理をする際に使用しているAWSのSageMaker Experimentsの活用例を紹介したいと思います．アドベントカレンダー1日目でたかぱいさんがSageMaker Processingの使い所を紹介してくれているので，こちらも併せて参考下さい． tech.connehito.com はじめに前回のエントリー*1でML Test Scoreの話をしましたが，その際にMLOpsの大事な要素である再現性（モデル学習など）に触れました．今回はこのモデル学習の再現性のために必要な実験結果（ハイパーパラメータの引数の値，モデル評価指標など）の管理をSageMaker Experimentsでしているというお話です． ※本エ

pidekazu 2021/12/15

リンク

naoyaのはてなダイアリー - 負荷とは何か

調べごとをしたので blog に書いて理解を深めようのコーナーです。長文です。 Linux でシステム負荷を見る場合にお世話になるのが top や sar (sysstat パッケージに同梱されてるコマンド) などのツールです。 top ではシステム統計のスナップショットを見ることができます。今システムがどういう状態かなーというときは top が便利。 top - 08:16:54 up 3 days, 14:43, 6 users, load average: 0.18, 0.07, 0.03 Tasks: 43 total, 2 running, 41 sleeping, 0 stopped, 0 zombie Cpu(s): 18.2% us, 0.0% sy, 0.0% ni, 81.8% id, 0.0% wa, 0.0% hi, 0.0% si一方の sar では10分ごとのシ

pidekazu 2021/12/15

os

リンク

最長共通部分列問題 (Longest Common Subsequence) - naoyaのはてなダイアリー

部分列 (Subsequence) は系列のいくつかの要素を取り出してできた系列のことです。二つの系列の共通の部分列を共通部分列 (Common Subsecuence)と言います。共通部分列のうち、もっとも長いものを最長共通部分列 (Longest Common Subsequence, LCS) と言います。 X = <A, B, C, B, D, A, B> Y = <B, D, C, A, B, A> という二つの系列から得られる LCS は <B, C, B, A> で、その長さは 4 です。長さ 2 の<B, D> の長さ 3 の <A, B, A> なども共通部分列ですが、最長ではないのでこれらは LCS ではありません。また、LCS は最長であれば位置はどこでも良いので、この場合 <B, D, A, B> も LCS です。 LCS は動的計画法 (Dynamic Prog

pidekazu 2021/12/15

algorithm

リンク

Binary Indexed Tree (Fenwick Tree) - naoyaのはてなダイアリー

圧縮アルゴリズムにおける適応型算術符号の実装では、累積頻度表を効率的に更新できるデータ構造が必要になります。もともと算術符号を実装するには累積頻度表が必要なのですが、これが適応型になると、記号列を先頭から符号化しながら、すでに見た記号の累積頻度を更新していく必要があるためです。累積度数表をナイーブに実装すると、更新には O(n) かかってしまいます。配列で表を持っていた場合、適当な要素の頻度に更新がかかるとその要素よりも前の要素すべてを更新する必要があります。適応型算術符号のように記号を符号化する度に更新がかかるケースには向いていません。 Binary Indexed Tree (BIT, P.Fenwick 氏の名前を取って Fenwick Tree と呼ばれることもあるようです) を使うと、累積頻度表を更新 O(lg n)、参照 O(lg n) で実現することができます。BIT は更

pidekazu 2021/12/15

algorithm

リンク

Aho Corasick 法 - naoyaのはてなダイアリー

適当な単語群を含む辞書があったとします。「京都の高倉二条に美味しいつけ麺のお店がある」*1という文章が入力として与えられたとき、この文章中に含まれる辞書中のキーワードを抽出したい、ということがあります。例えば辞書に「京都」「高倉二条」「つけ麺」「店」という単語が含まれていた場合には、これらの単語(と出現位置)が入力に対しての出力になります。この類の処理は、任意の開始位置から部分一致する辞書中のキーワードをすべて取り出す処理、ということで「共通接頭辞検索 (Common Prefix Search)」などと呼ばれるそうです。形態素解析、Wikipedia やはてなキーワードのキーワードリンク処理などが代表的な応用例です。 Aho Corasick 法任意のテキストから辞書に含まれるキーワードをすべて抽出するという処理の実現方法は色々とあります。Aho Corasick 法はその方法のひと

pidekazu 2021/12/15

algorithm

リンク

世界一わかりやすいClean Architecture - nuits.jp blog

本項は「C# Tokyo オンライン「世界一わかりやすいClean Architecture」他」による発表の登壇原稿となります。過去に発表した.NET版の記事はこちらにアーカイブしています。本稿のサンプルコード・PPTはこちらで公開しています。「CC BY-SA 4.0」で公開していますので、気に入っていただけたら営利目的含め、ライセンスの範囲で自由に利用していただいて問題ありません。 github.com また動画を以下で配信しています。よろしければご覧ください。世界一わかりやすいClean Architecture はじめにまず初めに、クリーンアーキテクチャの誤解されがちな二つのことについてお話させていただきます。その上で、クリーンアーキテクチャの本質とは何か？押さえておくべき、本当に重要だと考えている三つの事について、お話しします。注意事項さて本題に入る前に、少し注意

pidekazu 2021/12/15

architecture

リンク

実装クリーンアーキテクチャ

最近何かと騒がしいクリーンアーキテクチャですが、丁度プロダクトで採用したところだったので折角なので情報共有ということで Qiita の初記事にしてみようと思います。こちらの記事は GUI や CUI のアプリケーションを対象にしています。 Java コードの記事リンク：https://nrslib.com/clean-architecture-with-java/?preview_id=1263&preview_nonce=542ba7b70f&_thumbnail_id=1293&preview=true その他解説もしています。もしよろしければチャンネル登録をお願いいたします。より実践的なコード（WEBアプリケーション）: https://github.com/nrslib/itddd/tree/master/CleanLike YouTube での解説（WEBアプリケーション）：

pidekazu 2021/12/15

architecture

リンク

Effective Java 第３版「ほぼ全章」を「読みやすい日本語」で説明してみました。 - Qiita

Effective Javaは「一人前」のJava エンジニアになるために避けては通れない書籍だと思います。特にアプリケーション基盤のコードや公開APIを作るような立場にいるエンジニアは、この書籍に書かれてあることを把握していないと、まともなものを作れません。素晴らしい書籍だということは言うまでもありませんが、一方で「要するにこういうことだよね」という理解をしづらい書籍であるとも感じます。その原因は、おそらく以下のとおりでしょう。表現が回りくどいです。全部で９０の項目がありますが、項目内の構造が分かりづらいです。コード例が必要以上に複雑な場合があります。内容の本質そのものはあまり難しくないのに、こういった理由でこの書籍の敷居が上がるのは、何と言うかもったいないと思います。そこで、本記事では（ほぼ）全項目について、できるだけ「読みやすい日本語」で内容を説明してみたいと思います。

pidekazu 2021/12/15

java

リンク

個人のキャリアの8割は偶発的なことによって決まっていく　広木大地氏が成長の節目で諦めること、大事にすること

主体的で幸福感の高いキャリアを歩むための勘所やコツをIT業界の最前線で活躍する、二人の元エンジニアに学ぶ「DX時代を勝ち抜くエンジニア成長戦略」。ここで株式会社レクター取締役／一般社団法人日本CTO協会理事の広木氏が登壇。ここからは、キャリアの節目で広木氏が考えていたこと、とっていた行動を紹介します。前回はこちらから。キャリアの節目で考えていた2つのこと広木大地氏：このような活動をしていた僕が、キャリアの節目節目でどんなことを考えたかをまとめてみました。誰かに負けたくないという思いから、成長を求めるゲームに参加してきた。それはなにか。自分の信用度合いがそんなに高くない時に、「できます。できます」とビッグマウスでいれば、いい仕事をもらえるかもしれません。その仕事にきちんと応えていけば、それがまた信頼や信用になり、新たな仕事を得るためのチャンスになるので、さらにレバレッジをかけて、「自

pidekazu 2021/12/15

リンク

郵便番号APIのようなシンプルなREST APIをlambdaで作る時にマスターデータを何で持つべきか計測してみた

こういうAPIを作らなければいけないときって割とよくあると思います（有料データベースと契約してて、csvでもらったデータをAPIで使えるようにするとか）そんな時に一番シンプルな解決方法として思いつくのがaws lambda + API Gatewayになると思いますそんな時にふとした疑問が生まれました元のcsvって何の形式で持つのが一番効率良いのだろうこういうのって何となく適当に選んじゃうことが多いのですが実際に計測して選ぶことも大切なので色々計測してみました別解多分goあたりでプログラム本体に含めてコンパイルしちゃうのが早いと思いますが、今回はrubyでやりたかったのでそれ以外の解決策を考えてみます準備郵便局の出している住所 <-> 郵便番号データをサンプルとして使います元データがcsvなのですがその時点で以下のようになっています行数：12万4500行ファイルサイズ

pidekazu 2021/12/15

aws
rest

リンク

はてなブックマーク

タグ

2021年12月15日のブックマーク (11件)

基礎線形代数講座

SageMaker Experimentsを使った機械学習モデルの実験管理 - コネヒト開発者ブログ

naoyaのはてなダイアリー - 負荷とは何か

最長共通部分列問題 (Longest Common Subsequence) - naoyaのはてなダイアリー

Binary Indexed Tree (Fenwick Tree) - naoyaのはてなダイアリー

Aho Corasick 法 - naoyaのはてなダイアリー

世界一わかりやすいClean Architecture - nuits.jp blog

実装クリーンアーキテクチャ

Effective Java 第３版「ほぼ全章」を「読みやすい日本語」で説明してみました。 - Qiita

個人のキャリアの8割は偶発的なことによって決まっていく　広木大地氏が成長の節目で諦めること、大事にすること

郵便番号APIのようなシンプルなREST APIをlambdaで作る時にマスターデータを何で持つべきか計測してみた

お知らせ

今週のはてなブックマーク数ランキング（2024年7月第2週）

はてなブックマーク透明性レポート（2024年 2月-2024年4月）

今週のはてなブックマーク数ランキング（2024年7月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス