oratosaのブックマーク - はてなブックマーク

今さら聞けないログの基本と設計指針 - Qiita

はじめに皆さんのログに対する理解はどんなものでしょうか？仕組みから設計方法まで完璧に理解しているエンジニアもいれば、なんとなく使用しているエンジニアも多いことでしょう。ログとは、システムに着いてエラーや障害の発生、利用者による操作や設定の変更、外部との通信などを時系列に記録したものです。ログに関する理解を深めることで、複雑なシステム開発や運用が可能となります。また、AWS、Azure、GCPなどのクラウドサービスを利用している場合はシステムの開発が可能になるだけでなく、経費削減に繋がる可能性も考えられます。本記事では、ログの基本を押さえるためにその設計方法について解説します。少しでも自信がない方は、ご一読ください。ログを出力する理由は？ログの基本や、ログの設計について解説する前にそもそもログを出力する理由を押さえましょう。大きく4つの理由が考えられます。・問題が発生した時に調査

oratosa 2023/09/13

リンク

奨学金立ち上げ振り返り - 小市民ブログ

何度かこちらのブログでも触れていますが、昨年末から、出身県の高校生を対象とした留学奨学金の立ち上げに動いていました。直近、無事に県庁、県教育委員会経由で募集要項を高校側に通知してもらうところまで至り、一つのマイルストーンに達した感があります。これから書類選考、面接、送金、その後のサポートと続きこれからが本番ではあるのですが、全部終わってから振り返ると色々忘れそうなので、記憶が残っている内に立ち上げに関して感じたことを振り返っておきます。そもそも何をやっているのか毎年、出身県の高校生を対象に、50万円×2名の奨学金を出します。留学関連であれば参加するプログラムは指定しませんが、金額的にサマースクールや交換留学の費用に充てることを想定しています。そもそもなんでやっているのか嫌な気持ちになる人もいるかもですが、思っていることをそのまま書きます。私は海外留学界隈の、「全て自分の努力しにより

oratosa 2023/09/02

これは素敵な取り組み。自分も仕事について余剰資金ができたらやってみたい。

リンク

dbt-coreにおけるOSS活動ことはじめその8 ~ コミュニティの話 ~ - Qiita

本記事が目指すこと dbt-coreにおけるOSS活動を始めるにあたってやるべきこと、学びになったことを紹介する複数回に渡り連載する予定これまでの投稿記事 dbt-coreにおけるOSS活動ことはじめ ~投稿記事まとめ~ 注意本記事は筆者が所属する会社と関係なく、個人の記事であることをご了承ください背景筆者は、ちゅらデータ株式会社に務める会社員であるが、就業時間中に職務としてのdbt-coreのOSS活動を始めた（OSS活動自体が初めての経験） CONTRIBUTING.mdには明示的に記載されてない部分があったため、それらの解説を含む本編 dbt-coreにおけるOSS活動を進めていくうちに、何らかの疑問や質問が浮かぶだろう。そんなときに役立つコミュニティを紹介する。公式ドキュメントに記載のコミュニティ dbtの公式ドキュメントには、コミュニティに関するページが設けられて

oratosa 2023/08/12

dbtにOSS貢献したくなったときのために

リンク

プレゼンテーションに悩むすべての人達のために：プレゼンテーションの世界標準「構造的プレゼンテーション」 - Kazu’s Blog

国際会議で欧米の人のプレゼンテーションを聞いたとき、こんなことを思ったことはありませんか？　内容的には、それほど大したことないが、彼らはプレゼンテーションがうまい。大したことない話でも、いい話のように聞こえる。その点、日本人は下手だよなぁ、と。実は、欧米の人たちは、子供の頃から、下記に述べる「構造的プレゼンテーション」の教育を受けているのです。下記は口頭プレゼンテーションを前提に述べますが、文章でも、基本は同じです。以前、ドイツで、小学校の時からドイツで暮らしている日本人の方から伺いましたが、ドイツでは小学校のときから、文章を書くときは構造を意識せよ、ということをしつこく叩き込まれるそうです。プレゼンテーションの世界は実は非常に奥深く、極論すれば、内容に応じて、内容の数だけ、それにふさわしいプレゼンテーションのスタイルがあります。ですが、まずはプレゼンテーションの基本形を身に付けましょ

oratosa 2021/07/13

プレゼン

リンク

セールスエンジニアという仕事 - 科学と非科学の迷宮

現在の自分の肩書である「セールスエンジニア」という仕事がどのようなものか知らない方も多く、毎回説明するのが大変なのでブログ記事にしました。セールスエンジニアという仕事はなかなか馴染みがありませんが、20代後半から30代のIT エンジニアのキャリアパスとしては面白い仕事の一つだと思います。マネージャーになるかどうか考える前に、是非一度読んでください。この記事では、ClouderaのようなB2BのITソフトウェアベンダーのセールスエンジニアを想定して執筆しています。他の業界のセールスエンジニアについては確実に状況が異なりますのでご注意ください。要約セールスエンジニアとは、お客様が自分たちの製品を正しく活用できるよう情報を提供していき、営業が製品・サービスを販売するのを助ける仕事です。お客様への製品紹介と提案が主要業務ですが、その方法は様々です。お客様の要望を満たすようなサンプルプログラムを

oratosa 2021/02/15

リンク

ランサーズのデータ活用を手伝っている話 - 下町柚子黄昏記 by @yuzutas0

ランサーズ Advent Calendar 2020 24日目の記事です。昨日はまなみんさんの「思考発話法でUXリサーチをしてみた話」でした。概要社員ではなく、1人のフリーランス人材（ランサー）として、ランサーズ社を手伝っています。「こんなことをやってきたよ！」という話を、書ける範囲で書きます。 CRM（顧客管理）x データ活用の案件を主に担当しています。注意本稿は筆者個人の見解に基づく内容であり、関係組織を代表するものではありません。不適切・考慮不足だと感じさせてしまう点があれば、それは筆者個人の責任によるものです。どうぞ筆者個人宛てにご指摘のコメントをいただけますと幸いです。もくじ概要注意もくじきっかけ案件1:顧客セグメント可視化案件2:社内システム改善案件3:オープンデータ活用その他:データプラットフォームのメンテナンス性向上意識している

oratosa 2020/12/28

すごい，参考になる

リンク

SQLで始める自然言語処理 - やむやむもやむなし

こちらの記事はRecruit Engineers Advent Calendar 2020の24日目の記事です。メリークリスマス！ adventar.org 仕事の分析で使うデータはほとんどがBigQueryに保存されているため、基本的な分析作業の多くはBigQueryでSQLを書くことで行なっています。 BigQueryでテキストデータを扱おうと思うとSQLではできない or 取り回しが悪いことも多く、一度Pythonでスクリプトを書いてその結果を再度BigQueryのテーブルに格納し、Joinして分析に使うということをしていました。しかしこのやり方だとテキストデータを分析したいときは毎回Pythonのコードを書きにいかねばならず、またPythonでのテキスト処理も決して早いとはいえず、せっかくBigQueryでさくさく分析しているのにどうしてもテキスト処理に部分が作業時間のボトルネッ

oratosa 2020/12/28

前処理の内容もまとめてくれている

リンク

PostgreSQL のプランを Free から Hobby に移行する(Heroku) - ブログ

たくさんデータ投入したら無料プランから外れちゃった前提状況解決手順新データベースの追加新/旧データベース情報の確認データベースのデータ移行環境変数の更新 Dyno の再起動旧データベースの削除 Links 前提 Rails アプリケーションを作っていて、データベースはとくに複数利用せず1つだけ扱う利用者が自分だけの、趣味プロジェクトなので、サービス止まっても困る人がいない(ので、止めちゃうやりかたを採る) 状況 Heroku から「すぐ対応して」とメールを受け取る The database contains 26,642 rows, exceeding the Hobby-dev plan limit of 10,000. INSERT privileges to the database will be automatically revoked in 7 days

oratosa 2020/02/13

リンク

良い進捗報告のやり方 - 発声練習

まとめ良い進捗報告とは、自分が行っている作業やプロジェクトを順調に進めるのに役立つ手助けが得られやすい報告である教員にとって良い進捗報告学生が行っている作業やプロジェクトが自分の研究のプロジェクトの一部であったり、研究室で取り組んでいるプロジェクトの場合とそうでない場合では教員にとって作業の進捗の意味がある程度変わる。前者の場合は、自分のプロジェクトの一環なので、作業やプロジェクトの進捗がそのまま自分のプロジェクトの進捗に反映されるので、より真剣に、場合によっては過剰に干渉して進捗状況を制御しようとする可能性がある。後者の場合は、学生が順調に卒業／修了できるかどうかが興味の焦点になるので、学生が援助を求めてきたならば援助しようという程度の干渉の可能性がある。ここいらへんは指導教員の性格による。どちらの場合にしても、教員が知りたいのは「どこまで進んでいるか」と「援助は求められていない

oratosa 2020/01/07

リンク

【python】scipyで階層型クラスタリングするときの知見まとめ - 静かなる名辞

はじめに scipyの階層型クラスタリングを使う機会がありましたが、使い方がわかりづらいと思ったのでまとめておきます。目次はじめに関数がいっぱいある使い方 linkage fcluster cophenet dendrogram 実践編データを作る手法を選ぶクラスタに分けるデンドログラムを描く遊ぶまとめ関数がいっぱいあるいっぱいあるんですよ。 Hierarchical clustering (scipy.cluster.hierarchy) — SciPy v1.3.0 Reference Guide 私の数え間違えがなければ31個。多いですね。とはいえ、本質的なもの（実際によく使うもの）は以下くらいです。 linkage 実際に階層型クラスタリングを行う。これがないと始まらない。 fcluster 任意の深さで木を切り、クラスタに分割する。 cophenet y

oratosa 2019/12/31

リンク

【python】scipyのpdistとsquareformの使い方と仕組み - 静かなる名辞

はじめに scipyで距離行列を扱うときはscipy.spatial.distanceのpdist, squareformなどを主に使いますが、長年よくわからないままに使っていたので、整理してまとめておきます。なお、以下のドキュメントを参考にします。 scipy.spatial.distance.pdist — SciPy v1.2.1 Reference Guide scipy.spatial.distance.squareform — SciPy v1.2.1 Reference Guide pdist pdistを使うと様々な距離の距離行列を計算できます。デフォルトはユークリッド距離ですが、他にもいろいろ指定できる距離の種類があります。詳細はドキュメントを見てください。そしてpdistは「condensed distance matrix」という表現方式の距離行列を返します。この

oratosa 2019/12/26

リンク

【Python実装】ノンパラベイズ3次元無限関係モデル（3D-IRM）をギブスサンプリング（MCMC）で推論 - ガシンラーニング

今回は、書籍「続・わかりやすいパターン認識」の13章で紹介されている無限関係モデル（Infinite Relational Model）のギブズサンプリング（MCMC）による推論を、3次元にカスタマイズした3D-IRM（勝手に名前）をPythonで実装します。モデルと推論方法に関しては、書籍「続・わかりやすいパターン認識」の13章を参考にしています。詳しくはこちらをご参照ください。続・わかりやすいパターン認識―教師なし学習入門― 作者: 石井健一郎,上田修功出版社/メーカー: オーム社発売日: 2014/08/26 メディア: 単行本（ソフトカバー）この商品を含むブログ (2件) を見る今回のコードを全てgithubに載せています。遊べるようにnotebookもつけてます。githubはこちら Twitterフォローよろしくお願いいたします！ twitterはこちら無限関係モ

oratosa 2019/12/23

リンク

Python: scipy.sparseで疎行列計算する - け日記

疎行列計算用のモジュール scipy.sparse について解説します。 https://docs.scipy.org/doc/scipy/reference/sparse.html 疎行列クラス疎行列とは要素のほとんど(90%以上)が0で構成される行列です。レコメンドやソーシャルグラフなどの分野ではしばしば現れ、総じて巨大な行列(数千×数千〜)のため、そのままではCPUキャッシュやメモリに乗り切らずに非効率な計算になりやすく、扱いが難しいデータです。こうした疎行列を効率的に扱うために、Pythonではscipy.sparseがよく使われます。 scipy.sparseで提供されている疎行列クラスはいくつかあります。詳細は公式ドキュメントを参照ですが、代表的な3つのクラス(lil_matrix, csr_matrix, csc_matrix)について紹介します。 https://d

oratosa 2019/12/23

リンク

Python で疎行列(SciPy) - 唯物是真 @Scaled_Wurm

疎行列とは疎行列は成分のほとんどがゼロである行列のことです。たとえば、文書に登場する単語の頻度を数えたりするとこういった行列になります。他にも疎なグラフの隣接行列は疎行列になります。こういった行列は通常の行列(密行列)を使うよりも、少ないメモリで処理できたり、高速に処理できたりすることがあります。疎行列 - Wikipedia 例えば簡単な例として上の行列を考えます。この時すべての成分を保存するには個分の数値のメモリが必要になります。しかし上の行列では非ゼロの要素は3個だけです。この3個について、以下のように行と列の位置と値だけを覚えておけばとなりすべての成分を記憶しておくよりも効率的なことがわかると思います。疎行列の種類上では単純な例を示しましたが、実際の疎行列はそれぞれ特徴の異なる様々な表現手法が用いられていて、SciPyにも以下のような種類の疎行列が実装されていま

oratosa 2019/12/23

リンク

S2PL、SS2PL、C2PL - nkty blog

背景先日、CSR (Conflict Serializability)について説明しました。今回は、CSRを満たすスケジューリングを動的に生成する方法について、整理してみます。なお、ここで書くその方法とは、2PL (Two Phase Lock)なのですが、一応念のため書いておくと、2PC (Two Phase Commit)と混同しないでください。 2PCは、複数のDBでトランザクションを管理する分散トランザクションを実現する方法の一つです。分散トランザクションは、また別の機会に書きたいと思います。 PaxosやRaft、Spannerなど。成長層と縮退層 2PLは、トランザクションが開始しデータにアクセスすると、そのデータにロックをかけていきます。そして、トランザクションの終了時に、全てのロックを解除します。ロックをかけていくフェーズを成長層 (Growing Phase

oratosa 2019/12/22

database
2PL

リンク

Python: PandasのDataFrameを横持ち・縦持ちに変換する - け日記

PandasのDataFrameを縦持ちから横持ちにする方法とその逆(横持ちから縦持ちにする方法)についての備忘録です。縦持ちと横持ち縦持ちは、以下のように、カラム固定で1行に1つの値を持たせている表です。カラムをおいそれと変更できないDBのテーブルなどはこういった形かと思います。 customer_id product_id count C1 P1 1 C1 P2 2 C2 P2 2 C2 P2 1 C3 P3 3 一方で、横持ちは、カラム数が可変で1行に複数の値をもたせている表です。行列はこういう形になるでしょう。 P1 P2 P3 C1 1 2 0 C2 0 3 0 C3 0 0 3 縦持ちから横持ちへ変換するそれでは縦持ちとなっている以下のデータを横持ちへ変換します。 import pandas as pd import numpy as np orders_df = pd.

oratosa 2019/12/20

リンク

Rでone-hot encodingするときに便利なパッケージ{dummies} - と。

はじめに私生活でも仕事でも「カテゴリ変数を[0,1]実数で表現したい」という欲望に駆られる．どういうことか？下のように入っているデータがあるとする． Category A B C これを，下のように変換したい． Category_A Category_B Category_C 1 0 0 0 1 0 0 0 1 界隈ではこのようなデータの変換をone-hot encodingという．自前でアルゴリズムを組んでみるのもためになるが，納期は迫る．焦る．そんなときのdummiesパッケージ．開発元は下． github.com 大したことやっていない実装例は下． github.com インストールはみなさんおなじみinstall.packages("dummies") 使うデータも皆さんおなじみirisを使う． install.packages("dummies") dat <- iri

oratosa 2019/12/20

リンク

レコメンドつれづれ　～第3回レコメンド精度の評価方法を学ぶ～ - Platinum Data Blog by BrainPad

本記事は、当社オウンドメディア「Doors」に移転しました。約5秒後に自動的にリダイレクトします。「レコメンドつれづれ」は、レコメンド手法の概念や実装方法を中心に、レコメンドに関する基礎的な内容から最近流行りの技術まで幅広くご紹介する連載です。第3回は、レコメンドの評価方法について、代表的な評価方法・指標をピックアップしてご紹介します。こんにちは。アナリティクスサービス本部の小田です。レコメンドについて考察していく連載の第3回です。第1回協調フィルタリングのコンセプトを知る第2回協調フィルタリングの実装第2回では、協調フィルタリングの実装を行いました。本連載では今後各種手法を実装しながら比較していく予定ですが、その前にレコメンドの評価について確認したいと思います。といっても、レコメンド全体の評価となるとシステムやユーザビリティの評価など広範にわたりますので、今回はアルゴリズ

oratosa 2019/12/04

リンク

チュートリアル1: 1-gram言語モデル - 自然言語処理の分別奮闘記

とりあえず１回目は、前に言っていたNLP Programing TutorialのCapter01(pdf)、1-gram言語モデルの勉強です。では、スライドに沿って話を進めようと思います。言語モデルって何？ 1-gram言語モデルの前に、そもそも言語モデルって何？具体例で説明すると。音声認識システムにて、認識した結果の出力候補としていくつかの単語列があったとしましょう。 W1 = speech recognition system W2 = speech cognition system W3 = speck podcast histamine W4 = スピーチが救出ストン言語モデルは、これらの単語列に「もっともらしさ」を与えてくれるのです。一般的には、各単語列に確率を与えてくれます。上の各単語列は、ある言語モデルに基づくと P(W1) = 4.021*10-2 P

oratosa 2019/11/10

リンク

ターミナルからプライベートIPアドレスとMACアドレス、ルーティングテーブルを確認する - bambinya's blog

自分のlaptopのプライベートIPアドレスがどのように割り当てられているか、調べる。ターミナルから$ ifconfig をうつ。複数のインターフェースが表示される。上記は「lo0」「gif0」「stf0」「en0」が表示されている。他にも「en1」「en2」「p2p0」「awdl0」「bridge0」「utun0」が表示された。各インターフェースの名前と役割 lo0(loopback) ネットワークのテストに使えるよう用意された仮想インターフェース、NICがなくても、このloは表示される。inetの127.0.0.1がIPアドレスとして自動で割り当てられる。 gif0(generic tunnel interface) IPv6/IPv4トンネリングを行うときに使うインターフェース。IPv6/IPv4トンネリングとは、IPv4(またはIPv6)をサポートするネットワークに、IPv

oratosa 2019/10/31

リンク

はてなブックマーク

タグ

oratosaのブックマーク (56)

お知らせ

今週のはてなブックマーク数ランキング（2024年7月第2週）

はてなブックマーク透明性レポート（2024年 2月-2024年4月）

今週のはてなブックマーク数ランキング（2024年7月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス