oratosaのブックマーク (56)

  • 今さら聞けないログの基本と設計指針 - Qiita

    はじめに 皆さんのログに対する理解はどんなものでしょうか?仕組みから設計方法まで完璧に理解しているエンジニアもいれば、なんとなく使用しているエンジニアも多いことでしょう。 ログとは、システムに着いてエラーや障害の発生、利用者による操作や設定の変更、外部との通信などを時系列に記録したものです。ログに関する理解を深めることで、複雑なシステム開発や運用が可能となります。また、AWS、Azure、GCPなどのクラウドサービスを利用している場合はシステムの開発が可能になるだけでなく、経費削減に繋がる可能性も考えられます。 記事では、ログの基を押さえるためにその設計方法について解説します。少しでも自信がない方は、ご一読ください。 ログを出力する理由は? ログの基や、ログの設計について解説する前にそもそもログを出力する理由を押さえましょう。大きく4つの理由が考えられます。 ・問題が発生した時に調査

    今さら聞けないログの基本と設計指針 - Qiita
  • 奨学金立ち上げ振り返り - 小市民ブログ

    何度かこちらのブログでも触れていますが、昨年末から、出身県の高校生を対象とした留学奨学金の立ち上げに動いていました。直近、無事に県庁、県教育委員会経由で募集要項を高校側に通知してもらうところまで至り、一つのマイルストーンに達した感があります。これから書類選考、面接、送金、その後のサポートと続きこれからが番ではあるのですが、全部終わってから振り返ると色々忘れそうなので、記憶が残っている内に立ち上げに関して感じたことを振り返っておきます。 そもそも何をやっているのか 毎年、出身県の高校生を対象に、50万円×2名の奨学金を出します。留学関連であれば参加するプログラムは指定しませんが、金額的にサマースクールや交換留学の費用に充てることを想定しています。 そもそもなんでやっているのか 嫌な気持ちになる人もいるかもですが、思っていることをそのまま書きます。私は海外留学界隈の、「全て自分の努力しにより

    奨学金立ち上げ振り返り - 小市民ブログ
    oratosa
    oratosa 2023/09/02
    これは素敵な取り組み。自分も仕事について余剰資金ができたらやってみたい。
  • dbt-coreにおけるOSS活動ことはじめその8 ~ コミュニティの話 ~ - Qiita

    記事が目指すこと dbt-coreにおけるOSS活動を始めるにあたってやるべきこと、学びになったことを紹介する 複数回に渡り連載する予定 これまでの投稿記事 dbt-coreにおけるOSS活動ことはじめ ~投稿記事まとめ~ 注意 記事は筆者が所属する会社と関係なく、個人の記事であることをご了承ください 背景 筆者は、ちゅらデータ株式会社に務める会社員であるが、就業時間中に職務としてのdbt-coreのOSS活動を始めた(OSS活動自体が初めての経験) CONTRIBUTING.mdには明示的に記載されてない部分があったため、それらの解説を含む dbt-coreにおけるOSS活動を進めていくうちに、何らかの疑問や質問が浮かぶだろう。 そんなときに役立つコミュニティを紹介する。 公式ドキュメントに記載のコミュニティ dbtの公式ドキュメントには、コミュニティに関するページが設けられて

    dbt-coreにおけるOSS活動ことはじめその8 ~ コミュニティの話 ~ - Qiita
    oratosa
    oratosa 2023/08/12
    dbtにOSS貢献したくなったときのために
  • プレゼンテーションに悩むすべての人達のために:プレゼンテーションの世界標準「構造的プレゼンテーション」 - Kazu’s Blog

    国際会議で欧米の人のプレゼンテーションを聞いたとき、こんなことを思ったことはありませんか? 内容的には、それほど大したことないが、彼らはプレゼンテーションがうまい。大したことない話でも、いい話のように聞こえる。その点、日人は下手だよなぁ、と。 実は、欧米の人たちは、子供の頃から、下記に述べる「構造的プレゼンテーション」の教育を受けているのです。下記は口頭プレゼンテーションを前提に述べますが、文章でも、基は同じです。以前、ドイツで、小学校の時からドイツで暮らしている日人の方から伺いましたが、ドイツでは小学校のときから、文章を書くときは構造を意識せよ、ということをしつこく叩き込まれるそうです。 プレゼンテーションの世界は実は非常に奥深く、極論すれば、内容に応じて、内容の数だけ、それにふさわしいプレゼンテーションのスタイルがあります。ですが、まずはプレゼンテーションの基形を身に付けましょ

    プレゼンテーションに悩むすべての人達のために:プレゼンテーションの世界標準「構造的プレゼンテーション」 - Kazu’s Blog
  • セールスエンジニアという仕事 - 科学と非科学の迷宮

    現在の自分の肩書である「セールスエンジニア」という仕事がどのようなものか知らない方も多く、毎回説明するのが大変なのでブログ記事にしました。セールスエンジニアという仕事はなかなか馴染みがありませんが、20代後半から30代のITエンジニアのキャリアパスとしては面白い仕事の一つだと思います。マネージャーになるかどうか考える前に、是非一度読んでください。 この記事では、ClouderaのようなB2BのITソフトウェアベンダーのセールスエンジニアを想定して執筆しています。他の業界のセールスエンジニアについては確実に状況が異なりますのでご注意ください。 要約 セールスエンジニアとは、お客様が自分たちの製品を正しく活用できるよう情報を提供していき、営業が製品・サービスを販売するのを助ける仕事です。お客様への製品紹介と提案が主要業務ですが、その方法は様々です。お客様の要望を満たすようなサンプルプログラムを

    セールスエンジニアという仕事 - 科学と非科学の迷宮
  • ランサーズのデータ活用を手伝っている話 - 下町柚子黄昏記 by @yuzutas0

    ランサーズ Advent Calendar 2020 24日目の記事です。 昨日は まなみん さんの 「思考発話法でUXリサーチをしてみた話」 でした。 概要 社員ではなく、1人のフリーランス人材(ランサー)として、ランサーズ社を手伝っています。 「こんなことをやってきたよ!」という話を、書ける範囲で書きます。 CRM(顧客管理)x データ活用 の案件を主に担当しています。 注意 稿は筆者個人の見解に基づく内容であり、関係組織を代表するものではありません。 不適切・考慮不足だと感じさせてしまう点があれば、それは筆者個人の責任によるものです。 どうぞ筆者個人宛てにご指摘のコメントをいただけますと幸いです。 もくじ 概要 注意 もくじ きっかけ 案件1:顧客セグメント可視化 案件2:社内システム改善 案件3:オープンデータ活用 その他:データプラットフォームのメンテナンス性向上 意識している

    ランサーズのデータ活用を手伝っている話 - 下町柚子黄昏記 by @yuzutas0
    oratosa
    oratosa 2020/12/28
    すごい,参考になる
  • SQLで始める自然言語処理 - やむやむもやむなし

    こちらの記事はRecruit Engineers Advent Calendar 2020の24日目の記事です。メリークリスマス! adventar.org 仕事の分析で使うデータはほとんどがBigQueryに保存されているため、基的な分析作業の多くはBigQueryでSQLを書くことで行なっています。 BigQueryでテキストデータを扱おうと思うとSQLではできない or 取り回しが悪いことも多く、一度Pythonでスクリプトを書いてその結果を再度BigQueryのテーブルに格納し、Joinして分析に使うということをしていました。 しかしこのやり方だとテキストデータを分析したいときは毎回Pythonのコードを書きにいかねばならず、またPythonでのテキスト処理も決して早いとはいえず、せっかくBigQueryでさくさく分析しているのにどうしてもテキスト処理に部分が作業時間のボトルネッ

    SQLで始める自然言語処理 - やむやむもやむなし
    oratosa
    oratosa 2020/12/28
    前処理の内容もまとめてくれている
  • PostgreSQL のプランを Free から Hobby に移行する(Heroku) - ブログ

    たくさんデータ投入したら無料プランから外れちゃった 前提 状況 解決 手順 新データベースの追加 新/旧 データベース情報の確認 データベースのデータ移行 環境変数の更新 Dyno の再起動 旧データベースの削除 Links 前提 Rails アプリケーションを作っていて、データベースはとくに複数利用せず1つだけ扱う 利用者が自分だけの、趣味プロジェクトなので、サービス止まっても困る人がいない(ので、止めちゃうやりかたを採る) 状況 Heroku から「すぐ対応して」とメールを受け取る The database contains 26,642 rows, exceeding the Hobby-dev plan limit of 10,000. INSERT privileges to the database will be automatically revoked in 7 days

    PostgreSQL のプランを Free から Hobby に移行する(Heroku) - ブログ
  • 良い進捗報告のやり方 - 発声練習

    まとめ 良い進捗報告とは、自分が行っている作業やプロジェクトを順調に進めるのに役立つ手助けが得られやすい報告である 教員にとって良い進捗報告 学生が行っている作業やプロジェクトが自分の研究のプロジェクトの一部であったり、研究室で取り組んでいるプロジェクトの場合とそうでない場合では教員にとって作業の進捗の意味がある程度変わる。前者の場合は、自分のプロジェクトの一環なので、作業やプロジェクトの進捗がそのまま自分のプロジェクトの進捗に反映されるので、より真剣に、場合によっては過剰に干渉して進捗状況を制御しようとする可能性がある。後者の場合は、学生が順調に卒業/修了できるかどうかが興味の焦点になるので、学生が援助を求めてきたならば援助しようという程度の干渉の可能性がある。ここいらへんは指導教員の性格による。 どちらの場合にしても、教員が知りたいのは「どこまで進んでいるか」と「援助は求められていない

    良い進捗報告のやり方 - 発声練習
  • 【python】scipyで階層型クラスタリングするときの知見まとめ - 静かなる名辞

    はじめに scipyの階層型クラスタリングを使う機会がありましたが、使い方がわかりづらいと思ったのでまとめておきます。 目次 はじめに 関数がいっぱいある 使い方 linkage fcluster cophenet dendrogram 実践編 データを作る 手法を選ぶ クラスタに分ける デンドログラムを描く 遊ぶ まとめ 関数がいっぱいある いっぱいあるんですよ。 Hierarchical clustering (scipy.cluster.hierarchy) — SciPy v1.3.0 Reference Guide 私の数え間違えがなければ31個。多いですね。 とはいえ、質的なもの(実際によく使うもの)は以下くらいです。 linkage 実際に階層型クラスタリングを行う。これがないと始まらない。 fcluster 任意の深さで木を切り、クラスタに分割する。 cophenet y

    【python】scipyで階層型クラスタリングするときの知見まとめ - 静かなる名辞
  • 【python】scipyのpdistとsquareformの使い方と仕組み - 静かなる名辞

    はじめに scipyで距離行列を扱うときはscipy.spatial.distanceのpdist, squareformなどを主に使いますが、長年よくわからないままに使っていたので、整理してまとめておきます。 なお、以下のドキュメントを参考にします。 scipy.spatial.distance.pdist — SciPy v1.2.1 Reference Guide scipy.spatial.distance.squareform — SciPy v1.2.1 Reference Guide pdist pdistを使うと様々な距離の距離行列を計算できます。デフォルトはユークリッド距離ですが、他にもいろいろ指定できる距離の種類があります。詳細はドキュメントを見てください。 そしてpdistは「condensed distance matrix」という表現方式の距離行列を返します。この

  • 【Python実装】ノンパラベイズ3次元無限関係モデル(3D-IRM)をギブスサンプリング(MCMC)で推論 - ガシンラーニング

    今回は、書籍「続・わかりやすいパターン認識」の13章で紹介されている無限関係モデル(Infinite Relational Model)のギブズサンプリング(MCMC)による推論を、3次元にカスタマイズした3D-IRM(勝手に名前)をPythonで実装します。 モデルと推論方法に関しては、書籍「続・わかりやすいパターン認識」の13章を参考にしています。詳しくはこちらをご参照ください。 続・わかりやすいパターン認識―教師なし学習入門― 作者: 石井健一郎,上田修功 出版社/メーカー: オーム社 発売日: 2014/08/26 メディア: 単行(ソフトカバー) この商品を含むブログ (2件) を見る 今回のコードを全てgithubに載せています。遊べるようにnotebookもつけてます。githubはこちら Twitterフォローよろしくお願いいたします! twitterはこちら 無限関係モ

    【Python実装】ノンパラベイズ3次元無限関係モデル(3D-IRM)をギブスサンプリング(MCMC)で推論 - ガシンラーニング
    oratosa
    oratosa 2019/12/23
  • Python: scipy.sparseで疎行列計算する - け日記

    疎行列計算用のモジュール scipy.sparse について解説します。 https://docs.scipy.org/doc/scipy/reference/sparse.html 疎行列クラス 疎行列とは要素のほとんど(90%以上)が0で構成される行列です。 レコメンドやソーシャルグラフなどの分野ではしばしば現れ、総じて巨大な行列(数千×数千〜)のため、そのままではCPUキャッシュやメモリに乗り切らずに非効率な計算になりやすく、扱いが難しいデータです。 こうした疎行列を効率的に扱うために、Pythonではscipy.sparseがよく使われます。 scipy.sparseで提供されている疎行列クラスはいくつかあります。 詳細は公式ドキュメントを参照ですが、代表的な3つのクラス(lil_matrix, csr_matrix, csc_matrix)について紹介します。 https://d

    Python: scipy.sparseで疎行列計算する - け日記
  • Python で疎行列(SciPy) - 唯物是真 @Scaled_Wurm

    疎行列とは 疎行列は成分のほとんどがゼロである行列のことです。 たとえば、文書に登場する単語の頻度を数えたりするとこういった行列になります。 他にも疎なグラフの隣接行列は疎行列になります。 こういった行列は通常の行列(密行列)を使うよりも、少ないメモリで処理できたり、高速に処理できたりすることがあります。 疎行列 - Wikipedia 例えば簡単な例として上の行列を考えます。 この時すべての成分を保存するには個分の数値のメモリが必要になります。 しかし上の行列では非ゼロの要素は3個だけです。 この3個について、以下のように行と列の位置と値だけを覚えておけばとなりすべての成分を記憶しておくよりも効率的なことがわかると思います。 疎行列の種類 上では単純な例を示しましたが、実際の疎行列はそれぞれ特徴の異なる様々な表現手法が用いられていて、SciPyにも以下のような種類の疎行列が実装されていま

  • S2PL、SS2PL、C2PL - nkty blog

    背景 先日、CSR (Conflict Serializability)について説明しました。 今回は、CSRを満たすスケジューリングを動的に生成する方法について、整理してみます。 なお、ここで書くその方法とは、2PL (Two Phase Lock)なのですが、一応念のため書いておくと、2PC (Two Phase Commit)と混同しないでください。 2PCは、複数のDBでトランザクションを管理する分散トランザクションを実現する方法の一つです。 分散トランザクションは、また別の機会に書きたいと思います。 PaxosやRaft、Spannerなど。 成長層と縮退層 2PLは、トランザクションが開始しデータにアクセスすると、そのデータにロックをかけていきます。 そして、トランザクションの終了時に、全てのロックを解除します。 ロックをかけていくフェーズを成長層 (Growing Phase

    S2PL、SS2PL、C2PL - nkty blog
  • Python: PandasのDataFrameを横持ち・縦持ちに変換する - け日記

    PandasのDataFrameを縦持ちから横持ちにする方法とその逆(横持ちから縦持ちにする方法)についての備忘録です。 縦持ちと横持ち 縦持ちは、以下のように、カラム固定で1行に1つの値を持たせている表です。カラムをおいそれと変更できないDBのテーブルなどはこういった形かと思います。 customer_id product_id count C1 P1 1 C1 P2 2 C2 P2 2 C2 P2 1 C3 P3 3 一方で、横持ちは、カラム数が可変で1行に複数の値をもたせている表です。行列はこういう形になるでしょう。 P1 P2 P3 C1 1 2 0 C2 0 3 0 C3 0 0 3 縦持ちから横持ちへ変換する それでは縦持ちとなっている以下のデータを横持ちへ変換します。 import pandas as pd import numpy as np orders_df = pd.

    Python: PandasのDataFrameを横持ち・縦持ちに変換する - け日記
  • Rでone-hot encodingするときに便利なパッケージ{dummies} - と。

    はじめに 私生活でも仕事でも「カテゴリ変数を[0,1]実数で表現したい」という欲望に駆られる. どういうことか?下のように入っているデータがあるとする. Category A B C これを,下のように変換したい. Category_A Category_B Category_C 1 0 0 0 1 0 0 0 1 界隈ではこのようなデータの変換をone-hot encodingという. 自前でアルゴリズムを組んでみるのもためになるが,納期は迫る.焦る. そんなときのdummiesパッケージ. 開発元は下. github.com 大したことやっていない実装例は下. github.com インストールはみなさんおなじみinstall.packages("dummies") 使うデータも皆さんおなじみirisを使う. install.packages("dummies") dat <- iri

    Rでone-hot encodingするときに便利なパッケージ{dummies} - と。
  • レコメンドつれづれ ~第3回 レコメンド精度の評価方法を学ぶ~ - Platinum Data Blog by BrainPad

    記事は、当社オウンドメディア「Doors」に移転しました。 約5秒後に自動的にリダイレクトします。 「レコメンドつれづれ」は、レコメンド手法の概念や実装方法を中心に、レコメンドに関する基礎的な内容から最近流行りの技術まで幅広くご紹介する連載です。第3回は、レコメンドの評価方法について、代表的な評価方法・指標をピックアップしてご紹介します。 こんにちは。アナリティクスサービス部の小田です。レコメンドについて考察していく連載の第3回です。 第1回 協調フィルタリングのコンセプトを知る 第2回 協調フィルタリングの実装 第2回では、協調フィルタリングの実装を行いました。連載では今後各種手法を実装しながら比較していく予定ですが、その前にレコメンドの評価について確認したいと思います。といっても、レコメンド全体の評価となるとシステムやユーザビリティの評価など広範にわたりますので、今回はアルゴリズ

    レコメンドつれづれ ~第3回 レコメンド精度の評価方法を学ぶ~ - Platinum Data Blog by BrainPad
  • チュートリアル1: 1-gram言語モデル - 自然言語処理の分別奮闘記

    とりあえず1回目は、前に言っていたNLP Programing TutorialのCapter01(pdf)、1-gram言語モデルの勉強です。 では、スライドに沿って話を進めようと思います。 言語モデルって何? 1-gram言語モデルの前に、そもそも言語モデルって何? 具体例で説明すると。 音声認識システムにて、認識した結果の出力候補としていくつかの単語列があったとしましょう。 W1 = speech recognition system W2 = speech cognition system W3 = speck podcast histamine W4 = スピーチ が 救出 ストン 言語モデルは、これらの単語列に「もっともらしさ」を与えてくれるのです。 一般的には、各単語列に確率を与えてくれます。 上の各単語列は、ある言語モデルに基づくと P(W1) = 4.021*10-2 P

  • ターミナルからプライベートIPアドレスとMACアドレス、ルーティングテーブルを確認する - bambinya's blog

    自分のlaptopのプライベートIPアドレスがどのように割り当てられているか、調べる。 ターミナルから$ ifconfig をうつ。複数のインターフェースが表示される。 上記は「lo0」「gif0」「stf0」「en0」が表示されている。 他にも「en1」「en2」「p2p0」「awdl0」「bridge0」「utun0」が表示された。 各インターフェースの名前と役割 lo0(loopback) ネットワークのテストに使えるよう用意された仮想インターフェース、NICがなくても、このloは表示される。inetの127.0.0.1がIPアドレスとして自動で割り当てられる。 gif0(generic tunnel interface) IPv6/IPv4トンネリングを行うときに使うインターフェース。IPv6/IPv4トンネリングとは、IPv4(またはIPv6)をサポートするネットワークに、IPv

    ターミナルからプライベートIPアドレスとMACアドレス、ルーティングテーブルを確認する - bambinya's blog