タグ

2022年1月13日のブックマーク (4件)

  • データはほんとうに「真実」なのか - Qiita

    最近、データを使うということが手段でなく、目的になってしまい、その挙げ句、データが「神格化」されてしまっているような風潮があります。 つまり、データが言うのだから、間違いはないというわけです。 そこで「データ・ドリブン」という言葉が先歩きをしてしまうのでしょう。 もちろん、単に「データ」と言っても、人によってその意味することは様々ですが、その中でも、英語では、「Raw Data」、日語にすると「生データ」、つまり加工する前の、とれたてほやほやのデータという意味でのデータは、人間によって操作されていないので、事実で、客観的で、正直だと私達は思い込んでいたりします。 しかし、そういった期待は全くの勘違いで、データとは集められた瞬間からすでに人間の意思によって「汚れている」ものなのだという記事がおもしろかったので、こちらで紹介したいと思います。 以下、要訳。 Why Data Is Never

    データはほんとうに「真実」なのか - Qiita
    sh19910711
    sh19910711 2022/01/13
    "データとは集められた瞬間からすでに人間の意思によって「汚れている」もの / 使いこなせない人がデータを持ってしまうことで、データにドライブされてしまい、おかしな意思決定を行ってしまう"
  • cakes(ケイクス)

    cakesは2022年8月31日に終了いたしました。 10年間の長きにわたり、ご愛読ありがとうございました。 2022年9月1日

    cakes(ケイクス)
    sh19910711
    sh19910711 2022/01/13
    "囲碁は陣地を作るゲーム / 陣地がどのようにできていくかイメージできると、囲碁はグンと面白くなります / 石と石の幅をとって柔軟に対応できるようにしておくのが、結果的に効率良く陣地を囲うことに"
  • Atcoder Heuristic Contestの順位とアルゴリズムのレートの関係性を眺める - rmizutaの日記

    はじめに Atcoder Heuristic Contest(AHC)は最適解を出すのが難しい問題に対し、出来るだけ良い解を作成するコンテストで、 開催期間が1週間以上の長期コンテストと、1日未満の短期コンテストがあります。 ABC/ARC/AGCのような最適解を求めるアルゴリズムコンテストとは性質の異なるものにはなるのですが、 体感としてアルゴのレーティングが相対的に低い人は長期コンテストの方が良い順位がとりやすい感じがしたので、 それをデータを見て確認したいと思います。 必要なデータはAtCoderの順位表のページのURLに/jsonをつければjson形式で取得できるので、それを利用しています。 コンテスト種別 現在まででRatedのヒューリスティックコンテストは9回開催されており、 うち5回が短期、4回が長期コンテストでした。 コンテスト名 開催期間 種別 AtCoder Heuri

    Atcoder Heuristic Contestの順位とアルゴリズムのレートの関係性を眺める - rmizutaの日記
    sh19910711
    sh19910711 2022/01/13
    "若干ですが長期コンテストの方がばらつきが大きいように見えます / 30位以内に絞ると長期と短期で傾向に違い > 青色以下の人が30位以内に入る比率が短期だと平均20%程度なのに対し、長期だと50%近くまで増加"
  • GKEでなるべく節約してcronjobを使う方法 - 現場データサイエンティスト奮闘記

    概要 cronjob をGKEで使っているけど、常に n1-standard 系のインスタンスが立っていると結構お高い しかし処理によっては g1-small などの貧弱なインスタンスでは足りないケースがある したがって cronjob のときだけパワーのあるマシンが使えるようにして最低限の課金で済ませたい という状況に使えるアイディアです。 結論から言うとjobテンプレートに nodeSelector を記載して、default node pool 以外のノードを指定する方式です。 クラスタ作成時に default node poolと cronjob 用の node pool を作成する 自分は default node pool は以下のように作っています。 マシンタイプは g1-small f1-micro だとやたら不安定なのでおすすめしません サイズは最小の2個 プリエンプティ

    GKEでなるべく節約してcronjobを使う方法 - 現場データサイエンティスト奮闘記
    sh19910711
    sh19910711 2022/01/13
    nodeSelector