タグ

2022年3月28日のブックマーク (5件)

  • Apache Drill で遊んでみた。プラグインも作ってみた。 - Qiita

    sh19910711
    sh19910711 2022/03/28
    2016 / "WHERE ORDER GROUP BY などはプラグイン側では一切処理していません。Drill側が面倒をみてくれます / 外部ストレージのプラグインの実装を見てみると、極力そちら側で処理してもらうような最適化を行っており"
  • Bayesian Statistics and Marketingの5章 – 家計の異質性を考慮した階層ベイズモデル – かものはしの分析ブログ

    都内の事業会社で分析やWebマーケティングの仕事をしています。大学・大学院では経済学を通じて統計解析を行うなどしておりました。企業に勤めてからは、機械学習やテキストマイニング、クローリング技術などに関心を持っています。 Twitterアカウント Mr_Sakaue( SKUE ) GitHub 読書メーター ほしいものリスト はじめに ゴールデンウィークで実家に持ち込むとしてチョイスしたのが、2005年出版の「Bayesian Statistics and Marketing」です。大学院のときに購入して、ちょっとしか読んでませんでした。 このは、字面の通りマーケティング関連の分析に関してベイズ統計を使ってアプローチするというもので、この書籍のために作られた、Rのbayesmというパッケージの紹介もあり、理論だけでなくRで実践することもできます。1章から7章までの全ての分析事例に対して

    Bayesian Statistics and Marketingの5章 – 家計の異質性を考慮した階層ベイズモデル – かものはしの分析ブログ
    sh19910711
    sh19910711 2022/03/28
    "マーケティング関連の分析に関してベイズ統計を使って / 2005年の本とは言え十分に使いみちのある本 / ケーススタディが5つほどあるのですが、それのstanコード化などをしていけばかなり力がつくような気がします"
  • PC選びの過程を検索の時系列データから見る|ヤフー・データソリューション

    こんにちは、データアナリストの中込攻太郎です。 早いもので気付けば3月下旬。もうすぐ新年度ということで、この機にパソコンを新しくしてみようという方も多い頃ではないでしょうか? パソコンのような大きな買い物の時には慎重にしっかり調べてから買うことが多いですよね。 となればその調べ物の様子は検索データにしっかり出ているはず! ということで今回は「新しいパソコンが欲しい!」と思った方がどのようにパソコンを探し選んでいくのか、その過程を「DS.INSIGHT」を使って調べてみたいと思います。 今回は以下のような流れで分析を行います。 「新しいパソコンが欲しい人」が検索する代表的な検索ワードを決めるまずは「新しいパソコンが欲しい人」が検索する代表的なワードの見当を付けます。 その見当を付けるために、DS.INSIGHT Peopleの「共起キーワード」機能からそれらしいキーワードを探してみます。 共

    PC選びの過程を検索の時系列データから見る|ヤフー・データソリューション
    sh19910711
    sh19910711 2022/03/28
    "「パソコン おすすめ」を調べた人がその前後にどういった検索をするのか / 最初に「トラブル」や「用途」に関する検索 > 1日経たないうちに「おすすめ」や「価格」 / 「スペック、機能」について調べたり"
  • クローラを生まれ変わらせるにあたっての思考 - かれ4

    Advent Calendar 2015の13日目の記事です。 今うちで動いているCrawlerは数年前に作られたもので、 仕組みとしてはAzureのService Fabricの上でAWSLambdaを動かしているのと似たアーキテクチャになっている。 そろそろ生まれ変わりの頃かなと思う。 生まれ変わるにあたって、これからのアーキテクチャをどうしようかと悩むわけだけど、 そんな時には過去に遡っていくと次時代へのヒントが転がっていることがよくある。 特に、過去に敗北した素晴らしいアーキテクチャが今の技術であれば一般時にも実現可能になっていたりする。 昔話 昔々世界にはInktomiという会社と AltaVistaという会社があった。 Inktomiという会社はソフトウェア開発会社で、2002年に米Yahoo!に買収されている。 AltaVistaは検索エンジンの会社だったが、2003年にO

    クローラを生まれ変わらせるにあたっての思考 - かれ4
    sh19910711
    sh19910711 2022/03/28
    SQLでDOMのセレクタ捌くの良さそう / 2015 / "Scrapingをする必要があるのは、インデックスを作りたいのではなく、構造化されたデータとして使いたい場合 / SELECT `span\.name`, `span.price` FROM `STORAGEPREFIX.div#listtable ul li `"
  • 良い"空気"のスタートアップを作る技術|Anno Takahiro

    手前味噌だが、弊社のオフィスではそれなりに良い”空気”が漂っているのではないかと自負している。やはり働くにあたってどういう”空気”で働くかは重要だと考えている。”空気”といっても、「人々の気持ちを支配するようなその場の雰囲気」のことではない。文字通り「オフィスに充填された気体」のことを指して言っている。 なぜか弊社のCareers Deck(採用候補者向けのプレゼン資料)にも、空気に関する記載が多い。「採用候補者向けの資料に占める空気関連の記述領域の割合」は数あるスタートアップの中でも上位にい込むのではないだろうか。 働く場所における気体の”空気”を大事にする風潮は、COVID-19で「密を防ごう」という文脈から一気に加速した感じはあるものの、実はその前から割と言われるようになってきていたように思う。 リアルかオンラインかの議論以前に、CO2満載の会議室だけは撲滅したい。。あれは明確にハ

    良い"空気"のスタートアップを作る技術|Anno Takahiro
    sh19910711
    sh19910711 2022/03/28
    "空気と一言にいっても、いろいろな性質 / 推奨温度は研究によってバラバラ / 窓はほんの少しだけ開けておくことでも意味がある / 空調を『つける』か『つけない』か > 高度に政治的な判断が伴う"