タグ

bigqueryに関するskypenguinsのブックマーク (5)

  • BigQueryによる最大内積検索の実装

    はじめに 機械学習エンジニア田志温です。最近担当した類似アイテム推薦の案件で、BigQueryを使って最大内積検索(MIPS; maximum inner-product search)1 を実装したので、その方法と高速化のテクニックを紹介します。 類似アイテム推薦は「多数のアイテム候補から、クエリとなるアイテムに最も類似したK件を抽出する」というタスクなので、MIPSないし近傍探索の枠組みで解くことが一般的です。 一定の規模を持つサービスでMIPSを実装しようとすると、アイテム数×特徴量次元の行列が何かと厄介です2。第一に、MIPSを素朴な行列積で実装すると、時間・空間計算量がアイテム数の2乗でかかってきます。典型的には空間計算量の方がボトルネックになりやすく、RAMの制約に収めるための工夫が必要になるでしょう。第二に、アイテム数が膨大な場合、特徴量マートから全アイテムの特徴量を転送

    BigQueryによる最大内積検索の実装
  • BigQueryで150万円溶かした人の顔 - Qiita

    ※ かなり前の記事ですが、未だに引用されるので一応追記しておきます。タイトルと画像がキャッチーなのはちょっと反省していますが、これを見てBigQuery使うのを躊躇している人は多分あまり内容を読んでいないので気にする必要はないです。自分は当時の会社でも今の会社でも個人でも普通にBigQuery使っていて解析用データなどはBigQueryに入れる設計をよくしています。また、アドベントカレンダーだったのでネタっぽく書きましたが事前に想定できる金額です。 ※ 代役:プロ生ちゃん(暮井 慧) 巷のBigQueryの噂と言えば「とにかく安い」「数億行フルスキャンしても早い」などなど。とりわけ料金に関しては保存しておくだけであれば無視できるほど安く、SQLに不慣れなプロデューサーがクエリを実行しても月数ドルで済むなど、賞賛すべき事例は枚挙に暇がありません。 しかし、使い方によってはかなり大きな金額を使

    BigQueryで150万円溶かした人の顔 - Qiita
    skypenguins
    skypenguins 2015/12/06
    あびゃ〜
  • 使いたければ使えば?ツンデレなGAEとBigQueryを語るの巻 (1/2)

    吉積:吉積情報 代表取締役 吉積礼敏。アクセンチュア出身で現在Google専門の開発会社を経営。Google社員以外の⽇人として初めてGoogle Apps Certified Deployment Specialistを取得。2014年3⽉、日人として初めてGCPのQualified Developer5種⽬合格。 上田:ソフトウェアエンジニア 上田哲広。Web系の開発でGoogle App Engineを使ったことがきっかけでコミュニティに参加し、現在はGoogle Developers Expertとして活動中。サーバーサイドでGCPAWSを使っており、最近はAndroidやiOSのアプリも開発している。好きな言語はGoPython。 得上:オークファンサービス基盤技術部長 得上竜一。新会社に移って、ますます意気盛んなML(Machine Learning)の第一人者。最近は

    使いたければ使えば?ツンデレなGAEとBigQueryを語るの巻 (1/2)
  • Google BigQueryで今期アニメに関するツイートを分析するぞい! - Qiita

    BigQueryでアニメに関するツイートを分析する アニメツイートを記録したCSVをBigQueryに上げる データ形式を選択する CSV/JSON/AppEngine Backupが選べますが今回はCSVとします。 File Uploadでブラウザからファイルアップロード・・・といきたい所ですがファイルブラウザからのアップロードは10Mバイトに制限されています。 10Mバイト以上のファイルはGoogleのクラウドストレージにファイルをアップロードする必要があります。 Google Cloud Storage にデータを上げる Cloud StorageにBucketsを作成しファイルをアップロードします。 こちらではブラウザから10M以上のファイルのもアップロードできますが、数百Gバイトなどのでかいファイルはブラウザがタイムアウトなどを起こすのでGoogleの用意するツール(gsutil

    Google BigQueryで今期アニメに関するツイートを分析するぞい! - Qiita
  • BigQueryで待望のUDF(user-defined function)がリリースされたので早速試してみた | feedforce Engineers' blog

    ゆきやんです! ついに出ました!! UDF!!! 前回の私の投稿では弊社でのBigQueryの導入事例をご紹介いたしました。 今回は、今朝リリースされたBigQueryの新機能であるUDFについて書きたいと思います。 UDFとは UDFとは、BigQueryで実行するクエリ内にJavaScriptを書いて任意のロジックが実行できるようになる機能です。 この機能によって、BigQueryのクエリでは表現しづらかったことも表現しやすくなります。 UDFはすぐに試せる UDFを用いたクエリの実行は、以下のようにBigQueryのWebUIからすぐに試すことができます。 Query Editorでは、クエリを入力します。 UDF Editorでは、UDFを入力します。 実際に使ってみる では、実際に使ってみながら説明していきます。 ある数値をカンマ区切りの金額表示形式に変換してみましょう。 (例:

    BigQueryで待望のUDF(user-defined function)がリリースされたので早速試してみた | feedforce Engineers' blog
  • 1