タグ

ブックマーク / blog.recruit.co.jp (10)

  • リクルートテクノロジーズ 新人研修特別編を公開します

    こんにちは。アプリエンジニアの五味です。 2017年4月にリクルートホールディングスの新卒Web採用枠で入社した新卒社員のうち、21名がリクルートテクノロジーズに配属となりました。(いらっしゃい!) リクルートテクノロジーズでは「ブートキャンプ」と呼ばれる新卒社員向けの技術研修を3か月間実施しています。 もともと高い能力を持つ彼・彼女らですが、「これからのリクルートをリードしていく存在」になって欲しいという期待を込め、プロとしての重要な立ち上がり期を支援しています。 今年からは社外講師の既存プログラムに加え、より実践的な内容を求める経験者をターゲットに、総勢12名の現場エンジニアが担当する特別講座を開催しました。 各分野のスペシャリストがこれまで現場で培ってきた「当に必要な生きた知識・技術」のインプットは、彼・彼女らの成長を加速させ、これからのエンジニア人生の礎になってくれるものと僕らは

    リクルートテクノロジーズ 新人研修特別編を公開します
  • A/Bテストに用いられる統計的検定手法(ロジック)のまとめ&比較 | RCO Ad-Tech Lab Blog

    リクルートデータ組織のブログをはじめました。※最新情報はRecruit Data Blogをご覧ください。 Recruit Data Blogはこちら 汎用人型雑用AIの stakaya です。 たまたま数年前に社内のBLOGに書いたABテストのロジックのまとめ&比較記事を発掘したので、 このまま眠らせているのはもったいないぞと、 圧倒的もったいない精神を発揮し、シェアさせていただきます。 あの頃は私も若かった。 社内では”堅物・真面目・一途”で有名なものでして、下記文章がお硬いのはご勘弁ください。 はじめに 記事は、施策の評価手法としてしばしば用いられるA/Bテスト(A/B testing)について、できる限り背後にある仮定を明記した上で、まとめたものである。 A/Bテストとは、主にインターネットマーケティングにおける施策の良否を判断するために、2つの施策(通常、A・Bと記載)を比較す

    A/Bテストに用いられる統計的検定手法(ロジック)のまとめ&比較 | RCO Ad-Tech Lab Blog
  • RCOアドテク部論文輪読会:「Factorization Machines」を紹介しました | リクルート

    リクルートデータ組織のブログをはじめました。※最新情報はRecruit Data Blogをご覧ください。 Recruit Data Blogはこちら ゆるふわ系エンジニアの林田です。 データ分析チームの論文輪読会で「Factorization Machines」を紹介しました。 Factorization Machinesは2010年Steffen Rendle氏によって提案されたモデルで、識別問題、回帰問題、ランキング問題など様々な問題に適用できる一般的なモデルです。複数のCTR予測コンテストで優勝チームが利用したモデルとして話題になりました。 論文に沿って、Factorization Machinesのモデル、計算量に関する考察、SVMとの比較、最先端の因子分解法との比較について議論しました。

    RCOアドテク部論文輪読会:「Factorization Machines」を紹介しました | リクルート
  • NNライブラリChainerをScikit-learn likeにガンガン拡張する

    APソリューショングループの大杉です。 SFCの修士2年の加藤慶之さんが、機械学習を中心としたデータ分析について勉強してみたいと言ってきたので、OJT的に3ヶ月間ほど一緒に仕事をさせてもらいました。 その中で機械学習ツールを共同開発したのですが、世間に公開できるレベルまで作りこむことが出来たのでリクルートテクノロジーズのgithubレポジトリでxchainerという名前で公開することとなりました。 このツールについて、加藤さんが記事を書いてくれたので、人の承諾のもと、ここにその記事も公開します。以下、加藤さんの記事です。 はじめに 近頃話題の、PFIが開発しているChainerというニューラルネットワークのライブラリはご存知の方も多いかと思います。ネットワーク構造の定義なども直観的に書くことができてとても素敵なライブラリなのですが、Scikit-learn1との互換性がないので予測率の評

    NNライブラリChainerをScikit-learn likeにガンガン拡張する
  • Convolutional Neural Networkを用いて商品に新しいタグを付与しました

    データ活用推進担当の白井です。最近、リクルートマーケティングパートナーズとリクルートテクノロジーズで協働し、カーセンサーnetの「内装色検索機能」をリリースしました。 今回は、この裏で動いているConvolutional Neural Network(以下CNN)の概要と、活用方法について以下の流れで紹介したいと思います。 内装色検索機能の概要 なぜCNNを適応したか 物体認識とCNN 内装判別モデルの作成について 終わりに 1 内装色検索機能の概要 カーセンサーnetでは、中古車販売店のクライアント(広告主)が、商品である車の情報を登録して入稿します。この時登録される情報が、カスタマー(サイト利用者)の検索用のタグとなります。例えば、走行距離が3万キロなら、カスタマーが検索条件に「走行距離5万キロ未満」と入れればヒットして、「走行距離5万キロ以上」ならヒットせず、といった具合です。

    Convolutional Neural Networkを用いて商品に新しいタグを付与しました
  • ディープラーニングで検索ランキングを改善し、大きな効果が出た話

    検索改善担当の大杉です。今回は、2015年度まるまる取り組んでいたディープラーニング1を活用した施策について共有します。 汎用的に使えそうな部分を抽出して書いています。なので具体的な数字は出てきませんが、検索動線がコンバージョンに影響を与えるようなサービス一般に対して通用するんじゃないかと思ってます。 前提として すでにログやユーザーが集まっているサービス 専門性の高いメンバーで構成されたチーム(データサイエンティストは不在) が、すでに与えられている恵まれた状態からスタートしています。 なにをやったか ポンパレモールというECサイトで、検索時のランキングアルゴリズムの改善をやりました。検索基盤についてはこちらをご参照ください。 リクルート全社検索基盤のアーキテクチャ、採用技術、開発体制はどうなっているのか (1/2) 今回はそのアルゴリズムのロジック部分の話です。 やったことを1文にまと

    ディープラーニングで検索ランキングを改善し、大きな効果が出た話
  • モダンな開発をするための取り組み

    CETプロジェクトで開発を担当している明智です。 今回は、社内向けに開催したAtlassianユーザ会をレポートいたします。 リクルートライフスタイルでは、Atlassianの製品を格導入して1年が経ちました。 これらの製品を使っていくうちに、「正しく使えてる?」「他のチームはどうしてる?」という疑問が出るようになっていました。 そこで、モダンな開発について触れるために、Atlassianエバンジェリストの長沢さんをお招きし登壇していただきました。 また、社内からもスピーカを募り、各チームでの使い方の共有も行いました。 今回のイベントでは3件の発表がありました。 今の時代に必要な開発環境とこれから 〜継続的デリバリー、DevOps〜 JIRAとAWSTableauを利用しデータドリブンにプロダクトや運用改善につなげる ナレッジを共有する文化を作るために さて、前置きはこれぐらいにして、

    モダンな開発をするための取り組み
  • DockerでローカルにDBを立ててテストをもっと快適に!

    こんにちは、Airシリーズ海外開発チーム 15新卒フロントエンドエンジニアの蔀です。 普段は見習いFEとして、画面を作っています。 Airシリーズ海外開発チームでは、DockerでアプリケーションやDBのコンテナを立て、継続的インテグレーションに役立てています。 チーム内では自動テストが文化として定着しつつある一方で、共有しているMac mini上のDBコンテナに負荷が集中して、テスト実行時間が長くなっていました。 そこで、Docker Registryという技術を用いて、最新のDDLを適用したDBのイメージをチームメンバーに配布し、各自のローカルでDBを用いたテストを実行できるようにしてみました。 背景 チームの環境 バックエンドのエンジニアは4名 DBOracle 3名がMacで、1名がWindows チーム内で1台のMac miniを共有し、その上にDockerコンテナを立ててCI

    DockerでローカルにDBを立ててテストをもっと快適に!
  • SparkRをEC2上で動かして分散処理してみる

    こんにちは!美味しいコーヒーを飲むために、毎朝早くにデスクコーヒーミル回してます、アナリティクスチームの高柳です。 アナリティクスチームでは、じゃらんnetやホットペッパービューティーをはじめとしたリクルートライフスタイルのサービスに対して、基礎集計やレポーティング、また、データマイニング(データ分析)を活用し、高速にサービスを改善していくというミッションを担っています。 記事では、データ分析環境としてのApache Spark、特にver 1.4から利用可能になったSparkRを、当チームのAWS上の分析環境に導入検討していたので、その辺について書きたいと思います。 SparkRは、まだリリースから日が浅いことから、日語の記事が相当に少ないので、この記事がみなさんの"Happy SparkR ライフ"のお役に立つことを願っております。 Apache Spark導入の背景 サービスを

    SparkRをEC2上で動かして分散処理してみる
  • Terraform + fluentd + Docker + Puree で小さく始めるモバイル行動ログ収集基盤構築 | PSYENCE:MEDIA

    Terraform + fluentd + Docker + Puree で小さく始めるモバイル行動ログ収集基盤構築 河合 航平 2015.07.07 1273 194192628259 こんにちは。 4月から新卒駆け出しインフラエンジニアとして日々奮闘しております河合です。 "モバイル行動ログ収集基盤" を "小さく" 始めたので、以下にインフラ構築からモバイルまでの設計までをまとめたいと思います。今回このログ収集基盤を作るにあたって私自身がこれまで経験したことのない技術・ツールを利用しましたので、それらの導入についてもご紹介いたします。 導入の背景 私は英単語サプリを中心にインフラを担当しています。 英単語サプリとは、聞ける・話せる・覚えてるをコンセプトとした高校受験からTOEICまで対策できる英単語学習のサービスです。 ユーザの分析によく使われるツールの1つにGoogle Analy

    Terraform + fluentd + Docker + Puree で小さく始めるモバイル行動ログ収集基盤構築 | PSYENCE:MEDIA
  • 1