並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 314件

新着順 人気順

"data scientist"の検索結果1 - 40 件 / 314件

  • 【転職エントリ】Googleに入社します|Lillian

    はじめに この記事には、Googleのオンサイト面接に向けて勉強した内容が記載されていますが、それらはすべて面接を受ける直前に書いておいたものです。このエントリを読むことで面接で聞かれた内容が予測されてしまわないようにそのようにさせていただきました。ご了承お願いします。 この記事について 令和元年に医師を退職し、ソフトウェアエンジニアに転職します。 自分にとって大きな転機であったのと、とても大変な道のりであったので、私という人間が辿った道筋を最初から最後までちゃんとまとめておきたいと思いこの記事を書くことにしました。 私のような他業種から未経験での転職を目指されている方にとっても、何らかの参考になる内容であれば幸いです。 私の生い立ち 私は小さい頃からテレビゲームが大好きで、学校から帰るとずっと家でゲームをしている子でした。あまりにもゲームが好きだったので、遊ぶだけではなく自分で作ってみた

      【転職エントリ】Googleに入社します|Lillian
    • 「未経験文系から3ヶ月でデータサイエンティストになって一発逆転」はここで終わり (2020/7/31 更新) - todo-mentor’s diary

      データサイエンティストを生業にする手段と実態について述べる。 途中、具体例・境界値の例として私個人の話もするが、なるべく一般性のある話をする。 この記事で言いたいことは具体的には4つだ。 プログラミングスクールをディスるなら代わりの入門方法を提供しようよ。 もう「未経験文系から3ヶ月でデータサイエンティストで一発逆転物語」を止めろ。*1 おじさんは人生逆転したいなら真面目にやれ。 若者はワンチャンじゃなくて、ちゃんと化け物になれよ。 この記事についてはパブリック・ドメインとして転載・改変・リンク記載を自由にしてよいです。 (続き書いた) a. 入門は辛いが… b. 思考停止でプログラミングスクールに通うな。 なろう系・始めてみよう系資料一覧 (最速・最短ルート用) まずは動かしてみよう。強くてニューゲームが体験出来るぞ! 入門以前の本 一般向け業界本 (AI業界と展望がわかる本) 技術者入

        「未経験文系から3ヶ月でデータサイエンティストになって一発逆転」はここで終わり (2020/7/31 更新) - todo-mentor’s diary
      • 今日 Twitter 日本法人を解雇された皆さんへ #OneTeam - The Decisive Strike

        Twitter #OneTeam の皆さん、こんにちは。昨年まで Twitter (Scaled Enforcement Heuristics, Health Engineering) で Data Scientist として働いていた Kazushi と言います。 Elon Musk によって解雇された皆さん、おつかれさまでした。これから転職先を探す方もいらっしゃると思います。しかしその前に、まだ自分以外にこの点について公に言及されている方がいらっしゃらないようなので、簡単にブログに書いておきます。これは不当解雇であり、法廷で争うべきことです。労働者の庇護が日本ほど手厚くないアメリカでも、訴訟が起こっています。戦いましょう。 今日解雇された Twitter 日本法人社員も不当解雇として法廷で争って欲しい。整理解雇要件を満たすのは難しいはず。 https://t.co/mscQURXi70

          今日 Twitter 日本法人を解雇された皆さんへ #OneTeam - The Decisive Strike
        • 「努力して成功」もただ運がよかっただけ?能力主義の落とし穴を指摘するサンデル先生の新刊がおもしろそう

          Yuki Nakazato @ynakazat Product @MetaAI. ex @awscloud, @OneCarlyle, @BankofAmerica. @BerkeleyHaas, @UTokyo_News, @kaiseikai. Opinions are my own. アメリカでゴルフ/テニス/キャンプ/ボードしてますが腕前は聞かないで下さい https://t.co/IiVuUyjYoV Yuki Nakazato @ynakazat 結局のところ、人生は運次第でどうにでも転ぶ超unfairなものなので、人と比べず、自分でコントロールできる数少ないものを大事にして、後は運良く大きくうまくいくことが沢山起きそうな場所に身を置くくらいしかできないと思ってます。後はせめて他人にはfairに接することか。 2021-05-10 11:08:22 TJO @TJO_datas

            「努力して成功」もただ運がよかっただけ?能力主義の落とし穴を指摘するサンデル先生の新刊がおもしろそう
          • プロダクトの成功に必要な 3 つのステージと 20 のタスクについて:現場の動き方をまとめました|Fritz | Lead Product Manager @ Mercari

            こんにちは、フリッツ です。プロダクトマネージャー(以下 PM)になってから相当の年月が経ち、特に、現職の US メルカリにおいては「 UIUX 強化型 PM 」として認知されるようになりました(ありがたい)。 ただ、最近は自分があまりにもいま持っているスキル・経験に立脚しすぎているなぁ、と感じており、強みの分野を広げようとお勉強中。 ということで、旅の序盤として、本記事では「プロダクトの成功」を導くために必要とされる、問題定義・優先順位決定・実行 という 3 つのステージを PM 視点から 20 項目にわけてみました。できるかぎり、(自分の今までの)現場の動き方に沿うようにまとめました。割と基本的な内容ではありつつも、特に実行のパートにおいては、現場で役立つような個人的知見を多少含められたはず…。 プロダクトに関わる方、および・駆け出し~数年目の PM の方のお役に立てる記事になっていれ

              プロダクトの成功に必要な 3 つのステージと 20 のタスクについて:現場の動き方をまとめました|Fritz | Lead Product Manager @ Mercari
            • This is The Entire Computer Science Curriculum in 1000 YouTube Videos

              This is The Entire Computer Science Curriculum in 1000 YouTube Videos In this article, we are going to create an entire Computer Science curriculum using only YouTube videos. The Computer Science curriculum is going to cover every skill essential for a Computer Science Engineer that has expertise in Artificial Intelligence and its subfields, like: Machine Learning, Deep Learning, Computer Vision,

                This is The Entire Computer Science Curriculum in 1000 YouTube Videos
              • 「ググれば何でも分かる時代に知識の暗記が問われる職業は必要?」という意見が→集まる反論になぜ暗記が必要かがよく分かる

                TJO @TJO_datasci Takashi J Ozaki, PhD / Data Scientist since 2012 / tjo.hatenablog.com / DVT (treated with Rivaroxaban) / Tweets are totally personal & my own linkedin.com/in/tjozaki TJO @TJO_datasci 「ググれば何でも分かる時代に医師や弁護士など知識を暗記するだけの職業は廃止すべき」という論を見かけて、予備校バイトしてた時に医学部志望の受験生から「暗記なんか無駄だ」と言われて「君は目の前の患者があと2分で死んでしまうという時に5分かけて治療法を調べるのか」と返したのを思い出した 2023-06-26 09:51:09

                  「ググれば何でも分かる時代に知識の暗記が問われる職業は必要?」という意見が→集まる反論になぜ暗記が必要かがよく分かる
                • データエンジニア道の俺のバイブル

                  先人の知恵に学ぶ データエンジニア道で、本当に良かった!読み物を、不定期に追記していく。 A Beginner’s Guide to Data Engineering — Part I データエンジニアをこれから始める人に、必ず薦める記事。データエンジニアの基本を学べるかつ、どういう世界に広がっていくのかまで、一気に学べるのでとても良い。 Functional Data Engineering — a modern paradigm for batch data processing 関数型パラダイムを使ったデータパイプラインの構築方法。これを初めて読んだ時の衝撃は今でも忘れないし、フルスクラッチからdbtを使ったデータパイプラインになっても健在な設計手法。 Engineers Shouldn’t Write ETL: A Guide to Building a High Function

                    データエンジニア道の俺のバイブル
                  • ITスキルロードマップ roadmap.sh がすごい。AI and Data Scientist について対応する本をまとめた - Qiita

                    ITスキルロードマップ roadmap.sh がすごい。AI and Data Scientist について対応する本をまとめた機械学習データ分析キャリアデータサイエンスデータサイエンティスト Developer Roadmapsというサイトがすごいです。ITエンジニアの分野別にスキルアップのロードマップが示されています。 言語、基盤、アプリ、かなり網羅されています。 その中のAI and Data Scientist Roadmapについての推薦図書まとめです。 雑感 これだけ学んでいれば「こいつ知ってるな」感がありますね。ただ気になる点としては ビジネス、ドメイン知識や分析目的定義などのスキルについて言及がないのは残念。 いきなり数学から入るコースになってますが、一旦は飛ばしてコード写経してから戻ってきても良いと思います。ここで挫折すると勿体無いので。 計量経済学重視の観点はいいですね

                      ITスキルロードマップ roadmap.sh がすごい。AI and Data Scientist について対応する本をまとめた - Qiita
                    • Azureの資格を全て取ったので資格制度について語る(2022/07現在21個) - APC 技術ブログ

                      はじめに こんにちは、ACS事業部の吉川です。 タイトルにあるとおり、Azureの認定資格全21種を取得しました。 以下URLで公開されている認定資格ポスターのうち、一番左の Azure 列の資格が対象です。 https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE2PjDI このポスターは毎月更新されており内容が変わってしまうので、2022年7月時点の画像も貼っておきます。 私が取得済みの資格にレ点を付けています。 以下は資格取得後発行されるデジタルバッジの一覧です。 www.credly.com 試験を大量に受け続けた経験から、皆様にAzureの資格についてお話ししようと思います。 資格を取得するモチベーション ITの分野においては、資格は特に必須なものではないです。資格持ってないからといって、困ることもないでしょう。 じ

                        Azureの資格を全て取ったので資格制度について語る(2022/07現在21個) - APC 技術ブログ
                      • 統計的因果推論と因果探索について|M3 Data Science Blog

                        こんにちは。エムスリーデータ分析グループの中島です。 本記事ではマーケティングやデータサイエンスの文脈で重要度が高まっている統計的因果推論への足掛かりをデータ分析グループの業務と結び付けながらご紹介したいと思います。 1. はじめに「A→Bの因果関係がある」とは、Aへ介入する(Aを変化させる)ことよって、要因Bを変化させることができることを意味します。 具体例で考えると、投薬(A)の有無によって病気の治癒率(B)が変化する場合、投薬→治癒率の因果関係があるといえるわけです。 このような因果関係をデータを活用して解き明かそうとするのが統計的因果推論の目的ですが、大別するとさらに次の2つに分類されます。 (1) 因果の方向を既知のものとして因果の大きさを評価(因果推論) (2) 因果の方向の決定・探索(因果探索) これらの基本的な考え方と手法について紹介をしたいと思いますが、その前に重要な概念

                          統計的因果推論と因果探索について|M3 Data Science Blog
                        • LangChainを使わない - ABEJA Tech Blog

                          TL; DR LangChainのメリデメを整理する過程で、今となってはopenai-pythonのうちChatGPTのAPIをを簡単に取り回せる程度のシンプルなライブラリがあるだけでも十分便利なんじゃないかと思ったので、ライブラリを個人で作ってみました。(バージョン0.0.1なのでちょっとお粗末な所もありますが) github.com はじめに こんにちは、データサイエンティストの坂元です。ABEJAアドベントカレンダーの13日目の記事です。世は大LLM時代ということで、ありがたいことにABEJAでも複数のLLMプロジェクトを推進させて頂いています。私自身もいくつかのLLMプロジェクトに参画しています。LLMといえばLangChainが便利ですね。OpenAI APIの利用だけでなく、各種ドキュメントのパースが出来たり、HuggingFaceやインデックスDBを扱う他のライブラリとインテ

                            LangChainを使わない - ABEJA Tech Blog
                          • 統計学に魂が震えた体験をもとに、何を選択できるようにしてきたか? データ活用職のキャリアプランを考える - Findy Engineer Lab

                            統計屋のあんちべ(@antibayesian)です。 さまざまな企業でデータ解析やコンサルを請け負ったり、データ活用部署の立ち上げをしたりしながら生活しています。 この記事では、データ活用系職種のキャリアプラン形成に悩んでいる方の参考になればと、私のこれまでのキャリアや、キャリアプランニングの考え方についてシェアしたいと思います。 というのも、データ活用系職種の中でも特に2010年くらいから注目を集めている1データサイエンティスト界隈のキャリアは、まだ職種として歴が浅いこともあって不透明な部分が多く、データサイエンティストなるものの解釈やポジションも多様なため、先行きに懸念を抱いている方も多いかと思います。 また、周辺環境も日進月歩の勢いで成長しています。例えば、全自動で簡単に売上予測や画像の分類などができるCloud AutoMLというサービスも提供されています。この手の仕組みはどんどん

                              統計学に魂が震えた体験をもとに、何を選択できるようにしてきたか? データ活用職のキャリアプランを考える - Findy Engineer Lab
                            • Mercari Microservices Platformの進捗(2019年) | メルカリエンジニアリング

                              Microservices Platform TeamでTech leadをしている@deeeeeeetです. 昨年のMTC2018ではMicroservices Platformチームの立ち上げから1年で僕らが取り組んできたことを紹介しました. speakerdeck.com 具体的にはStranglerパターンによるMonolithからMicroservicesへの段階的なリクエスト移行を行うためのAPI gatewayの開発や,Microservicesのインフラのセットアップを簡単にしサービス開発チームのSelf-service化を進めるためのStarter-kitの開発,GoでのMicroservicesの開発を高速で始めるためのTemplateプロジェクトの開発,Spinnakerの導入などについて紹介しました. これらはPlatformとして最低限の機能を整備したにすぎず,さ

                                Mercari Microservices Platformの進捗(2019年) | メルカリエンジニアリング
                              • データサイエンティストに王道無し - 渋谷駅前で働くデータサイエンティストのブログ

                                TL;DR(思ったよりもかなりの長文になってしまったので*1、時間がないという方は1番目と2番目のセクションの冒頭だけお読みください) しんゆうさんの舌鋒鋭いブログ&note記事にはいつも楽しませていただいているのですが、この記事は一点僕のデータ分析業界の認識に新たな視点を与える話題があって特に目を引きました。それが以下の箇所です。 資格があるわけでもないので名乗るのは自由だし、未経験だろうが文系だろうがそれはどうでもいいのだけど、傍から見ていると「サイエンティスト」と名乗っているわりには「サイエンス」な話をしていないなぁとは思っている。(中略) 現在起きている第3次データサイエンティストブームは「データサイエンティストと名乗りたい人」が盛り上げているように見える。 (太字筆者) この問題は、このブログの前々回の記事でも取り上げています。 ただ、僕はこういう「データサイエンティストになりた

                                  データサイエンティストに王道無し - 渋谷駅前で働くデータサイエンティストのブログ
                                • Launchableに入社しました | おそらくはそれさえも平凡な日々

                                  本日10月1日、LaunchableにPrincipal Software Engineerとして入社しました。最近日本のエンジニア界隈でも少しづつ聞かれるようになったIC(Individual Contributor)としてのキャリアです。 ご存知の方も多いとは思いますが、LaunchableはあのJenkinsを作った川口さんらが2年前に創業された、まだ若いスタートアップです。自動テストにおける、スローテストやflakyテスト等の痛みを、AIの力で解決するプロダクトを作っています。 シリーズAの調達を終え、採用にも力を入れています。現在は、サービスの肝に関わるData Scientistを一番求めているようなので、興味のある方は是非採用応募してください。 Careers: Data Scientist - US or Japan | Launchable Inc. 元々優秀なスタッフ揃

                                    Launchableに入社しました | おそらくはそれさえも平凡な日々
                                  • 何故データサイエンスは魅力を失いつつあるのか - 渋谷駅前で働くデータサイエンティストのブログ

                                    (Image by Pixabay) こんな記事が、しばらく前に我らが盟主タカヤナギ=サンによって言及されていました。 データサイエンティストになる魅力がなくなってきた理由を4つの理由(ジュニアのポジションが減っている、アナリスト職種で良い、データサイエンスを簡単だと思いすぎ、AutoML出てきた)とともに紹介。 Why Is Data Science Losing Its Charm? by @iamharshitahuja https://t.co/fqRUil9QLr— Shinichi Takayanagi (@_stakaya) 2020年6月8日 Why Is Data Science Losing Its Charm? データ分析業界の中の人という立場から見れば、ここで言われている主張については分からないこともありません。ただ、同意できる部分もあれば同意できない部分もあり、ま

                                      何故データサイエンスは魅力を失いつつあるのか - 渋谷駅前で働くデータサイエンティストのブログ
                                    • 3大クラウドの資格を全種取得して38冠になってみた | DevelopersIO

                                      CX事業本部@大阪の岩田です。昔からクラスメソッドにはAWS認定資格の受験費用を会社が負担してくれる制度があるのですが、1年と少し前からAzureとGCPの試験についても会社が費用を負担してくれるようになりました。せっかくなので、この制度を活用していわゆる3大クラウドの資格を全てコンプリートしてみました。 合計で38冠になります。 ※補足 既に廃止されたAlexa Skill Builder - Specialty含めてカウントしています CertMetrics上の表記に従ってBig Data - SpecialtyとData Analytics - Specialtyは別資格としてカウントしています GCPのCloud Digital Leaderなる資格がもうすぐ受験可能になるそうですが、今回は対象外としています MicrosoftのWindows Virtual Desktop Sp

                                        3大クラウドの資格を全種取得して38冠になってみた | DevelopersIO
                                      • ML Ops: Machine Learning as an Engineering Discipline

                                        So, your company decided to invest in machine learning. You have a talented team of Data Scientists churning out models to solve important problems that were out of reach just a few years ago. All performance metrics are looking great, the demos cause jaws to drop and executives to ask how soon you can have a model in production. It should be pretty quick, you think. After all, you already solved

                                          ML Ops: Machine Learning as an Engineering Discipline
                                        • データサイエンティストになるには?求められるスキルセットや道のりを解説

                                          データサイエンティストとは――21世紀で最も魅力的と称された職業の今とこれから データサイエンティスト――2012年10月、アメリカのThomas H. Davenport氏とD.J. Patil氏が発表した"Data Scientist: The Sexiest Job of the 21st Century"(邦訳『データ・サイエンティストほど素敵な仕事はない』DHBR2013年2月号)で、21世紀、最も魅力的と称された職業です。 そこから本記事を執筆している2022年9月時点で約10年が経過しましたが、今も魅力的といえる職業といえるのでしょうか。 時間の経過とともに技術が進化した結果、データサイエンティストの需要は高まりました。10年前は魅力的な職業という表現でしたが、2022年の今、なくてはならない職業の一つといえます。 その背景には、2000年初頭からの、各種Webサービスやソー

                                            データサイエンティストになるには?求められるスキルセットや道のりを解説
                                          • 機械学習システムの信頼性を数値化する ML Test Scoreのハンズオンワークショップを開催しました | メルカリエンジニアリング

                                            こんにちは、メルカリでCRE (Customer Reliability Engineering) に所属している @hurutoriya です。 今回メルカリ社内での勉強会の一環として、Google が提案した機械学習システムの信頼性を数値化する ML Test Score のハンズオンワークショップを開催しました。 本記事では、ML Test Score の説明、ワークショップの開催方法や簡単な考察などをお話します。 今回はWFHの影響も受け Google Meet を使ったフルリモートでの開催となりました。 ワークショップの内容として、メルカリ内で実際に運用されている機械学習システムを対象に、実際にそのシステムを開発する機械学習エンジニアが ML Test Score を計算しました。 ML Test Scoreの説明 ML Test Score の目的は、定量化しづらい機械学習シス

                                              機械学習システムの信頼性を数値化する ML Test Scoreのハンズオンワークショップを開催しました | メルカリエンジニアリング
                                            • The Querynomicon

                                              Upon first encountering SQL after two decades of Fortran, C, Java, and Python, I thought I had stumbled into hell. I quickly realized that was optimistic: after all, hell has rules. I have since realized that SQL does too, and that they are no more confusing or contradictory than those of most other programming languages. They only appear so because it draws on a tradition unfamiliar to those of u

                                              • データサイエンス100本ノックを、Google ColabとAzure Notebooksで気軽に行いたい! - Qiita

                                                データサイエンス100本ノックを、Google ColabとAzure Notebooksで気軽に行いたい!PythonAzureデータサイエンス100本ノックGoogleColaboratory はじめに 2020年6月15日に、データサイエンティスト協会より発表されました「データサイエンス100本ノック(構造化データ加工編)」の素晴らしさに感動した私は早速ドリルを解き、めくるめくデータサイエンスの大冒険をエンジョイしていた。 しかし、ふと気づくとOriginalのデータサイエンス100本ノック(構造化データ加工編)はDocker形式で提供されており、実践的な演習が可能である一方でお手軽感はかった。同じ思いの人も数多く存在すると考え、より気軽に100本ノックするためにGoogle ColabとAzure Notebookで実行可能な演習スクリプトと解答編スクリプトを作成した。なお、作成者

                                                  データサイエンス100本ノックを、Google ColabとAzure Notebooksで気軽に行いたい! - Qiita
                                                • 無闇にデータサイエンティストを雇うのをやめよう。 | AI専門ニュースメディア AINOW

                                                  著者のLuke Posey氏は、現在、P&Gアメリカ法人で機械学習エンジニアとして働く傍ら、AIスタートアップMalgoの共同設立者に名を連ねています(同氏に関する詳細はこちら)。同氏がMediumに投稿した記事では、データサイエンティストを雇用する際に生じる業務上のミスマッチが風刺されています。 近年データサイエンティストが「セクシーな職業」として注目を集めているのは周知の通りですが、本来はアナリストあるいはエンジニアのほうが適任な業務に対してもデータサイエンティストを重用する傾向がある、と同氏は指摘します。 アナリストを雇うべきなのにデータサイエンティストを雇ってしまうミスマッチは、統計学に関する学術的訓練を受けた人材が高額な報酬を欲しいがゆえに、データサイエンティストを名乗ることに起因します。その一方でビジネスに精通した本来的な意味でのアナリストは目立たなくなり、企業は高額でデータサ

                                                    無闇にデータサイエンティストを雇うのをやめよう。 | AI専門ニュースメディア AINOW
                                                  • 保有ETHを全て売った男は何を考えているのか

                                                    USのクオンツヘッジファンドであるNumeraiのCEO、リチャード氏は、 数年前に26セントで買ったETHを約2,500ドルで全て売却した と2022年05月09日に自身のTwitterアカウントで公表しました。 このtweetは(本人によると、思いがけず)プチバズり、後日↓のyoutubeチャネルにてインタビューも行われました。 私自身は仮想通貨について限定的な知識しかないのですが、動画で語られた内容はとても面白かったので簡単にまとめておきます。 リチャードに同意する、同意しない、興味ない様々あるとは思いますが、hypeに踊らされず自分の頭で考え、行動することのできる同氏の意見は、仮想通貨に違和感を持っている人たちはもちろん、多くの人に対し刺さるものがあるかもしれません。 (注)自分の英語力の都合でまとめに間違いのある可能性があります。なるべく↑の一次情報をご覧ください。 Q & A

                                                      保有ETHを全て売った男は何を考えているのか
                                                    • 10X のコスパ重視 MLOps - 10X Product Blog

                                                      どうも @metalunk です. コスパ,大事ですよね?コストをある値以下に抑えたとき,どれだけパフォーマンスを発揮できるか,という話です. 10X で最初の機械学習プロダクトを作るにあたり,コスパを意識して MLOps 基盤を作ったので,それの紹介をします. Stailer における ML の重要性 レジ前推薦 作りたかったもの アーキテクチャ Training pipeline の選択 Python function-based component vs Own container component Serving 用データストア CI (Continuous Integration) CD (Continuous Delivery) Monitoring リポジトリ構成 認証 Vertex ML Metadata stailer-suggest-batch の移行 組織の話 未来

                                                        10X のコスパ重視 MLOps - 10X Product Blog
                                                      • データサイエンティストが副業で成果を出すためのチェックリスト | Offers Magazine

                                                        データサイエンティストの基本的な副業の流れ データサイエンティストのsatomacoto(@satomacoto)です。普段は、解析に必要なIoTデバイスやWebアプリのソフトウェア開発から機械学習モデルの開発・デプロイまで携わるソフトウェアエンジニア/データサイエンティストとして働いています。本稿では、データサイエンティストとして短期間で成果を出すために気をつけていることについて執筆します。 1.契約前・オンボーディング 一口にデータサイエンスの案件といっても、その言葉が表す職務は、「モデル開発」「特徴量エンジニアリング」といったデータサイエンスそのものに関わるところから「アーキテクチャ」「データ整備」といったソフトウェア・インフラに関わるものまで広範囲に及びます。 契約前・オンボーディングでは、クライアントがどこまでの範囲をどの程度の期間で実現したいか、そして限られた自分の時間でどこま

                                                          データサイエンティストが副業で成果を出すためのチェックリスト | Offers Magazine
                                                        • 10Xが”検索”と”推薦”に心を燃やすワケ - 10X Product Blog

                                                          はい、こんちゃーす(eyden)、Stailerのプロダクト責任者の矢本です。この記事はCEO/創業者という立場ではなく、一人のプロダクトに関わる人間として書いています。この記事の焦点はStailerのエンドユーザーでもある、お客様の”買い物体験”です。 早速ですがこの記事の結論をお伝えします。 スーパーでの買い物体験は多量の”意思決定”で構成されています Stailerはお店の買い物体験を補完するプロダクトです ネットスーパーの買い物体験を支えるのは”検索”と”推薦”という技術です つまり、検索エンジニアや、推薦を支えるMLエンジニア、推薦のアルゴリズムを作る Data Scientist、MLをプロダクト価値に落とし込んでいくテクニカルプロダクトマネージャー、これらを多数の制約からプロダクトデザインへ落とし込むデザイナーも強く募集しています。ここまででピンと来た方は10XのMLエンジニ

                                                            10Xが”検索”と”推薦”に心を燃やすワケ - 10X Product Blog
                                                          • DMMのデータ活用を支えるビッグデータ基盤・ML基盤のクラウド移行 (CUS-40) #AWSSummit | DevelopersIO

                                                            本記事は、AWS Summit Japan 2021のセッション動画「CUS-40: AWS移行事例紹介 ~DMM のデータ活用を支えるビッグデータ基盤・ML基盤のクラウド移行 ~」のレポート記事です。 概要 "50以上の事業を展開するDMM。年々増えるデータ、バッチ、業務。そんな状況をAWS上での基盤構築を通じて打開した事例紹介" 50以上のビジネスを展開するDMM.comでのデータ活用基盤(データレイク基盤と機械学習基盤)をAWS上に構築した事例を紹介します。 データレイク基盤はオンプレ上で動いていた3000以上のJobの完全移行を実施し、よりスケーラブルな分析、データ処理、Single Source of Truth (SSoT)を実現しています。 機械学習基盤はArgoなどエコシステムが豊富なAmazon EKS Kubernetesを採用し、機械学習モデルの継続的なデプロイを行う

                                                              DMMのデータ活用を支えるビッグデータ基盤・ML基盤のクラウド移行 (CUS-40) #AWSSummit | DevelopersIO
                                                            • A search engine in 80 lines of Python

                                                              February 05, 2024 · 26 mins · 4728 words Discussion on HackerNews. Last September I hopped on board with Wallapop as a Search Data Scientist and since then part of my work has been working with Solr, an open source search engine based on Lucene. I’ve got the basics of how a search engine works, but I had this itch to understand it even better. So, I rolled up my sleeves and decided to build one fr

                                                              • Pinterest社で運用されているText-to-SQLを理解する

                                                                導入 こんにちは、株式会社ナレッジセンスの須藤英寿です。普段はエンジニアとして、LLMを使用したチャットのサービスを提供しており、とりわけRAGシステムの改善は日々の課題になっています。 本記事では、Pinterest社のエンジニアチームが紹介していた、実運用環境におけるText-to-SQLの構築方法に関する記事の紹介をします。 Text-to-SQLを実際の運用レベルで実現するための手法が解説されているので、その内容を解説、そして考察していきたいと思います。 なおこの手法には特に名前などは設定されていなかったので、以降Pinterest社の提案するText-to-SQLをPinterest Text-to-SQLと呼称します。 サマリー Pinterest Text-to-SQLは、RAGのシステムを最適化することで 検索に必要なTableのより正確な抽出 実際に使用されている値に準拠

                                                                  Pinterest社で運用されているText-to-SQLを理解する
                                                                • データサイエンティストになるには|仕事内容、スキル、学習サイト、書籍 | Ledge.ai

                                                                  サインインした状態で「いいね」を押すと、マイページの 「いいね履歴」に一覧として保存されていくので、 再度読みたくなった時や、あとでじっくり読みたいときに便利です。

                                                                    データサイエンティストになるには|仕事内容、スキル、学習サイト、書籍 | Ledge.ai
                                                                  • ワークフローツールを AWS Step Functions に移行した話 | CyberAgent Developers Blog

                                                                    AI事業本部の協業リテールメディアdivでソフトウェアエンジニアをしている 中澤 といいます。直近では、プロダクト開発以外にAI 事業本部の新卒研修の運営を行なったりもしていました。 私が所属しているチームで最近、定期バッチを行うワークフロー管理ツールを AWS Step Functionsへ移行したので、移行の背景や得た知見を記事として公開します。 移行前の構成 私たちのチームでは、ワークフロー管理ツールを AWS Step Functions に置き換える前には、Prefect を使っていました。 Prefect に関しては、弊社ブログの別記事があるので、Prefect について知りたい方はそちらも参考にしてみてください。 Prefect を利用している時の構成では、Prefect 側でワークフローのスケジュール管理やワークフロー内のタスク実行を Prefect、実際のワークフローのタ

                                                                      ワークフローツールを AWS Step Functions に移行した話 | CyberAgent Developers Blog
                                                                    • 日本語LLMにおけるトークナイザーの重要性 | データアナリティクスラボ

                                                                      ELYZA-Japanese-Llama-2-7b ELYZA-Japanese-Llama-2-7bは、ELYZAが公開した日本語に特化したLLMです。 公開されたのは以下のモデルです。 ELYZA-japanese-Llama-2-7bELYZA-japanese-Llama-2-7b-fastELYZA-japanese-Llama-2-7b-instructELYZA-japanese-Llama-2-7b-fast-instruct instruct:instruction tuningによって追加学習されたモデル。 fast:日本語の語彙の追加によって処理を高速化したモデル。 モデルの概要 ELYZA-japanese-Llama-2-7bはLlama2をベースとして日本語処理の性能を向上させるために追加学習したモデルです。英語で学習済みのLLMの言語能力を引き継ぐことで、少な

                                                                        日本語LLMにおけるトークナイザーの重要性 | データアナリティクスラボ
                                                                      • AI Roadmap

                                                                        i.am.ai AI Expert Roadmap Roadmap to becoming an Artificial Intelligence Expert in 2022 Below you find a set of charts demonstrating the paths that you can take and the technologies that you would want to adopt in order to become a data scientist, machine learning or an AI expert. We made these charts for our new employees to make them AI Experts but we wanted to share them here to help the commun

                                                                          AI Roadmap
                                                                        • ペパボにおけるデータサイエンティストの職種要件をまとめました - Pepabo Tech Portal

                                                                          この記事は、datatech-jp Advent Calendar 2021 の10日目の記事です。 技術部データ基盤チーム データサイエンティストの zaimy です。 今回、ペパボの職位制度におけるシニアポジションの一職種として、データサイエンティストの職種要件を整理したので内容を社外にも公開します。 主に、社内でデータサイエンティストについて説明したり、ジュニアポジションの方にデータサイエンティストという職種を知ってもらいこれからのキャリアパスの参考にしていただいたりするために、データサイエンティスト協会とIPAによるスキル定義を元に、ペパボのデータ基盤の定義や、ペパボで活用しているDX Criteria1のテーマに照らして簡潔にまとめたものです。 まえおき: ペパボの職位制度について データサイエンティストとは データサイエンティストのスキルセット 3つのスキル領域の概要 4等級シ

                                                                            ペパボにおけるデータサイエンティストの職種要件をまとめました - Pepabo Tech Portal
                                                                          • 投資家用・スタートアップ支援用・大学支援用に改良中 更新中)tfidf etc embeddings cluster reconstructing vis: 特許など長文の、動的な文章間類似俯瞰図可視化・迅速閲覧・解析・探索手段。および第三の特許検索手法、動的な知識抽出管理手法、特許自動生成 (類似度ベクトルと小規模言語モデル及びChatGPTを用いた空白領域における特許生成追加) - Qiita

                                                                            投資家用・スタートアップ支援用・大学支援用に改良中 更新中)tfidf etc embeddings cluster reconstructing vis: 特許など長文の、動的な文章間類似俯瞰図可視化・迅速閲覧・解析・探索手段。および第三の特許検索手法、動的な知識抽出管理手法、特許自動生成 (類似度ベクトルと小規模言語モデル及びChatGPTを用いた空白領域における特許生成追加)自然言語処理NLP可視化Visualization特許 追記を繰り返しており整合性も取れておらず非常に読みにくい状態です.近日中に再整理します. 技術だけではなく方法論が重要となります。後ろ向きに検証し、前向きに予測することが重要となるでしょう。現在検証中です。 お題をいただけますと助かります。後ろ向き検証ではどうもわかりきったものを恣意的に選んで言えるかもしれない危惧があるところです。 個人的には、会社の方針に

                                                                              投資家用・スタートアップ支援用・大学支援用に改良中 更新中)tfidf etc embeddings cluster reconstructing vis: 特許など長文の、動的な文章間類似俯瞰図可視化・迅速閲覧・解析・探索手段。および第三の特許検索手法、動的な知識抽出管理手法、特許自動生成 (類似度ベクトルと小規模言語モデル及びChatGPTを用いた空白領域における特許生成追加) - Qiita
                                                                            • 国鉄が民営化される直前に幕張豊砂駅で撮影した駅の看板に「違和感がない」の声

                                                                              walker@Data Scientist & Quantum Computing Engineer @Ayumu_walker え?もともとこんな駅あったの? 位置的には今のイオンモールの辺りで新駅になるところだろうな、って調べたら新駅も同じ名前になったらしい news.yahoo.co.jp/articles/4684a… twitter.com/WH0_WH4T/statu… 2021-10-30 17:00:49 リンク Yahoo!ニュース 「ゲートウェイじゃなくて良かった」 横文字なしに安堵の声広がる JR京葉線新駅「幕張豊砂」に決定(千葉日報オンライン) - Yahoo!ニュース JR京葉線の新習志野-海浜幕張間に2023年春開業予定の新駅(千葉市美浜区)の名称が「幕張豊砂(まくはりとよすな)」に決まったことを受け、ネット上では「ゲートウェイみたいじゃなくて良かった」と横文

                                                                                国鉄が民営化される直前に幕張豊砂駅で撮影した駅の看板に「違和感がない」の声
                                                                              • Visual Studio Code comes to Raspberry Pi - Raspberry Pi

                                                                                Microsoft’s Visual Studio Code is an excellent C development environment, and now it’s an easy install on Raspberry Pi. Here’s Jim Bennett from Microsoft to show you all how to get VS Code up and running on our tiny computer. Take it away, Jim… There are a few products in the tech sphere that get me really excited. One of them is Raspberry Pi (obviously), and the other is Visual Studio Code or VS

                                                                                  Visual Studio Code comes to Raspberry Pi - Raspberry Pi
                                                                                • AI Paper Recommendations from Experts

                                                                                  See part two with new experts here. After the 'top AI books' reading list was so well received, we reached out to some of our community to find out which papers they believe everyone should have read! All of the below papers are free to access and cover a range of topics from Hypergradients to modeling yield response for CNNs. Each expert also included a reason as to why the paper was picked as we

                                                                                    AI Paper Recommendations from Experts