ABEJA で Research Engineer をやっている中川です.普段は論文読んだり,機械学習モデルを実装したり,インフラを構築したりしています.今回のブログでは,Insight for Retail の一機能として提供しているリピータ分析に用いる特徴量DBの改善に向けた言語選定について紹介します. ※ たくさんの方々からのコメントありがとうございます.いただいた観点をベースに「2020-04-14 追記」以下に実験を追加しました. モチベーション リピート分析では,任意の特徴量をクエリに最も類似した特徴量を数100msec以内に検索する必要があり,一般的なデータベースでは実現することが難しいという課題がありました.そこで,われわれは python で独自のインメモリデータベースを実装し運用してきました.このデータベースがサービスの成長に合わせて限界を迎えつつあるので,アルゴリズム
この文章の背景 この文章はプライベートメソッドのテストを書くべきか否かに関する knsmr さんのご質問に対して 2013/03/13 に QA@IT で回答したものです。残念ながらQA@IT のサービス終了(2020/02/28)と共にアクセスできなくなってしまったため、運営を行っていたアイティメディア株式会社様、開発を行っていた永和システムマネジメント様、そして質問をされた knsmr さんに許可とご協力をいただき、当時の回答をサルベージしてブログに転載する運びとなりました。 プライベートメソッドのテストはよく議論になるテーマですので、当時の回答を再編集し、knsmr さんのご質問も含め、ご利用いただきやすいライセンス CC BY(クリエイティブ・コモンズ — 表示 4.0 国際 — CC BY 4.0) で公開いたします。 目次 この文章の背景 目次 knsmr さんのご質問 私の回
今月14日午後、中国科学院の仝小林院士(中国中央指導グループの専門家、国家中医薬管理局専門家グループのリーダー、中国中医科学院の首席研究員)は、「13日の時点で、10省の新型コロナウイルス感染者1261人が『清肺排毒湯』を服用し、うち1102人が治癒した。そして、29人の症状が消え、71人の症状が改善した。重症患者40人も服用し、うち28人が退院した。12人は病院で治療を受けており、10人の症状が好転し、重症から軽症になった」と明らかにした。 中国国家中医薬管理局科技司の李昱司長によると、同局は、1月27日に、中医薬の新型コロナウイルス感染による肺炎患者に対する実用性、効果を確かめるべく、方剤の臨床研究を緊急にスタートさせた。そして、患者214人から有効なデータを取得し、2月6日に国家衛生健康委員会、国家中医薬管理局が共同で清肺排毒湯の使用推奨の通達を全国に発した。 最近発表された「新型コ
弊社のスタッフ向けに推奨している教科書リストをご紹介。新卒や中途入社にかかわらず全社員が対象です。 この教科書リストにある本は「この1冊で人生が変わった!」とかいう類のものではなく入門書的なもので、エンジニア/営業/マーケティング/CS等の職種にかかわらず、全ての人に最低限理解して身につけて欲しい内容です。 学校や読書より、明確な問題意識をもって日々の仕事に真摯に取り組むことがビジネスパーソンとしての大きな成長につながると信じています。でも、仕事だけでは成長できません。イベントやSNSで刺激を受けるのも大切だけど、基礎がないとそもそも役に立たないし、勉強してない人の底の浅さはすぐバレてしまう。 基礎能力を伸ばすには体系だった知識と理解が必要で、入門書を読むことが一番の近道。こういう土台を引き上げる努力が、弊社が提供する「現場向け動画教育システム tebiki」の事業開発にも役立っているなー
さて、1週間くらい前のニュースですがAlibabaがOracleのデータベースを抜いて世界1位の座を獲得しました。 itnews.org 世界一位って何よ? って所なのですが TPC-C - All Results - Sorted by Performance の結果みたいです。 まあ「Oracleのデータが10年前の11gなので今のExadata X8Mとは比べ物にならない程性能が低いであろうこと」「HPEとかも虎の子のNonStop SQL出してない」「レギュレーションの問題なのかやる気の問題なのかAWS AuroraもGCP Spannerも居ない」という事もあって、最速のRDBランキングとしての妥当性に疑問はありますが、これはランキングが悪いのであってAlibabaを貶めるものでは無いでしょう。誇大広告感は狙ったと思いますがw ベンチマーク結果としては以下のように、2位のOrac
ここまで読んでくださった皆さんに、ちょっとしたクリスマスプレゼント。マンガでわかる GoF デザインパターン 23 種チートシートです。これでもうデザインパターンは完全にマスターしましたよ。やったね! (注: ここからはあとがきポエムです) ところでみなさん、せっかくデザインパターンを学んだので、これを使ってプログラムを書こう、チートシートがあるからなんでも書けそうだぞ、なんて思っていませんか。ダメですよ。そんなことしたら 2000 年前後に起きた失敗を繰り返してしまいます。 実は GoF のデザインパターンは、ビジネス的には成功したけど、教育には失敗しました。最初に出版された本に「オブジェクト指向における再利用のための」という肩書が付いていましたが、これが本当に良くなかった。 あの頃 (ポール・グレアムが LISP と Ruby を褒めるまで) は、「オブジェクト指向様こそが良い設計のす
はてながまたしても改悪をして、はてブの黄色スターを表示させなくなった。一部カテゴリだけだが。 https://bookmark.hatenastaff.com/entry/2020/03/31/180820 そのせいで、困ったことになった。有力な情報を得ることが難しくなったのだ。 現状では、(はてブで)有力な情報を得るには、「人気のコメント」を見るしかない。しかし、ここで表示されるのは、初期に人気になったコメントだけだ。最近になって上がったコメントは、まだ星が三つぐらいしか付いていないので、表示されない。また、表示されるのはトップの 10件ぐらいであって、それに次ぐ重要性のコメントは表示されない。 こうなると、あとは全部のコメントを一つ一つシラミつぶしに見ていくしかない。しかし、そんなことをしたら、すごく時間がかかるので、いちいちやることはできない。結果的には、重要なコメントを見るのを諦め
気づくと僕達は晒されていた。 どうしてこうなったんだ… 今回は4/7の夜に1部のTwitterで起きたランサーズ事件において僕ら善良なTwitterユーザーがネットの政治印象操作をしたbotやそれを目的とした企業の工作員と勘違いされ一方的に晒されたことを受けてそれに対して 「なんでこんなことになったのか」 を詳しく解説し、 身の潔白を証明しようと思います。 騒動を時系列順に簡単にまとめます。 4/7 1.Twitterにおいてこちらの投稿が観測される ※彼は僕とFFで本人から掲載の許可は得てます 同時刻、安倍晋三首相による新型コロナウイルスに関する緊急事態宣言の会見。 2. 1のツイートを見たフォロワー達がこのツイートをコピべ。 3.数十分後、5ch(旧2ch)においてこれらのツイートをまとめたスクショが「ランサーズによる印象操作!」の趣旨で書き込まれる 4. 3の書き込みを発見したTwi
2020年1月に入社し、SWETの仕様分析サポートチームに加わったtakasek(@takasek)です。 仕様分析サポートチームでは、社内のプロダクト開発に対する形式手法の活用可能性を模索しています。当ブログでも、継続的に形式手法に関する情報発信をしています(形式手法 カテゴリーの記事一覧)。 この記事では、加入3か月を経てようやく形式手法の輪郭が掴めてきた私の視点から、学習前後での理解の変化について振り返ります。想定読者として学習前の私と近い属性——すなわちコンピュータサイエンスや数学の専門教育を受けておらず、主に現場での実務と自習に頼ってきたソフトウェアエンジニアを想定しています。 形式手法を学ぶ前の認識と疑問 ソフトウェアエンジニアとしての私の一番の興味関心は設計手法です。設計は、なんらかの解決したい問題に対して、ある一面を切り取った構造(モデル)を与え、そのモデルを解決の機構に落
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く