サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
アメリカ大統領選
qiita.com/KanNishida
私は本を読むのが好きで、Amazonや、また日本に行ったときはいくつも書店に立ち寄りついついたくさん本を買ってしまいます。しかし時間を十分確保できず、読まずにそのままになっている本もたくさんあります。 そんな中、最近モーティマー・アドラー氏による、その名も「How to Read a Book (本の読み方)」という本に出会い感激しました。(今さらではありますが。。。)日本では「本を読む本」というタイトルの日本語訳版も出ているようです。 今から80年以上も前に出版された、本からほんとうの知識を得るための土台を提供してくれるこの本は、本の読み方に関するクラシック(古典)と呼ぶにふさわしい本です。世の中にあるたいていの「読み方」に関する本はこの本からの派生と言っても言い過ぎではないかと思います。 どうやって本を読むべきなのかというのは、もちろん目的によって変わってくるのですが、この「本の読み方
ボイス・オブ・カスタマーを聞いていてもプロセスを改善することはできない。ボイス・オブ・プロセスを聞くことによってのみプロセスを改善することができる。 ドナルド・ウィーラー 最近、データを使ってビジネスを改善するためにはデータドリブンではなくデータインフォームドを目指すべきというテーマでいくつかの投稿やセミナーを行い、ビジネスの改善のためにはボイス・オブ・カスタマー(顧客の声)ではなく、ボイス・オブ・プロセス(プロセスの声)を聞かなくてはいけないという話をしてきました。 改善のための知識をデータから得るために必要なデータインフォームド文化(ブログ記事) - リンク デミング哲学 - 「深遠なる知識」- データインフォームドな文化を作るための哲学 - リンク この点においてセミナーに参加いただいた方たちより何度か質問を受けました。 というのも、一般的にはボイス・オブ・カスタマー、つまり顧客の声
今回は、データが中心で人間を不幸にするデータドリブンな文化と、人間中心でデータを道具としてデータインフォームドな文化の違いの話をします。今回の記事を書くにあたって、「Becoming Data Driven, From First Principles」(リンク)を大きく参考にさせてもらっています。 データドリブンという言葉は日本でもだいぶ浸透していますね。 私はふだんアメリカに住んでいるのですが、仕事の関係でたまに日本に行きます。そのタイミングでExploratoryのお客様の方たちとお話をさせていただくのですが、そのさい「データドリブン」になりたいが、うまくいかないという話をよく耳にします。 ここで質問ですが、みなさんはなぜ「データドリブン」になりたいんでしょうか? こんな質問をすると、今さら当たり前のことを聞くのはやめてよ、 と言われるかもしれません。 今となってはどんなビジネスでも
ノーベル物理学賞を受賞したこともある偉大な科学者であり、愉快な先生でもあるリチャード・ファインマン(1918 - 1988)が推奨した学習メソッドである「ファインマンテクニック (The Feynman Technique」というのがあります。 今回はこの、知ってるだけでなく、使えるものになる学習をしたいときに最強のファインマン学習メソッドについて紹介したいと思います。 ところでまず最初に断っておきたいのは、ここでいう学習とは本を読み流して何らかの概要を知っているとか、試験のために暗記したりするといったものではなありません。 学んだことを他の人に説明することができ、様々な状況でそれらを自由に活用することができるという意味においての学習です。 以下、要訳。 もし何かをほんとうの意味で学んだのであれば、それはあなたにとって残りの人生で使い続けることができる武器となります。そして、なにか新しいこ
パワポのスライドと箇条書きが人間を駄目にする 今から20年前の2003年、データの可視化やインフォメーションデザインの先駆者として有名なイエール大学の教授エドワード・タフティが「パワーポイントの認知スタイル」というエッセイを発表しました。 彼はこのエッセイの中で、パワーポイントのようなスライド形式はプレゼンテーション自体の質を低下させ、余計な誤解や混乱を招き、さらに言葉の使い方、論理的な説明、そして統計的な分析といったものが犠牲になるため、スライドをつくる人の思考回路にダメージを与えると主張します。 こうした主張に賛同する人は現在でも多くいて、その典型的な例がアマゾンです。アマゾンではミーティングの前に文章形式の資料が配られ、ミーティングの最初の5分はそれぞれがこの配られたレポートを黙って読むことから始まるという話は多くの方も聞いたことがあるのではないでしょうか。(リンク) 実は、アマゾン
よくスタートアップやSaaSの世界などでノーススター(北極星)指標が注目されます。自分たちのビジネスを成長させるために組織の全員が一丸となって追うべき1つの指標というものです。 例えば、アクティビティの指標であるDAU(Daily Activity Users)やMAU(Monthly Active Users)であったり、またはエンゲージメントを測るためのDAU/MAU、またはそれこそ売上やMRRであったりするかもしれません。 データや数値を元にビジネスを成長させようということで、こうした「ノーススター」指標を決め、ダッシュボードなどで毎週、毎月モニターし始めます。 ところが、ここから誰もが話したくないことが起き始めます。 たいていの組織や企業の中の人達はこの指標をだんだん見なくなる、または本気にしなくなります。 実際見ている人は経験あると思うのですが、こうした指標の数値は良くなったり悪
今回は、みなさんがこれからのキャリアまたは自分の仕事を考えていく上で、私が最も重要ではないかなと思う話を紹介したいと思います。 数多くある予測モデルの中でも最もシンプルで古くから使われている線形回帰を使ったキャリアの構築に関する話です。 これはもともと、私がExploratoryという会社を創業する頃にある知人が紹介してくれた、スタンフォード大学のJohn Ousterhout教授によるコンピューターサイエンスのクラスの生徒に向けた話で(リンク)、どう自分の専門となるスキルを伸ばしていくか、さらにどういう人を雇っていけばよいのかを考える上で、今でも北極星のように指針を与えてくれるかのような素晴らしい話です。 以下、訳。 みなさんに週末の間にちょっと考えてほしいことがあります。それはちょっとした傾きの差が最初にあった差を覆すということについてです。 こちらのチャートを見てみてください。 これ
みなさん、「情報カスケード」という言葉、聞いたことありますか? これは、みんな個人的には何かがおかしいと思っているにも関わらず、自分の属する集団が「正しい」と思っていることをいつまでも「正しい」と思い込んでしまうことになる仕組みのことです。 カスケードとは階段になっている滝のことで、直訳すると情報が上の方からどんどんと勢いを増して広まっていくということになります。問題はその情報が間違ったものだったとしても、それらはどんどんと広がっていくだけでなく、一度勢いをつけると止めるのが難しく、さらに、一度この情報カスケードによって作り上げられた世界に入ってしまうと、まるで「無限ループ」のようにそこからなかなか抜け出すことができなくなってしまうのです。その結果、一度出来上がってしまうと、いつまで経ってもその「間違い」を集団で信じ続けてしまうという、厄介な仕組みです。 こういう話をすると、「デマを信じる
ビッグデータといった言葉が流行ると、多くのデータ量によってより良い予測モデルが作れるようになる、より多くの知見が得られるようになる、より良い意思決定ができるようになる、などと思い込みがちです。 しかし、ほんとうにそうなのでしょうか? そこで、今回は少し古い記事になるのですが、起業家のアダム・ロビンソンという人が、より多くのデータはより良い意思決定につながらないどころか、むしろそれは危険な間違いにつながってしまうこともある、という点を今から半世紀前ほどに行われた研究をもとに解説している記事を見つけたので、こちらに紹介します。 以下、要訳。 ほぼ全ての投資家が、若いときに言われたか、直接でなくとも彼らが卒業したビジネス・スクールの決まりきったカリキュラムを通して推奨されたことがあります。 それは、世界のことをより多く理解すれば、彼らの投資結果はよりよくなる、ということです。特にデータに裏付けさ
データ関連の仕事のオファーをもらい、いざ新しい会社で仕事し始めたところ、期待していたものと現実の間に大きなギャップがあり失望してしまうということはよくあります。そこで、どういったことがよく問題になるか、それらを事前に明らかにするために就活インタビューの際にどういったことを質問すべきかをまとめた記事があったので、こちらに要訳として紹介します。 Red Flags to Look Out for When Joining a Data Team 以下、要訳。 1. データがない 入社したら、そもそも分析対象となるデータがまったくなかったり、または整理されていなかったりアクセスできなかったりするというのはよくあります。 これは、まだ顧客があまりいないスタートアップやデータを自社で管理していない企業などにありがちです。 どんなデータを収集しているのですか?またはあなたのシステムから取り出しているの
qiita.com
Help us understand the problem. What is going on with this article? 以前から言っいることですが、メディアでよく目にする感染者数という数字はあまり意味がないと思います。特にその数字を持ってそれぞれの国を比べようとするときには意味がないどころが害すらあると思います。 というのも、感染者の数というのは検査の数に大きく影響を受けます。そしてその検査をどれだけ、どのように行うかというのはそれぞれの国によって戦略も状況も違います。 しかし現実にはそういったことを考慮することなしに、感染者数の値を毎日見て、一喜一憂し、さらにはそれぞれの国の感染者数の値を比べ、どこの国がいいとか悪いと決めつけ、さらには感染者数の増加のトレンドをもとに「あなたの国もイタリアのようになってしまう」といった、無責任な報道が多くのメディアから毎日垂れ流されていま
最近別の記事で、コロナウイルスの感染者数に関するデータはその背景を理解することなしに使うのは危険であるという内容の話をしましたが、今回は、コロナウイルスの感染者数を予測するモデルを使うときには気をつけなくてはいけない、という内容のエッセイがイギリスにおける統計学の学会である、王立統計学会(Royal Statistical Society)の中にあるデータ・サイエンス部のトップの人によって出されていました。 とくにそのモデルを作る人(科学者)、モデルによって出される数字を伝える人(ジャーナリスト)、モデルから得られる情報をもとに政策を作る人(政治家)は、責任が大きく、さらに間違いによる影響や被害が大きいだけに細心の注意を払うべきで、そのためのガイドラインを6つのルールとしてまとめています。 これは、コロナウイルスなどの感染症ウイルスの予測モデルに関わる人達だけでなく、広く一般の我々にとって
データ・リテラシーと言う言葉を聞いたことありますか? 簡単に言うと、「データを読むことができて、データを理解でき、データを使って議論でき、データから得られた情報を使って意思決定ができる」能力のことです。 ダレル・ハフによって今から70年前になる1950年代に書かれた「統計でウソをつく方法 (How to Lie with Statistics) 」というこの世界では古典となる本があります。この本ほどデータリテラシーがいかに重要かをわかりやすく簡潔に説いた本はないと思うのですが、その教えは70年経った今でもまるで昨日書かれたかのように新鮮です。 むしろ、私達市民のデータリテラシーは当時と比べてあまり変わっていないかのようで残念です。 さらに、今日のようにデータがいよいよ簡単に手に入るようになり、簡単に分析できるようなツールも出てくるようになると、情報の消費者としてだけでなく、むしろ情報の供給
US、ヨーロッパ、中国の3者によるAIレースの行方 最近、US、EU(ヨーロピアン・ユニオン)、中国のAI分野に関する強さを以下の6つのカテゴリーから分析しているレポート「Who Is Winning the AI Race: China, the EU or the United States?(リンク)」が、Center for Data Innovationという研究機関から出ていました。 人材 研究 開発 導入 データ ハードウェア 結論から言ってしまうと、現在のところ全体的に見るとやはりUSが圧倒的にトップで、その次に中国、そしてその後にEUとのことです。 しかし、中国の成長は著しいので近いうちにUSに追いつくかもしれない。逆にEUはどんどんと距離を離されていくだろうとのことです。 まあ、このへんはこの業界では常識といえるし、以前にヨーロッパがいかにだめかというのは、それに関する
機械学習と統計学、予測と因果など、これまでにもこうした違いについて何回か取り上げてきました。 実は言語学、自然言語の研究分野でもこうした違いに関しての論争があります。その中でも有名なのは、近代の言語学の父とも言われるノーム・チョムスキーと、AI分野の第一線の研究者でGoogleの研究部門のディレクターでもあるピーター・ノーヴィグの間でのものです。 そのことについて触れている「Predicting vs. Explaining」というおもしろい記事があったのでここで紹介します。 以下は一部の要約です。 チョムスキーは、言語というデータのなかにある法則性を説明することができないのであれば、それはサイエンスではないと主張します。 それに対して、ノーヴィグはそもそも言語とは説明できるほど単純なものではなく、逆にその複雑性を受け入れたモデルを作ったからこそ、近年の自然言語の分野で見られる飛躍的なイノ
ファイナンシャル・タイムスのようなシリコンバレーの外にある古い会社でも、シリコンバレーのように「データを使った仮説と実験」を繰り返すことでビジネスをうまく成長させていくことができるっていう話を最近オライリーのイベントで話しているのをたまたま見つけました。(ビデオ、スライド) いつも、シリコンバレーの企業がデータを使ってうまく言っている話をよく紹介していますが、このイギリスのロンドンにある老舗新聞会社がシリコンバレーのやり方を真似してうまく言っているという話は、日本のみなさんにも参考になるのではと思ったので、ぜひここで紹介したいと思います。 ファイナンシャル・タイムスは1888年(明治21年)創業のイギリスに古くからある、クオリティの高い経済新聞紙で、今でも世界中の多くの人に読まれています。(ちなみに2015年に日経新聞に買収されています。) 最近は紙からデジタルへの移行に成功し、さらにビジ
これまでにも何度か紹介してきた、シリコンバレーのA16Zというトップクラスのベンチャーキャピタルの気鋭のアナリスト、ベネディクト・エバンスが、「AIのバイアス」についての考察をまとめていました。 いわゆる「AIのバイアス」といえば、例えば、白人の方が黒人より多い画像データで作ったAIシステムは白人を認識するのは得意だが黒人はそうでない、といったもののように、私達にとって想像つきやすいものについつい目が行ってしまいがちです。しかし実は、私達人間には認識すらできないもの、例えば光の当たり加減や、音の領域などがバイアスとしてデータに入ってきてしまった場合におきるAIのバイアスこそが、難しい問題なのではないかとベネディクトは言います。 いつものように、鋭い考察でいろいろな角度からAIのバイアスに切り込んでいきますが、彼のエッセイがおもしろいのは、もちろん彼の分析力、クリティカル・シンキング能力が素
人種差別の慣習をもっている組織が作ったデータにはやはり人種差別なバイアスが入り込んでしまうわけで、そんなデータをもとに作った機械学習のモデルは、例えどんな高度なアルゴリズムやテクニックを適用したところで、人種差別的なものになってしまうものです。 アメリカでは人種差別的な慣習を持った警察がよく問題になることがあります。特に南部や中西部の方に行くとひどかったりします。 現在そういった組織が過去に記録したデータをもとに、犯罪予測システムを作り、そこから出てくる予測をもとに捜査を行ったり、容疑者の扱いや刑罰の決定を行ったりということがすでに行われ始めているようです。 今から20年近く前に、トム・クルーズ主演の「マイノリティ・レポート」という映画がありましたが、まさにこうした犯罪予測システムによって間違って逮捕されてしまうという話の映画でした。 20年たった今、こうした問題がいよいよ現実になってきた
これまでに、「データサイエンスに関してビジネスからよく聞かれる質問」というシリーズで以下の2つの記事の訳と解説を書いてきました。 あなたのビジネスのデータサイエンス本気度を試す4つの質問 - Link データサイエンスをいつ始めればよいか - Link 今回はこのシリーズの最後として、「データサイエンス・チームを組織の中でどう作っていけばよいのか」という質問に対する答えとして、いくつものシリコンバレーのデータ先進企業でデータサイエンスのチームを作り、率いてきた、このシリーズではおなじみのJeremy (Instacart, Sailthru, Collective) とDaniel (LinkedIn, Ebay, Apple) によるアドバイスを要訳という形で紹介します。 以下、要訳。 データサイエンスのチームはどこに作られるべきか 組織の中にデータサイエンスのチームを作る場合には大きく
ちょっと前に、シリコンバレーのInstacartで、データサイエンスのVP(バイス・プレジデント)をやっているJeremy Stanleyによる「あなたのビジネスのデータサイエンス本気度を試す4つの質問」という記事の訳と解説を書きました。 今回はその続きです。 上の記事の質問に答え、データサイエンスに対して本気であるということが確認できたとします。その場合、いつ始めればよいのかという質問が出てくるかと思います。 そこで、いくつものシリコンバレーのデータ先進企業でデータサイエンスのチームを作り、率いてきたJeremyとDanielによるアドバイスをここで、要訳という形で紹介します。 以下、要訳。 Doing Data Science Right — Your Most Common Questions Answered - Link データサイエンスにはサイエンスのためのデータが必要です。し
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? データサイエンスという言葉はまだ流行っていますが、ひょっとしたらあなたの組織にとっては必要ないかもしれません。 この重要な問いに答るためにはまず、そもそもデータサイエンスの目的とは何なのか、どういった組織がデータサイエンスをやるにふさわしいのかを理解する必要があります。 この点についてうまくまとめられている記事が、シリコンバレーのInstacartで、データサイエンスのVP(バイス・プレジデント、日本で言う部長)をやっているJeremy Stanleyと、元LinkedInのデータリーダーで今はテクニカル・アドバイザーをやっているDan
Photo by The Climate Reality Project on Unsplash 「優れた料理人はお客さんが育てる」と言うことばがあります。 料理を食べるお客さんが、それがほんとにうまいかどうかわからないと、料理人のレベルも上がらないということです。 実はAIにもそれと同じような面があります。 AIがわからない人にAIを渡しても、AIの真価は発揮できないということです。 今回は、汚染された水道管を発見することができるAI(機械学習による予測モデル)をせっかく開発したにもかかわらず、結局使われなくなってしまい、そのせいで問題の水道管が今でも取り替えられず、多くの人の命が危険にさらされていると言う、アメリカのミシガン州のフリントという町で起こった話を紹介したいと思います。 以下、要約。 How a Feel-Good AI Story Went Wrong in Flint -
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? Image from Teaching Tolerance 現在のアメリカの政治はますます、右と左の極端化が進んでいます。右はトランプ旋風を支えている人たち、左は金持ちから70%の税金を搾り取れと叫んでいる主に民主党の人たちです。 以前にも紹介したことのある、Bridgewaterという世界で一番大きいヘッジファンドの創業者で元CEO、現在はCIO(Chief Investment Officer)としてまだ現役のレイ・ダリオが、「最も懸念すべき経済、社会、政治の問題」という分析レポートを今から一年ほど前に出していたのですが、今のような
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 日本では「欧米」という言葉のもと、ヨーロッパとアメリカを一緒のようなものとして扱ってしまうことをよく見受けます。 例えば、アメリカがすごいという分野があると、それによってヨーロッパも同じようにすごいのだ、というかんじです。 ところがじっさいにアメリカやヨーロッパに住んでみると、この2つは大きく異なる価値観をもった2つの異なる世界なのだと実感することになります。もちろん、そのヨーロッパの中でも、西と東で大きく違い、西ヨーロッパの中でも北と南、もしくはカトリック系とプロテスタント系では大きく違ったりします。さらにアメリカの中でも、例えば東海
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 最近、データを使うということが手段でなく、目的になってしまい、その挙げ句、データが「神格化」されてしまっているような風潮があります。 つまり、データが言うのだから、間違いはないというわけです。 そこで「データ・ドリブン」という言葉が先歩きをしてしまうのでしょう。 もちろん、単に「データ」と言っても、人によってその意味することは様々ですが、その中でも、英語では、「Raw Data」、日本語にすると「生データ」、つまり加工する前の、とれたてほやほやのデータという意味でのデータは、人間によって操作されていないので、事実で、客観的で、正直だと私
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? データ分析で有名なNetflixの社内では現在、シリコンバレーのデータ文化とロサンゼルスの人間関係文化が衝突しているようだという話が最近ウォールストリート・ジャーナルに出ていました。 映画やTV番組(ショー)などの動画配信サービスを提供しているNetflixは、何度かWeekly Updateでも取り上げてきましたが、データがこの会社のDNAに浸透していて、とにかくデータを積極的に使ってカスタマーをだれよりも深く理解し、そのことでビジネスを成長させてきたことで有名です。 Netflixがカスタマーを誰よりも理解するためのデータ分析プロセ
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 主にUSですがAIに関する政策研究者たちが毎年AIに関するトレンドをまとめたAIインデックスというレポートを出していますが、その最新版である2018年のものが最近リリースされました。 去年は北米中心でしたが、今年はヨーロッパ、中国に関するトレンドもカバーされています。主に、投資、雇用、論文、特許、スタートアップ、ビジネス、政治の分野でのAIのトレンドです。 詳細はこちらのオリジナルのレポートを見ていただければと思いますが、ここではいくつか興味深いものを簡単に紹介します。 AIに関する論文の数 発表されたAIに関する論文の数の年ごとのトレ
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 以前、「結局、機械学習と統計学は何が違うのか?」というポストの中で「統計と機械学習の違い」について、手法や技術的な側面から簡潔に説明していた記事を紹介しました。 今回は、もう一歩先に進んで、それでは、統計と機械学習のモデルがあった時、どう使い分ければいいのか」について簡潔にまとめられていた記事、"Road Map for Choosing Between Statistical Modeling and Machine Learning" を紹介したいと思います。 以下、要訳。 Road Map for Choosing Between
次のページ
このページを最初にブックマークしてみませんか?
『KanNishida - Qiita』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く