タグ

データに関するe24nsのブックマーク (6)

  • アマゾン『Alexa』に盗聴問題。録音した会話を顧客情報と紐付け&面白い内容は従業員で共有とヤバい(篠原修司) - エキスパート - Yahoo!ニュース

    アマゾンのAIアシスタント『Alexa』がユーザーとの会話を録音しており、それを従業員たちが聞ける状態にあることを米メディア『Bloomberg』が衝撃的な証言とともにすっぱ抜きました。 これが海外を中心に、「盗聴だ」と騒ぎになっています(『Alexa』とユーザーの会話なので正確には「盗聴」ではないのですが、プライバシーへの配慮が足りないため騒がれています)。 会話の録音は精度を高めるために必要なものの…… まず説明しておきたいのは、AIアシスタントを搭載するスマートスピーカーがユーザーとの会話を録音する行為は、AIの精度を高めるために行われているという点です。 たとえば発端となった『Bloomberg』の記事では、スペイン語の「Hecho(エチョ)」がよく「echo(エコー。アマゾンのスマートスピーカーの名前)」と聞き間違えられるといった例が紹介されていました。 筆者が家族との会話のなか

    アマゾン『Alexa』に盗聴問題。録音した会話を顧客情報と紐付け&面白い内容は従業員で共有とヤバい(篠原修司) - エキスパート - Yahoo!ニュース
  • 全人類に告ぐ。セル結合をやめろ。 - hibitの技術系メモ

    (12/13追記 タイトルや表記に過剰な表現があり、セル結合を全否定するかのような印象を与えてしまいました。そのような意図はなかったのですが、補足記事を書きましたので、併せて読んでいただけると幸いです。すみませんでした。) 人類よ、なぜそんなにセル結合を使いたがる? それが罪深い行為とも知らずに……。 思わず神視点になってしまいましたが、この世界にはExcelのセル結合を無意味に使いたがる人が多すぎます。いや、メリットがないことはないのですが、それを余裕で上回るデメリットがあることを意識している人が少ないように思われます。データというのは、コピペしやすいこと、集計しやすいこと、数え間違いをしづらいことが第一なので、それを損ねるような行為は許されざる大悪というべきでしょう。断固として弾劾していきます。 綺麗なデータとは ここにエクセルで作った、同じソースから作成した3種類のデータ(東京都の区

    全人類に告ぐ。セル結合をやめろ。 - hibitの技術系メモ
  • あなたを死なせないためのプログラミング - Qiita

    <追記> 避難所情報を最新化していないので、稼働停止しました。 ちなみに、268人の方がLINEで友だち追加してくれました。ありがとうございました。 ------------------------ 今年は、大規模な地震・台風と、災害が多い年になりました。でもそれらをニュースで見て、「今のうちに災害対策アプリを入れておこう」と行動に移した人は多くはないでしょう。 災害対策情報だけでなく、今やどんな情報も、その気になればすぐに手に入る世の中になったにもかかわらず、「その気になる」までの心理的ハードルは未だに高いように感じています。人間は、気で危機感を覚えないと行動できない生き物なのでしょう。 確かに、必要に迫られていないのに新しいアプリを入れるのには抵抗がある人も多い。それなら、日中で誰もが使っている「LINE」で避難場所を知ることができたら、みんなもう少し気軽に使えるんじゃないか? と

    あなたを死なせないためのプログラミング - Qiita
  • システムで「性別」の情報を扱う前に知っておくべきこと - Qiita

    0は性別に関する情報が得られない場合に使います。性別に関する情報はあるのだけど1とも2とも言えない場合は9を使います。要は「0でもなくて1でも2でもなければ9」です。 これを知っていればMだとかFだとかを議論をせずに済みますね。 国際規格に従うべき理由 国際規格に従うことは色々と利点があります。まず、どうしてそういうコード体系にしたのかを説明しやすいです。また多言語対応する際も規格通りに書けば伝わるはずなので迷わずに済みます。別システムへのデータの移行や、異なるシステム間でのデータの統合もコード体系が同じならラクラクです。もしかしたら別のプロジェクトで書いたコードをそのまま使いまわせるかもしれません。技術者に対するトレーニングも不要です。 対して、わざわざ国際規格に反する実装をする場合は上記のメリットがそのままひっくり返ってデメリットになりはしますが、もちろん、それなりの理由があれば規格と

    システムで「性別」の情報を扱う前に知っておくべきこと - Qiita
  • [RDBMS][SQL]トランザクション分離レベルについて極力分かりやすく解説 - Qiita

    技術系の記事色んなところで書いてたけど、ここにまとめることにした。昔書いてたやつは綺麗バッサリ消そうかと思ったんだけど、やたらView数が多いやつが何個かあったので気が向いた時に乗り換えしつつ(予定)今の知識で更新。 概要 以下の3つの不都合な読み込み現象がある。この意味に関しては後ほど解説。とりあえずはどれもRDBMSのACID特性のI(Isolation-隔離性)から外れたものと思ってくれればいい。 ダーティリード ファジーリード(非再現リード,ノンリピータブルリード) ファントムリード で、題のトランザクション分離レベルは4つのレベルがある。 READ UNCOMMITTED READ COMMITTED REPEATABLE READ SERIALIZABLE 下に行くほど高レベルで上に行くほど低レベル。 高レベルになればなるほど、先ほどの不都合な読み込み現象が発生しなくなる。が

    [RDBMS][SQL]トランザクション分離レベルについて極力分かりやすく解説 - Qiita
  • 市場バグを引き起こした優秀なデータたち - ボドゲを愛するテスト屋さん

    ※この記事は「ソフトウェアテストの小ネタ Advent Calendar 2017 - Qiita」用の記事です。 ソフトウェアテストの小ネタ 2日目担当のオムそばです。 実はちゃんとした(?)記事を書くのはこれが初めてなので、生暖かい目で見ていただければ。 そんなわけで早速表題の件、市場バグを引き起こした優秀なデータたちをご紹介します。 今回は、よくある「半角記号」、「空白やスペース」などは割愛させていただきます。 (2017/12/26追記)"市場バグ"という言葉に違和感や疑問を持たれた方は、こちらの記事をどうぞ。文言について整理してみました。 ■日時に関するデータ ・1969/12/31、2038/1/20:UNIX系のシステムに有効なデータ。UNIXのシステム時刻は1970/1/1 開始なので、それ以前のデータを打ち込むと予期せぬエラーが発生する可能性がある。また、同様に2038/

    市場バグを引き起こした優秀なデータたち - ボドゲを愛するテスト屋さん
  • 1