タグ

アルゴリズムに関するpick_mugetuのブックマーク (10)

  • Google検索のアルゴリズムに関する2500ページ超の内部文書が本物であることをGoogleが認める

    Googleの検索ランキングアルゴリズムに関する2500ページ超の内部文書「Google API Content Warehouse」がリークされました。この内部文書についてコメントを拒否していたGoogleですが、ついにこれが物であることを認めました。 Google confirms the leaked Search documents are real - The Verge https://www.theverge.com/2024/5/29/24167407/google-search-algorithm-documents-leak-confirmation 世界最大級の検索エンジンであるGoogle検索を運用するGoogleの、検索アルゴリズムに関する2500ページ超の内部文書「Google API Content Warehouse」がリークされました。この内部文書により

    Google検索のアルゴリズムに関する2500ページ超の内部文書が本物であることをGoogleが認める
  • ソルト付きハッシュのソルトはどこに保存するのが一般的か - Qiita

    pictBLandとpictSQUAREに対する不正アクセスがあり、パスワードがソルトなしのMD5ハッシュで保存されていたことが話題になっています。 2023年8月16日に外部のフォーラムにpictSQUAREより窃取した情報と主張するデータ販売の取引を持ち掛ける投稿が行われた(中略)パスワードはMD5によるハッシュ化は行われているもののソルト付与は行われていなかったため、単純なパスワードが使用されていた29万4512件は元の文字列が判明していると投稿。(それ以外の26万8172件はまだMD5ハッシュ化されたままと説明。) 不正アクセスによるpictBLand、pictSQUAREの情報流出の可能性についてまとめてみた - piyolog より引用 これに関連してMD5ハッシュやソルトに関するツイート(post)を観察したところ、どうもソルトの理解が間違っている方が多いような気がしました。

    ソルト付きハッシュのソルトはどこに保存するのが一般的か - Qiita
  • 画像認識モデルの「盲点」を克服するための奇妙な画像ばかり集めたデータセット「ObjectNet」をMITとIBMの研究チームが公開

    人工知能(AI)を用いた画像認識モデルは、写真や映像の中に映り込む物体を正確に識別することを目的としたもので、自動運転車の外界認識機能などさまざまなものに応用されています。例えば自動運転車の場合、画像認識モデルの物体認識精度は自動運転車の安全性に直結してくるため、モデルの学習に使用するデータセットは非常に重要な役割を担うこととなります。そこで、マサチューセッツ工科大学(MIT)とIBMの研究者チームは、多種多様な物体を含んだ画像認識モデル向けのデータセット「ObjectNet」を作成しています。 This object-recognition dataset stumped the world’s best computer vision models | MIT News https://news.mit.edu/2019/object-recognition-dataset-stump

    画像認識モデルの「盲点」を克服するための奇妙な画像ばかり集めたデータセット「ObjectNet」をMITとIBMの研究チームが公開
  • プログラマだったら当然知ってるよね?という知識一覧

    2019年11月11日追記 ただのタイトルで煽ってるだけの記事に半年経っても未だに大量のアクセスがあるので追記しておきます。 ここで言いたいことは、「プログラマならコンピュータサイエンスを勉強してると役に立つよね」、ということ だけ です。 この一文以上に有用な言葉は以降の文章では出てきません。みなさんの時間を無駄にしないために注意書きをしました。 それでも良いという人は読んでみてください。 Twitterで「〇〇ができるという人が面接に来たけど、『じゃあXXXやYYYって知ってます?』というと知らないという人が多いんだよねぇ」とかいうツイートを見かけて、私はXXXやYYYってのを知らなかったので調べた見たところ、常識とまでは言えない概念だったり、名前は知らなくても誰もが知ってる概念だったり、むしろもっと良いアプローチがあるのではという思想だったりでなんだかなぁと思っていたところ、半日くら

    プログラマだったら当然知ってるよね?という知識一覧
  • モナコインへの攻撃について(Block withholding attack)

    モナコインが攻撃にあい、大規模なブロックチェーンの再編成(巻き戻し)と、取引所が金銭的な被害にあったことが明らかになりました。 攻撃の手口と、この攻撃から考えられる示唆についてまとめます。 この攻撃は、Block Withholdig Attackといわれます。日語訳がないのですが、「ブロック隠し持ち攻撃」とでもいいましょう。 攻撃の手口 攻撃の手口についてまずは解説します。 マイナーはブロックが見つかると、通常すぐにネットワークにブロードキャストします。しかしながら、ハッシュパワーが勝っているなどの有利な条件があれば、見つけたブロックを敢えてブロードキャストせずに、裏で次のブロックを掘り続けるということもできます。 それが下の図です。 矢印の時点が攻撃のタイミングです。表では別のブロックチェーンが伸びているのですが(青色)、攻撃者はある時点から、自分だけでブロックを隠し掘りをしはじめま

    モナコインへの攻撃について(Block withholding attack)
  • 本当に実用的なたったひとつのソートアルゴリズム - CARTA TECH BLOG

    コンテンツメディア事業部の新卒エンジニアがお送りいたします。 突然ですが、皆さんの好きなソートアルゴリズムはなんですか? 私は基数ソートのスマートでストイックな雰囲気に惹かれます。 とはいえ、普段の開発では「どのソートアルゴリズムを使うか」を意識することは少ないのではないでしょうか。 むしろ現実世界で「トランプが全部揃ってるか」を手作業で確認するときとかのほうが、実はソートアルゴリズムが必要なのかもしれません。 ということで(?)、そのような現実的な場面で、当に実用的なソートアルゴリズムを決める戦いが始まりました。 選手紹介 今回試したソートアルゴリズムは、独断と偏見で選んだ以下の5種類。 1 挿入ソート シンプル・イズ・ベスト!正直言ってベンチマークの噛ませ犬! 2 クイックソート 「クイック」の名前はダテじゃない!王者の貫禄を見せてやれ! 3 マージソート 安定感のある隠れた実

    本当に実用的なたったひとつのソートアルゴリズム - CARTA TECH BLOG
  • 一部のスキャナで「勝手に原稿の数字を書き換える」エラーが出ることが明らかに

    コピー機やスキャナで取り込んだ書類は原と100%まったく同じ内容になるはず。しかし、最近のスキャナでは画像をより美しく圧縮するアルゴリズムが誤作動し、原稿の中の数字を勝手に書き換えてしまうという恐ろしいエラーが起こるのだそうです。 問題が発覚したのは、こちらの建築図面をスキャンして画像化した時のこと。 一番上の欄の3つが元の画像です。二段目はXerox WorkCentre 7535。三段目以降はXerox WorkCentre 7556でスキャンしたものです。赤丸がエラー位置。単なるスキャンつぶれではなく、明らかに違う数字に書き換えられているのが分かります。7535では毎回同じ位置にエラー、7556ではランダムな位置にエラーが出ました。 こちらは「6」が「8」になっているのが、よりはっきりとわかります。 ランダムな数字で検証した結果がこちら。 多くの白黒コピー機/スキャナでは元原稿を画

    一部のスキャナで「勝手に原稿の数字を書き換える」エラーが出ることが明らかに
  • iTunes11のアルバム情報表示に使われるオシャレアルゴリズムを考える | fladdict

    iTunes11がリリースされましたね。賛否両論を呼びそうな大変更。 このiTunes11、アルバム選択時の情報画面がもの凄く凝ってる。なんとアルバムジャケットにあわせて情報の色が変化するんよ!! 何これオシャレ! どういうアルゴリズムになっているのか、とっても気になる。 仮定としては、 ジャケットを16〜32色程度で減色、パレット抽出する。 四辺のエッジに含まれる色から、最多ピクセル色を背景に採用。 残りの色の中で、背景色と一定距離(RGB or 色相)がある最多ピクセル色を文字色1として採用。 残りの色の中で、背景色と一定距離(RGB or 色相)がある最多ピクセル色を文字色2として採用。 どうしても適切な色がない場合、白か黒を文字色に採用。 アルバムの四隅に対し、背景色でインナーシャドーをかける という感じかなと。多分これであってる。 アルゴリズムで文脈にあった綺麗な配色を作るってい

  • 【レポート】GNU grepが高速な理由 | エンタープライズ | マイコミジャーナル

    FreeBSD - The Power To Serve why GNU grep is fast (なぜGNU grepは高速なのか)といったタイトルの興味深いメールがFreeBSD開発者メーリングリストに投函された。メールを出したのはGNU grepのオリジナル開発者であるMike Haertel氏。Mike Haertel氏はFreeBSDユーザでもあり、FreeBSD開発者メーリングリストで興味深いやりとりがあったため、このメールを流したとしている。Mike Haertel氏の紹介する内容はgrep(1)の実装のみならず、高速な文字列処理を実現するひとつの方法として参考になる。紹介されているGNU grep高速さの秘訣は次のとおり。 GNU grepは入力バイトのすべてをチェックするようなことは避けている。 GNU grepはバイトごとに適用する操作を極力最小限に減らしている。 G

  • Hatetris 超高難易度テトリス | 秋元@サイボウズラボ・プログラマー・ブログ

    Hate(憎む) + Tetris = Hatetrisと名付けられたこのブラウザで動くテトリス、普通のテトリスと大きく違うところがあります。 * 重力がないので好きなだけ次の移動を考えることができる? たしかにそれも違うところですが、もっと大きな違いは * 常に、一番困難なブロックが現れる という点です。操作はカーソルキーのみ。重力がないので明に下に落としていかないと次は出ません。まあ一回やってみてください。すごいイライラしますよ 作者の解説によれば、このゲームに偶然はなく、どの状況ならどのパーツが出てくるかは常に決まっています。ラインを消せないように消せないようにブロックが出てくるので、その消しにくいブロックを使ってラインを作ることを、理詰めで考えなければいけません。勝手にブロックが落ちなくても、そうとう考えさせられますよ。 偶然性がないことから、すべての入力は記号の組み合わせで記録す

    Hatetris 超高難易度テトリス | 秋元@サイボウズラボ・プログラマー・ブログ
  • 1