並び順

ブックマーク数

期間指定

  • から
  • まで

1161 - 1200 件 / 1553件

新着順 人気順

algorithmの検索結果1161 - 1200 件 / 1553件

  • 「人を審査するAI」のリスクとは? 現金給付アルゴリズムが“暴走”した世界銀行の事例

    「人を審査するAI」のリスクとは? 現金給付アルゴリズムが“暴走”した世界銀行の事例:事例で学ぶAIガバナンス(1/3 ページ) イーロン・マスク氏などを筆頭に、AIの野放図な発展に反対する姿勢を取る人物は多い。AIは強力な存在であるが、何の制約もなく放置していては、大きな悪影響が生じる懸念がある。そのためAI導入を検討する企業の中には、あらかじめ自社が守る「AI倫理」を定めておき、この技術が正しく機能することを担保しようとするところが増えている。 そのAI倫理を構成する要素の一つが「透明性」(Transparency)だ。これは「あるAIがどのように機能するのか」「どのようにして特定の結論に至るのか」が外部からも理解できるようになっている状態を指す。特に後者の透明性は「説明可能性」(Explainability)と呼ばれる場合もある。 例えば、求人に応募してきた志望者の履歴書を読み込ませ

      「人を審査するAI」のリスクとは? 現金給付アルゴリズムが“暴走”した世界銀行の事例
    • ICFP Programming Contest 2025におけるAIツールShinkaEvolveとの協働 - iwiwiの日記

      我々チームUnagiはICFP Programming Contest 2025にて優勝することが出来ました。今回、私はこのコンテスト中に勤務先Sakana AIが開発するAIツール「ShinkaEvolve」を活用することを試みました。この記事では、ShinkaEvolveがコンテスト中に我々にどのように貢献したかを説明します。 ShinkaEvolveは我々の解法の中核である問題のSAT式へのエンコーディングを大きく改善し、解法全体を大幅(〜10倍)に高速化し、大規模な問題を最適に近いステップ数で解くことを可能としました。また、そこでShinkaEvolveが与えた知見が、その後に人間が設計した別の解法でもチーム内で活用されました。 (この記事は会社のブログリリースの元となった原稿です。会社からの許可に基づき、個人のブログ記事として投稿しています。) ICFP Programming

        ICFP Programming Contest 2025におけるAIツールShinkaEvolveとの協働 - iwiwiの日記
      • Google検索では依然としてAIの分析よりも「メタデータ」が重視されている

        Googleなどの検索エンジンは人工知能(AI)を利用して最適な検索結果を表示すると考えている人も多いはずですが、実際にはAIの分析よりも多様な「メタデータ」が重視されています。一体なぜGoogle検索ではメタデータが使われているのかについて、ソフトウェア開発者のCal Paterson氏が説明しています。 We were promised Strong AI, but instead we got metadata analysis https://calpaterson.com/metadata.html 1990年代後半には、将来の検索エンジンはAIを用いて全てのウェブページを検索して内容を理解し、最適な検索結果を表示できるようになることが期待されていました。ところが、記事作成時点でもGoogleはAIを使って全てのページを分析しているのではなく、ウェブサイトの管理者が提供するメタデ

          Google検索では依然としてAIの分析よりも「メタデータ」が重視されている
        • リスク無視したフェイスブック そして告発を後押しする事件が起きた:朝日新聞

          米フェイスブック(FB、現メタ)の元従業員、フランシス・ホーゲンさんが持ち出した膨大な文書による内部告発は、世界に衝撃を与えた。社会の分断を生む投稿表示のアルゴリズム(計算手順)、若者心理に与える悪…

            リスク無視したフェイスブック そして告発を後押しする事件が起きた:朝日新聞
          • バイデン大統領、一般教書演説でテック企業をメッタ切り

            バイデン大統領、一般教書演説でテック企業をメッタ切り2023.02.26 12:009,630 Mack DeGeurin - Gizmodo US [原文] ( satomi ) 「競争のない資本主義は資本主義ではない。搾取だ」 今年2度目になる一般教書演説でバイデン大統領はこう語り、巨大IT企業による過剰なデータ収集と競争阻害を規制する法律を与野党が協力して成立させることに意欲を示しました。 バイデン大統領の口から「反トラスト法(日本の独占禁止法)」のキーワードが出てくることは滅多にないですが、政権の布陣を見回すと、連邦取引委員会(FTC)委員長には、反トラスト法に精通している、リナ・カーン氏を任命しました。一部では、ビッグテックにもっとも恐れられている人物だとして取り上げられることも。 さらに、米国司法省で反トラスト法を担う司法次官補には、過去にビッグテックと戦った実績を持つ、弁護士

              バイデン大統領、一般教書演説でテック企業をメッタ切り
            • Twitterのアルゴリズムとツリーぶらさげ文化に思うこと - ねじまき日記

              ツイッターの改悪について 最近、Twitterのアルゴリズムが公開されて以降、 長文を区切って、ツリーをぶら下げるツイートがさらに増えた気がする。 なぜかというと その方が拡散されやすく、 「より多くのインプレッションを得られるから」だそう。 より多くの人に見られる工夫としてそういうツイートが増えるのはまあいいとして、 ツリーにぶら下げられた文章ってけっこう読みにくいと思うのは 自分だけなんだろうか? たとえばこういうツイート。 ChatGPT生みの親、アルトマン氏が抱える矛盾 ・彼は現在37歳 ・8歳のとき人工知能について考え始める ・触れていたのはApple「マッキントッシュLC II」 ・20代の若い頃スタートアップ企業に投資 ・「一生で必要とする以上のお金」を稼いだ ・利益主義のAI開発に警戒感 (1/n)https://t.co/AlZEwNWa41 — 鶴田 浩之@CODEGY

                Twitterのアルゴリズムとツリーぶらさげ文化に思うこと - ねじまき日記
              • 株高か株安か 2025年の相場は「あの人」次第?【経済コラム】 | NHK

                2024年は東京株式市場にとって歴史的な1年でした。 日経平均株価の最高値更新、過去最大の急落と上昇。 数々の記録に揺さぶられながらも最後は『上昇』で着地しそうです。 2025年はどのような相場になるのでしょうか。 カギを握るのは“あの人”かもしれません。 (経済部記者 横山太一) 2024年の株価 なぜ上昇? 「ことしの株式市場は堅調に推移した」 日本取引所グループの山道裕己CEOは今月13日の定例会見で、ことしの株式市場をこう総括しました。 日経平均株価のチャートを見てみると、まるでことしの干支(えと)の『辰』(龍)のように上に下にと蛇行しながらも、25日移動平均線はゆるやかな右肩上がりとなっています。 1年を振り返ってみると「総じて堅調」「株高の年」だったかもしれません。 日経平均株価 ▽2月22日 バブル期につけた終値としての史上最高値を34年ぶりに更新 ▽3月4日 4万円の大台を

                  株高か株安か 2025年の相場は「あの人」次第?【経済コラム】 | NHK
                • Introducing the Gemini 2.5 Computer Use model

                    Introducing the Gemini 2.5 Computer Use model
                  • 必須教養!?プログラミング“金メダリスト”に学ぶ「アルゴリズム」【橋本幸治の理系通信】(2022年3月30日)

                    興味深いサイエンスニュースをお伝えする「理系通信」。 今回のテーマは「アルゴリズム」です。 アルゴリズムとは「計算手順」のこと。 スーパーコンピューターをもってしても計算に100年かかるような問題を、「うまいアルゴリズム」を使えば0.01秒で解けてしまうこともあります。 そんなアルゴリズムの魅力を、国際情報オリンピックで金メダルを三度獲得したプログラミングの達人である、東京大学新2年生の米田優峻さんに教えてもらいます。 ※引用元: 問題解決のための「アルゴリズム×数学」が基礎からしっかり身につく本(米田優峻 著) https://gihyo.jp/book/2022/978-4-297-12521-9 #アルゴリズム#プログラミング#E8さん#競技プログラミング#数学#動的計画法#二分探索法#幅優先探索#最短経路問題#線形計画法#E869120#競プロ#AtCoder WBS、モーサ

                      必須教養!?プログラミング“金メダリスト”に学ぶ「アルゴリズム」【橋本幸治の理系通信】(2022年3月30日)
                    • Gödel's Incompleteness Theorem, in Bash

                      Gödel’s first incompleteness theorem states that there are mathematical statements that can neither be proven or disproven. His proof is fairly difficult to understand - it involves prime numbers, factorization, all this number theory. Gödel’s proof had to be complicated because in 1931, computer algorithms hadn’t really been invented. Turing machines would only be invented in 1936, five years lat

                        Gödel's Incompleteness Theorem, in Bash
                      • こわくないbit全探索1 入門編: bit全探索ってなに?【競プロ解説】 - Qiita

                        競技プログラミング(AtCoder)初心者が、最初に突き当たる壁になることが多いアルゴリズムのひとつに『bit全探索』があります。 この記事では、その『bit全探索』についてできる限り丁寧に解説をしていきます。 記事リンク 1. 入門編 bit全探索ってなに? : bit全探索はどんなことをするアルゴリズムなのか解説します。 2. 基本編1 簡単な例題でbit全探索をやってみよう! : 簡単な例題(部分和問題)で実際にbit全探索を実装してみます。 3. 基本編2 2進法を使って実装してみよう! : 2進法を使ったbit全探索の実装をしてみます。 4. 実践編 AtCoderの問題を解いてみよう! : AtCoderのbit全探索を使う問題のヒントとコード(Python・C++)を載せています。 5. 応用編 3つ以上の選択肢は再帰関数で書こう! : 再帰関数を使ってbit全探索に似た問題

                          こわくないbit全探索1 入門編: bit全探索ってなに?【競プロ解説】 - Qiita
                        • AI画像生成ツールは悪なのか? 2つの訴訟でいま起きていること

                          AI画像生成ツールは悪なのか? 2つの訴訟でいま起きていること2023.02.04 21:0014,665 Thomas Germain - Gizmodo US [原文] ( 禿頭帽子屋/Word Connection JAPAN ) Getty Imagesとアーティストの集団がStability AI、Midjourney、DeviantArtを訴え、AIテクノロジーの今後のあり方が問われています。以下、米ギズモードによる解説です。 画像でも文章でも、AIが生成したコンテンツが急速に身近になってきました。いったい著作権はどうなっているのか? 皆さんも気になりますよね。 人工知能(AI)を使った画像生成ツールを構築するとき、エンジニアはアルゴリズムをトレーニングします。そのとき使うのは、写真や絵画、グラフィックスの大規模なデータベースです。話題になっている画像生成AIのほとんどは、We

                            AI画像生成ツールは悪なのか? 2つの訴訟でいま起きていること
                          • C++の高速なハッシュテーブルの実装を読んだ (ankerl::unordered_dense) - Qiita

                            m_bucketsがハッシュテーブルの管理データで、m_valuesが格納した要素の配列。 m_valuesは全要素が隙間なく詰められていて、イテレートする際はここを直接走査する。 dist_and_fingerprintは、名前の通り2つの値が一つの変数にパックされている。 この工夫で、いろいろと効率よく処理できる(後述) 上位3バイト: dist ハッシュ関数で求めた位置から、実際に要素が格納されている位置までの距離 基本アルゴリズムの解説でProbe Sequence Lengthと呼ばれているものと同じ 1から数えるので注意。つまりdist == 1ならハッシュ関数で求めた位置と実際に格納されている位置が等しい 下位1バイト: fingerprint ハッシュ値の下位1バイトを格納 dist_and_fingerprint == 0の場合はEmpty(その位置に要素が格納されていな

                              C++の高速なハッシュテーブルの実装を読んだ (ankerl::unordered_dense) - Qiita
                            • The Rubik's Cube Perfect Scramble

                              I was playing with my son’s Rubik’s Cubes and tried to scramble a cube randomly so that no two squares with the same color were side by side. Here’s one way to do it: But I wanted a scramble that looked like a random scramble. No matter how many different moves I made, I couldn’t do it. Every time I separated two squares with the same color, two other squares of the same color would touch somewher

                                The Rubik's Cube Perfect Scramble
                              • mergekit-evolve による 進化的モデルマージ|npaka

                                以下の記事が面白かったので、簡単にまとめました。 ・Evolutionary Model Merging For All 1. 進化的モデルマージ「Sakana.ai」は約1か月前、「進化的モデルマージ」に関する論文を発表し、大きな話題を呼びました。 「進化的モデルマージ」を使用すると、マージで特定のコンピテンシーや資質をターゲットにすることができます。これがないと、モデルマージは手動の探索プロセスになります。数十回のマージを試し、それらを手動で評価し、マージパラメータが最終モデルの性能にどのように関連するか頭の中で考え出そうとすることになります。「進化的モデルマージ」を使用すると、どのような性質を持たせたいかを指定でき、最適化がそれを処理します。 「mergekit」では、この「進化的モデルマージ」を利用できます。 2. ハードウェア要件7Bモデル の場合は 24GB のVRAMで十分で

                                  mergekit-evolve による 進化的モデルマージ|npaka
                                • 2023 パズルの逆ポーランド記法(RPN)による解法の解説

                                  2023 年、あけましておめでとうございます!私は元旦に次のようなオリジナル・パズルを出しました。 上の例のように、数字の合間に四則演算(+−×÷)や括弧を入れることで、2023 を作ってください。 数字の間に必ず演算子を 1 つ入れてください ただし 9 と 8 の間には既に ÷ が入っています 括弧は複数重ねて使用できます 10×(-9 ÷ 8) のようなマイナス記号の使用は禁止です オリジナルツイートはこちらです。この記事では、JavaScript によるこのクイズの解き方をご紹介します。 括弧の数式をプログラムで扱うには さて、この問題の一番厄介な点は、括弧の絡む数式をプログラムで処理するという点ではないかと思います。この記事でもそこを重点的に解説したいと思います。 中置記法 まず、我々が日常的に使っている数式は、いわゆる「中置記法」と呼ばれる記法です。例えば (1 + 1 / 9

                                  • 競技プログラミングをしなくても知っておきたい計算量のはなし

                                    これは ミライトデザイン Advent Calendar 2021 の 14 日の記事です 最近ふぐひれ酒が飲みたくて仕方ない ほげさん ( zenn ) です 今日は計算量について超ゆるふわに紹介してみようと思います 「競技プログラミングとかやらんし」「Web サービス作るのにいらんし」などと思った方! 大量リクエストの対応やバッチ処理など、案外役に立つかもしれないですよ! どういうときに計算量を考えるか 計算量とは、処理の効率などを示す尺度のことです この記事では処理時間についてのみ紹介します まずはサンプルコードと実行結果を見ながら、代表的なケースとインパクトを見てみましょう データ構造をちょっとだけ気にする ロジックをちょっとだけ気にする アルゴリズムをちょっとだけ気にする の三本立てでサクサクいきますよ ケース 1: データ構造をちょっとだけ気にする 最後の要素を取得するのは、配

                                      競技プログラミングをしなくても知っておきたい計算量のはなし
                                    • バブル相場用の回転ボットのコンセプトとQuantZoneロジック(追記あり)|Hoheto (仮想通貨botter)

                                      こんにちは、Hohetoです。 今回のnoteでは、「力強い上昇相場に乗り遅れたときに、リスクを限定しつつ利益を上げるための方法」について検討と実践を行った結果について共有します。 ご注意! 当noteに出てくる手法は特に再現性があるわけではなく、たまたま相場とマッチしてうまくいっただけなので、今後もうまく機能するとは限りません。 ここで書かれている情報については、自己責任でご利用ください。筆者はいかなる損失も補償できませんので、ご承知おきください。 追記!(必ずお読みください) 2021年5月19日の暴落に買いで立ち向かった回転ボットは、あえなくその生涯を閉じました(26万ドルの損失、ゼロカット)。 ・4万ドル→40万ドル→30万ドルを退避して10万ドル→26万ドル→ゼロ。 教訓 ・下げ相場に入っているのにそのまま運用してしまった。本来は方向を逆にして必ず売りから入る状態にすべき。 ・ネ

                                        バブル相場用の回転ボットのコンセプトとQuantZoneロジック(追記あり)|Hoheto (仮想通貨botter)
                                      • Python Type Hints are Turing Complete

                                        Grigore showed that Java generics are Turing complete by describing a reduction from Turing machines to Java subtyping. We apply Grigore's algorithm to Python type hints and deduce that they are Turing complete. In addition, we present an alternative reduction in which the Turing machines are simulated in real time, resulting in significantly lower compilation times. Our work is accompanied by a P

                                        • How Unix Spell Ran in 64kB RAM

                                          How do you fit a 250kB dictionary in 64kB of RAM and still perform fast lookups? For reference, even with modern compression techniques like gzip -9, you can't compress this file below 85kB. In the 1970s, Douglas McIlroy faced this exact challenge while implementing the spell checker for Unix at AT&T. The constraints of the PDP-11 computer meant the entire dictionary needed to fit in just 64kB of

                                            How Unix Spell Ran in 64kB RAM
                                          • 2022年9月 Helpful Content Update に関する調査 - 株式会社JADE

                                            Google は、「人が人のために書いた、より独創的で役立つコンテンツ」「人間優先のコンテンツ」(people-first content) を評価するための Helpful Content Update を、8月25日から9月9日(米国時間)にかけて展開しました。英語圏のみのリリースということもあり、どのようなサイトが動いていたのかなどの情報が少ないため、今回 JADE では、サードパーティーツールの情報を複数使用し調査を行いました。

                                              2022年9月 Helpful Content Update に関する調査 - 株式会社JADE
                                            • ネットワークの混雑を制御するアルゴリズムに「公平な通信を提供しきれない」という問題があることが判明

                                              2022年7月2日に発生したKDDIの通信障害では、多数の端末からアクセスが集中したためにネットワークで輻輳(ふくそう)が発生し、KDDIのモバイル通信などを利用しづらい状況が長時間にわたり続きました。輻輳について行われた新たな海外研究で、本来あらゆるユーザーが公平にネットワークへアクセスできるよう管理するアルゴリズムに偏りがある可能性が指摘されました。 Researchers discover major roadblock in alleviating network congestion | MIT News | Massachusetts Institute of Technology https://news.mit.edu/2022/algorithm-computer-network-bandwidth-0804 マサチューセッツ工科大学の研究者らによると、Googleが開発

                                                ネットワークの混雑を制御するアルゴリズムに「公平な通信を提供しきれない」という問題があることが判明
                                              • スレッドプールの作り方

                                                (*)が付いている材料は、コア数分用意できると性能がアップします。 シンプルなProducer-Consumerパターン スレッドを1本だけ使うパターンから紹介します。特に小細工する必要も無いので実装もシンプルになります。 メインスレッドから非同期に実行して欲しい処理をワーカースレッドのキューに積む ワーカースレッドはキューから処理を取り出して実行する 生産者(Producer)・消費者(Consumer)パターンと呼ばれる、非常に古典的なデザインパターンの1つです。 コードにするならこんな感じ。 #include <condition_variable> #include <deque> #include <functional> #include <mutex> #include <thread> class worker { public: worker() : thread_([t

                                                  スレッドプールの作り方
                                                • 【プロが解説】Instagramでフォロワーを増やす施策15選! - SAKIYOMI|SNS運用のプロ集団

                                                  フォロワーの増やし方を手っ取り早く動画で学習したい方は、こちらをご覧ください。 Instagramマーケティング会社のマーケ責任者が、プロ独自のノウハウ(PECTサイクル)を解説しています。 「広告以外でInstagramのフォロワーを増やすにはどうしたらいいの?」 「フォロワーを増やす方法を実践してるが、成果がでない。」 Instagramのフォロワーの増やし方で悩む運用担当者の方は非常に多いです。私のもとにも、どのようにしたら増やすことができるのかを訪ねてくる人が後を断ちません。 そこで今回は、Instagramでフォロワーを増やすためにはどうしたらいいのか、 アルゴリズムに基づいた4つのステップ初級編~上級編までの難易度別の施策 を解説いたします。 残念ながら、多くの方がフォロワーを増やす為のステップを理解せずに運用してしまっています。分析に必要な計算式(フォロワー増加率など)すら知

                                                    【プロが解説】Instagramでフォロワーを増やす施策15選! - SAKIYOMI|SNS運用のプロ集団
                                                  • https://openai.com/ja-JP/index/japan-economic-blueprint/

                                                    • How a Single Line of Code Made a 24-core Server Slower Than a Laptop | Piotr Kołaczkowski

                                                      Imagine you wrote a program for a pleasingly parallel problem, where each thread does its own independent piece of work, and the threads don’t need to coordinate except joining the results at the end. Obviously you’d expect the more cores it runs on, the faster it is. You benchmark it on a laptop first and indeed you find out it scales nearly perfectly on all of the 4 available cores. Then you run

                                                      • GANとどう違う?君は画像生成モデルNeRFを知っているか。

                                                        3つの要点 ✔️ NeRFとは新規視点の画像生成ネットワークである。 ✔️ NeRFの入力は、5次元(空間座標のx,y,zと視点のθ,φ)で、出力は体積密度(≒透明感)と放射輝度(≒RGBカラー)である。 ✔️ NeRFによって従来よりも複雑な形状を持つ対象物の新規視点画像を得ることに成功した。 NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis written by Ben Mildenhall, Pratul P. Srinivasan, Matthew Tancik, Jonathan T. Barron, Ravi Ramamoorthi, Ren Ng (Submitted on 19 Mar 2020 (v1), last revised 3 Aug 2020 (this version,

                                                          GANとどう違う?君は画像生成モデルNeRFを知っているか。
                                                        • 一人のチカラで日経平均を動かせる男、時価総額6兆円台のセブン&アイを114文字で易々と動かす : 市況かぶ全力2階建

                                                          ピストン赤沢さん、TACOピーの言った言わないの関税で迅速に仕事して新しいあだ名“アディーレ赤沢”が増える

                                                            一人のチカラで日経平均を動かせる男、時価総額6兆円台のセブン&アイを114文字で易々と動かす : 市況かぶ全力2階建
                                                          • What is the NP-hardness

                                                            組合せ最適化問題を語る上で避けて通れないのが「NP困難問題」です.NP困難問題の定義は「指数時間アルゴリズムが存在する問題」でも「多項式時間アルゴリズムが存在しない問題」でもないのですが誤解する人が大変多く,プレスリリースの「NP困難問題が解けました!」という見出しを読むたびにしかめ面をしています.私自…

                                                              What is the NP-hardness
                                                            • 【2025年最新】Instagramのアルゴリズムを理解しよう

                                                              リーチ最大化=これからフォロワーになる人へ投稿を届ける Instagramアルゴリズムランキングについて、アダム・モセリ氏が解説ショート動画はほかにもあります。 リーチを最大化する最善の方法は、まだあなたをフォローしていない人にあなたのコンテンツを表示させることです。これこそがInstagramの重要な部分となっており、表示順をおすすめする「アルゴリズム」の根幹ともいえそうです。 まだフォロワーになっていない人との接点は①発見タブ②リールタブでのおすすめです。つまり、投稿が「おすすめされるコンテンツ」である必要があるということは明確です。発見タブやリールタブでの各要素(シグナル)の重要度の順位は明確に公開されていませんでしたが、おすすめされる露出には「シェアなどの送信」が重要と考えられます。 「シェアなどの送信」をされるコンテンツであることに加えて、視聴時間が長いコンテンツであるか?いいね

                                                                【2025年最新】Instagramのアルゴリズムを理解しよう
                                                              • 5500万件の不正レビューをGoogleマップから削除、Googleはどのようにマップスパム対策しているのか?

                                                                [レベル: 中級] Google マップのスパムにどのように対応しているかを Google は公式ブログで解説しました。 具体的に明かすと逆に悪用されかねないと詳細な説明を避けつつも、マップスパム対策の取り組みの一部を Google は紹介しています。 通常ユーザーとの行動様式の違いを検出 本当のマップユーザーの行動様式との違いを検出してスパム判断に用います。 たとえば、ユーザーは通常、通勤や長距離移動の経路案内、あるいはレストランなどのサービスを探すときにマップを利用します。 また、実際に訪れた場所についてレビューや写真を投稿します。 こうした一般的な行動様式を機械学習によって学びます。 もしこうした行動様式から外れたユーザーがレビューを投稿した場合は偽物の可能性があると判断します。 バンコクのユーザーが突然、メキシコシティのカーディーラーに★1つの評価悪いレビューを投稿したら怪しいと判

                                                                  5500万件の不正レビューをGoogleマップから削除、Googleはどのようにマップスパム対策しているのか?
                                                                • Nearest Neighbor Indexes for Similarity Search | Pinecone

                                                                  Vector similarity search is a game-changer in the world of search. It allows us to efficiently search a huge range of media, from GIFs to articles — with incredible accuracy in sub-second timescales for billion+ size datasets. One of the key components to efficient search is flexibility. And for that we have a wide range of search indexes available to us — there is no ‘one-size-fits-all’ in simila

                                                                    Nearest Neighbor Indexes for Similarity Search | Pinecone
                                                                  • Google、リンクスパムアップデートを実施。不正なリンクの検出と無効化をさらに強固に

                                                                    [レベル: 初級] リンクスパムに対処するためのアルゴリズム更新を Google は実施します。 “link spam update”(リンクスパム アップデート)と名付けています。 検出と無効化の能力を強化 リンクスパムに対抗する能力を Google は改良し続けてきました。 20 年以上にわたる取り組みでリンクスパムを大幅に削除することに成功しています。 それでも、完璧ではなく改善の余地は依然として残ってます。 そこでリンクスパム対策をさらに強固なものにするために、リンクスパム アップデートを実施することになりました。 Google によれば、リンクスパム アップデートは次の点において従来のアルゴリズムよりもずっと能力が向上しているとのことです。 効果的な検出 広範囲な無効化 取りこぼしが少なくなったということですかね。 なお、“nullify[ing]” という言葉を用いているので、

                                                                      Google、リンクスパムアップデートを実施。不正なリンクの検出と無効化をさらに強固に
                                                                    • 「いつの間にか精度が落ちて慌てて直す」──“AI運用あるある”を成功に導く「MLOps」とは

                                                                      第3次AIブームと言われて久しく、すでにさまざまな企業が画像認識や音声認識、自然言語処理などを生かしたAIサービスを提供するようになった。 AIを実装する機械学習アルゴリズム、特に深層学習は、従来のルールベースなアルゴリズムより高い精度を出せる場合があるのが利点の一つだ。しかし、内部はブラックボックスになりがちで精度改善が難しい場合や、機械学習モデルに学習させるべきデータが適切に整形されていないこともある。 こうした「AI開発」前後の運用を成功に導く取り組みとして、近年「MLOps」(エムエルオプス)という開発手法に注目が集まり始めている。 特集:MLOpsキホンのキ AIベンダーやノーコード/ローコードでのAIモデル作成ツールなどが増え、以前よりはAIを導入しやすい環境になった。しかし、AI導入の“前後”はおろそかになっていないか。開発体制は迅速に回るか。モデル精度はモニタリングできてい

                                                                        「いつの間にか精度が落ちて慌てて直す」──“AI運用あるある”を成功に導く「MLOps」とは
                                                                      • Introducing OpenZL: An Open Source Format-Aware Compression Framework

                                                                        OpenZL is a new open source data compression framework that offers lossless compression for structured data. OpenZL is designed to offer the performance of a format-specific compressor with the easy maintenance of a single executable binary. You can get started with OpenZL today by visiting our Quick Start guide and the OpenZL GitHub repository. Learn more about the theory behind OpenZL in this wh

                                                                          Introducing OpenZL: An Open Source Format-Aware Compression Framework
                                                                        • Highlights from Git 2.42

                                                                          AI & MLLearn about artificial intelligence and machine learning across the GitHub ecosystem and the wider industry. Generative AILearn how to build with generative AI. GitHub CopilotChange how you work with GitHub Copilot. LLMsEverything developers need to know about LLMs. Machine learningMachine learning tips, tricks, and best practices. How AI code generation worksExplore the capabilities and be

                                                                            Highlights from Git 2.42
                                                                          • Chromeで共有辞書を使用した圧縮のテストが開始される、リピーターが多いウェブサイトで極めて効果的

                                                                            ウェブサーバーとブラウザ間の通信においてはさまざまなデータが圧縮されています。より圧縮率の高いアルゴリズムの開発と普及が進む中、Chromeで共有辞書を使用した圧縮のテストを開始するとGoogleが発表しました。 Supercharge compression efficiency with shared dictionaries  |  Blog  |  Chrome for Developers https://developer.chrome.com/blog/shared-dictionary-compression ウェブサイト閲覧時にはリソースの読み込み時間を削減するため、ウェブサーバーでHTMLやCSS、JavaScriptなどの一般的なテキスト形式のファイルを送信する前に圧縮を行い、クライアントで解凍することが一般的です。 長い間圧縮にはgzipというアルゴリズムが使用され

                                                                              Chromeで共有辞書を使用した圧縮のテストが開始される、リピーターが多いウェブサイトで極めて効果的
                                                                            • パワースポットを見つける地図アプリ「結界発見」の製作経緯とアルゴリズム解説

                                                                              概要 この記事では、選択した周囲の神社仏閣から自分だけのパワースポットを探し出すアプリ「結界発見」の制作の経緯や五芒星・六芒星探索アルゴリズムの説明などを書いている。 まだ試したことのない人はぜひリンクから遊んでみよう。 https://hothukurou.com/#6 陰謀論ウォッチャーとして有名なライター雨宮純氏のツイートをふと見つけたことから始まる。 私はもとよりオカルトや不思議な噂に興味がある方である。某ルポ漫画で「某公園に存在しないはずの大仏を見た人がおり、その人は後日出世した!」という話を読んだ際には、写真などの情報から場所を特定して怪談ハンターとして赴く程度にはこういう話が好きだ。 といいつつもさすがに神社仏閣を結んだ五芒星・六芒星話については「日本にはたくさん神社仏閣があるから、あちこちで結べる気がするなあ」と思っていた。実際、n個の点から5点選ぶ時の組み合わせ数はnの値

                                                                                パワースポットを見つける地図アプリ「結界発見」の製作経緯とアルゴリズム解説
                                                                              • Speeding up `atan2f` by 50x

                                                                                2021-08-16 Speeding up atan2f by 50x \mathrm{atan2} is an important but slow trigonometric function. However, if we’re working with batches of points and willing to live with tiny errors, we can produce an \mathrm{atan2} approximation which is 50 times faster than the standard version provided by glibc. Perhaps more impressively, the approximation produces a result every 2 clock cycles. This is ac

                                                                                  Speeding up `atan2f` by 50x
                                                                                • 気付けばssh-keygen -t の後にrsaでなくed25519と打つことが推奨されていた | ABC DX Tech Blog

                                                                                  いつのまにかSSH鍵生成時のデファクトスタンダードが変わっていた 気付いた発端 実は前回の記事「Vertex AI WorkbenchとGitHubの繋ぎ込み」を書いている時に、GitHubのドキュメント「新しい SSH キーを生成して ssh-agent に追加する」を参照していたら、気になる記載が… ssh-keygen -t rsa なんてもう皆が何でも無いときにでも打ってしまうようなフレーズだと思っていたらいつのまにか ed25519 なるものが推奨されていたという衝撃。 調べて見るとここ数年はRSAよりEd25519のほうが強固だからそっちを使おう、みたいな話がたくさんヒットしてきて完全に乗り遅れていたことがバレてしまいました… せっかくなので、本記事では rsa と Ed25519 で何が違うかについて調べながら書いてみます。 ssh鍵生成の方式 とりあえずマニュアルで全方式を

                                                                                    気付けばssh-keygen -t の後にrsaでなくed25519と打つことが推奨されていた | ABC DX Tech Blog

                                                                                  新着記事