並び順

ブックマーク数

期間指定

  • から
  • まで

361 - 400 件 / 968件

新着順 人気順

algorithmの検索結果361 - 400 件 / 968件

  • ZoomやSkypeでリアルタイムに他人になりすませるオープンソースのディープフェイクツール「Avatarify」

    自宅からリモートワークを行う際、ZoomやSkypeといったオンラインビデオ会議ツールを使用するケースがよくあります。オンラインビデオ会議ツールではウェブカメラを使って自分の顔を映しますが、アルゴリズムで別人になりきってオンラインビデオ会議に参加できるオープンソースのディープフェイクツール「Avatarify」が公開されています。 GitHub - alievk/avatarify: Avatars for Zoom and Skype https://github.com/alievk/avatarify This Open-Source Program Deepfakes You During Zoom Meetings, in Real Time - VICE https://www.vice.com/en_us/article/g5xagy/this-open-source-pro

      ZoomやSkypeでリアルタイムに他人になりすませるオープンソースのディープフェイクツール「Avatarify」
    • Mozcdic-UT (Mozc-UT)が終わった話と、代替品を開発してる話 - Chienomi

      序 2023-01-12にLinux界隈に激震が走ったらしい。 Linux環境(Unix環境を含む)の日本語入力を支えていた、Mozcdic-UTプロジェクトが終了したからだ。 まず、前提として私の立場を明確にしよう。 私は2017年から、従来のMozc-UTに代わる新しい(ライセンス上の懸念のない)Mozc辞書として誕生したMozc-NEologd-UTのFcitxバインディング、fcitx-mozc-neologd-utのAURパッケージをメンテナンスしてきた。 その後新生Mozc-UTが誕生してからはfcitx-mozc-ut-unifiedとfcitx-mozc-ut-unified-fullというふたつのパッケージを加え、計3つパッケージをメンテナンスしてきた。 その後、mozcdic-ut自体がfcitx4をサポートしなくなったこと、fcitx5は既にメンテナーがいたことから私

      • 機械学習モデルの判断根拠の説明(Ver.2)

        【第40回AIセミナー】 「説明できるAI 〜AIはブラックボックスなのか?〜」 https://www.airc.aist.go.jp/seminar_detail/seminar_040.html 【講演タイトル】 機械学習モデルの判断根拠の説明 【講演概要】 本講演では、機械学習モデルの判断根拠を提示するための説明法について紹介する。高精度な認識・識別が可能な機械学習モデルは一般に非常に複雑な構造をしており、どのような基準で判断が下されているかを人間が窺い知ることは困難である。このようなモデルのブラックボックス性を解消するために、近年様々なモデルの説明法が研究・提案されてきている。本講演ではこれら近年の代表的な説明法について紹介する。Read less

          機械学習モデルの判断根拠の説明(Ver.2)
        • GPT-3を使って根拠付きで正確に質問応答してくれるシステムを作ってみる - Taste of Tech Topics

          こんにちは。社内データサイエンスチームYAMALEXの@Ssk1029Takashiです。 最近はChatGPTが出て注目を浴びたり、BingにもChatGPTのように質問応答してくれるAIが搭載されるなど、OpenAIのGPTモデルが世の中を騒がせています。 私もChatGPT使ってみましたが、受け答え自体は人が書いていた文章と遜色なく、文章の自動生成もここまで来たか。。という感じでした。 そんなChatGPTの特徴の一つとして、回答には時々嘘が含まれるというものがあります。 ChatGPT自体は知識を持っているわけではないので、学習データにないことなどはそれっぽいけどでたらめな回答を返してしまいます。 ただし、最近追加されたBingのGPTでは、ChatGPTよりもはるかに正確な回答が返ってくるように感じます。 画面を見ると回答の根拠となっている詳細情報が出ています。 ここから推測する

            GPT-3を使って根拠付きで正確に質問応答してくれるシステムを作ってみる - Taste of Tech Topics
          • あるエンジニアの面接で、ソートについて聞かれたら

            あるエンジニアさんが面接でソートについてきかれました。 ここまで覚えておく必要あるの?と思いましたが、知っている人はいるものですね。 でも、必要なら調べるぐらいの情報のような気もする。Webエンジニアなら必要な知識なのかなあ。

              あるエンジニアの面接で、ソートについて聞かれたら
            • おすすめ.ssh/config設定 - 2023-04-03 - ククログ

              はじめに つい先日、GitHubのRSA SSHホスト鍵が突如差し替えられるという一件がありました。 We updated our RSA SSH host key 詳細に関しては識者による解説に委ねますが、ちょうどタイムリーな話題だったので、SSHをより安全に利用するという観点でおすすめ設定についていくつか紹介します。 なお、クリアコードではSSH以外にもおすすめzsh設定やおすすめEmacs設定という記事も公開しているので参考にしてみてください。 2023年5月11日更新:StrictHostKeyCheckingをyesにする場合の安全なknown_hostsの更新方法について追記しました。 おすすめ設定について クリアコードでは、.ssh/configのおすすめ設定を https://gitlab.com/clear-code/ssh.d にて公開しています。 これは、社内で.ss

                おすすめ.ssh/config設定 - 2023-04-03 - ククログ
              • 人気エントリーのアルゴリズムを一部変更しました(ほか予告1件) - はてなブックマーク開発ブログ

                いつもはてなブックマークをご利用いただき誠にありがとうございます。はてなブックマーク開発チーム、ディレクターのid:yone-yamaです。 以下の記事で予告した通り、2023年2月7日(火)に、はてなブックマークの人気エントリーのアルゴリズムに一部変更を加えましたのでお知らせいたします。 bookmark.hatenastaff.com アルゴリズム変更の概要 変更を行った背景 (予告)人気コメントアルゴリズムの変更について アルゴリズム変更の概要 人気エントリーを選出するアルゴリズムに、新たに「人気エントリー全体の多様性」という観点を加味する変更を行いました。 これまでの人気エントリーでは、ユーザーのみなさまが行ったブックマーク行動を中心としたアルゴリズムを用いて記事を表示していました。今回のリリースではこれまでのアルゴリズムを補助するかたちで、いくつかの変数を新たに組み込んでいます。

                  人気エントリーのアルゴリズムを一部変更しました(ほか予告1件) - はてなブックマーク開発ブログ
                • Facebookが開発した圧縮アルゴリズムZstandardについて調べた(非常に高速)(今日から使えます) - Lambdaカクテル

                  Common Lispの処理系であるSBCLをインストールしようとしたら、追加でlibzstd-develというのを新たに要求されるようになっていた。見るからに圧縮系のライブラリだけれど聞き慣れないのでちょっと調べてみた。 ちょろっと調べたところ、以下のことが分かった: Zstandard(ゼットスタンダード?)というのが正式な名前。 Facebookが開発した。 Deflateよりも速いことを主眼においている。 BSDライセンス。 Linuxカーネルまわりで使えるようになっているほか、一部のディストロではパッケージの圧縮フォーマットとして使われているようだ。 Webというよりはどちらかといえばバックエンド的な箇所で使われている印象がある。 facebook.github.io zstd コマンド使ってみた 他の名だたる圧縮アルゴリズム同様、Linuxで直接ファイルに対してこれを実行して圧

                    Facebookが開発した圧縮アルゴリズムZstandardについて調べた(非常に高速)(今日から使えます) - Lambdaカクテル
                  • 機械学習を中途半端に勉強しても必要とされているのは研究者レベルの人だと考えてしまうのですがどう思いますか?

                    回答 (4件中の1件目) ”中途半端に”というのはどのくらいのレベルなのでしょう。 谷村新司が歌うところの、「中途半端でなけりゃ、生きられない」by 狂った果実 ってあたりでしょうか。とりあえず「基礎知識はあるがそれを使って何か自分で問題解決をするソリューションを組むことはできない」レベルとしてみましょう。 さてそんな中途半端な私は将来必要とされますかね? YesかNoかで言えば、単純に普通のビジネスマンを続ける上ではあまり必要とされないのではと感じます。 まず自分がMLシステムの構築を主導・管理する場合: MLを問題解決やシステムとして使う場合、正しいデータを用意し、学習した結...

                      機械学習を中途半端に勉強しても必要とされているのは研究者レベルの人だと考えてしまうのですがどう思いますか?
                    • 「H.265/HEVC」と同じ画質でファイルサイズを50%削減できる次世代動画圧縮規格「H.266/VVC」が登場

                      Fraunhofer Heinrich Hertz Instituteが、Windows/macOS/Android/iOSといった各種OSでデフォルトでサポートされている動画圧縮規格「H.265/HEVC」の次世代規格となる「H.266/VVC」を発表しました。「H.266/VVC」はデータの圧縮効率を改善し、約50%ビットレートを削減することが可能となります。 Fraunhofer Heinrich Hertz Institute HHI https://newsletter.fraunhofer.de/-viewonline2/17386/465/11/14SHcBTt/V44RELLZBp/1 記事作成時点で、インターネットトラフィックの80%を占めているのが圧縮されたムービーデータです。Fraunhofer Heinrich Hertz Instituteが発表した新しい動画圧縮

                        「H.265/HEVC」と同じ画質でファイルサイズを50%削減できる次世代動画圧縮規格「H.266/VVC」が登場
                      • Pythonコードを35000倍に高速化したい

                        はじめに Pythonは世界的にも人気のあるプログラミング言語ですが、実行速度については課題があります。Pythonの実行速度を高速化したい、という要求は根強く、これまでにも様々な処理系が開発されています。 この記事はPythonで書かれたコードを35000倍に高速化するにはどのような方法があるかについてまとめたものです。 この記事は: Pythonで書かれたアルゴリズムを35000倍に高速化する 事前コンパイル、並列化、SIMD演算を駆使する 最終的に44000倍まで高速化できた なぜ35000倍? 2023年5月2日にModular社よりPythonの使いやすさとC言語の性能を兼ね備える新しいプログラミング言語、Mojoの開発について発表がありました。低レベルのハードウェア向けにコンパイル可能なこと、文法的にはPythonを踏襲しており、既存のPythonライブラリを利用可能であること

                          Pythonコードを35000倍に高速化したい
                        • 最短経路問題総特集!!!~BFSから拡張ダイクストラまで~ - Qiita

                          基本的アルゴリズム(幅優先探索など)から応用(経路復元、拡張ダイクストラなど)まで、最短経路問題に関するアルゴリズムを総特集しました。 基本的なグラフ理論の用語については、次を参考にしてください。 グラフ理論 用語集 queueなどのデータ構造の用語については、次のスライドの後半を参考にしてください。 C++ STL講習会 by @e869120 最短経路問題とは 一般的に、次のような問題とされます。 $V$ 頂点と $E$ 辺からなるグラフが与えられる。頂点 $u$ と 頂点 $v$ を結ぶパスのうち、重みの総和が最も小さいものはどれか。 始点を固定して他のすべての頂点との対について最短経路問題を解く場合や、任意の2頂点の対について解く場合などが実際には多いです。 実社会とも強く密着した問題のため、古くからたくさん効率的な解法が考えられてきました。 今回はそれらを紹介しつつ、細かいテクニ

                            最短経路問題総特集!!!~BFSから拡張ダイクストラまで~ - Qiita
                          • 数値計算の研究をしている学生が"数値計算に潜むとんでもないリスク"について話してみる - Qiita

                            筆者は「精度保証付き数値計算」という分野で研究をしている大学院生です. 「数値計算は分かるけど」「精度保証付き数値計算?ナニソレ?」という方がほとんどだと思います. 「精度保証付き数値計算」の研究自体は30年ほど前から盛んに行われていますが,世間に浸透しているとは言えない状況です. 自分の研究分野が世間に知られていないのは何か少し寂しい感じがするので「精度保証付き数値計算」を少しでも広めるべく記事を投稿することにしました.(シリーズ化するかも知れません) 本日は「精度保証付き数値計算」というワードだけでも覚えていただければ幸いです. 今回は"数値計算に潜むとんでもないリスク"に関してカジュアルにお話します. そして筆者の研究分野である「精度保証付き数値計算」の必要性を知ってもらえればなと思います. この記事を読み終える頃には計算機を信頼できなくなっているかも知れません(笑) ※不安を煽るこ

                              数値計算の研究をしている学生が"数値計算に潜むとんでもないリスク"について話してみる - Qiita
                            • 論理憲法

                              2つの選択ボックスから調べたい単語を選び、 「質問する」ボタンを押してください |-? ( , X, N).

                              • メールアドレスをハッシュ化したものを公開してもよいのか - しまたろさんの掃き溜め

                                注意 この記事は攻撃の実行を教唆する目的で書かれたものではなく、特定の状況におけるセキュリティ上の問題点を指摘するために公開しているものです。この記事に書かれた内容を実行して発生した結果について、筆者は一切の責任を負いません。 はじめに インターネット上で他人のメールアドレスをmd5で二重ハッシュしたものを公開されている方を見かけたため、解析する実験を行いました。 メールアドレスのユーザー名部分は多くの場合小文字のアルファベットと数字のみ(36文字)のそれほど長くない列で構成されており、ブルートフォース攻撃(総当り攻撃)によって簡単に特定できてしまうと考えられます。 またドメイン部分に関しても、一般の方が使うメールプロバイダが限られていることを考慮すると、サイズの小さい辞書でも十分な確率で当たるものと考えられます。 実験 今回はhashcatという、GPUでハッシュ値を解読するソフトウェア

                                  メールアドレスをハッシュ化したものを公開してもよいのか - しまたろさんの掃き溜め
                                • 数学の難問「巡回セールスマン問題」の近似解を求める最良のアルゴリズムが数十年ぶりに更新される

                                  巡回セールスマン問題とは、「複数の都市を移動するセールスマンが全都市をちょうど一度ずつ巡り、総移動コストが最小の経路を求める」という数学の難問です。長年にわたり「クリストフィードのアルゴリズム」が巡回セールスマン問題の近似度が最も高いアルゴリズムとされてきましたが、新たに「クリストフィードのアルゴリズムを上回る近似度のアルゴリズムがあると証明された」という論文を、コンピューターサイエンスの研究者が発表しています。 [2007.01409] A (Slightly) Improved Approximation Algorithm for Metric TSP https://arxiv.org/abs/2007.01409 Computer Scientists Break Traveling Salesperson Record | Quanta Magazine https://www

                                    数学の難問「巡回セールスマン問題」の近似解を求める最良のアルゴリズムが数十年ぶりに更新される
                                  • クッキークリッカーで学ぶアルゴリズム入門 : あすなろの雑記

                                    0. 目次 1. クッキークリッカーとは? 2. クッキークリッカー100万枚RTA 3. 解答? 4. 解答 5. 余談 6. おわりに 1. クッキークリッカーとは? 皆さんはクッキークリッカーというゲームをご存じでしょうか? 2013年に公開され同年に日本でも爆発的に流行を見せたゲームです。知らないよという方もご安心ください、最初の方だけですがざっくり説明します。 上の画像がプレイ画面です。左にあるクッキーをクリックします。 クッキーが1枚焼けました。やったね。 クッキーが15枚貯まりました、右側にあるカーソルをクリックしてみます。 指はどこだ!? クッキーの周りにある指が10秒に1回クッキーをクリックしてくれます。助かるー。 100枚貯まりました。アップグレード「強化された人差し指」を買ってみます。 クッキーの上に、クリックした回数分「+2」と書かれています 1回のクリックでクッキ

                                      クッキークリッカーで学ぶアルゴリズム入門 : あすなろの雑記
                                    • 時代がstaticおじさんに追いついてきた(追記あり) - きしだのHatena

                                      この文章みてください。 オレはもう20年以上システム業界にいるけどな、その長い経験から言うと、オブジェクト指向なんてものは、理論としては面白いけど、およそ実用的とは言い難いものだな。まぁ、例えばGUIのコンポーネントとかはオブジェクト指向に基づいて作られているようだから、そういうツールとかを作る人には必要なものなのかもしれない。しかし君たちがいずれ作ることになる業務アルゴリズムにはまったく無縁のものだと思ってもらって間違いない。どうもこの業界、オブジェクト指向でなければダメ、というような風潮がまかりとおっているけどな、オブジェクト指向なんか本当に使っている人はほとんどいないよ。オレも少し勉強してみたけど、カプセル化とかポリ何とかとか、どうにも利点が理解できなかったね。実際、実業務で使ったことなどないしな…… 「またお前、オブジェクト指向の話をしてるのか」と思ったかもしれませんが、2010年

                                        時代がstaticおじさんに追いついてきた(追記あり) - きしだのHatena
                                      • キャッシュと向き合う、キャッシュと共に生きる / cache pattern

                                        PHPerKaigi 2024の登壇資料です。 https://phperkaigi.jp/2024/ - https://speakerdeck.com/moznion/pattern-and-strategy-of-web-application-caching - https://soudai.hatenablog.com/entry/cache-strategy

                                          キャッシュと向き合う、キャッシュと共に生きる / cache pattern
                                        • 二分木 - Rustではじめるデータ構造とアルゴリズム(第1回)

                                          Rustの特徴のひとつは、所有権(ownership)・移動(move)・借用(borrow)の概念です。これらがコンパイル時に厳格にチェックされることにより、古くから未定義挙動でプログラマを悩ませてきたダングリングポインタなどの問題がなくなり、メモリ安全性がもたらされます。 しかし一方で、自分で多少複雑なデータ構造を定義しようとする場合にはコンパイルを通すだけでもかなりの知識・力量が要求されます。 この(不定期)連載では、 Rustではじめるデータ構造とアルゴリズム と題し、プログラミングコンテストなどでよく見かける基礎的なデータ構造とアルゴリズムを、できるだけシンプルにRustで実装していきます。 &, &mut, Box, Rc, Cell, RefCell などの使い分けや、なぜそれを使う必要があるかの解説を、実例を通して行います。 第1回は、最もシンプルな木構造である 二分木 を

                                            二分木 - Rustではじめるデータ構造とアルゴリズム(第1回)
                                          • 画像生成AIを実際に触ってみた結果、結構大きい副作用があり『手にした魔剣に自由意志をすべて奪われる感覚』を擬似的に体験してしまった

                                            鐘の音(除夜の鐘)ダイエット中−30kg @kanenooto7248 画像生成AIについて、思うこと。 実際に触ってみた結果、 ①個性が食われる ②自分よりも上手い ③創作意欲のすべてが消滅する という結構大きい副作用があって、回復しきれてない。 例えて言うのなら、「手にした魔剣に自由意志をすべて奪われる感覚」とはこういうものかと、擬似的に体験できた。 2023-01-17 22:22:15 鐘の音(除夜の鐘)ダイエット中−30kg @kanenooto7248 一番でかい副作用が、 ③創作意欲のすべてが消滅する だった。 ここまでヤバい勢いで減るのかと思って、個人の問題かもしれないが、一気に減衰した。正直、「勉強のために触ってみるかな?」と思って触ってみたのが間違いだった。ミスった。 2023-01-17 22:26:03 鐘の音(除夜の鐘)ダイエット中−30kg @kanenooto

                                              画像生成AIを実際に触ってみた結果、結構大きい副作用があり『手にした魔剣に自由意志をすべて奪われる感覚』を擬似的に体験してしまった
                                            • 神絵を描くAI「 #Midjourney 」はどうやって生まれたか…その可能性と限界、そして課題

                                              筆者が絵描きAI「Midjourney」に描かせた風景。「Sustainable Development Goals」をテーマに指定した。 作成:清水亮 ここのところ、Twitterなどで“神絵を描くAI”こと「Midjourney」が、話題になっている。一瞬で神のように上手な絵が描けると話題になり、またたく間にネットのミームになった。 「絵を描くAI」というと、イーロン・マスクらが出資したことでも知られるAI研究企業、米OpenAIの画像生成AI「DALL-E2」が有名だが、グーグルは今年に入ってからDALL-E2の性能を上回る「Imagen」を発表し、さらに大規模な作画AI「Parti」も矢継ぎ早に発表している。 Midjourneyはこれら画像生成AI開発ブームの一端として生まれたとも言える。 この記事では、全3回の短期集中連載として、AI研究者目線で見た「Midjourney」の課

                                                神絵を描くAI「 #Midjourney 」はどうやって生まれたか…その可能性と限界、そして課題
                                              • 海外で就職した話|takusemba

                                                先日、3年半ほど働いたサイバーエージェントを退社しました。来月からはオーストラリアに移住して、現地の企業でソフトウェアエンジニアとして働きます。 あまり技術以外の記事を書くのは得意ではないですが、自分にとって大きな節目なのと、海外での就職を考えてる人に少しでもでも参考になればと思い、自分の就職談を紹介できたらと思います。 入社までの道のり2017年に新卒としてサイバーエージェントに入社し、ABEMAでAndroidエンジニア(もしくは、Streamingエンジニア)としてアプリ開発に携わってました。 元々、海外で働きたい、海外に住みたいという願望があり、入社当時から海外での就職を模索していました。最初の1~2年は、特に海外で働くためのノウハウや知識もなかったので、とりあえずアメリカの知っている企業に片っ端から応募していました。何社からかは返事があり面接まで進むものもあったのですが、VISA

                                                  海外で就職した話|takusemba
                                                • 動的計画法によるDVDのディスク分割の改善

                                                  こんにちは。「家族アルバム みてね」の開発チームに所属している黒川と申します。今回は、その「みてね」の機能の1つで、写真や動画をDVDにして注文できる機能を動的計画法を使って改善した話をします。 「みてね」では家族の写真や動画をアップロードし、アプリ上で月ごとに振り返ることが可能になっています。一方、たとえば自宅のテレビやパソコンでまとめて振り返りたいという要望もあり、「みてね」では最長過去1年間の写真や動画をDVDにまとめて注文することができます。 このときに問題となるのがDVDのディスク分割です。1年分の写真や動画はともすると1枚のディスクに収まりきらず、複数のディスクに分割する必要があります。いままでは、動画を月ごとに分けて各ディスクに入れていく、というシンプルなアルゴリズムで分割を行っていました。しかし、ユーザーさんからは「1枚のディスクにすこしの動画しかないがどうなっているのか」

                                                    動的計画法によるDVDのディスク分割の改善
                                                  • ssh-rsa,非推奨のお知らせ

                                                    2020-05-28T14:11+9:00 追記 これは SHA-1 を用いた RSA 鍵についての話で,OpenSSH 7.2 以降で生成・利用される RSA 鍵はまだ利用可能です 2020-05-28T19:27+9:00 追記 既に生成されている RSA 鍵でもホスト・クライアントの両方が OpenSSH 7.2 以降ホスト・クライアントの両方が OpenSSH 7.2 以降,ただしサーバー側は OpenSSH 7.4 以外であれば SHA-2 で署名するので大丈夫なようです。(OpenSSH 7.4 はバグがあるようです) ssh-rsaという名前は"公開鍵の形式"と"公開鍵を使った署名方式"の二つで使われていて、廃止対象となっているのは署名方式の方だけです。なのでOpenSSH 7.2以降を入れれば、鍵自体は古いOpenSSHで生成した物がそのまま使えます。 — いわもと こうい

                                                    • 理解して拡げる分散システムの基礎知識

                                                      20200725の #JTF2020 セッションスライド。 (資料内で説明した資料へのリンク) ・昨年のJTF発表資料 https://speakerdeck.com/tzkoba/cloud-nativekai-fa-zhe-falsetamefalsedatabase-with-kubernetes ・「2020年のNewSQL」 https://qiita.com/tzkoba/items/5316c6eac66510233115 ・「NewSQLのコンポーネント詳解」 https://qiita.com/tzkoba/items/3e875e5a6ccd99af332f ・Saga https://www.infoq.com/jp/news/2018/03/data-consistency-microservices/ ・「マイクロサービスとは分散システムである」 https://

                                                        理解して拡げる分散システムの基礎知識
                                                      • 秀逸すぎるアルゴリズムの教え方|Sangmin Ahn

                                                        こんにちは、Choimirai Schoolのサンミンです。 0  はじめにお父さんと子供たちで「Peanut Butter and Jelly (PB&J) Sandwich」を作る様子を録画した動画。 これは、子供たちにプログラミングを教える上でも大変効果的な方法✨。面白いし、結果を見てどんな改善が必要なのか考えるのでアルゴリズムの基礎が学べる。pic.twitter.com/JoCJcINg9u — Sangmin @ChoimiraiSchool (@gijigae) July 6, 2021 息子と娘さんが書いた指示書に従ってサンドイッチを作るお父さん。自分たちが思った通りではなく、書いた通りに動いているお父さんに気付き、指示書を改善しつつもまだまだ足りない箇所が多い。 ▲Peanut Butter and Jelly (PB&J) Sandwich 動画のスクリプトを文字起こし

                                                          秀逸すぎるアルゴリズムの教え方|Sangmin Ahn
                                                        • 分散システムについて語らせてくれ

                                                          ↓↓↓↓訂正あります。↓↓↓↓ 2018/07/02に株式会社エフコード社内で行われた勉強会のスライドです。 訂正版(随時更新中): https://docs.google.com/presentation/d/15HOMfAbtdWwO48njcB8IdkN3kVAMu3wsmZo0O3S-f_4/edit?usp=sharing 専門家による資料・専門家向けの資料ではありません。自分自身で学習し、論文・文献等を読解してまとめた内容となります。間違い等あるかもしれませんが、あれば是非コメント頂ければと思います。 【訂正事項】 スライド16: 誤:たった一つのプロセスが故障しただけでも有限時間で合意できない 正:たった一つのプロセスが故障しうるだけでも有限時間で合意できない スライド20: 誤: 重要: あるschedule σ1, σ2 がdisjoint (nodeが被ってない) なら

                                                            分散システムについて語らせてくれ
                                                          • 【訃報】ZIP圧縮やPNG・PDFなどファイルフォーマットの基礎を作ったジェイコブ・ジヴが死去

                                                            データ圧縮フォーマットのひとつであるZIP(ZIP圧縮)や、電子文書フォーマットのPDF、音声ファイルフォーマットのMP3の基礎となったデータ圧縮アルゴリズムのLZ77やLZ78などを開発したイスラエルのコンピューターサイエンティストであるジェイコブ・ジヴ氏が亡くなりました。91歳でした。 Israeli computer pioneer passes away just weeks after famed research partner https://www.ynetnews.com/business/article/bj2k2g0x3 Ziv and Lempel co-invented the famous Lempel-Ziv algorithm that is the basis of ZIP files. Prof. Abraham Lempel died 7 weeks

                                                              【訃報】ZIP圧縮やPNG・PDFなどファイルフォーマットの基礎を作ったジェイコブ・ジヴが死去
                                                            • 乱数について本気出して考えてみる|TechRacho by BPS株式会社

                                                              プログラミングをやっていると、様々な乱数に出会います。乱数に関しては大勢の研究者が色々な研究結果を出しているため、種類も増え、いったいどれを使えばいいのかと悩む原因にもなります。 大勢が研究し利用している分野ですから、私以外でも大勢が乱数に関する記事を書いているため、あえて新しい記事を書く価値は高くないかもしれません。まあ、既に理解している人はここで記事を閉じるか、暇つぶし程度の感覚で読んでいただくと良いかと思います。 真乱数と疑似乱数 プログラミングの世界の中でいわゆる "乱数" として扱われることが多いのは擬似乱数です。疑似、と付くからには、これは実のところ乱数ではないと言えます。とは言え、擬似乱数を乱数でないと言ってしまうと話が終わってしまうので、疑似乱数を含む乱数を広義の乱数とします。この記事で扱うのは広義の乱数です。逆に、狭義の乱数、本物の乱数は真乱数と言います。 本物と言いまし

                                                                乱数について本気出して考えてみる|TechRacho by BPS株式会社
                                                              • 海中写真から青緑色を除去し、本当の色を再現するアルゴリズムを海洋学者が開発 : カラパイア

                                                                海の中で自然光で水中写真を撮影すると、まるでフィルターを通したかのように青緑色を帯びてしまうことが多い。 海の浅いところであっても、そこに差し込む光は吸収・散乱してしまい、赤や黄色といったサンゴならではの色合いはほとんど消えてしまう。 青みを帯びた水中写真は、フォトショップなどの画像処理ツールで修正することは可能だが、それだと人工的な色合いになってしまい、実際の色とは違ったものとなってしまう。 そこで海洋学者は、、海底を彩る本当の色を再現できるアルゴリズムを開発した。

                                                                  海中写真から青緑色を除去し、本当の色を再現するアルゴリズムを海洋学者が開発 : カラパイア
                                                                • オンライン DDL を期待して ALTER 文を実行したら障害になりかけた話 - カミナシ エンジニアブログ

                                                                  こんにちは。ソフトウェアエンジニアの坂井 (@manabusakai) です。 カミナシではマルチプロダクト化に向けて、認証・認可の切り出しを進めています。その対応を進める中で、既存テーブルへのカラム追加が必要になりました。 先日、そのリリースのために本番データベースにマイグレーションの ALTER 文を実行したところ、クエリが詰まって危うく障害になるところでした(幸いすぐにキャンセルして事なきを得ました)。 原因を調べたところ、オンライン DDL は複数の条件が関係することがわかりました。オンライン DDL に対する知識不足と事前検証の甘さゆえのミスでしたが、結果的には良い学びが得られました。 カミナシのバリューのひとつである「全開オープン」の気持ちで、事の顛末やそこから得た学びを公開します。 なお、今回の話は MySQL 5.7 互換の Amazon Aurora MySQL 2 で確

                                                                    オンライン DDL を期待して ALTER 文を実行したら障害になりかけた話 - カミナシ エンジニアブログ
                                                                  • 「解けない方程式」

                                                                    よくアニソンとかの歌詞で「解けない方程式」みたいなフレーズが出てくるが、代数方程式だって5次方程式(たった5次!)以上になったら一般には解けないし、微分方程式に至っては「ミレニアム懸賞問題」として100万ドルの懸賞金が懸かってたりする難しさなわけで、たいていの方程式は解けなくて当たり前なんだよ!って、聞くたびにツッコミたくなる。 つまり、「解ける方程式」なんてほとんど無いのだから、「解けない方程式」に悩むなんて、空が飛べる翼がないことに悩むくらい実現不可能な空想であり、そもそも悩み方として間違っている。 というかまずは、お前の歌詞で求める「解」は近似解ではダメなのか、どうしてダメなのか、歌詞はせいぜい10分も無いけど、小一時間膝を付き合わせて問い詰めたい。ゼミを開いてお前の意図を詳らかにしたい。 ガロア群が可解にならないからって諦める前に、最適化のための近似アルゴリズムを試せよ。ニュートン

                                                                      「解けない方程式」
                                                                    • 競技プログラミングことはじめ

                                                                      第1章 競技プログラミングとは?(p.7~) 第2章 AtCoderの始め方(p.43~) 第3章 競プロで必要な「アルゴリズムと思考力」(p.86~) スライドのまとめ(p.154~)

                                                                        競技プログラミングことはじめ
                                                                      • 検索エンジン自作入門 Go Conference 2021 Spring

                                                                        Go Conference 2021 Springの登壇資料です アウトライン 1. 検索エンジンとは ~ 一般的な検索エンジンの仕組みと構成要素 2. 自作した検索エンジンの紹介 ~ 具体的に自作した検索エンジンの構成要素と動作例 3. 自作した検索エンジンの実装 ~ アルゴリズムとデータ構造、ライブラリ 4. おわりに ~ 検索エンジンを自作した感想

                                                                          検索エンジン自作入門 Go Conference 2021 Spring
                                                                        • 作って理解するOS x86系コンピュータを動かす理論と実装

                                                                          2019年9月26日紙版発売 2019年9月26日電子版発売 林高勲 著,川合秀実 監修 B5変形判/736ページ 定価4,048円(本体3,680円+税10%) ISBN 978-4-297-10847-2 Gihyo Direct Amazon 楽天ブックス honto ヨドバシ.com 電子版 Gihyo Digital Publishing Amazon Kindle ブックライブ 楽天kobo 本書のサポートページサンプルファイルのダウンロードや正誤表など この本の概要 現在広く普及している,x86系CPU搭載のコンピュータ。 本書はOSの機能を実装しながら,その姿を明らかにしていきます。 第1部ではまず,ハードウェア,ソフトウェアの基本概念や,CPUとOSの関係など,コンピュータの核となる理論を丁寧に解説します。 第2部では,x86系コンピュータに対象を絞り,レジスタの構成や,

                                                                            作って理解するOS x86系コンピュータを動かす理論と実装
                                                                          • RAGのSurvey論文からRAG関連技術を俯瞰する - 元生技のデータサイエンティストのメモ帳

                                                                            大規模言語モデル (LLM) の学習データに含まれない知識(各社の特有の書類など)を踏まえてLLMに回答させる際に最早必須となってきたRAG (Retrieval-Augumented Generation)。 今回はそんなRAGのSurvey論文を元に、RAGの変遷や構成要素、新たに出てきた技術を俯瞰していきます。 Survey論文へのリンクはこちら arxiv.org RAGとは LLMはそれ単体で回答させると、質問によってはハルシネーションや学習時のデータにはなかった情報を生成時に加味できないといった問題から正しくない回答を生成することが多々あります。例えば世間一般に公開されていない自社の就業規則や業務標準についてをChatGPTに質問しても、正しい回答は得られません。 そのような問題への対応としてRAGが使われます。 「LLM単体で適切な回答を生成できないなら、ユーザーの質問を元に

                                                                              RAGのSurvey論文からRAG関連技術を俯瞰する - 元生技のデータサイエンティストのメモ帳
                                                                            • 1000本の見た目がまったく同じワイン入りの瓶がある

                                                                              その中に1本だけ毒入りのワインの瓶が入っている その毒はほんの一滴でも飲むと確実に死ぬ ただし遅効性の毒で、死ぬのは10~20時間後の間のどこかのランダムなタイミング それを死んでもいい奴隷を使って毒入りのワインを1000本の中から見つける 24時間以内に見つけないといけない 最低何人の奴隷を使って見つけることができるか(死ぬ人数ではない) 最小人数を考えてほしい

                                                                                1000本の見た目がまったく同じワイン入りの瓶がある
                                                                              • 機械学習の全体像をまとめてみた

                                                                                教師あり学習 概要 入力値から何かしらの予測をしたい場合を考えます. 予測する対象の正解データが事前に得られる場合、 入力値から正解データを出力するモデルを学習する手法を教師あり学習と言います. 主なタスク 何を入力して、何を出力するかでタスクが分類されます. 代表的なものに以下が挙げられます 時系列予測: 現在以前の時系列データ ⇒ 未来の時系列データ 画像分類: 画像 ⇒ ラベル 物体検出: 画像 ⇒ 物の位置と種類 セグメンテーション: 画像をピクセル単位で分割 文章分類: 文章 ⇒ ラベル 機械翻訳: ある言語の文章 ⇒ 別の言語の文章 時系列予測 現在以前のデータから将来のデータを予測します. 実用例 株価予測 災害予測 自動車の事故防止システム 主要なアルゴリズム 自己回帰モデル(AR・MA・ARMA・ARIMA) 時系列間の関係を数学的に定量化、モデル化する. 周期性のあるデ

                                                                                  機械学習の全体像をまとめてみた
                                                                                • ID生成方法についてあれこれ

                                                                                  ID生成について聞かれることが多いので、独自の観点でまとめてみます。タイトルは適当です…。 DBはMySQL(InnoDB)を想定しています。あしからず。 ID生成を知りたいなら ID生成に関しては以下の記事がよくまとまっているので参考にしてみてください。値形式など詳しく書かれています。 ID生成大全 Facebook, Twitter, Instagram等がどうやってIDを生成しているのか まとめ ID生成方法 以下のID生成方法は、お手軽に採用しやすいもの順で列挙します。 DB採番/連番型 AUTO_INCREMENT DBのAUTO_INCREMENTで採番する方法。 Pros 数値型で扱える 普通は64ビットの整数型を採用することが多い 単調増加する連番ですので、ソート可能でかつインデックスの空間効率がよい 単調増加するので、キャパシティを予測しやすい 64ビットあればあまり気に

                                                                                    ID生成方法についてあれこれ