タグ

2024年5月22日のブックマーク (29件)

  • NLP2024 に参加しました - クックパッド開発者ブログ

    こんにちは! 技術機械学習グループの山口 (@altescy) です。 先月、神戸にて開催された言語処理学会第30回年次大会 (NLP2024)に同じく機械学習グループの深澤 (@fufufukakaka)と共に参加してきました。 昨年に引き続き今年も過去最多の参加者数となり、言語処理研究の盛り上がりを実感しました。 特に去年の年次大会 (NLP2023) のタイミングで GPT-4 が発表されて以降、自然言語処理の研究は大きな転換期を迎えていると感じます。 大規模言語モデル (LLM) が研究の主流となる中、どんな課題や発見があるのか、期待をもって参加する大会となりました。 この記事では NLP2024 にてクックパッドから発表した 2 つの研究と、その他の興味深かった研究についていくつか紹介します。 発表内容の紹介 クックパッドからは以下 2 つの研究を発表しました。 P2-11:

    NLP2024 に参加しました - クックパッド開発者ブログ
    sh19910711
    sh19910711 2024/05/22
    "文埋め込みの再検討: WMDによる点群としての類似度と平均プーリング後のL2距離 ~ それぞれの類似度を比較 / WMDによる類似度が低い場合に平均プーリング後のL2距離が高いケースがいくつか存在" NLP2024:A10-4
  • Google Japanを訪問してGeminiについて色々教えてもらいました - karaage. [からあげ]

    Google Japanにおじゃましてきました ご縁あって、Googleに行ってきました!Googleさんには、5年前に六木のオフィスの勉強会に呼んでいただいて以来の訪問でした。渋谷のオフィスは初めての訪問になります。 色々お話をしました。なんとGeminiグッズをいただきました! やったー そして、噂のGoogleランチを楽しみました! Googleランチ ここは撮影大丈夫らしいです。 めちゃくちゃ眺めが良い場所にある堂 景色がよいときは富士山が見えるらしいです おしゃれな壁 和室がある!茶道部があるらしいです ぜんぶ無料! カフェも楽しめます。 Geminiについて ちょうどGoogle I/O 2024直後ということもあり、LLM、Geminiの話で盛り上がりました。 Geminiといえば、発音が「ジェミニ」なのか「ジェミナイ」なのか問題があるのですが、中の人いわく、日では「ジ

    Google Japanを訪問してGeminiについて色々教えてもらいました - karaage. [からあげ]
    sh19910711
    sh19910711 2024/05/22
    "Gemini: 発音が「ジェミニ」なのか「ジェミナイ」なのか問題 / 中の人いわく、日本では「ジェミニ」とのことでした。ただ、その後はずっとみなさん「ジェミナイ」と発音して"
  • unity1week でチーム開発を成功させる秘訣

    2023年7月22日に開催された「unity1week 共有会 #12」で登壇した際の資料です。 「りるを・もんりぃ」チームがチーム開発をする際に意識したポイントなどを紹介しています。

    unity1week でチーム開発を成功させる秘訣
    sh19910711
    sh19910711 2024/05/22
    "ビルドでハマらない: 開始時点でビルド可能な状態を作る + 安心を早い段階で得る / メンバー全員がビルドできる状態を作る / 「ゲームの要件を決める人」を事前に定義しておく" 2023
  • LLM 向け MinHash でテキストの重複除去のメモ

    LLM 向けデータセットでは, 重複や繰り返し(repeatation)が少ないことが重要となります. Scaling Laws and Interpretability of Learning from Repeated Data Deduplicating Training Data Makes Language Models Better CCNet(LLaMa などで使われた), RefinedWeb(Falcon)でも dedup は重要な役割を果たしています. 情報 基は Suffix Array で exact match と MinHash(LSH, Locally Sensitive Hash)で fuzzy match でテキストの重複除去を行うのが昨今(2023/07 時点)での主流のようです. (SimHash は遅いので大規模では使わないっぽ?) Shingle

    LLM 向け MinHash でテキストの重複除去のメモ
    sh19910711
    sh19910711 2024/05/22
    "dedup: LLM 向けデータセットでは重複や繰り返しが少ないことが重要 / Suffix Array で exact match と MinHash(LSH, Locally Sensitive Hash)で fuzzy match でテキストの重複除去を行うのが昨今(2023/07 時点)での主流" 2023
  • ニューラルネットワークの量子化手法の紹介

    ニューラルネットワークにおける量子化とLLMや混合精度などの最近のトピックに関して紹介します。

    ニューラルネットワークの量子化手法の紹介
    sh19910711
    sh19910711 2024/05/22
    "PTQ: スケールが小さい→表現できる範囲は小さいが範囲内では正確 + スケールが大きい→表現できる範囲は大きいが範囲内でも誤差 / PyTorch Quantization: ONNXへのexportはサポートされていない + 外部ツールに頼る必要" 2023
  • 教師なし画像特徴表現学習の動向 {Un, Self} supervised representation learning (CVPR 2…

    CVPR 2018 完全読破チャレンジ報告会 cvpaper.challenge 勉強会@Wantedly白金台オフィス cvpaper.challenge はコンピュータビジョン分野の今を映し、創り出す挑戦です。論文読破・まとめ・アイディア考案・議論・実装・論文執筆(・社会実装)に至るまで広く取り組み、あらゆる知識を共有しています。 http://xpaperchallenge.org/cv/Read less

    教師なし画像特徴表現学習の動向 {Un, Self} supervised representation learning (CVPR 2…
    sh19910711
    sh19910711 2024/05/22
    "解きたいタスクに有効なデータの特徴表現を擬似的なタスクを事前に解くことで獲得する / Deep Cluster: CNNの中間特徴を元にk-means + クラスタをPseudo labelとして識別 + ImageNetでの実験ではk=10000 (> 1000)が最も良い" 2018
  • 驚くほどキレイな三次元シーン復元、「3D Gaussian Splatting」を徹底的に解説する - Qiita

    はじめに 最近、3D業界で大きな衝撃を与えた「3D Gaussian Splatting」1について、ご存知でしょうか?数少ない写真から、目を奪われるほど美しい三次元シーンを再構成できるデモを見て私も大感動しました。なぜこんなに美しいのか、どんな技術で実現したのか、興味が湧いています! "普通の3D物体ではなく、カメラの移動に合わせて、水面に映る景色も正確に表現しています。これはなかなか凄い..." 私も時間をかけて論文や公開されたコード2を勉強しました。家の実装はCUDA化されており、難解な部分が多く、論文に書かれていないこともあります。そのため、「3D Gaussian Splatting」を勉強したい人にむけ、わかりやすい解説記事を書こうと思いました。単に概念や考え方だけでなく、ゼロから再実装できるように、すべてのロジックを数式として整理し、徹底的に解説しようと思います。 「3D

    驚くほどキレイな三次元シーン復元、「3D Gaussian Splatting」を徹底的に解説する - Qiita
    sh19910711
    sh19910711 2024/05/22
    "3D Gaussian Splatting: ボクセルで空間を分割せず、かなり高密度なガウス分布に従う単位を使うことで、細かい物体の形状を表現 / カメラの姿勢に応じて、見えた3D Gaussianの色を計算"
  • RubyKaigi 2024 で RBS と LLM の話をしました

    Leaner 開発チームの黒曜(@kokuyouwind)です。 先日の RubyKaigi 2024で Let's use LLMs from Ruby 〜 Refine RBS types using LLM 〜 というタイトルで登壇させていただきました! 参加しての感想は別記事にするので、この記事では発表の概要や裏話などをまとめます。 動画アーカイブ 記事執筆時点では公開されてないので、公開されたら更新します。(去年はフルセッションの録画がアップロードされてるので、今年もそのうち出るはずです) 発表スライド 自分の発表資料は slides.com というサービスでスライドを作っています。 埋め込み表示ができませんが、上記リンクから開くと発表時のスライドがそのまま見られます。 一応 Speaker Deck にもアップロードしていますが、 PDF 出力時にフォントが化けてしまっているた

    RubyKaigi 2024 で RBS と LLM の話をしました
    sh19910711
    sh19910711 2024/05/22
    "RBS: 手で書くのは大変 + LLM でうまくやれないか / なまじ半端にそれっぽい型が出ているせいで型エラー原因の特定が難しく、正直なところまだ実用レベルとは言い難い"
  • Microsoft、Windowsローカルで実行可能なSLM「Phi Silica」を全「Copilot+ PC」に搭載へ

    Microsoftは5月21日(現地時間)、開発者向け年次開発者会議「Microsoft Build 2024」の基調講演で、ローカルで実行可能なSLM(小規模言語モデル)「Phi Silica」(ファイシリカ)を発表した。前日発表した一連の「Copilot+ PC」に搭載していく。 Microsoftは「Phi-3」ファミリーでSLMを展開しているが、Phi SilicaはPhi-3の最小モデル「Phi-3-mini」(38億パラメータ)より小さい33億パラメータ。 Copilot+ PCのNPU(ニューラルプロセッシングユニット)に最適化されており、トークン生成はNPUのキャッシュを再利用してCPUで実行され、1秒当たり約27個のトークンを生成するという。これにより、閲覧中の画面を数秒ごとに保存しておき、後から横断検索できる「回顧」(Recall)機能などを高速に実行できる。 「回顧

    Microsoft、Windowsローカルで実行可能なSLM「Phi Silica」を全「Copilot+ PC」に搭載へ
    sh19910711
    sh19910711 2024/05/22
    "Phi Silica: Phi-3-miniより小さい + Copilot+ PCのNPUに最適化 / 閲覧中の画面を数秒ごとに保存しておき、後から横断検索できる「回顧」(Recall)機能などを高速に実行 / Windows Copilotライブラリで利用可能になる見込み"
  • Microsoft、マルチモーダルなSLM「Phi-3-vision」をプレビュー

    Microsoftは5月21日(現地時間)、開発者向け年次開発者会議「Microsoft Build 2024」の基調講演で、SLM(小規模言語モデル)「Phi-3」ファミリーの新メンバー「Phi-3-vision」(以下「vision」)を発表した。画像を解析するマルチモーダルなSLMだ。プレビュー版を利用可能。 SLMは単純なタスクで適切に実行できるように設計されており、リソースが限られる組織や端末上でローカルに実行する必要があるアプリに適した言語モデルだ。 visionは、描画はできないが、モバイル端末で利用可能なコンパクトさだ。42億パラメータモデルで、グラフや画像に関して質問すると、それについて説明してくれる。 Microsoftは「visionは画像とテキストを一緒に検討する必要があるタスクに最適だ」としている。多様なハードウェアで実行できるように最適化されており、開発者はモ

    Microsoft、マルチモーダルなSLM「Phi-3-vision」をプレビュー
    sh19910711
    sh19910711 2024/05/22
    "Phi-3-vision: 画像を解析するマルチモーダルなSLM + モバイル端末で利用可能なコンパクトさ + 4月発表のPhi-3-mini(38億パラメータ)の言語機能をベースに構築 / Phi-3: smallとmediumも同日からMicrosoft Azureで利用可能に"
  • 小さなファイルが大きな問題を引き起こす

    原文: https://blog.cloudera.com/blog/2019/05/small-files-big-foils-addressing-the-associated-metadata-and-application-challenges/ 著者: Shashank Naik, Bhagya Gummalla 訳注: 稿は2019/5/9に公開されたブログ記事の翻訳です。 「スモール・ファイル」はApache Hadoopの世界では一般的な課題であり、注意して扱わないと、いくつかの複雑な問題を引き起こす可能性があります。Apache Hadoop分散ファイルシステム(HDFS)は、テラバイトからペタバイトの範囲にわたる、大きなデータセットを格納して処理するために開発されました。しかしHDFSはスモール・ファイルを効率的に格納しないため、スモール・ファイルによってNameNo

    小さなファイルが大きな問題を引き起こす
    sh19910711
    sh19910711 2024/05/22
    "スモール・ファイル: NameNodeのメモリ使用率とRPC呼び出しの効率が悪くなり、スキャンのスループットが低下 / Spark: 各パーティションは、デフォルトで1つのHDFSブロック / できる限りHDFSブロックサイズの倍数に近づける" 2019
  • MartinでPostGISからベクトルタイルを配信しよう - Qiita

    MapLibre User Group Japanの@Kanahiroです。今回はベクトルタイルサーバーMartinを紹介します。 TL;DR MartinでPostGISのテーブルをベクトルタイルとして高速に配信 glyph/sprteも動的に配信出来るぞ Martin MapLibre傘下の、PostGISバックエンドなタイルサーバーです。特徴は、ベクトルタイルをPostGISのテーブルから動的に作成して配信出来ることです。世はまさにdynamic tiling時代。 今をときめくPMTilesをはじめとして、あらかじめ全てのタイルを作り切っておくアプローチは、配信パフォーマンスの観点では最善です。しかしたとえば頑張って大きなタイルデータを作成したとして、その原典データが更新されてしまったらどうすればよいでしょうか?PMTilesなどのアプローチでは、再度タイルを作り直す必要があります

    MartinでPostGISからベクトルタイルを配信しよう - Qiita
    sh19910711
    sh19910711 2024/05/22
    "Martin: PostGISバックエンドなタイルサーバー + ベクトルタイルをPostGISのテーブルから動的に作成して配信 / 動的配信: QGISなどでPostGISのテーブルの内容を変更したのちに再度地図を表示してみると内容が反映され" 2023
  • ものづくりをする人にこそ読んで欲しい本 - 下林明正のブログ

    このを読み終わった。 映画を書くためにあなたがしなくてはならないこと シド・フィールドの脚術 作者: シド・フィールド,安藤紘平,加藤正人出版社/メーカー: フィルムアート社発売日: 2009/03/31メディア: 単行購入: 55人 クリック: 290回この商品を含むブログ (42件) を見る 別に僕は映画を書きたいわけではないのだけど、同僚がこのの話をしているのを聞いて面白そうだったので借りて読んでいた。 読んでみたところ、このの内容は映画に留まらずものづくり全般に対して通用する部分が多い。 なので、ものづくりをする人はこのを読んでみると教養も兼ねて大いに勇気づけられるものだろう。 そう思った。 一番大きいのは、第14章の存在だ。 脚術についてはひと通り学び、あとは書くだけ、というところだ。 ここで、時間の作り方だとか、書かない言い訳に関する話だとか、途中でやる気

    ものづくりをする人にこそ読んで欲しい本 - 下林明正のブログ
    sh19910711
    sh19910711 2024/05/22
    "時間の作り方だとか、書かない言い訳に関する話 / 脚本に限らず全てのものづくりをする上でぶち当たる問題 / そして結局はぶち当たった問題を解決できず、ものが完成しないのである" 2013
  • ChatGPTをプログラミング言語開発に役立てる - kmizuの日記

    久し振りの更新です。巷では先日リリースされたばかりのGPT-4oの話題でもちきりですが、私も当日深夜2時のライブストリーミングを見てその後すぐにGPT-4oを試しています。性能に関する雑感としては 全般的にはGPT-4-Turboより頭が良い Claude 3 Opusと比較すると、お堅い & 無難な回答を返す傾向あり ただし、Opusよりハルシネーションは起きにくい印象 画像認識の性能が凄い 辺りでしょうか。特に最後の点は特筆すべきことで、GPT-4-Turboの画像認識よりだいぶ性能が向上したおかげで今までだとやりにくかったことも簡単にできるようになっています。その際たるものが先日バズった GPT-4oの画像認識力と理解力をもってすればいけるやろと思ってやってみたら実際いけた。 ペーパープロトタイピングから最初のHTML書き起こすのにかなり使えるのでは。 つーか指示そのものを画像の中に

    ChatGPTをプログラミング言語開発に役立てる - kmizuの日記
    sh19910711
    sh19910711 2024/05/22
    "Scratch: 抽象構文木を割と素直に視覚化したプログラミング言語 / 一方でScratchである程度「プログラム」が書けるようになっても、そこから先のテキストベース言語に移行する際に大きなギャップ"
  • 【GPT-4o, Gemini 1.5 Flash】LLMたちに競プロの問題解かせてみた【結果編】 - Qiita

    はじめに OpenAIはgpt2としてテストされていたものをGPT-4oとして公開しましたね。この伏線回収には少し驚きました。また、googleもGemini 1.5 Proの新機能、Gemini 1.5 Flashの発表などここ数日LLM界隈?はかなり盛り上がってそうです。 ここで、一つの疑問が生まれました。「これだけLLMが進化したなら青色くらいの実力があるのでは・・・?」この疑問を解決するため、気になったモデルたちで競プロの問題がどれだけ解けるか競いたいと思います。 ルール 解答方法 対象コンテストの各問題をAから順に解いていく すべてのLLMで同一のプロンプトを使用する 各問題に対して、解答を3回挑戦させる 正誤失格判定 3回中1回でも正答できれば、問題を正答したとする 3回すべて間違えれば、誤答 2問誤答した時点で失格となる 順位付け 各コンテストについて問題の難しさ(Diffi

    【GPT-4o, Gemini 1.5 Flash】LLMたちに競プロの問題解かせてみた【結果編】 - Qiita
    sh19910711
    sh19910711 2024/05/22
    "ABC346の問題CではGPT-4系列が誤答しているのに対し、Gemini 1.5 ProとClaude 3 Opusについては正答 / Gemini 1.5 FlashはABC344の問題Dが解けています / 得意な問題が違うなら両方のLLMで出力し比較させればよい"
  • 政治学と因果推論 - sunaharayのブログ

    大阪大学の松林哲也先生から,『政治学と因果推論』を頂きました。どうもありがとうございます。因果推論の方法は経済学を中心に,社会科学で共有できる方法として広がっています。そんな中で「政治学と因果推論」と言うと,政治学でも因果推論の方法を使わないとダメなんだといったような極端な議論に傾いてしまうこともありますが,政治学の中で早くから因果推論の研究に取り組んでこられた松林さんが書かれた著作だけあって,その意義や方法を解説ところが素晴らしいのはもちろんですが,その限界や社会における役割についても触れられているのもよかったと思います。最後のところで僕のもご紹介頂いて非常にうれしく感じました。 書を頂いて,あまり何も考えずに頭から読み始めて,因果効果の定義と測定,自己選択の話とそれへの対応と流れていくわけですが,4章で無作為化実験の話が来て,5章で降雨量と投票率の話が続きます。5章は「自然実験」と

    政治学と因果推論 - sunaharayのブログ
    sh19910711
    sh19910711 2024/05/22
    "4章で無作為化実験の話が来て,5章で降雨量と投票率の話 / 降雨量と投票率の話はよく操作変数のときに使われ + 強い外生性を持つ偶然の割り当ての話,という位置づけ / 降雨量の話はきちんと7章で回収" 2022
  • 内生性を考慮しないMMMが破滅的な意思決定につながる一例をお見せします - Qiita

    はじめに こんにちは、事業会社で働いているデータサイエンティストです: 今回の記事では、ディリクレ過程を含めた、新しいマーケティングミックスモデルを提案します。この新しいモデルをアメリカのマクロ経済データに応用し、各変数が失業率にどのように寄与するかを可視化します。 しかし、内生性を考慮しない結果、経済理論と常識の予想とは逆の値になっている係数があり、連邦準備制度理事会(FRB、アメリカの中央銀行に相当)がこのようなモデルで意思決定すると、とんでもないことになることを示します。 最後に、内生性の正体を少し教科書的な説明とは違う視点から説明し、データサイエンティストのあなたが内生性の問題をどこまで真剣に考える必要があるのかについて話します。 (先に言っておくと、内生性の正体は理不尽がないことだと思います) ではまずはモデルの話に入ります! モデルの考え方 このモデルは、独立変数の過去効果の加

    内生性を考慮しないMMMが破滅的な意思決定につながる一例をお見せします - Qiita
    sh19910711
    sh19910711 2024/05/22
    "因果推論: 説明変数の変な理不尽の存在を前提 / 内生性: 上げようと思えば上げられるし下げようと思えば下げられる / 実際の企業内のデータはそんなに内生性まみれではなく説明変数にある程度の外生的な変動が担保"
  • 行列の積演算で openBLAS cuBLAS を体感する - Qiita

    Basic Linear Algebra Subprograms (BLAS) の 行列の積 演算が、C の for 文で率直に書いたルーチンに比べ、どれ程のものか体感してみる。 背景 深層学習の実装を理解していくにあたり、行列の積演算を高速に行いたくなった。 BLASは 行列の積演算が速いとの話を目にするが、実際に使ってみたことはなかった。 → 今回 BLAS の性能を体感してみる。 BLAS について 下記Webサイトを参考にしています。 ・Basic Linear Algebra Subprograms(Wikipedia) ・BLASの簡単な使い方 ・CUDA Toolkit cuBLAS ・インテル(R) 数値演算ライブラリ(MKL) リファレンス・マニュアル(PDF)

    行列の積演算で openBLAS cuBLAS を体感する - Qiita
    sh19910711
    sh19910711 2024/05/22
    "深層学習の実装を理解していくにあたり、行列の積演算を高速に行いたくなった / cuBLAS: NVIDIA のグラフィックカードのGPU上で並列演算 / gefoce1050ti な 15K円位のボードでも 率直C版に比べ 500倍以上の差" 2017
  • 最近3Dプリントで作ったもの紹介 - c-bata web

    友人3Dプリンターで色々作っている様子を見ていて、以前から興味は持っていたのですが、 Scott Yu-JanさんのYouTube動画 を色々見るようになってからまた3Dプリントに興味がでてきたので、最近ようやくFusion 360を触り始めました。今回は3D CADの勉強方法と作ったものを紹介します。 3D CADの勉強と3Dプリントサービスでの注文 作ったもの紹介 Raspberry Pi Zero 2 Wケース Raspberry Pi Pico Wケース 壁掛けディスプレイ デスク周りの色々 テーブルグロメット 扇風機のマウントとカバー デスク周りその他 はんだ付け用のサポート iPad Proスタンド ケーブルホルダー 釣り用リールのハンドル おわりに 3D CADの勉強と3Dプリントサービスでの注文 3D CADは id:puhitaku も使っているFusion 360を使

    最近3Dプリントで作ったもの紹介 - c-bata web
    sh19910711
    sh19910711 2024/05/22
    "Fusion 360: YouTube動画を1本見ればある程度使い始められる / 外部の3Dプリントサービスを利用してプリント / 失敗の可能性が高そうなアイテムは発注段階で細かくチェックしてメールで確認してくれる" 2023
  • 傾向スコアを利用した施策効果推定 - Qiita

    はじめに 統計的因果推論(以下、因果推論)は、マーケティングや医療分野において、施策や治療の効果をより正確に推定するためのフレームワークです。特に、 因果推論の使い時 傾向スコアによる逆確率重み付け法による施策効果推定方法 について簡単にまとめます。 最近は、因果推論に関する非常にわかりやすい入門書(効果検証入門~正しい比較のための因果推論/計量経済学の基礎)が出たので、因果推論も市民権を得てきた感じがします。 因果推論の使い時 因果推論の使い時は、ABテストはできないが、介入(マーケティング施策や治療)の効果をより正確に見積もりたいときです。 ABテスト(ランダム化比較試験(RCT: Randomized Controlled Trial)とも呼ぶ)は、対象者をランダムに2つのグループに割り振り、一方のグループには介入を実施し、もう一方のグループには介入を実施せず、両グループの結果を比較

    傾向スコアを利用した施策効果推定 - Qiita
    sh19910711
    sh19910711 2024/05/22
    "ABテストはできないが、介入(マーケティング施策や治療)の効果をより正確に見積もりたい / 傾向スコア: 「対象者 𝑖 の背景情報がこんな感じなので、対象者 𝑖 が処置群へ属する確率はこのくらい」という量" 2020
  • Python: Annoy の近似最近傍探索 (ANN) を試す - CUBE SUGAR CONTAINER

    今回は Spotify の作った近似最近傍探索 (ANN: Approximate Nearest Neighbor algorithms search) ライブラリの Annoy を試してみる。 ANN は k-NN (k-Nearest Neighbor algorithms search) の一種で、厳密な解を追い求めない代わりに高いスループットが得られる。 ちなみに ANN のライブラリごとのベンチマークを公開している Web サイトがある。 その中でいうと Annoy は大体のベンチマークで真ん中くらいの位置にある。 その代わり Annoy はインストールが簡単という利点がある。 ANN-Benchmarks 使った環境は次の通り。 $ sw_vers ProductName: Mac OS X ProductVersion: 10.14 BuildVersion: 18A391

    Python: Annoy の近似最近傍探索 (ANN) を試す - CUBE SUGAR CONTAINER
    sh19910711
    sh19910711 2024/05/22
    "Annoy: k-d tree を元に探索を高速化 + 大体のベンチマークで真ん中くらい / AnnoyIndex: 次元数と距離の計算に用いるメトリックを指定 / 近傍数と共に距離も手に入れたいときは include_distances オプションに True を渡す" 2018
  • [強化学習] いつの間にか OpenAI Gym が終焉していた

    前提 強化学習で利用する環境Env(を集めたライブラリ)では、OpenAI Gymが有名でよく使われてきました。 私もいくつか記事を書いたり、スクラップにまとめたりしてきました。 上の記事でも取り上げたように、2021年7月にメンテナーが交代し、その後APIや利用できるEnvが頻繁に変更されるようになりました。 変更が頻繁だったため、Gymと一緒に使う拙作のライブラリはだんだん更新が手間になって止まってしまいました。(すみません。) 題: Gym の終焉 そしてつい先日以下の記事を読みました。 私が書いたGymの記事への言及があり、残念ながら内容が古くなっているとのことでした。 そろそろ重い腰を上げて確認するかとGymのページを見に行ったところ以下のような文言が表示されていました。 引用: https://github.com/openai/gym 引用: https://www.gym

    [強化学習] いつの間にか OpenAI Gym が終焉していた
    sh19910711
    sh19910711 2024/05/22
    "OpenAI Gym: 2021年7月にメンテナーが交代 + APIや利用できるEnvが頻繁に変更 / Gymのメンテナーを引き継いだ人(達)は、GymをforkしてGymnasiumというプロジェクトを立ち上げ" 2023
  • Stanでネットワークメタ分析(固定効果モデル) - Computational Clinical Psychology Lab

    はじめに この記事は,Stan Advent Calendar 2018の15日目の記事です。 ネットワークメタ分析は,3つ以上の治療の比較が可能なメタ分析です。これまでよく行われていたメタ分析(一対比較のメタ分析)は,2つの治療間の直接比較の結果を統合するものでした(一対比較のベイジアンメタ分析については,こちらを参照ください)。一方,ネットワークメタ分析では,3つ以上の治療について,直接的な比較だけでなく,間接的な比較(別の2つ以上の治療薬の効果から,検討されていない2つの治療薬間の差を推定する)も行って,治療効果の統合をします。ネットワークメタ分析の利点としては,以下の3点があります。 間接比較ができる 間接と直接比較を統合し,より精度を高められる 複数の治療が比較でき,効果のランキングが作れる ネットワークメタ分析を学ぶ場合,『Network Meta-Analysis for D

    Stanでネットワークメタ分析(固定効果モデル) - Computational Clinical Psychology Lab
    sh19910711
    sh19910711 2024/05/22
    "ネットワークメタ分析: リファレンスに対する相対効果を推定することで,最終的にランキングなどを作ることができます / 同質性,類似性,一貫性などの前提があり + その前提を確認する必要" 2018
  • 物体の周辺構造を考慮した教師なし深層学習によるマルチモダリティ位置合わせ

    sh19910711
    sh19910711 2024/05/22
    "位置合わせ: 患者の呼吸や体位の変化により生じる画像間の位置ずれを補正する技術 / 深層学習を用いて変位ベクトル場を推定 + 変位ベクトル場によって浮動画像を空間変換することで位置を合わせる" 2021
  • DataformをGoogle Cloud上から触ってみる(rawデータから集計テーブルを作るまで) - ギークなエンジニアを目指す男

    たかぱい(@takapy0210)です。 正月にGoogle CloudのDataformをゴニョゴニョ触っていたので、その備忘録を残しておこうと思います。 Dataformとは dbtとの違いは...? 使用したデータ 実際に動かしてみる 基的な設定を記載する「dataform.json」 Dataformのディレクトリ構成はどうするのが良いのか 実際に記述するsqlxのコード definitions/sources/mansion.sqlx definitions/outputs/day_aggregated_by_city.sqlx スケジュール実行する Githubと連携してコード管理する おわりに Dataformとは SQL likeなコード(SQLX)でテーブルやビュー作成クエリを記述することで、テーブル間の依存関係を管理することができるデータモデリングツールです。同じよう

    DataformをGoogle Cloud上から触ってみる(rawデータから集計テーブルを作るまで) - ギークなエンジニアを目指す男
    sh19910711
    sh19910711 2024/05/22
    "買収前の従来のDataformのドキュメントには、definitions ディレクトリ配下に「Sources」、「Staging」、「Reporting」を用意することが推奨 / リリース構成で指定した時間よりワークフロー構築で指定する実行時間を最短でも1h開け"
  • 仏検3・4級におすすめの参考書 - 夢見るヒキガエル

    フランス語検定結果 Je suis content de réussir les examens de français! 先日、11月に受けたフランス語検定(3・4級併願)の結果が返ってきました。 結果は――― 無事合格!おめでとう!ありがとう!(一人二役) そんなわけで今回の記事では仏検に向けた勉強の際に僕が使っていた参考書を紹介します。もし仏検を受ける機会があったらぜひ参考にしてください。仏検だけでなくフランス語をこれから始めようと思っている人にもおすすめです。僕自身フランス語学習は1年未満ですが、これらのはフランス語入門としても非常に役に立ちました。 おすすめ参考書 J'étudiais le français avec ces livres! 【文法書】 ケータイ「万能」フランス語文法 (Amazon) フランス語の入門から中級レベルまでの文法事項を網羅した文法書です。つづりと

    仏検3・4級におすすめの参考書 - 夢見るヒキガエル
    sh19910711
    sh19910711 2024/05/22
    "「万能」フランス語文法: 入門から中級レベルまでの文法事項を網羅した文法書 + 「文法の辞書」として使う / 文法でわからない部分があってもこの1冊がそばにあるだけでほとんど解決できる" ISBN:4411004763 2019
  • スケールと形状を学習可能なConvolution: Modulated Deformable Convolution (Deformable ConvNets v2)を実装 - Qiita

    スケールと形状を学習可能なConvolution: Modulated Deformable Convolution (Deformable ConvNets v2)を実装Python機械学習MachineLearningDeepLearningPyTorch 2018/11/27にarXivに投稿された論文「Deformable ConvNets v2: More Deformable, Better Results」で、スケールと形状を学習可能なConvolutionであるModulated Deformable Convolutionが提案されています。おもしろそうな手法だったのでPyTorchで実装してみました。 ソースコードはこちら https://github.com/4uiiurz1/pytorch-deform-conv-v2 Modulated Deformable Co

    スケールと形状を学習可能なConvolution: Modulated Deformable Convolution (Deformable ConvNets v2)を実装 - Qiita
    sh19910711
    sh19910711 2024/05/22
    "segmentationやobject detectionのようなタスクでは、様々なスケールと形状の物体をカバーするようなReceptive Fieldを持つネットワークを設計する必要 / modulation: 入力画素ごとの学習可能な重み(0~1)" arXiv:1811.11168 2018
  • 『Phase reconstruction based on recurrent phase unwrapping with deep neural networks』に基づく位相復元手法をPyTorchで実装した - 備忘録

    はじめに 実装 実験 音声の分析条件 実験結果 おわりに はじめに Masuyama氏らによる位相復元手法 "Phase reconstruction based on recurrent phase unwrapping with deep neural networks"が2020年に提案されている. https://ieeexplore.ieee.org/document/9053234 arxiv.org 手法は,まずDNNで位相の微分(時間方向・周波数方向)を推定し,次に推定した微分に基づいて位相を再帰的に求める(積分する,アンラッピング)という2段階の処理からなる.位相が波形のずれに敏感という問題を回避しつつ,従来のDNNによる位相の直接推定(von Mises DNN)よりも高い精度で位相を推定することができる,というわけである.「位相を再帰的に求める」 recurrent

    『Phase reconstruction based on recurrent phase unwrapping with deep neural networks』に基づく位相復元手法をPyTorchで実装した - 備忘録
    sh19910711
    sh19910711 2024/05/22
    "RPU: DNNで位相の微分(時間方向・周波数方向)を推定 + 推定した微分に基づいて位相を再帰的に求める(積分する,アンラッピング) / 位相が波形のずれに敏感という問題を回避" arXiv:2002.05832
  • 生成AIでニュースアプリの精度改善を競う社内コンペを開催しました - JX通信社エンジニアブログ

    JX通信社CTOの小笠原(@yamitzky)です。4月19日に「AIコンペティション」を社内勉強会として開催したので、その取り組みを紹介します。 開催の目的 JX通信社では、AIで世界中のリスク情報を解析する「FASTALERT」という製品を開発しています。ただ、普段からエンジニアの全員がAI開発に取り組んでいるわけではなく、フロントエンドやバックエンドなど、AI以外のコンポーネントを開発しているエンジニアも多くいます。 数年前まではDeep Learningなどの高度なAIを活用した製品開発は敷居の高いものでしたが、 近年ではAutoMLやAmazon SageMakerのようなマネージドなAI開発の仕組みや、生成AIの台頭など、AIを使ったサービス開発の難易度は日に日に下がっています。 そこで今回の勉強会では 「普段AI開発に関わってない人」をターゲットに、AIの分野や、AIを使った

    生成AIでニュースアプリの精度改善を競う社内コンペを開催しました - JX通信社エンジニアブログ
    sh19910711
    sh19910711 2024/05/22
    "Gemini 1.5 Pro にお願いをして、ポータルサイトを作りました / text-bison: 指示を無視して「ゲーム」や「生活」など、存在しないタブを誕生 / Function calling: レスポンスをEnum型で定義したことで安定して分類"