2024.09.04
NHKニュースおよび複数の関連アカウントの所在地表示が「アメリカ(United States)」になっていることが、X上で大きな話題になっている。NHKの本当の所在地を知っているXユーザーであっても、国内の公共放送であるはずのNHKの所在地が米国と記されている状況に驚きや違和感を覚えたようで、多くの指摘が寄せられている。 NHKアカウントが一斉に「アメリカ」表示 X上での騒動は、単一アカウントの誤表示にとどまらず、NHKニュースのメインアカウントだけでなく、関連部署や番組のアカウントでも同様の表記が確認されたことが発端となっている。X上では、「日本の公共放送が米国扱いなのはなぜか」という素朴な疑問から、組織的な背景を勘繰る声まで幅広い反応が見られるようになった。 一部では、アメリカの諜報機関の関与や、何らかの政治的意図を巡る臆測が飛び交い、それをやゆする投稿も散見される。過去の報道姿勢への
4日のニューヨーク外国為替市場では、この日に発表されたアメリカの雇用統計の内容から労働市場が堅調だという受け止めが広がり、円売り・ドル買いが加速し、円相場は、一時、1ドル=149円台まで値下がりしました。 4日のニューヨーク外国為替市場ではこの日、発表される先月(9月)の雇用統計に注目が集まっていました。 統計では就業者の伸びが市場予想を大きく上回り、労働市場の堅調さからFRB=連邦準備制度理事会による利下げのペースが緩やかになるという受け止めが広がりました。 日米の金利差が縮まりにくいとの見方から円売り・ドル買いの動きが加速し、統計の発表前、1ドル=146円台半ばでしたが、一時、1ドル=149円台まで2円余り値下がりしました。 ことし8月中旬以来、およそ1か月半ぶりの円安水準です。 市場関係者は「FRBの金融政策を見極める上で最大の焦点となっていた雇用について力強い内容が示されたことでF
TL;DR プログラムは「下から組む方法」と「上から組む方法」がある プログラムを組む時は少しずつテストしながら組む はじめに なにかゼロからプログラムを組むとします。そのプログラムのアルゴリズムや、何をやるべきかはなんとなくわかっているけれど、どこから手をつけてよいかがわからず、ChatGPTに全部書かせて、その後修正できずに困る、という事例を何度か観測しています。 プログラムをゼロから書くのは慣れが必要です。プログラムをゼロから書く場合、小さな部品を一つ一つ作っていって、最後にそれらを組み上げる「下から書く」方法と、「こういう関数が必要であるはず」と外枠から書いていって最後に中身を埋める「上から書く」方法があります。その一般論を論じるのは私の能力を超えるため、以下では「下から」と「上から」の例を挙げて、その「気持ち」を説明してみようと思います。言語はなんでも良いですが、ここではPyth
結論 まだMastodon以下の機能実現状況なので、SNS目的で参加するのはNostr以上に勧めしません。 API叩いて遊べる人や、自分で問題解決できる人向け ※現在、基本機能も完成していないためクローズドβ中です。 公式サーバーの作成には、既存ユーザーに発行される招待コードが必要です(2週間に付き1個) 有志の非公式サーバーもそちら用の招待コードが必要になりました。 まだまだ仕様も未完成!!!破壊的変更も色々起きるぞ! ※コードを買ってまで参加するものではないと思います。開発やフィードバックに協力できる人のみ参加すべき。 はじめに Twitterの動乱に巻き込まれ、移住先にMisskeyやMastodonなど選ばれつつある今日このごろ、皆様いかがお過ごしでしょうか。 つい先日、BlueSkyのクローズドベータが開始されました。 BlueSkyは、Nostr同様Twitter創設者のジャッ
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? はじめに 2023/3/14にOpenAIがGPT-4という新しいAIモデルを公開しました。 このモデルはさまざまなタスクにおいてChatGPT(GPT-3.5)を大幅に上回る結果を示しています。 この記事ではGPT-4を用いて競技プログラミングがどのくらい解けるのかについて調べてみました。 下馬評 OpenAIが公開した論文によると、GPT-4のCodeforcesレーティングは392だそうです。 これはパーセンタイルでいうと下から5%らしいので、 そこまで競技プログラミングが得意なわけではないようです。 ただし、おそらくこれはGPT
Version 1.93 is now available! Read about the new features and fixes from August. Bracket pair colorization 10,000x faster September 29, 2021 by Henning Dieterichs, @hediet_dev When dealing with deeply nested brackets in Visual Studio Code, it can be hard to figure out which brackets match and which do not. To make this easier, in 2016, a user named CoenraadS developed the awesome Bracket Pair Col
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? はじめに グラフ最適化(Graph Optimization)は、パラメータをグラフ構造で表現し、最適化問題を解決する手法です。特にロボティクスなどの領域で広く活用されています。 以下に、グラフ最適化の応用例をいくつか挙げます。 Visual SLAMやSFMのバンドル調整(Bundle Adjustment)→「解説記事」 Graph SLAMのループ閉じ込み問題→「解説記事」 経路計画問題(TEB, ebandなど)→(coming soon) 実際のアプリケーションでは、ceresやgtsam、g2oなどのグラフ最適化ライブラリを
しかのこのこのここしたんたん 豆知識 / Fun facts: - 今の状態が「し」なら、「しかのこのこのここしたんたん」の始まりである確率は1/512 - If the current state is し, the probability of it being the start of しかのこのこのここしたんたん is 1/512 - 「し」の定常確率は1/8 - The steady-state probability of し is 1/8 - 各サンプルの長さは4フレーム=1/6秒 - Each sample is 4 frames = 1/6 second long - つまり、「しかのこのこのここしたんたん」は平均して512 * 8 / 6 = 2048/3秒(約11分)1回現れる - So しかのこのこのここしたんたん appears on average on
LLMのチャット以外の可能性 ChatGPTなどで話題のLLM(Large Language Model)、用途としてはチャットボットとしての使われ方が多いですが、チャット以外にも使える可能性を秘めています。 具体的には、生成AIでロボット制御をする「RT-1」や、マインクラフトをプレイする「Voyager」などがあります。これらの詳細の解説は以下記事参照ください。 今回は、夏休みの自由研究(と呼べるほど高尚なものではないですが)として、手軽に分かりやすい例として、LLMでマリオをプレイできるか試してみることにしました。 LLMでマリオをプレイ マリオに関しては、以前に深層強化学習で全ステージクリアにチャレンジしたことがあります。 複数人の有志の協力があり、ループを多用する8-4を除いたステージを全てクリアすることができました。ただ、ステージごとにシミュレータで半日以上かけて学習させる必要
こんにちは、Insight EdgeのLead Engineerの日下です。 今回は、DEAPライブラリを利用した遺伝的アルゴリズムをAWS Lambdaで分散並列実行した話を紹介しようと思います。 目次 目次 背景と課題 並列化の方法の検討 どこを並列化するか? どのように並列化するか? 実装の方針 呼び出し側コード Lambda側コード その他 Lambdaを呼び出すためのDEAPへのmap実装 呼び出し側コード Lambda側コード 今回の実装の工夫ポイント 改善の評価 まとめ 前提 クラウド基盤: AWS 言語: Python ライブラリ: DEAP 背景と課題 ある案件で、遺伝的アルゴリズム (以下、GA)を用いた最適化処理により業務改善の実証実験をしていたところ、性能に課題があるということでデータサイエンティストチームから相談を受けました。 当該処理は、EC2 (r7g.4xl
はじめに はじめまして。データアナリティクスラボの力岡です。 私は日頃、テーブルデータの分析業務において、LightGBMをはじめとする勾配ブースティング系アルゴリズムを活用しています。ただし、その仕組みを十分に理解したうえで使いこなせているかというと、まだ自信が持てない部分もあります。そこで本記事では、自分自身の理解を深めるとともに、これから学ぶ方々にも役立つよう、勾配ブースティング決定木(GBDT)について体系的に解説していきます。 1. 勾配ブースティング決定木 勾配ブースティング決定木(Gradient Boosting Decision Trees、GBDT) は、複数の決定木(弱学習器)を組み合わせて高い予測精度を実現する、アンサンブル学習の一手法です。その名の通り、「勾配降下法」「ブースティング」「決定木」という3つの要素を組み合わせて構成されており、実務やKaggleなどの
NASAは、「宇宙から地球に無線で画像を転送する」といったデータ損失の大きな状況に最適化した画像圧縮アルゴリズム「ICER」を開発しています。そんなICERをC言語のライブラリとして実装したものがGitHubで無料公開されています。 GitHub - TheRealOrange/icer_compression: Progressive, error tolerant, wavelet-based image compression algorithm https://github.com/TheRealOrange/icer_compression NASAは火星探査などのミッションで現地の様子を撮影した画像データを地球へ送信しています。異なる場所へデータを送信する際は、地球上での通信であってもデータの損失が発生しているのですが、地球と火星などの宇宙規模の通信ではデータの損失は非常に大き
DeepMindによる最新の研究で、プロンプトエンジニアリングの新たな手法が発表されました。その手法は遺伝的アルゴリズムを用いてプロンプトを最適化するもので『Promptbreeder(プロンプトブリーダー)』と名付けられています。 Promptbreederは、従来のCoT(ステップバイステップ)手法を上回る性能を持つとされています。プロンプトエンジニアリングの分野において、新たな可能性を切り開くかもしれません。 参照論文情報 タイトル:Promptbreeder: Self-Referential Self-Improvement Via Prompt Evolution 著者:Chrisantha Fernando, Dylan Banarse, Henryk Michalewski, Simon Osindero, Tim Rocktäschel 所属:Google DeepMin
米マサチューセッツ工科大学(MIT)に所属する研究者らが発表した論文「You Can’t Solve These Super Mario Bros. Levels: Undecidable Mario Games」は、任天堂のスーパーマリオシリーズの一部のゲームにおいて、プレイヤーがクリアすることが理論上不可能なコースを数学的に証明した研究報告である。 keyboard_arrow_down 研究内容 keyboard_arrow_down 研究結果 対象となったゲームは、「New スーパーマリオブラザーズ」シリーズ(オリジナル版、Wii、U、2)と、「スーパーマリオメーカー」1および2の全ゲームスタイル(スーパーマリオブラザーズ1、3、ワールド、New スーパーマリオブラザーズU、3Dワールド)である。 研究チームは、これらのゲームにおいて、ステージがクリアできるかどうかの判定が決定不可
概要 DBMS で広く利用されている B+ tree には様々な variant が存在するが、B-link tree もその1つ。 シンプルなラッチプロトコルで並行アクセスをさばけるよう、リーフノード以外のノードにも右の隣接ノードへのポインタを持たせた構造となっており、PostgreSQL で使われていることでも有名。 この記事では主にこの B-link tree に焦点を当てる。 B+ tree 全般やその他インデックス技術自体に興味がある場合は「最強DB講義 #10 いまどきのデータベース索引技術(石川佳治 教授)」の講義資料を読むのがおすすめ。 B-link tree 理解する上で必須な知識「ラッチ」 「ラッチ」というのはいわゆるロックのことだが、DB においては「ロック」というとトランザクション分離のための高価な(数千CPUサイクルを要する)処理を指すことが多く、「ラッチ」という
TOPフォーカス「クマ遭遇AI予測マップ」を開発して見えたもの。人流解析のプロが野生動物の世界に挑んだ所感【フォーカス】 上智大学 応用データサイエンス学位プログラム 准教授 データサイエンティスト 深澤 佑介 機械学習応用や時空間データ解析を専門とする。株式会社NTTドコモに19年間在籍し、携帯電話の運用データに基づくモバイル人口統計の実用化研究等に従事。人々の移動需要や飲食店の需要予測など、都市空間における人流解析の最前線で活躍。2023年4月より上智大学准教授。 クマ遭遇AI予測マップ(上智大学 深澤研究室サイト内) researchmap 連日のようにクマによる人身被害が報じられ、状況が深刻化しています。環境省の2025年10月17日付発表によると、今年度のクマによる死者数はこの時点で7名で、過去最多。この状況に対し、さまざまなアプローチでのクマ対策が各地で進んでいます。 そんな中
コロナ禍への現状での最大の対抗策、ワクチン接種に関する誤解の広がりが大きな問題になっています。 コロナウイルスやワクチンに関する誤解は、通常の人間関係での口コミなど様々な経路で伝わるでしょうが、ネットが主な経路というケースも少なくないでしょう。 どのような人々がワクチン接種をしたがらないか独立行政法人経済産業研究所が2021年4月に調査したデータがあります。 [PDF]どういう人々が新型コロナウイルスのワクチンを接種したがらないか:インターネット調査における検証 この調査によると「インターネットの検索エンジン」を新型コロナウイルスの情報源として最も重視している人はテレビの次に多く、そして比較的接種を忌避する傾向が強いことが明らかになっています。 実際に、様々なデータで、非常に多くのコロナ関連の検索が行われていることがわかります。 これはGoogle トレンドでの[コロナ][コロナウイルス]
FizzBuzzFS FizzBuzz問題といえば定期的にSNSで話題になっては変な解法が発明されることでおなじみですが(?)、ファイルシステムを使った事例が見当たらなかったのでやってみました。 まあ見ての通りというか…… /mnt/FizzBuzz に FizzBuzz.txt(8エクサバイト)があって、FizzBuzzが書いてあります。 どこまでも…… 容量の続く限り…… 以上!!!!!!! 技術解説 FUSE FUSE(Filesystem in USEr space)というソフトウェアを使うことで、簡単に新しいファイルシステムを実装することが可能です。 Rustにおいては、fuse crateの更新が停止した結果フォークが複数存在するようですが、利用者数と更新頻度的にfuser crateを使うのがよさそうです。 FileSystem traitが実装された値をmount2関数に渡
アメリカの国家安全保障局(NSA)によって開発された「SHA-2」は電子署名やブロックチェーンに応用される暗号学的ハッシュ関数の1つです。そのSHA-2の中でも特に使われているSHA-256でハッシュを生成するための計算プロセスがよくわかるサイト「Sha256 Algorithm Explained」を、Domingo Martin氏が公開しています。 Sha256 Algorithm Explained https://sha256algorithm.com/ Sha256 Algorithm Explainedにアクセスするとこんな感じ。 上部にある入力欄に、好きな文字列を入力します。今回はGIGAZINEのURLである「https://gigazine.net/」を入力してみました。すると、入力したURLをバイナリに変換したメッセージブロックが表示されます。メッセージブロックは32b
ついカッとなって先週からRustで詰将棋ソルバを書き始めてしまい、ようやくdf-pnで何らかの解答を出せるようになったところ。ここからもうちょっと調整していくぞ、、 pic.twitter.com/XM9iPJqocv— すぎゃーん💯 (@sugyan) November 2, 2021 というわけで突然Rustで詰将棋ソルバを作りたくなり、作った。 github.com 現時点ではまだ完成度は低くて6割ほどかな…。 とはいえそこらの素直な詰将棋問題なら普通に解けると思う。 冒頭の画像は看寿賞作品の3手詰「新たなる殺意」を2秒弱で解いたもの。 先行事例 将棋プログラムの多くはC++で書かれていて 最近はRustも増えてきているのかな? しかし「詰将棋を解く」ことに特化しているものはあまり多くはなさそうだった。 なかでもRustで書かれているものはna2hiroさんによるものくらいしか無さ
少し前のことですが、こんな話題がありました。 自分がこれまで現職で手がけた機械学習ソリューションでは 1. そもそも「予測」ではなく「説明(解釈)」をアウトプットにする 2. クラス分類確率の高いものだけアウトプットし、低いものは「未定」扱いにして捨てる などという形で実務の現場で使ってもらってます。精度勝負をしないのも一つの解かと https://t.co/NmZJCPnue2— TJO (@TJO_datasci) 2021年8月29日 実際問題として「ある目的のために機械学習システムを開発し、非常に高精度のものが出来上がったが、結局色々あって実戦投入されなかった」という話は、自分の身の回りでも業界内の伝聞でも事欠きません。 しかし、機械学習と言えばどちらかというと「より精度の高いモデルを追い求める」試み、もう少し下世話に言うと「精度勝負」によって、連綿と発展してきたという歴史がありま
門野まもり🌊ゲーム探求Valker @kadonomamori Epic Storeで現在無料中の「shapez」 いわゆる生産管理系のゲームなんですが、極限まで抽象化されたデザインとゲーム性により、この手のゲームをやった事がない人にも、この手のゲームが大好きな人にもお勧めです 「工夫によって効率を上げる」事に快感を覚える人はプレイしてみるとよいぞよ pic.twitter.com/jdO3dpWWgs 2023-04-08 10:53:59 MAMについて shapezにおいて、自動で課題を解析して、自動で作る仕組みのことを MAM(Make Anything Machine)と呼ぶ。 その中でも、存在する全てのパターンに対応しているものを TMAM(True Make Anything Machine)と呼ぶ。
はてなブックマークからシャドウバンされている されているんです。実は。2年くらい前からいくらブクマがついてもホッテントリに上がらなくなってる。 それで、バンされてるのかもと思って株式会社はてなに問い合わせをしたんですけれども、回答としては 「バンしてない。はてなブックマークのホッテントリはアルゴリズムでやってて上がることも上がらないこともあるよ」 ということでした。 それでもいくら記事にブクマがついても全然ホッテントリに上がらなくて、ああ、このブログはアルゴリズムに嫌われたのだなあ、と思ってました。はてな村奇譚とかやってたしな…仕方ないな…。 (推測だけど実際のシャドウバンされた理由というのは、はてな村エントリばかりやってて同じような人たちがブックマークしてるのを互助会行為だとアルゴリズムに判断されたんじゃないだろうか) 別に『はてな』からバンされているということはなくて、はてなブログの注
その誕生を地元新聞も経済新聞も記事にしなかった。2年後、『コードの情報を白黒の点の組み合わせに置き換える』と最下段のベタ記事で初めて紹介された時、その形を思い浮かべることができる読者はいなかった。いま、説明の必要すらない。QRコードはなぜ開発され、どう動くのだろうか。 QRコードは、自動車生産ラインの切実な要請と非自動車部門の技術者の「世界標準の発明をしたい」という野心の微妙な混交の下、1990年代前半の日本電装(現デンソー)で開発された。 トヨタグループの生産現場では、部品名と数量の記された物理的なカンバンが発注書、納品書として行き来することで在庫を管理する。そのデータ入力を自動化するバーコード(NDコード)を開発したのがデンソーだ。 バブル全盛の1990年ごろ、空前の生産台数、多様な車種・オプションに応えるため、部品も納入業者も急激に増え、NDコードが限界を迎えていた。63桁の数字しか
精度の高い文章を自動生成できるチャットボット「ChatGPT」の誕生は、新しいイノベーションへの期待感だけでなく、急速に成長するAIへの不安ももたらした。そんななか米国では、AIとの共存を避けられない次世代のために、アルゴリズムを理解し、批判的に評価する力を身に着けるための教育が始まっている。 マリサ・シューマンは、その日いつもと同じように午前の授業を始めた。彼女は、米ニューヨークのブロンクス地区にある中高一貫の公立女子高「ヤング・ウーマン・リーダーシップ・スクール(YWLS)」で、コンピュータ・サイエンスの教師を務める。 11時半になると、エネルギーに満ちあふれた高校生たちが教室に入って来た。着席し、ノートパソコンを取り出すと、生徒たちは教室前方にある電子ホワイトボードに目を向ける。そこには、授業のテーマであるウェアラブル機器に関する質問が映し出されていた。 教師歴10年のシューマンが、
8月28日に発売された今年の「Google Pixel 10」シリーズのうち、10 Proおよび10 Pro XLには、「超解像ズームPro」という新機能が搭載された。 これは、最大100倍に拡大された写真に対してAIが補完処理を行い、より精密な画像を生成する仕組みだ。Proシリーズの望遠カメラは、メインカメラを1倍とした時に光学5倍という関係になる。100倍にするということは、光学5倍×デジタル20倍ということである。さすがに20倍も拡大してしまうと、画像がボケボケになってしまうが、それをAI処理によってしゃっきりさせますよ、というわけだ。 発売日以降、この「超解像ズームPro」を使った多くの写真がネットにアップされているが、「これは写真ではないのではないか」といった感想が目立つ。ボケている部分がどうなっているのかはAIが想像して補完するわけだが、そこには生成AI技術が投入される。単にノ
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? はじめに 書籍化 本記事を元に ゲームで学ぶ探索アルゴリズム実践入門~木探索とメタヒューリスティクス という書籍を出版することになりました! 本記事を読んで気になっていただけたらご購入をご検討いただけるとうれしいです! この記事で得られる技術 ゲームルールに適した探索アルゴリズムを選択する ゲーム木探索をするのに適したクラス設計 主要なゲーム木探索アルゴリズムの実装 この記事の特徴 汎用アルゴリズムの実装例による他ゲームへの応用力と、実際に動作可能なサンプルコードによる具体的実装イメージの両視点でわかりやすくした(片方しか記載のない記事
この記事は、NTT Communications Advent Calendar 2021 21日目の記事です。 はじめに こんにちは、イノベーションセンターの鈴ヶ嶺(@suzu_3_14159265)です。普段は、クラウド・ハイブリッドクラウド・エッジデバイスなどを利用したAI/MLシステムに関する業務に従事しています。本日は、Rustで動的メモリ確保(dynamic memory allocation)のmallocを実装してPythonやvimを動かしてみようという内容をお届けします。 また、去年もRustネタのアドベントカレンダーを書いているのでぜひ見ていただけると嬉しいです! NTTコミュニケーションズ Advent Calendar 2020 Rustで実装するNetflow Collector 実装するmallocのアルゴリズム 今回実装するmallocのアルゴリズムは小さな
こんにちは、すきにーです。 強化学習の基礎的な手法についてまとめました。 はじめに この記事では以下を説明しています 動的計画法 モンテカルロ法 TD法(SARSA、Q学習) コードはゼロから作るDeepLearning4 強化学習編 に載っているものを参考にしています。 参考記事 深層強化学習アルゴリズムまとめ ゼロからDeepまで学ぶ強化学習 これから強化学習を勉強する人のための「強化学習アルゴリズム・マップ」と、実装例まとめ 今さら聞けない強化学習(1):状態価値関数とBellman方程式 全体図 動的計画法 動的計画法は、エージェントが置かれた環境のモデルがすでに分かっているとき最適な方策を見つけるアプローチです。 方策反復法と価値反復法があります。 環境のモデルが分かっていることは少ないので、あまり使われません。 モンテカルロ法 動的計画法では環境のモデルが完全にわかっている状態
0.はじめに 2020年の5月よりAtcoderのコンテストに参加してから一年経った、現在水色コーダーとなりました、H20と申します。 AtCoderではPythonを使用して参加しており、水色になるまでに様々なアルゴリズムを使用しました。 アルゴリズムについてはほとんど自作せず、有識者の作成されたスニペットを調べては、ある程度理解しながら使用していました。 この記事では、Pythonにてあるアルゴリズムを使用する際にお勧めな書き方の説明をしているスニペットの記事に、それを利用してACしたコードを添えて紹介していきたいと思います。 (ただ、私のACコードは極力見ないで自力で解いてください。綺麗とは言い難いので…) 1.目次 ※各アルゴリズムで紹介している問題は、感覚的な難易度順に並べています。基本的に後半は解けたら凄い!くらいの想いで載せてます。 解き方は多種多様であり、特に難易度の低い問
ただし、「Following」設定にしてあっても、一旦ログアウトして再ログインすると「For You」に戻ってしまう。iOSアプリの場合は、アプリを閉じただけで「For You」に戻ってしまうので、それよりはましだ。 13日ごろから、Tweetbot、Twitterrific、TwitPane、featherなどのサードパーティ製Twitterクライアントでトラブルが続いている。各サービスとも、本稿執筆現在、Twitterからは何も説明がないとしている。 関連記事 Twitterのサードパーティーアプリでトラブル相次ぐ 「非公式アプリを締め出しか」と疑う声も 1月13日の昼ごろから、Twitterのサードパーティー製クライアントで相次いでトラブルが発生している。 Twitter、「おすすめ」と「最新」(旧「フォロー中」)のスワイプ切り替えをiOSでロールアウト TwitterはiOSアプリ
はじめに Turing 株式会社のリサーチチームでインターンをしている東京工業大学 B4 横田研究室の藤井(@okoge_kaz)です。 自然言語処理分野における大規模深層学習の重要性は日に日に高まっていますが、GPT-3, GPT-4 などのモデルの学習には膨大な計算コストがかかり、容易に学習できなくなっています。実際、モデルサイズが近年急速に大きくなっていることにより、学習に必要な計算量(FLOPs)は以下のように年々膨大になっています。近年の大規模モデルでは、NVIDIA H100 80GB であっても 1 つの GPU では、モデルをのせることすらできません。 Compute Trends Across Three Eras of Machine Learning より またScaling Laws によると、大規模なモデルは小さいモデルと比較してより優れた性能を発揮するため、自動
以下の記事が面白かったので、軽く要約しました。 ・Illustrating Reinforcement Learning from Human Feedback (RLHF) 1. はじめに言語モデルは、人間の入力プロンプトから多様で説得力のあるテキストを生成することで、ここ数年、目覚ましい成果をあげています。しかし、「良い」テキストかどうかは、主観的で文脈に依存するため、定義することが困難です。 「良い」テキストを生成するための損失関数の設計は難しく、ほとんどの言語モデルは、まだ単純な次のトークン予測損失(クロスエントロピーなど)で学習しています。この損失自体の欠点を補うために、BLEUやROUGEなどの人間の好みをよりよく捉えるように設計された指標も定義されています。しかしこれらは、能力測定において損失関数より適してますが、生成されたテキストを単純なルールで参照比較するため、制限があり
はじめに こんにちは、2025 年新卒で ABEMA の広告配信システム開発チームに所属している戸田朋花です。 生成 AI を活用した開発が広がる中で、コードを書くこと自体のハードルは大きく下がりました。 一方で、生成 AI に「どのようなシステムを実装して欲しいのか」を正確に伝える難しさを日々感じています。 2 週間ほど前には spec-driven development を掲げた AI 統合開発環境の Kiro が AWS からリリースされ、話題となりました。 Kiro ではユーザーとの対話を通じて Requirements, Design, Task list を順に作成することで、まずシステムの設計を明確にしてからコーディングに入るプロセスが取られています。この方法は冒頭で述べた課題に対する 1 つのアプローチになるでしょう。しかし、依然として生成 AI と自然言語で設計の微妙な
こんにちは。@kenkoooo です。 教科書に載っているようなアルゴリズムって勉強しても仕事では全然使わない、と見せかけて意外と使うなぁと感じたので、仕事で見たことがあるアルゴリズムをいくつか紹介します。 広告を配信したい! あなたはウェブサービスの会社で働いています。サービス利用者のユーザーに広告を配信することで、広告主からお金をもらっています。 あなたは今から広告主からもらった広告をユーザーに配信します。 広告主が 社います。 広告主 は広告を 人に配信したいです。 配信対象となるユーザーが 人います。 ユーザー は広告主 の広告は受け取りを許可しています。 ユーザー は、合計 件までしか広告を受け取りたくないです。 上記のような条件の中で、どのように広告を配信したら良いでしょうか? 条件を整理する 条件を整理してみましょう。 各ユーザーごとに、受け取りを許可している広告主がいます。
こんにちは。LegalForce Researchで研究員をしている神田 (@kampersanda) です。 LegalForce Researchでは現在、高速なパターンマッチングマシン Daachorse(ダークホース)を開発・運用しています。文字列処理の基礎である複数パターン検索を提供するRust製ライブラリです。以下のレポジトリで公開されています。 github.com 本記事はDaachorseの技術仕様を解説します。具体的には、 複数パターン検索に関係する基礎技術(トライ木・Aho–Corasick法・ダブル配列) Daachorseの実装の工夫と性能 を解説します。 以下のような方を読者として想定します。 文字列処理アルゴリズムやデータ構造に興味のある方 自然言語処理の要素技術に興味のある方 Rustライブラリに興味がある方 Daachorseについて 複数パターン検索の基
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く