2025.03.25

言語モデルの物理学 (Physics of Language Models) とは、FAIR (Meta) の Zeyuan Allen-Zhu が提唱した、言語モデルの研究を進めるためのコンセプトです。ざっくり言うと、「あのモデルはこう」とか「そのモデルはこのモデルよりもこう」というような博物学的な知識を深めるのではなく、17世紀にケプラーやニュートンが物理学において行ったような原理に基づいた研究を進め、「言語モデルはなぜこのような振る舞いをするのか」という問いに答えられるようになるべきという考え方です。 言語モデルの物理学の特徴は大きく2つあります。 第一は、ウェブから収集したコーパスを使わず、きっちりコントロールされたデータセットを使って言語モデルを訓練するということ。ウェブは誰も全体像を理解できないほど複雑で、ノイズにまみれています。本物の物理学でも空気抵抗や摩擦があると、「鉄球は
もし誰かに酒の席で「今まで一番、秋葉原でお金を使った店ってどこですか?」と問われれば、当方はまず間違いなく「ソフマップ」と答えるだろう。 実際に当方はソフマップで「新品パソコン」「中古パソコン」「新品パソコンパーツ」「中古パソコンパーツ」「新品パソコンゲーム」「中古パソコンゲーム」「新品ビジネスソフト」「新品テレビゲーム」「中古テレビゲーム」「中古シンセサイザー」「中古エフェクター」「本」「CD」「OAサプライ」「コピーツール」など、様々なものを買っていたし、いま何となく「今日までソフマップにて使った金額」をエクセルに書き出して計算したところ「中古のレクサス」が買えるくらいの金額を使っていて、軽く悔いた。 だが、あの頃の散在はきっと今の糧になっていると思うし、もし仮に糧となっていなかったとしても「80〜90年代のソフマップの話」というのは、電脳中年たちと酒を飲んでいる際に「超盛り上がるトー
最初に 本記事では、非エンジニアな方でも理解しやすいように「オンラインアクションゲームを開発するにあたって知っておきたい仕組み」について、丁寧に解説していきます。 対象読者は以下の通りです。 ゲームサーバーを運営したり、シンプルなオンラインゲームを構築した経験があり、実際の開発ではどういった仕組みを用いているのか興味がある方 プログラムやゲームエンジンを触ったことがあり、オンラインゲーム開発の基礎について学びたい方 なんもわからんけど知見として持っておきたい方 今回、前編と後編で記事を分割しています。 前編で紹介する内容は以下の通りとなります。 ゲーム開発における基本用語 非同期型について 非同期型における「アイテムデュープ」などの問題 後編では以下の内容を記載します。 同期型について 同期型におけるフルメッシュ型とスター型の違い C/SやP2Pの簡単な概要について グローバルIPアドレス
漫画の絵は象形文字に近いと考えています。つまり、漫画における絵は、「読む人に対して意図した意味を伝えるための手段」であるということです。 そう考えたときに、漫画における「絵が上手い」という言葉が意味するところは、単純な一枚絵としての絵画的な意味とは異なることになります。作者が意図した意味がそこに込められているなら、その絵によって意図した通りに伝われば上手いし、伝わらなければ下手ということになるからです。どれだけデッサンが整っていても、細密でも、光の描き方が正しくても、見たこともない独自性があったとしても、意図した通りに伝わらなければ、それは下手だということです。なぜならその絵は、求められている機能を果たしていないからです。 しかし、実際にはそこには単純に良し悪しを判断できない難しさがあります。なぜなら、作者がその絵を通して伝えたかったものは、作者しか完璧には把握していないからです。なので、
私のXのタイムラインでNext.jsおよびVercelが話題になると 「Proは高い。VPSで十分」という意見を各人がつぶやきはじめるっていう流れがある。観測範囲ではDHHが脱クラウドを宣言してから同調する意見が増えた印象がある。発言者は欧米のインディーデベロッパーが中心でベテラン開発者で、月$5で運用できるDigital OceanやHetzner、VultrのVPSを推すというポジションだ。今日はVercelのVPoPがそれに反応して、「VPSでNextセルフホスト試してるなう」とポストしていた。Vercelにベンダーロックインでないことをデモでアピールする算段らしい。彼はこの手のDevRel系の火消しを得意とする。 どうしてもウェブ技術の先端はメジャーリーグである米国にありというイメージが我々日本人にはあるが、誕生する場所としてはそうだけど(世界的巨大企業などのIssueが日夜発生す
Prof or Hobo? - Quiz Follow @jccsomody Prof Hobo Prof Hobo Prof Hobo Prof Hobo Prof Hobo Prof Hobo Prof Hobo Prof Hobo Prof Hobo Prof Hobo
富士の山頂は山梨か静岡か、という論争はつねに蒸し返される。 国土地理院に全国都道府県市区町村別面積調があり、その中に「都県にまたがる境界未定地域」が出ているので、ひととおり調べてみた。 こればかりは、やはり正確性や信頼性という点で、国土地理院の地図でなければならない。以下の箇所で、紫色の境界線 (破線) が切れている。 蔵王連峰、御釜の北西で約200mほど境界未確定 新潟と山形にまたがる飯豊朝日連峰、2kmあまり境界未確定 同じく朝日山地で300mほど 三郷市と葛飾区にまたがる水元公園。1897年の地勢図と比べると川の形が違う。当時は北側が「北葛飾郡」南側が「南葛飾郡」となっている 市川市と江戸川区の間、行徳可動堰あたりはさらに地勢が変貌している。水門の所管など行政上の問題か ディズニーリゾートも葛西臨海公園も元々は埋立だが、その経緯で画定されなかったのは怠慢か 小谷村と糸魚川、この戸倉山
お久しぶりです、ANDPADボードの tomtwinkle です。 この記事はGoの go:linkname 騒動は 6/18に行われた Go Bash で話した内容を要約したものです。 そもそも go:linkname とは何かといえば internal packageやprivate var/funcなど普通はアクセスできないオブジェクトシンボルをエイリアス出来るようCompilerに指示して、アクセス可能にするcompiler directiveです。 go:linkname はprivateな変数へアクセス可能な便利なものでしたが unsafe packageのimportを必須とする通り、せっかく互換性や安全を考慮して作られているGoプログラムを簡単に破壊できる諸刃の剣でした。 詳細は発表スライドを見てください。 go:linkname 禁止騒動 Go 1.23 のリリースまで2
Unix系OSのルートディレクトリ直下にある “/usr” はなんの略なのか。 巷の意見はおおよそこんな感じです。 「もちろん “USeR” の略でしょ。」 「あまいな。 “User Services and Routines” の略だ。」 「その “User S*R*” の略だっていうソースはあるの?」 どうもはっきりしません。そこで調べ始めたら、思いのほか深入りしてしまったので、今回調べたことを書いておきます。 0. Unixユーザグループの機関誌に載っていた説 Unixユーザグループの機関誌に “User Services and Routines” の略だと書いてあったという情報が散見しますが、ここではそれをソースとして認めません。その記事に「XXXのドキュメントに書いてある」とか、「IEEE NNN.N で決まっている」とか書いてあれば一件落着なのですが、原典を見つけることはでき
Goで単体テストを実装する場合、動的な言語のように「テスト実行中に外部への依存を置き換える」といったことはできません。代わりに、 外部への依存を引数で渡す 外部への依存をインターフェイスで渡す のように、テスト対象をテスト可能な実装に変更しておき、テストの時は外部への依存をモック等に置き換えて実行する場合が多いのではないかと思います。 個人的な体験でいえば、テスト可能な実装に置き換えていく過程で設計が洗練されていく*1ことは度々あるので、面倒を強制されているというよりは設計を整理するための道具といった捉え方をしているのですが、そうは言っても動的な言語に比べると面倒だなと感じるときは少なからずあります。既存の実装がテスト可能になっておらず、変更するコストが高い場合は特にそうですね。 そんなとき、気軽にモンキーパッチできると嬉しいんじゃないかと思って、テストの時だけ関数を置き換えられるようなラ
株式会社ヘンリーのSongmu氏は、ブログの魅力と発信の際に気をつけていること、おすすめの構成やカスタマイズなどについて話しました。全2回。 Songmu氏の自己紹介Songmu氏:よろしくお願いします。この会場に入ってきて若干緊張を感じたんですけど。というのも、後ろにSix Apartさんのロゴがあって。この発表で「Movable Type」をやめたという話が出てくるんですよね。 (会場笑) ちょっと「すみません」とお断りをしておきますということと、「Movable Typeは、やはりすごい。静的配信だというのもすごく良かった」という話もするので、ご了承ください。 ヘンリーという会社から来ました。電子カルテのSaaSを開発しているのですが、今絶賛採用中なので、興味がある方はお声がけください。よろしくお願いします。 サブタイトルに「Blog Hacks 2024」というのを付けていますが、
CockroachDB はどのくらい「しぶとい」のか? / How tough is CockroachDB?
テキストサイトのTO-DOリスト ねじまきのの個人サイト「nejimaki.me」。 最近触れてなかったけれど、GW中にちょっと大型工事をやってみるつもりです。 備忘録の意味も込めて、個人サイトでやりたいことをまとめておこうかなと。 www.nejimakiblog.com やりたいことリスト バナー作成&設置する カテゴリーページ(サイトマップ)を作る RSSを整理 過去のおすすめ記事をまとめる リンク集を作成 アクセスカウンターを設置 ゲスト投稿ページをつくる 隠しページをつくる お気に入りのツール・ソフトをまとめる 思い出の記録をつくる 写真ギャラリーをつくる カスタム404ページをつくる サイトの方針を宣言する 無料ダウンロード可能なアイコン/素材集をつくる 毎月チャレンジの様子を記録していく 非AI生成コンテンツ宣言をする 占いページをつくる 使っているツール/ソフトまとめ ゲス
[2024年4月25日 追記] Safariの動作について考慮漏れがありましたので、一部追記・編集しました。 新宿にオフィスのあるClassiは、岡山在住の私のような地方在住者だけでなく、いわゆる通勤圏内に在住していてもリモートワークで働いている人が多い会社です。必然的にミーティングはいわゆるオンラインミーティングとなり、主にGoogle Meetが利用されています。 そのGoogle Meetのチャット機能、ここ1週間ぐらい「IMEで日本語に変換のために押すエンターキーで送信されてしまう」という現象が発生しています。このエントリーを読まれている時点では対応しているかも知れませんが、2024年4月22日17時時点ではその現象は続いています(Windowsでは再現しないという情報もあります)。 入力開始 変換して確定のエンターキーを押すと 送信される エンターキーに頼らない日本語入力を頑張り
電通マンぼろぼろ日記 (日記シリーズ) 作者:福永 耕太郎フォレスト出版Amazon Kindle版もあります。 電通マンぼろぼろ日記 作者:福永 耕太郎三五館シンシャAmazon ベストセラー日記シリーズ最新刊!今回もすべて実話の生々しさ。 30年間にわたって広告代理店の最前線で汗をかいた著者による怒りと悲哀と笑いの記録。 ゴルフ・料亭・×××接待、クライアントは神さまです ~「今すぐに、俺が飲んでいる店に来い!」 大手電機メーカー・S社の宣伝部メディア担当である 田代部長からの電話だった。私はすぐにピンときた。翌朝の日経新聞に 掲載される予定のS社の広告割り付けの変更が彼の逆鱗に触れたのだ。 (第1章「知られざる電通の内幕」より)~ マスコミと電通が日本をダメにした、などとネットではよく槍玉に挙げられている、日本最大の広告代理店・電通。 電通の新入社員だった高橋まつりさんが、長時間の残
書類の一部だけを照らす光 NHKスペシャルで、書類にこんなふうに光が当たっているのをよく見る。 「NHK 大川原化工機」の Google 画像検索結果のキャプチャ NHKが手に入れた書類にスポットライトを当てて、重要な行や単語だけを分かりやすいようにするのが典型だ。その他、暗闇の中に書類そのものをぼんやりと浮かびあがらせるやり方もある。 これを真似したいなあと思っていた。「盆踊り大会のお知らせ」のようななんでもない文書でも、こうやって照らせばなにか重大な資料みたいに見えないだろうか。 どうやって照らすか しかし問題がひとつある。これそもそもどうやって光を当ててるんだろうか。まずはシンプルに、書類に帯状に光を当てるやり方を試してみたい。 そのためにこんな方法を考えてみた。 照らしたい紙の上に透明の板を浮かべ、そこに光のスキマを作るための紙を置いて、全体を上から照らすのだ。 スマホのライトで照
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く