tockriのブックマーク / 2023年8月8日

最近の話題にも詳しい14億パラメータの日本語LLMの公開

Research部門の近江崇宏です。今回、ストックマークは最近の話題にも詳しいGPT-NeoXをベースとした14億パラメータの日本語のLLM（大規模言語モデル）をオープンソースとして公開します。モデルはHugging Face Hubからダウンロードいただけます。 https://huggingface.co/stockmark/gpt-neox-japanese-1.4b 当社はビジネスにおける情報収集・分析をサポートするサービスを運営しており、そのために最新のWebデータの収集を日々行なっております。今回の事前学習では、一般にLLMの事前学習によく使われるCommon Crawl由来のデータだけでなく、当社が所有している独自のWebデータ（2023年6月まで）も含めて事前学習を行うことで、最近の話題にも詳しいモデルを開発しました。具体的には、事前学習に用いたデータセットはCC100の

tockri 2023/08/08

いいねー。どんどん色んなのがでてきてほしいね。

リンク

避難指示の投稿断念の自治体も X（旧ツイッター）仕様変更で | NHK

避難指示などの情報をSNSのX（旧ツイッター）で周知していた自治体が、仕様の変更によって投稿をやめるケースも増えています。中には台風6号が接近している九州の自治体も含まれていて防災メールなど他の手段で確認してほしいと呼びかけています。これまで避難情報などをツイッターで発信するときには、次々と発表される情報を速やかに届けるため、自動で投稿するシステムも使われていました。しかし、起業家のイーロン・マスク氏が買収して以降、仕様の変更が相次いでいて、自動で投稿できる回数が制限されるようになっています。台風6号が接近している九州・沖縄地方の8県を取材したところ、熊本県と鹿児島県はこの制限を受けて、避難指示などの投稿をやめていました。このうち熊本県は、先月5日から旧ツイッターでの投稿を停止しています。ことし6月から7月にかけて大雨の際に投稿ができなくなり調べたところ、自動で投稿できる回数が1

tockri 2023/08/08

NERVがやってくれる

リンク

重い人ほどローラー式滑り台を速く滑ると判明！物理学の常識を修正か？ - ナゾロジー

滑り台で重い物体の方が速く滑る！？ローラー滑り台は子供の頃より大人になってから滑る方が速度が出て怖い？ / Credit:藤尾山公園ローラー滑り台　HD（You Tube）山の行楽地に出掛けるとよく見かけるローラー形式の滑り台。この遊具を大人になってから滑ったとき、子供の頃より速度が出て怖いと感じたことは無いでしょうか？もしくは子供を先に滑らせて、後から自分が滑ったとき、子供に追いついてぶつかってしまったという経験を持つ人もいるかもしれません。実際、今回の研究者である村田教授がそうした経験をしたといいます。確かに筆者も甥と滑り台で遊んでいて、同じ経験をしました。こうした現象についてほとんどの人は、体重が重くなれば速く滑るのは直感的になにも不思議なことではないと思うかもしれません。しかし、先にも述べた通り、実際には丸めたティッシュとスマホをベッドに落とせば同時に布団に着地します。

tockri 2023/08/08

教えてあげよう。重くておしりの硬い人が速く滑るよ。おしりの柔らかい人はローラーとローラーの間に食い込むから止まっちゃうよ。

リンク

国語辞典の第7版と第8版で『オタク』の解説が180度変わっていて時代の変化を感じる「生徒の反応も違ってた」

けいろー🖋バーチャルライター @K16writer すっっっげーーーー！！！「オタク」という言葉に対するイメージが完全に塗り替えられていることがわかるエピソードだし、生徒さんたちの反応から、「辞書に載っている意味も、その変化を汲み取ったものに変わっている」ことがわかって二重にすっげー！ kotobaken.jp/event_reports/… pic.twitter.com/rIM1GnY6Qb 2023-08-07 12:58:46

tockri 2023/08/08

オタクという単語が俺たちを指す言葉から俺たちを指さない言葉に変わった

リンク

マイナンバー公務員の年金情報ひも付けに誤り 118件確認 | NHK

マイナンバーカードをめぐるトラブルを受けた政府の総点検で、地方公務員や国家公務員などの年金を運営する組合について、マイナンバーと年金情報のひも付けの誤りが118件、確認されたことがわかりました。マイナンバーカードをめぐるトラブルを受け、政府はカードの取得者向け専用サイト「マイナポータル」で閲覧できる医療や年金など29項目のデータの総点検を行っています。このうち公務員などの年金を運営する「共済組合」について、加入者のデータ、およそ510万件を対象に点検を行ったところ、合わせて118件で、マイナンバーと年金情報のひも付けに誤りがあったことが確認されました。内訳を見ますと、「地方公務員共済組合」が112件、「国家公務員共済組合連合会」が6件となっています。いずれも年金支給額に影響はなく、すでにひも付けの修正を終えたということです。誤りが起きた原因は、対象者の住所が一致しているかどうか確

tockri 2023/08/08

510万件中のたった100件だけ「対象者の住所が一致しているかどうか確認していなかったケース」を見つける作業って想像するのも嫌だけど、少なすぎるので却って「ほんとに総点検した？」ってなっちゃう

リンク

なぜ図書館で本を借りることは恥ずかしいのか？

図書館で本を借りられることは正しいのか？「図書館で本を借りられることは正しいのか？」と問われて、「正しい」と答えるのが正しい。どのように正しいのか。AIにいくら「図書館が本を貸し出すことの弊害」を訊いても、結局は「図書館が本を貸し出すこと、市民が本を借りられることは正しい」と答えるくらいには正しい。そのくらいポリティカルに正しいのだ。日本には「図書館の自由に関する宣言」というものもある。1954年に採択された。少し長いが引用したい。図書館は、基本的人権のひとつとして知る自由をもつ国民に、資料と施設を提供することをもっとも重要な任務とする。 1.日本国憲法は主権が国民に存するとの原理にもとづいており、この国民主権の原理を維持し発展させるためには、国民ひとりひとりが思想・意見を自由に発表し交換すること、すなわち表現の自由の保障が不可欠である知る自由は、表現の送り手に対して保障されるべ

tockri 2023/08/08

タイトルが多重質問になっている

リンク

はてなブックマーク

タグ

2023年8月8日のブックマーク (6件)

最近の話題にも詳しい14億パラメータの日本語LLMの公開

避難指示の投稿断念の自治体も X（旧ツイッター）仕様変更で | NHK

重い人ほどローラー式滑り台を速く滑ると判明！物理学の常識を修正か？ - ナゾロジー

国語辞典の第7版と第8版で『オタク』の解説が180度変わっていて時代の変化を感じる「生徒の反応も違ってた」

マイナンバー公務員の年金情報ひも付けに誤り 118件確認 | NHK

なぜ図書館で本を借りることは恥ずかしいのか？

お知らせ

今週のはてなブックマーク数ランキング（2024年7月第3週）

今週のはてなブックマーク数ランキング（2024年7月第2週）

はてなブックマーク透明性レポート（2024年 2月-2024年4月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス