並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 138件

新着順 人気順

NIIの検索結果1 - 40 件 / 138件

  • 歴史的地名の「行政区画変遷」を大規模オープンデータ化~『日本歴史地名大系』を平凡社地図出版との協働により機械可読データとして強化~ - 国立情報学研究所 / National Institute of Informatics

    2023/10/18 歴史的地名の「行政区画変遷」を大規模オープンデータ化 ~『日本歴史地名大系』を平凡社地図出版との協働により機械可読データとして強化~ 情報・システム研究機構 データサイエンス共同利用基盤施設 人文学オープンデータ共同利用センター(以下ROIS-DS CODH、センター長 北本朝展)と株式会社平凡社地図出版(代表取締役 西田裕一)は、『日本歴史地名大系』の機械可読データ化に向けた協働を推進し、このたび歴史的地名の「行政区画変遷」に関する大規模オープンデータを公開しました。 『日本歴史地名大系』(用語解説1)とは、全国の歴史研究者の協力を得て地名研究・地域史研究の全成果を結集し、株式会社平凡社が25年(1979年~2004年)をかけて出版した50巻51冊の地名辞典です。この地名辞典の編集にかつて関わった人々の全面的な協力を得て、地名辞典の内容の更新や位置情報(緯度経度)の

      歴史的地名の「行政区画変遷」を大規模オープンデータ化~『日本歴史地名大系』を平凡社地図出版との協働により機械可読データとして強化~ - 国立情報学研究所 / National Institute of Informatics
    • ニコニコ、システム全体を再構築へ サイバー攻撃の影響で 復旧の見込みは「今週中に告知」

      ドワンゴは6月10日、8日から続く大規模障害を巡り、今後の方針を発表した。10日午後6時時点で「サイバー攻撃の影響を受けずにニコニコのシステム全体を再構築するための対応を進めている」という。復旧予定やサイバー攻撃の詳細については「今週中に、役員の栗田穣崇およびCTO鈴木圭一が、復旧までの見込みおよびその時点までの調査で分かった情報を説明する予定」としている。 会員費の払い戻しなど、個々のサービスへの質問については「影響の調査を行っている段階のため」として回答を控えたが「誠実に対応させていただきますので続報をお待ちください」とした。 今回の攻撃を巡っては、ニコニコ以外にもKADOKAWAが提供する複数のサービスがダウンしており、KADOKAWAの公式サイトも表示できない状態が続いている。 関連記事 「#がんばれニコニコ」拡散 サイバー攻撃でダウン中、ユーザーが復旧を応援 「ニコニコ」でサイバ

        ニコニコ、システム全体を再構築へ サイバー攻撃の影響で 復旧の見込みは「今週中に告知」
      • 全エンジニア必見!情報収集のためのリンク集 - Qiita

        この記事はNuco Advent Calendar 2023の12日目の記事です。 はじめに 技術は目まぐるしく変化・進歩していて、トレンドに追いつくには、まず信頼できる情報源が必要です。 このリンク集では、エンジニア向けのコンテンツを種類別に紹介します。業界の最新ニュース、学術論文、実践的な動画解説、そして専門家のコミュニティなど多様なリソースをまとめました。 弊社Nucoでは、他にも様々なお役立ち記事を公開しています。よかったら、Organizationのページも覗いてみてください。 また、Nucoでは一緒に働く仲間も募集しています!興味をお持ちいただける方は、こちらまで。 知識共有コミュニティ Qiita 言わずもがな、国内最大級のコミュニティサービスです。言語・分野ごとのタグがあり、どのエンジニアにとっても使いやすいサイトになっています。 Zenn 「知識を共有するエンジニアに対価

          全エンジニア必見!情報収集のためのリンク集 - Qiita
        • 情報処理学会 情報入試委員会 - 情報科全教科書用語リスト

          情報処理学会情報入試委員会は、高等学校情報科において現在までに出版された検定済教科書すべての索引に現れる用語を整理した用語集[1](論文[2]が刊行された時点のもの)を基に、用語のカテゴリづけや、要約説明文づけ等の手を加え、再構成した「情報科全教科書用語リスト」を作成しました。 ここに広く、CC 4.0 BY-SA ライセンスを利用して、公開します。 https://docs.google.com/spreadsheets/d/1FYsq1-ZmwrovR1j8_Q_M5QmSlj6NIZdy/view (2024年5月9日改定、2024年4月12日初版公開) 高等学校の情報科は2003年から実施されており、20年以上の歴史があります。しかし、他の教科と比較すると歴史は浅く、情報科についての共通認識は広まっているわけではありません。 情報科の検定済み教科書は既に100冊以上出版されており、

            情報処理学会 情報入試委員会 - 情報科全教科書用語リスト
          • 都道府県 一覧 | 『日本歴史地名大系』地名項目データセット

            地名項目の位置情報(緯度経度)の推定については、精度を改善する余地が大きいため、今後も各種資料を精査しながら精度を向上させていきます。現状では、地図上のマーカーの位置が最適でない場合もあるかと思いますが、今後さまざまな精度向上の取り組みを進めていく予定です。 都道府県 一覧 合計 80502 件 検索 歴史的地名/現代地名による統合検索では、現代および歴史的な市区町村名や現代の町丁・字名による検索が可能です。 地名(の一部)を入力: 概要 『日本歴史地名大系』地名項目データセットとは、ジャパンナレッジ版『日本歴史地名大系』(平凡社)の中から、行政地名に関連する地名項目をまとめたデータセットです。2023年11月現在、地名項目=80,502件を提供しています。 出典 『日本歴史地名大系』地名項目データセット

              都道府県 一覧 | 『日本歴史地名大系』地名項目データセット
            • ポスト資本主義におけるソフトウェアエンジニア

              1. はじめに 企業に務めるソフトウェアエンジニアにとって、生産性向上というフレーズは聞かない日がないほど身近なものです。私自身も日々の仕事が、チームや組織の生産性向上に寄与するかどうか、意識しながら働いています。そもそもソフトウェアエンジニアという仕事は、人を機械に置き換えるという性質上、生産性向上とは切っても切り離せないという関係性を超え、生産性を向上させる営みそのものと言っても差し支えありません。 では私たちソフトウェアエンジニアのDNAである生産性向上の出自は何処かと探っていくと、どうやら資本主義と共に拡大してきたイデオロギーであることが分かります。資本主義は無限の成長を志向するエンジンを内蔵しており、現在先進国に住まう私たちの生活の豊かさは疑いなく資本主義の恩恵に依拠しています。その一方で、200年以上稼働し続けるこの資本主義というシステムについて、昨今多くの学者と有識者がその綻

                ポスト資本主義におけるソフトウェアエンジニア
              • 「これって今は形だけだけど大昔は実際に...」秋田には子宝を願って子どもが新妻を棒でつつくショタオネ同人誌みたいな奇習がある

                リンク bunka.nii.ac.jp 上郷の小正月行事 文化遺産オンライン 上郷の小正月行事は、横岡地区の4つの組と大森で、子どもたちによって行われている小正月行事で、サエの神小屋焼きに鳥追いなどが組み合わされた行事である。藁を集めて作ったサエの神小屋に小学性男子が籠もった後、最後に火をつけて焼やして豊凶を占う。...

                  「これって今は形だけだけど大昔は実際に...」秋田には子宝を願って子どもが新妻を棒でつつくショタオネ同人誌みたいな奇習がある
                • 日本語に強い大規模言語モデル「Swallow」を公開 英語が得意な大規模言語モデルに日本語を教える

                  要点 日本語能力に優れビジネスにも安心して活用できる大規模言語モデルを公開 継続事前学習により大規模言語モデルの日本語能力を改善 高度な日本語処理が求められる多くの場面で、生成AI技術の利活用を推進 概要 東京工業大学(以下、東工大) 情報理工学院 情報工学系の岡崎直観教授と横田理央教授らの研究チームと国立研究開発法人 産業技術総合研究所(以下、産総研)は、日本語能力に優れた生成AIの基盤である大規模言語モデル[用語1]「Swallow」を公開した[参考リンク1]。本モデルは現在公開されている日本語に対応した大規模言語モデルとしては最大規模であり、オープンで商用利用が可能であるため、ビジネスに安心して用いることができる。 東工大と産総研の研究チームは、英語の言語理解や対話で高い能力を持つ大規模言語モデル(米Meta社 Llama 2)の日本語能力を拡張することで「Swallow」を構築した

                    日本語に強い大規模言語モデル「Swallow」を公開 英語が得意な大規模言語モデルに日本語を教える
                  • 膨大なアニメの原画や動画を後世に伝えるためにはどうやって保存すべき?「2Dアニメの素材アーカイブについて!」をTRIGGER取締役が語る

                    アニメの原画や絵コンテ、設定資料集はアニメを作る上で必要な資料ですが、アニメが完成すると使うことはありません。こうしたアニメ制作の素材はこれまで時間が経ったら廃棄されていましたが、さまざまな理由で保存するべきではないかという声も挙がっています。「キルラキル」「プロメア」で知られるアニメ制作会社のTRIGGERもこうした素材をアーカイブする事業に着手しており、その辺りをたっぷり語る「2Dアニメの素材アーカイブについて!」というトークイベントをマチ★アソビ Vol.27で開催していたので、じっくり聞いてきました。 2Dアニメの素材アーカイブについて! マチ★アソビvol.27 : イベント情報 - アニメハック https://anime.eiga.com/event/162818/ 2000年にアニメ業界に入って23年目になる舛本和也さんは、クリエイターではなくて制作進行からスタートしてアニ

                      膨大なアニメの原画や動画を後世に伝えるためにはどうやって保存すべき?「2Dアニメの素材アーカイブについて!」をTRIGGER取締役が語る
                    • 技術書典15で「freee 技術の本」 を出します! - freee Developers Hub

                      こんにちは!DevBrandingのellyです。 いよいよ今週末は技術書典15ですね! この度、freeeの有志の開発メンバーで初めて技術同人誌「freee 技術の本」を制作しました。 すでに技術書典 マーケットにて公開されており、オンラインでは11月11日(土)より入手可能です。 11月12日(日)池袋・サンシャインシティのオフライン会場では、執筆者たちでブースを出しておりますのでぜひ立ち寄っていただけると嬉しいです! techbookfest.org freee 技術の本とは? freeeの有志の開発メンバーで執筆した技術同人誌です。 今回は、これ一冊を読むことで、freeeの技術はもちろん、開発組織やカルチャーなど、なんとなく会社の全体的な雰囲気が伝わるような内容にすることを心がけました。 数年前からDevBrandingチームで技術本の制作をしてみたいという話はあがっていたものの

                        技術書典15で「freee 技術の本」 を出します! - freee Developers Hub
                      • 総務省、データサイエンス入門の無料オンライン講座を開催 「統計学の基礎」など解説

                        講師は慶應義塾大学の安宅和人教授、統計情報研究開発センターの小西純氏、早稲田大学の西郷浩教授など、データサイエンスに携わる専門家が務める。統計学の基礎や統計データの見方など、統計データ分析の基本的な知識を学習できる同講座は、2015年の開講からのべ約19万2000人が受講したという。 受講登録は7月29日まで。 関連記事 データ分析初心者は“童心に帰る”べき── 現役データサイエンティストが説く、失敗しないための心構え コロナ禍の事業継続の姿勢から一転し、データ活用に関心を向ける企業が増えている。こ一方、ノウハウや人材不足により、思うような成果を出せない企業もある。現役のデータサイエンティストに分析初心者が持つべき心構えを聞いた。 総務省「社会人のためのデータサイエンス演習」リニューアル開講 無料で学べる 総務省の無料オンライン講座「社会人のためのデータサイエンス演習」がリニューアル開講。

                          総務省、データサイエンス入門の無料オンライン講座を開催 「統計学の基礎」など解説
                        • NII、「日本の判例HTMLデータ」研究者に無償提供 約6万5000件の判例収録

                          国立情報学研究所(NII)はこのほど、最高裁判所が公開している判例集のPDFデータをテキスト化(HTMLデータ化)した「日本の判例HTMLデータ」の研究者向け無償提供を始めた。 情報・システム研究機構から受け入れたもので、情報学研究データリポジトリ(IDR)のサイトからオンライン申請すれば入手できる。 最高裁判所のサイトで検索可能な、最高裁判所判例集、高等裁判所判例集、下級裁判所裁判例速報、行政事件裁判例集、労働事件裁判例集、知的財産裁判例集のPDFデータをHTML化。1947年~2023年の約6万5000件の判例データを収録する。 HTMLデータでは、本文に無関係な部分を除去した上で、小見出し、箇条書き、段落などの構造を認識。それぞれに応じたタグを付与している。 関連記事 メルカリの出品データ、研究者向けに無償提供 国立情報学研究所と連携 メルカリの研究開発組織であるmercari R4

                            NII、「日本の判例HTMLデータ」研究者に無償提供 約6万5000件の判例収録
                          • NII、130億パラメータのLLM構築 コーパスなども全公開 「今後の研究に資するため」

                            国立情報学研究所(NII)は10月20日、パラメータ数130億の大規模言語モデル(LLM)「LLM-jp-13B」を公開した。初期段階のモデルだが、アカデミアや産業界の研究開発に資するため、コーパスやツールなどを含めてすべてオープンにする。 公開したLLMの学習データ量は合計約3000億トークン。うち日本語は約1450億トークン(mC4/Wikipedia)、英語は約1450億トークン(The Pile/Wikipedia)、プログラムコード約100億トークン。 計算資源としては、大学や研究機関が共同運営する仮想化環境・データ活用社会創成プラットフォーム「mdx」を12ノード活用。モデル構築にはMicrosoftのDeepSpeedを、モデル構築時の監視やログの保存には、モデル開発プラットフォームのWeights&Biasesを利用した。 NIIが主宰するLLM勉強会(LLM-jp)で7月

                              NII、130億パラメータのLLM構築 コーパスなども全公開 「今後の研究に資するため」
                            • いかにして動的型付けのRubyに静的な型検査を持ち込むか? SteepとRBSが目指すもの - Findy Engineer Lab

                              Rubyをはじめとする「動的型付け」のプログラミング言語は、ソースコード中に型に関する記述が陽に出てこないことが特徴で、プログラムの実行前に(静的に)型検査をすることはありません。しかし、このようなプログラミング言語においても、大規模な開発における品質の向上や開発体験の改善、実行の高速化のために、静的な解析を活用しようという試みは多くなされてきました。この記事では、動的型付けの言語のための型検査の歴史を簡単に振り返って、現在私が開発しているRuby向けの型検査器Steepとその基盤となっている型記述言語RBSについて説明し、今後の展望を議論します。 著者:松本宗太郎さん(@soutaro) Rubyコミッター。大学院でRubyプログラムの型検査の研究に取り組み、修了後はスタートアップでWebアプリケーションの開発に従事。2017年から型検査ツールSteepの開発を始め、2019年からはRu

                                いかにして動的型付けのRubyに静的な型検査を持ち込むか? SteepとRBSが目指すもの - Findy Engineer Lab
                              • みなとみらいにある謎の地下施設はいったい何?「確かに謎の遺跡みたいに見える」「横浜市内の小学校だった人はたぶん知ってる」

                                Yo Ehara @yo_ehara みなとみらい唯一の重要文化財のはずです。1896年完成の国内最古の商船用石造りドック跡。横浜は1923年の関東大震災で壊滅、山手の洋館は震災後の再建で恐らくその為に重文指定逃してます。赤レンガ倉庫も震災前の建造物ですが改修され過ぎのためかやはり重要文化財指定は逃し経産省の産業遺産です。 x.com/kuromitsu_ka/s… hiroko 💉💉💉💉💉💉😷 @slowslowfood ドックヤードガーデンは第二ドックを復元・保存したもの 横浜開港後、船渠だったみなとみらい21地区の石造りドック #第一号船渠 は #国指定重要文化財 #近代化産業遺産 (子どもの頃、父に連れられてスケッチに行ってた。 横浜博やみなとみらい開発プロセスを仕事で見ていた昭和…) x.com/kuromitsu_ka/s… リンク bunka.nii.ac.jp

                                  みなとみらいにある謎の地下施設はいったい何?「確かに謎の遺跡みたいに見える」「横浜市内の小学校だった人はたぶん知ってる」
                                • 性的な衣装とは何か

                                  「性的な目的で考案、作成された衣装(A)」又は「元は異なる目的のものであってもある状況下で性的な目的に用いられるとのコンセンサスが社会的に生じた衣装(A')」を指すと仮定する。 たとえば「穴あき下着」は前者A、「亀甲縛り」は後者A'の例だろう。そして、それらが批判の対象とされるのは、 「それらが性的な喚起力を高くもつとの合意が現に社会的に維持されている(B)」こと、そして「性的存在として眼差すことへの禁忌が社会的に存在する対象にそれらの衣装を着ける(C)」ような場合(つまりAorA'、かつB&Cの場合)と仮定する。この場合、結果として現れる表象それ自体が公序良俗の取り締まり基準を満たしているか否か(D)とは、また別の問題として扱う必要がある(Dは、どんな文脈でも社会的に提示するのは一発アウト、みたいな基準と考えられたい。生性器のドアップ写真、とか。ただこの場合も、「公序」の制限とかけはなれ

                                    性的な衣装とは何か
                                  • 線虫がん検査の『HIROTSUバイオサイエンス』の神経芽腫マススクリーニングに関する誤り - NATROMのブログ

                                    線虫を利用したがん検査「N-NOSE」の疑惑を報じた■NewsPicksの記事に対し、HIROTSUバイオサイエンスが反論として■「一部メディアでの報道および内容の解説について」というプレスリリースを出しました。このプレスリリースにはさまざまな問題点がありますが、ここでは主に神経芽腫マススクリーニングに関する誤りについて焦点を当てます。線虫検査の有効性や性能とは直接は関係しませんが、HIROTSUバイオサイエンス側のがん検診の疫学についての理解の程度や科学的事実に対する誠実さについて、何某かの示唆を与えるものだと考えます。 誤:神経芽腫マススクリーニングの有効性は今や専門家の間では知られている。 正:神経芽腫マススクリーニングの有効性は現在も専門家の間では認められていない。 小児神経芽腫(神経芽細胞腫)は神経の細胞ががん化する小児がんの一種です。尿中に排泄されたがん細胞が分泌したカテコラミ

                                      線虫がん検査の『HIROTSUバイオサイエンス』の神経芽腫マススクリーニングに関する誤り - NATROMのブログ
                                    • ChatGPTはなぜ計算が苦手なのか - 湊 真一 京都大学大学院情報学研究科 教授

                                      講演概要ツール・環境 ChatGPTは、統計的な学習モデルによって、驚くほど滑らかに自然な対話を自動生成することができ、ここ半年の間にも社会に多大なインパクトを与えつつある。一方でChatGPTは、数を数えることや掛け算のような計算問題を解くのは苦手であり、小学生でも解けるような問題をしばしば間違えることが知られている。本講演では、アルゴリズムや計算量の観点から、ChatGPTがなぜ計算問題が苦手なのかを述べ、ChatGPTの能力の限界や、計算手順を理解するとはどういうことかについて論ずる。 講演映像

                                        ChatGPTはなぜ計算が苦手なのか - 湊 真一 京都大学大学院情報学研究科 教授
                                      • 1行あたりの文字数を20-29文字にすると文章が速く読める - ナゾロジー

                                        1行あたりの文字の表示数を多くすると文章が速く読めるようです。 レディング大学のポール・コラーズ氏(Paul Kolers)らの研究チームは、一行当たりの文字数と読む速さの関係性を検討しています。 結果、一文当たりの文字数が多いほど、読み終えるまでにかかる時間が短くなる現象が確認されました。 スマホやkindleで文章を読むときに縦ではなく横向きにし、一行当たりの文字数を多くすることで読み終わる時間を短くすることができるかもしれません。 また表示の文字の大きさを小さくし、一文当たりの文字数を多くすることでも早く読めるようになります。 この一行当たりの文字数を多くすることで読むスピードが速くなる現象は、日本語の文章を対象にした研究でも確認されています。 この研究の初期の報告は、学術誌「Human Factors: The Journal of the Human Factors and Er

                                          1行あたりの文字数を20-29文字にすると文章が速く読める - ナゾロジー
                                        • 司法の女割|rei

                                          まず結論から言うと「女性は刑事裁判になっても男性と比して量刑が軽くなる」という傾向はハッキリ存在する。この傾向の有無自体に議論の余地はない。何故なら殺人罪という解釈の余地が入りにくい犯罪における執行猶予率において、男性は20%であるのに対し女性は40%であるという数字が出てるからだ。 https://senshu-u.repo.nii.ac.jp/record/5700/files/1021_0102_03.pdf更に量刑の数字を追ってみると、特に女性が子供を殺した場合は執行猶予率は60%にも及ぶうえに、実刑はついた場合でも最長10年未満で最頻値は5年以下という驚愕の数字が弾き出されてる。当然その中には突発的犯行ではなく日頃からの虐待の末に殺したケースも珍しくない…というか子殺しの殆どはそのケースだ。 https://senshu-u.repo.nii.ac.jp/record/5700/

                                            司法の女割|rei
                                          • 特化型モデルが日本の生成AI開発の勝ち筋

                                            こんにちは、シバタアキラです。5月は皆様にとってもイベントの多い月間だと思いますが、私も日韓のAI Expoに出展、各所での講演、そして今週は日本人工知能学会の大会にて論文の発表も控えております。イベント参加は時間も取られますが、生の情報に触れるいい機会でもあり、今回は直近のAI業界の状況について私が学んだことを中心にご共有します。 出口の見えない日本のLLM開発に光? 昨年末MetaとIBMが手を組んでアナウンスされたThe AI Alliance は、「オープンAI開発を推進する」と大義を謳ってLinux Foundationとも手を組み、今月日本でカンファレンス及びディナーがありました。これまであまり話題になってこなかった団体という印象を持っていましたが、ビッグネームなメンバー企業・団体が着実に増えており、かなりモメンタムが増している印象を受けました。 私も東工大の岡崎先生と、NII

                                              特化型モデルが日本の生成AI開発の勝ち筋
                                            • 色々な生成AIモデルをColabで動かして今年を振り返る - ABEJA Tech Blog

                                              こんにちは、ラボで研究開発をしたりプロトタイプを作っている藤本(X(Twitter))です。ABEJAアドベントカレンダー2023の21日目の記事です。ここ近年、生成AIの勢いが凄いです。最近は一夜明けたら世界が変わっているみたいなことがしょっちゅう起きています。そんな状況なので、なかなか世の中についていくのが難しいのではないかと思います。そこで今回は、これまでに色々と出てきた生成モデルを振り返りつつ、ひたすら思いつく限りColabで動かしまくってみる企画をやってみようかと思います。流石に全部Colabで動かすのは大変でした・・・。 まずは言語を対象として日本語モデルを含む様々なモデルを対象に推論実験を行います。続いて高速化の実験、更にSFTによるInstructionチューニングや、RLHFもやってみます。最後に、ソースコード生成もやってみましょう。次に、画像を対象として、言語同様に色々

                                                色々な生成AIモデルをColabで動かして今年を振り返る - ABEJA Tech Blog
                                              • 公開しているモデル・コーパス・ツール

                                                LLM-jp で開発したモデルやツールを公開しています。コーパスを含む各種データは今後順次公開していく予定です。 公開プラットフォーム モデル: https://huggingface.co/llm-jp ツール: https://github.com/llm-jp 事前訓練済みモデル 13B v1.0 LLM-jp-13B-v1.0 1.3B v1.0 LLM-jp-1.3B-v1.0 チューニング済みモデル 13B v1.1 LLM-jp-13b-dpo-lora-hh_rlhf_ja-v1.1 LLM-jp-13b-instruct-full-dolly_en-dolly_ja-ichikara_003_001-oasst_en-oasst_ja-v1.1 LLM-jp-13b-instruct-lora-dolly_en-dolly_ja-ichikara_003_001-oass

                                                • ソフトバンク、3500億パラメーターの国産LLM構築へ 「国内最大級」生成AI計算基盤、稼働スタート

                                                  ソフトバンクは10月31日、「国内最大級」(同社)の生成AI開発用計算基盤の稼働を始めたと発表した。新設したAI子会社「SB Intuitions」とともに活用し、2024年内に3500億パラメーターの国産LLMの構築を目指す。大学や研究機関、企業などに提供する計画もあるという。 計算基盤は、AI向けスーパーコンピュータ「NVIDIA DGX SuperPOD」と、AIソフトウェアスイート「NVIDIA AI Enterprise」、NVIDIAのネットワーキングで構成された大規模クラスタで、「国内最大級の計算基盤」という。伊藤忠テクノソリューションズの協力を得て構築を進めた。 「ソフトバンクが日本語のデータセットを活用した高品質な国産LLMを開発することで、日本の商習慣や文化に適した生成AIサービスの提供を実現する」としている。 まずソフトバンクとSB Intuitionsで段階的に利用

                                                    ソフトバンク、3500億パラメーターの国産LLM構築へ 「国内最大級」生成AI計算基盤、稼働スタート
                                                  • 国立情報学研究所における大規模言語モデル構築への協力について|国立国会図書館―National Diet Library

                                                    2024年1月29日、国立国会図書館は、国立国会図書館インターネット資料収集保存事業(WARP)において収集保存した数十億件のファイルのURLリストを提供することについて、国立情報学研究所(NII)と合意しました。 提供したURLリストは、NIIにおける大規模言語モデル(LLM)の構築を目的として、主にコーパス用データを収集するために利用される予定です。LLMの詳細については、NIIの「LLM勉強会」をご参照ください。 本件は、当館とNIIの間で締結した「国立国会図書館及び学術情報センターの相互協力に関する協定」(平成7(1995)年4月19日)に基づく協力の一つです。

                                                    • ライトノベルの歴史における遡及範囲の検討と、ゼロ年代ライトノベルの定義についての持論 - ハテナのごとく!

                                                      はてなブログ用の前書き (必読) はじめに 概要 背景 ライトノベルが未だ未定義な3つの理由 1.先行研究の少なさと、そこに見る未定義の許容 2.SFもまた未定義である 3.越境するライトノベル アプローチ 先行研究 東浩紀が与えた「消費」の概念 「動物化」とは何か 「データベース消費」が示すサブカルチャーの変遷 「シミュラークル」により坩堝と化すサブカルチャー 『デ・ジ・キャラット』に見る「萌え要素」の消費 児童文学とライトノベル ライトノベルの起源はどこまで遡れるのか? ライトノベルの「現実逃避」に至る物的証拠 子供の人権意識から見る、ヤングアダルトの産声と背景 子供の「解放」としての児童文学 児童文学との比較に見るライトノベルの定義 従来のライトノベルの定義の問題点 ライトノベルをあえてベタに読む意味 スノビズムがライトノベルにもたらしたもの おわりに 脚注・出典 はてなブログ用の前

                                                        ライトノベルの歴史における遡及範囲の検討と、ゼロ年代ライトノベルの定義についての持論 - ハテナのごとく!
                                                      • 藤田嗣治は蛍光発光が異なる3種の「白」を使い分けていた - 再評価につながる発見

                                                        国立情報学研究所(NII)とポーラ美術館の両者は11月27日、藤田嗣治(レオナール・フジタ)の絵画『ベッドの上の裸婦と犬』(1921年、ポーラ美術館蔵)に、異なる発光色(蛍光)を持つ白い顔料を発見したことを発表。フジタが1920年代当時の芸術鑑賞のスタイルである紫外線が含まれる自然光の下において、複数の白色顔料の蛍光発光を用いて肌質感を再現しようとしていたことが考えられると共同で報告した。 フジタの絵画における蛍光発光(出所:共同プレスリリースPDF) 同成果は、NII、ポーラ美術館、東京藝術大学、東京大学、京都大学、三木学氏らの共同研究チームによるもの。今回の研究の内容については、12月13日よりポーラ美術館において実作品(フジタの師匠の師匠にあたるラファエル・コランの作品を除く)と共に紹介される予定だ。 フジタは、1920年代に「乳白色の肌」「乳白色の下地」と称された肌質感を再現するよ

                                                          藤田嗣治は蛍光発光が異なる3種の「白」を使い分けていた - 再評価につながる発見
                                                        • 130億パラメータの大規模言語モデル「LLM-jp-13B」を構築~NII主宰LLM勉強会(LLM-jp)の初期の成果をアカデミアや産業界の研究開発に資するために公開~ - 国立情報学研究所 / National Institute of Informatics

                                                          2023/10/20 130億パラメータの大規模言語モデル「LLM-jp-13B」を構築 ~NII主宰LLM勉強会(LLM-jp)の初期の成果をアカデミアや産業界の研究開発に資するために公開~ 大学共同利用機関法人 情報・システム研究機構 国立情報学研究所(NIIエヌアイアイ、所長:黒橋 禎夫、東京都千代田区)は、本年5月から、自然言語処理及び計算機システムの研究者を中心として、大学・企業等から500名以上が参加するLLM勉強会(LLM-jp)を主宰しています。7月から、計算資源としてデータ活用社会創成プラットフォームmdx*1を活用し、パラメータ数*2130億の大規模言語モデル(LLM)の構築を開始しました。このたび、同LLMの事前学習及びチューニングが終了し、モデルを公開しましたので、お知らせします。 同モデルはLLM研究開発としては初期段階のものであり、モデルの性能を示す評価値はこれ

                                                            130億パラメータの大規模言語モデル「LLM-jp-13B」を構築~NII主宰LLM勉強会(LLM-jp)の初期の成果をアカデミアや産業界の研究開発に資するために公開~ - 国立情報学研究所 / National Institute of Informatics
                                                          • 第6回 LLM 勉強会

                                                            2023年11月29日(水)に国立情報学研究所にて第6回 LLM 勉強会を開催しました。 プログラム LLM-jp 状況報告(黒橋) [資料] LLMの安全対策サーベイと日本語データ(理研AIP 鈴木久美) [資料] ビジネスのドメインや最新情報に対応した130億パラメータの日本語事前学習モデルの開発(ストックマーク 近江) [資料] 医療における大規模言語モデルの可能性と進歩(東大 小寺) [資料] コーパス構築WG(河原) [資料] モデル構築WG(鈴木) [資料] 評価・チューニングWG(宮尾) [資料] 安全性WG(関根) [資料] 参加者 現地26名・オンライン150名程度

                                                            • 電波が悪い時のGoogleマップがさすがに雑すぎて笑うしかない「ちょっと可愛いのやめてほしいw」

                                                              リンク bunka.nii.ac.jp 日本図 文化遺産オンライン イタリア・トレント出身の宣教師マルティーニがつくった日本図であり、ブラウ編『新中国地図帳』(1655年、アムステルダム)に収められた。<BR />日本列島は南西から北東にかけて、比較的正しい方向に伸びている。東北地方の海岸線も、それまでの...

                                                                電波が悪い時のGoogleマップがさすがに雑すぎて笑うしかない「ちょっと可愛いのやめてほしいw」
                                                              • 肉を超硬水で煮て食べよう(超硬水)

                                                                dragoner @dragoner_JP 「硬水で煮込んだ肉は旨味の抜けたパサパサの肉になる」「肉のアクは9割は旨味」というツイートがバズっているのを見たんですが、同志社女子大学の研究によると、アクの75%は脂質で、硬度50より硬度300の水で煮込む方が柔らかく味が良い結果出てるんすよね dwcla.repo.nii.ac.jp/record/1961/fi… pic.twitter.com/FZVg156ZNp

                                                                  肉を超硬水で煮て食べよう(超硬水)
                                                                • v1.1 チューニング済みモデル・データ公開

                                                                  目次 はじめに LLM-jp-13B とは インストラクションチューニング データセット 入力プロンプト 比較実験の設定 ハイパーパラメータ 学習 評価 DPO データセット 入力プロンプト ハイパーパラメータ 学習 評価 おわりに はじめに 京都大学 言語メディア研究室の児玉(個人ページ,X アカウント)です. LLM-jp では 2023年10月20日に LLM-jp-13B v1.0 を公開しました. 当時事前学習済みモデルとチューニング済みモデルの両方を公開しましたが,チューニング済みモデルについては時間上の制約もあり,十分に性能を高めることができていませんでした. 今回はインストラクションチューニングの設定の見直しや DPO (Direct Preference Optimization) の追加によって,性能を改善したチューニング済みモデル v1.1 とその際に使用したデータと

                                                                  • 日本語学術論文の即時オープンアクセス実現に向けて | Jxiv, JSTプレプリントサーバ

                                                                    ##article.authors## 横山, 詔一 国立国語研究所,研究系 石川, 慎一郎 神戸大学大学教育推進機構/国際文化学研究科/数理・データサイエンスセンター 井田, 浩之 城西大学,経営学部 相澤, 正夫 国立国語研究所,研究系 DOI: https://doi.org/10.51094/jxiv.720 キーワード: オープンアクセス、 オープンサイエンス、 日本語学術論文、 権利保持戦略 抄録 内閣府より,2025 年度以降の新規に公募する競争的研究費について,研究成果の即時オープンアクセス(OA)義務化の方針が示されている。それを前提に,本稿では,とくに日本語学術論文のOAをめぐる現状を整理し,日本語学術論文の執筆者がとるべき対応や留意点について考察を行う。本稿は7つの節からなる。まず,第1節では問題の背景を示し,第2節では関連する論考や資料を紹介する。次に,第3節では即

                                                                    • プレスリリース:JUSTICEとエルゼビア 日本のオープンアクセスを拡大する転換契約提案に合意 | 大学図書館コンソーシアム連合:JUSTICE

                                                                      JUSTICEは、日本の大学等から生み出される研究成果が「購読料の壁」(pay wall)を越えて広く国内外からアクセスされることを目指し、OA2020ロードマップやオープンアクセス出版モデル実現に向けた交渉方針に基づき、オープンアクセスの拡大に取り組んでいます。 このたび、JUSTICEとエルゼビアは、日本のオープンアクセス出版を促進するパイロット提案に合意しました。今回の合意により、日本の研究成果のビジビリティの向上や、オープンサイエンスの進展に寄与することが期待されます。 エルゼビアとの協議にはJUSTICE会員館から57大学が交渉チームとして参画しました。また、本提案には交渉参画大学を含む140大学が関心を表明しています。 JUSTICEはこのパイロットの実践を通じて、今後もオープンアクセスの推進に取り組んで参ります。 ※この提案に関心を表明したすべての大学が直ちに契約するものでは

                                                                      • 「NACSIS-CAT・NCR2018適用はじまる : コーディングマニュアル・目録情報の基準改訂説明会」の開催について | 目録所在情報サービス

                                                                        2024/08/22 これからの学術情報システム構築検討委員会では、日本目録規則2018年版(NCR2018)に対応した「コーディングマニュアル」および「目録情報の基準第6版」の改訂版を確定しました。 皆様のご参加をお待ちしています。 10月31日(木)からの新NACSIS-CAT/ILLへの改訂版の適用を前に、以下の要領で説明会を開催します。 ●タイトル NACSIS-CAT・NCR2018適用はじまる : コーディングマニュアル・目録情報の基準改訂説明会 開催方式 ●ハイブリッド方式(会場開催およびオンライン開催) ●日時 2024年9月13日(金)13:00-15:45(オンライン開催) 2024年9月13日(金)13:00-17:00(会場開催) ●会場 国立情報学研究所12階会議室 ●詳細・参加申込方法 説明会のページは以下のURLになります。会場参加には事前の参加申込が必要で、

                                                                        • <(安田賞) 受賞論文>平成ギャルの持つマインドが現代女性たちに及ぼす影響の検討 : 昭和レトロおよび平成レトロ流行の背景の検討とともに

                                                                          <(安田賞) 受賞論文>平成ギャルの持つマインドが現代女性たちに及ぼす影響の検討 : 昭和レトロおよび平成レトロ流行の背景の検討とともに

                                                                          • 動き出した「日の丸LLM」プロジェクトの"中身"――日本学術会議の講演から探る

                                                                            「ChatGPT」に代表される生成AIの基盤技術である大規模言語モデル(以下、LLM)の開発競争に注目が集まっている。現状では、ChatGPTを開発したOpenAIやGoogleなどの海外企業が先行しているが、日本でも日本語処理を重視したLLMを開発する動きが本格化してきた。 日本学術会議が日本情報学研究所(以下、NII)との共催で2023年9月14日に開催した公開シンポジウムで、その代表的な動きが明らかになった。今回はその内容を取り上げ、「日の丸LLM」の可能性を探る。 「日の丸LLM」研究開発プロジェクトは何を目指すのか 「生成AIの課題と今後」と題して開かれたそのシンポジウムから、NII所長の黒橋禎夫氏(日本学術会議連携会員、京都大学特定教授)による「大規模言語モデルを研究する基盤:LLM-jp」と題した講演内容のエッセンスを以下に紹介する。

                                                                              動き出した「日の丸LLM」プロジェクトの"中身"――日本学術会議の講演から探る
                                                                            • 2023年度大学図書館職員短期研修の参加メモ : 2日目(10月18日(水)) - 猫に夢研究所

                                                                              目次 参加メモの前提 はじめに 東京大学総合図書館見学 | 9:30-11:00 | 90分 電子コンテンツ導入・提供の現状と課題 / 井口 幸(法政大学図書館事務部多摩事務課長) | 11:15-12:30 | 75分(うち質疑15分) 学術コミュニケーションの動向 / 岩井 雅史(信州大学附属図書館副課長/情報システム・学術資料(雑誌)グループリーダー) | 13:30-14:45 | 75分(うち質疑15分) グループ討議 | 14:55-17:30 | 155分 関連記事 関連リンク 参加メモの前提 全体のバランスや文脈は考慮せず、自分が興味・関心を持ったところを中心にまとめています。 敬称略。 はじめに 机と椅子を1日目終了後に講義形式に並べ替え、受講者番号順に座るようになりました。 9時過ぎから研修が始まるまでの時間で、ある程度人数が集まってから、この研修のメーリングリスト(G

                                                                                2023年度大学図書館職員短期研修の参加メモ : 2日目(10月18日(水)) - 猫に夢研究所
                                                                              • 15H01922 研究成果報告書

                                                                                u u u u u u v u u v u u v u x y x y v u u v r u v u u v u u u u u v s u u v u u u v u u u v u v u u v u u v u v r HB 7E ()) :E5 u9H 0 uFa bRe J ZR _ JRYY%ORV T N FNSR e V 9a R v u HB 7E u :E5 u Fa bRe J ZR _ JRYY%ORV T N FNSR e V 9a R v u u v s u u v u u u v Fa bRe J ZR _ JRYY%ORV T N FNSR e V 9a R z u9H v u9H :E5 u v r v u u u u u u v w u u u u u v s u x y v w u x u y u u v t u )0 /- ,,0 u (). )(

                                                                                • 即時オープンアクセス義務化への反応 - やわらか図書館学

                                                                                  明日からオープンアクセスウィークというこのタイミンで折よく(?)、即時OA義務化の報道がなされました。 nordot.app Xを見てると、研究者と思われる方々が多くの反応をされていまして、とても参考になりましたので、togetterでざっくりとですが、まとめてみました。 togetter.com はてブのコメントも参考になります。 b.hatena.ne.jp b.hatena.ne.jp 皆様の反応を概観しての寸感としては、 研究者の方々にとって、オープンアクセスの手段は、 Gold OA >>>>>>>>>>>>>プレプリントサーバー>>>>>>>>>>>>>>>Green OA という感じなのだなということが再認識できました。 懸念として挙げられている、APCの件や、人文系の研究成果のことなど、全てごもっともで、そうしたことがきちんと考慮された指針が出るといいなぁと思いました。 個

                                                                                    即時オープンアクセス義務化への反応 - やわらか図書館学