タグ

ブックマーク / www.nii.ac.jp (34)

  • 「日本の判例HTMLデータ」提供開始のお知らせ - 国立情報学研究所 / National Institute of Informatics

    国立情報学研究所 情報学研究データリポジトリ(IDR)では、「研究者等提供データセット」として、情報・システム研究機構 データサイエンス共同利用基盤施設 人工知能法学研究支援センターより受け入れた「日の判例HTMLデータ」の提供を開始しました。 データセットは、最高裁判所が公開している判例集のPDFデータをテキスト化(HTMLデータ化)したものです。 最高裁判所のサイトで検索可能な最高裁判所判例集、高等裁判所判例集、下級裁判所裁判例速報、行政事件裁判例集、労働事件裁判例集、知的財産裁判例集のPDFデータをHTML化しており、2024年1月11日時点で検索可能であった1947年~2023年までの約65,000件の判例データからなります。 HTMLデータでは、文内容に無関係な部分を除去し、小見出し、箇条書き、段落などの構造を認識して、それぞれに応じたタグを付与しています。 データは情報学

    「日本の判例HTMLデータ」提供開始のお知らせ - 国立情報学研究所 / National Institute of Informatics
    yuiseki
    yuiseki 2024/08/22
  • 情報学研究データリポジトリ 日本の判例HTMLデータ

    国立情報学研究所が研究者提供データセットとして情報・システム研究機構 データサイエンス共同利用基盤施設 人工知能法学研究支援センターから受け入れたデータセットです。 2024/08/20 作成 データ概要 人工知能法学研究支援センターにて,最高裁判所が公開している判例集のPDFデータをテキスト化(HTML化)したデータセットです。 最高裁判所のサイトで検索可能な最高裁判所判例集,高等裁判所判例集,下級裁判所裁判例速報,行政事件裁判例集,労働事件裁判例集,知的財産裁判例集のPDFデータをテキスト化したもので,2024年1月11日時点で検索可能であった1947年~2023年までの65,198件の判例データからなります。 HTMLデータでは,文内容に無関係な部分を除去し,小見出し,箇条書き,段落などの構造を認識して,それぞれに応じたタグを付与しています。(ただし各処理は自動処理をしたままのもの

  • アニメ「リトルウィッチアカデミア」の絵コンテ等を研究に活用へ~TRIGGER制作のアニメ作品素材データをアカデミア研究者向けに提供開始~ - 国立情報学研究所 / National Institute of Informatics

    2022/03/15 アニメ「リトルウィッチアカデミア」の絵コンテ等を研究に活用へ ~TRIGGER制作のアニメ作品素材データをアカデミア研究者向けに提供開始~ アニメーションスタジオTRIGGER(社:東京都杉並区、代表取締役:大塚 雅彦、以下 TRIGGER)と大学共同利用機関法人 情報・システム研究機構 国立情報学研究所(所長:喜連川 優、東京都千代田区、以下 NII)は研究コミュニティへの研究用データの提供で提携し、劇場アニメ作品「リトルウィッチアカデミア」の絵コンテ等のアニメ素材データを「トリガーデータセット」(図1)として3月15日(火)から提供を開始しました。実際に劇場公開された商業アニメ作品の素材データを学術研究に提供することで、画像自動生成技術の開発や制作進行の効率化など、アニメーション技術に関する学術的研究の促進に貢献します。 このトリガーデータセットは、NIIのデー

    アニメ「リトルウィッチアカデミア」の絵コンテ等を研究に活用へ~TRIGGER制作のアニメ作品素材データをアカデミア研究者向けに提供開始~ - 国立情報学研究所 / National Institute of Informatics
    yuiseki
    yuiseki 2024/05/22
  • 情報学研究データリポジトリ トリガーデータセット

    国立情報学研究所が株式会社トリガーから提供を受けて研究者に提供しているデータセットです。 2022/08/17 更新 データ概要 アニメ作品素材データ 文化庁若手アニメーター育成プロジェクト『アニメミライ2013』の参加作品として劇場公開されたアニメーション作品『リトルウィッチアカデミア』の制作で使用した素材一式をデジタル化したデータです。 具体的には以下のスキャン画像データが含まれています。(動画データの提供はありません) シナリオ 絵コンテ(197ファイル) 美術(392ファイル) 設定(89ファイル) 色彩(67ファイル) カット袋・タイムシート・レイアウト・原画(383カット分) 仕上げ(397カット分) スキャン画像はTIFF形式やTGA形式で,サイズはデータセット全体で約550GBとなります。(画像ファイルの取り扱いにあたって必要となる編集ソフトウェアは各自ご準備ください)

    yuiseki
    yuiseki 2024/05/22
  • 130億パラメータの大規模言語モデル「LLM-jp-13B」を構築~NII主宰LLM勉強会(LLM-jp)の初期の成果をアカデミアや産業界の研究開発に資するために公開~ - 国立情報学研究所 / National Institute of Informatics

    2023/10/20 130億パラメータの大規模言語モデル「LLM-jp-13B」を構築 ~NII主宰LLM勉強会(LLM-jp)の初期の成果をアカデミアや産業界の研究開発に資するために公開~ 大学共同利用機関法人 情報・システム研究機構 国立情報学研究所(NIIエヌアイアイ、所長:黒橋 禎夫、東京都千代田区)は、年5月から、自然言語処理及び計算機システムの研究者を中心として、大学・企業等から500名以上が参加するLLM勉強会(LLM-jp)を主宰しています。7月から、計算資源としてデータ活用社会創成プラットフォームmdx*1を活用し、パラメータ数*2130億の大規模言語モデル(LLM)の構築を開始しました。このたび、同LLMの事前学習及びチューニングが終了し、モデルを公開しましたので、お知らせします。 同モデルはLLM研究開発としては初期段階のものであり、モデルの性能を示す評価値はこれ

    130億パラメータの大規模言語モデル「LLM-jp-13B」を構築~NII主宰LLM勉強会(LLM-jp)の初期の成果をアカデミアや産業界の研究開発に資するために公開~ - 国立情報学研究所 / National Institute of Informatics
  • 歴史的地名の「行政区画変遷」を大規模オープンデータ化~『日本歴史地名大系』を平凡社地図出版との協働により機械可読データとして強化~ - 国立情報学研究所 / National Institute of Informatics

    2023/10/18 歴史的地名の「行政区画変遷」を大規模オープンデータ化 ~『日歴史地名大系』を平凡社地図出版との協働により機械可読データとして強化~ 情報・システム研究機構 データサイエンス共同利用基盤施設 人文学オープンデータ共同利用センター(以下ROIS-DS CODH、センター長 北朝展)と株式会社平凡社地図出版(代表取締役 西田裕一)は、『日歴史地名大系』の機械可読データ化に向けた協働を推進し、このたび歴史的地名の「行政区画変遷」に関する大規模オープンデータを公開しました。 『日歴史地名大系』(用語解説1)とは、全国の歴史研究者の協力を得て地名研究・地域史研究の全成果を結集し、株式会社平凡社が25年(1979年~2004年)をかけて出版した50巻51冊の地名辞典です。この地名辞典の編集にかつて関わった人々の全面的な協力を得て、地名辞典の内容の更新や位置情報(緯度経度)の

    歴史的地名の「行政区画変遷」を大規模オープンデータ化~『日本歴史地名大系』を平凡社地図出版との協働により機械可読データとして強化~ - 国立情報学研究所 / National Institute of Informatics
  • 情報学研究データリポジトリ 地球の歩き方旅行記データセット

    株式会社地球の歩き方が国立情報学研究所を通じて研究者に提供しているデータセットです。 2022/11/24 作成 データ概要 投稿旅行記データ 株式会社地球の歩き方が運営するウェブサイト「地球の歩き方web」に投稿された旅行記のテキストデータです。 上記ウェブサイトで2022年3月まで提供されていた旅行記投稿サービス「旅スケ」に,サービス開始の2007年11月から2022年2月までに投稿された,自由記述の旅行記約14,000件とそれに紐づく旅スケジュール約9,500件のテキストで,投稿者の情報や写真データは含まれません。 旅行記テキストについては,奈良先端科学技術大学院大学 大内啓樹助教が研究代表者を務めるJSPS科研費基盤研究(B) 22H03648 の研究プロジェクトの協力により,自動解析による形態素情報と固有表現(地名,施設名等)をリストしたデータも併せて提供します。 データはJSO

    yuiseki
    yuiseki 2023/03/06
  • データセット共同利用研究開発センター - 研究 - 国立情報学研究所 / National Institute of Informatics

    過去のDSCセミナー 第16回DSCセミナー "Towards Sleep Apnea Detection with Consumer Electronics and Machine Learning" 講演者:Prof. Thomas Plageman (University of Oslo, Norway) 日時・場所:2019年12月16日(月)17:00-18:00, NII 15階 1512会議室 第15回DSCセミナー "Fake Content, Manipulated Accounts, Chatbots, and KillFies on Social Media" 講演者:Dr. Ponnurangam Kumaraguru (IIIT-Delhi, India) 日時・場所:2019年9月11日(水)10:00-11:00, NII 15階 1512会議室 第14回DS

    データセット共同利用研究開発センター - 研究 - 国立情報学研究所 / National Institute of Informatics
    yuiseki
    yuiseki 2022/09/03
  • 情報学研究データリポジトリ みんなの評判口コミデータセット

    株式会社マイスタースタジオが国立情報学研究所を通じて研究者に提供しているデータセットです。 2022/08/18 作成 データ概要 商品・サービス口コミデータ 株式会社マイスタースタジオが運営する多様な商品・サービスの口コミサイト「みんなの評判ランキング」への投稿データです。 2017年1月16日から2022年7月12日までに投稿された,約4,700の商品・サービスに対する約16万件の口コミデータで,個人情報は含まれていません。具体的なデータ項目は下記の通りです。 商品・サービスデータ:商品ID/商品名/カテゴリ名/サブ評価項目 口コミデータ:口コミID/投稿者名(ニックネーム)/会員登録の有無/投稿日時/商品ID/商品名/口コミタイトル/口コミ文/評価(満足度)/サブ評価/紐づくタグ数/参考になったボタンクリック数/気持ちアイコンID データはCSV形式で,サイズは約145MBです。

    yuiseki
    yuiseki 2022/09/03
  • 約16万件の商品・サービスの口コミデータを学術研究目的に無償で提供開始 - 国立情報学研究所 / National Institute of Informatics

    株式会社マイスタースタジオ(マイスタースタジオ、大阪大阪市、代表取締役社長:妹尾せのお 優ゆう)と情報・システム研究機構 国立情報学研究所(NIIエヌアイアイ、東京都千代田区、所長:喜連川きつれがわ 優まさる)は学術研究分野でのデータ活用促進に向けて提携し、マイスタースタジオが運営する商品・サービスの口コミサイト「みん評」の口コミデータを研究用データセットとして8月18日(木)より無償提供を開始しました。 この「みんなの評判口コミデータセット」は、NIIのデータセット共同利用研究開発センター(センター長:コンテンツ科学研究系教授 大山 敬三)が運営する情報学研究データリポジトリ(IDR)を通じて提供されます。 マイスタースタジオが運営する「みん評」(https://minhyo.jp/)は、多様な商品・サービスを取り上げ、実際にそれらを利用した消費者から口コミを収集しているサイトです。現

    約16万件の商品・サービスの口コミデータを学術研究目的に無償で提供開始 - 国立情報学研究所 / National Institute of Informatics
    yuiseki
    yuiseki 2022/09/03
  • 情報学研究データリポジトリ メルカリデータセット

    株式会社メルカリが国立情報学研究所を通じて研究者に提供しているデータセットです。 2023/09/01 更新 データ概要 フリマ商品データ 株式会社メルカリが運営する,スマートフォン向けフリマアプリ「メルカリ」へ登録されたデータで,個人を特定する情報や非公開情報は含まれません。 具体的なデータの内容は以下の通りです。 アプリ上に公開されている商品データ(出品状態,商品名,商品の説明,販売価格,カテゴリ,商品の状態,サイズ,ブランド,送料の負担,発送の方法,発送元の地域,発送にかかる日数,いいね!の数,コメントの数,出品日時,更新日時) 各商品ページにて公開されているコメントデータ 各商品ページにて公開されている画像データ(対象全商品のサムネイル画像/一週間分のオリジナル画像) 提供中のデータは2020年1月~12月の1年間に出品された商品が対象です。(データは随時更新される予定です) 商品

    yuiseki
    yuiseki 2022/09/01
    100GBのCSV、本当にあったのか……!!!!!!
  • 時間結晶が可能にする、量子の世界の複雑なネットワーク構造を発見−量子コンピュータ上で動く新しいシミュレーションの可能性 - 国立情報学研究所 / National Institute of Informatics

    2020/10/17 時間結晶が可能にする、量子の世界の複雑なネットワーク構造を発見 −量子コンピュータ上で動く新しいシミュレーションの可能性 国立情報学研究所、日電信電話会社(以下NTT)、東京理科大学、大阪大学、JFLI(Japan-France Laboratory of Informatics)は、時間結晶と呼ばれる時間的な結晶状態の中から複雑なネットワーク構造を発見しました。 さまざまな現象の背後にある巨大かつ複雑なネットワーク構造を解析することは、現象を理解する鍵を握っていると考えられますが、その解析には膨大な計算リソースが必要になります。そこで研究では、「時間結晶」というもの(※用語解説参照)と、このネットワーク解明に与るグラフ理論的なアプローチを用いることで、量子系の中に潜む様々な複雑ネットワークとその性質を捉えることに成功しました。今回の研究で明らかになった時間結晶が

    時間結晶が可能にする、量子の世界の複雑なネットワーク構造を発見−量子コンピュータ上で動く新しいシミュレーションの可能性 - 国立情報学研究所 / National Institute of Informatics
    yuiseki
    yuiseki 2021/09/07
  • データダイエットへの協力のお願い:遠隔授業を主催される先生方へ - イベント - 国立情報学研究所 / National Institute of Informatics

    情報通信回線は全国民が共有する有限の資源です。通信量が情報通信回線の限界を超えるとすべての利用者が大きな影響を受けます。1600万人の生徒・学生が、この世界的な災禍の中でも十分な学習ができるように、「データダイエット」に協力しましょう。 オンライン授業は通信量(データ量)が極力小さくなるように工夫しましょう。 空いた通信回線の容量は、初等中等教育や新入生教育等Face-to-Faceが必要となる場合や障がい者への合理的配慮など必須の分野へ使ってもらいましょう。 通信量に配慮した授業の実施・設計手法 先生が話す映像を送信する必要はありません。講義中、自分の顔や書画カメラを動画で常時流しておいたりすると通信量は多くなります。学生のカメラもオンにし続けると通信量が増えます。不要なカメラはオフしましょう。 画面共有による資料提供中心の授業は通信量が大幅に少なくなります。先生が黒板の前で動き回る授業

    データダイエットへの協力のお願い:遠隔授業を主催される先生方へ - イベント - 国立情報学研究所 / National Institute of Informatics
  • 「ロボット研究のこれまでとこれから」第86号 - NII Today / 国立情報学研究所

    Interview ロボット研究のこれまでとこれから 社会に役立つ革新的な研究を生み出すために 人工知能を搭載したロボットと共存する時代は、すぐそこまで来ているのだろうか。ロボット 研究の権威・金出武雄カーネギーメロン大学教授の答えは、間違いなく「イエス」だ。ロボッ トは今後、いったいどのように人間社会と関わっていくのか。1970 年代からロボットの目と なるコンピュータビジョン(画像処理・画像認識)の先駆的研究を行い、1995 年には自動運転車 によるアメリカ大陸横断に成功した金出教授に、ロボット研究の魅力と展望について聞いた。 金出武雄Takeo Kanade カーネギーメロン大学ワイタカー記念全学教授。国立情報学研究所客員教授。理化学研究所革新知能統合研究センター特別顧問。1945年生まれ。1973年、京都大学工学部電子工学科博士課程修了。同大学助教授を

  • NII Today - NIIについて - 国立情報学研究所 / National Institute of Informatics

    「情報学」は私たちが生活する社会をどう変え、未来にどのような価値を生み出すのか。国立情報学研究所(NII)の広報誌「NII Today」は、情報学研究の最先端をみなさまに分かりやすくお伝えします。 NII Today 国立情報学研究所ニュース 国立情報学研究所ニュース 学術情報センターニュース 学術情報センターニュース

    NII Today - NIIについて - 国立情報学研究所 / National Institute of Informatics
    yuiseki
    yuiseki 2018/02/17
  • 情報学研究データリポジトリ LIFULL HOME'Sデータセット

    LIFULL HOME'Sデータセット(旧名称: HOME'Sデータセット) 国立情報学研究所が株式会社LIFULL(旧社名 株式会社ネクスト)から提供を受けて研究者に提供しているデータセットです。 2020/09/07 更新 データ概要 不動産住宅情報サイトLIFULL HOME'Sに掲載されたデータです。 賃貸物件スナップショットデータ(2015年9月時点,賃貸物件データ+画像データ) 全国約533万件についての賃料,面積,立地(市区町村,郵便番号,最寄り駅,徒歩分),築年数,間取り,建物構造,諸設備などのデータと,各物件に対する間取り図や室内写真など約8,300万枚の画像データです。IDはユニーク番号に変換済みで,特定の物件に紐付く属性は含んでおりません。賃貸物件データはTSV形式のファイルで約1.6GBです。画像データは最大横120ピクセル×縦120ピクセルのJPEG形式で,圧縮

    yuiseki
    yuiseki 2017/03/21
  • 大量の不満投稿から作成した不満カテゴリーの辞書データを無償提供開始 2017/02/27 プレスリリース - 国立情報学研究所

    【国立情報学研究所・株式会社不満買取センター 共同発表】 大学共同利用機関法人 情報・システム研究機構 国立情報学研究所(NII、所長:喜連川 優、東京都千代田区)と株式会社不満買取センター(FKC、代表取締役社長:武石直人、東京都新宿区)は研究コミュニティーへの研究用データの提供で新たに提携し、NIIは2月27日より、FKCが運営するサービス「不満買取センター」に投稿された「不満」から作成された「不満カテゴリ辞書データ」の研究コミュニティーへの無償提供を始めました。NIIとFKCは昨年5月から、「不満買取センター」で買い取られた「不満」の投稿と投稿者のデータからなる「不満調査データ」の提供でも提携しており、「不満カテゴリ辞書データ」の提供はこれに続くものとなります。 今回提供するデータは、平成27年(2015年)3月18日から平成28年(2016年)12月1日までの間に投稿された「不満」

    大量の不満投稿から作成した不満カテゴリーの辞書データを無償提供開始 2017/02/27 プレスリリース - 国立情報学研究所
    yuiseki
    yuiseki 2017/02/28
  • 学術情報基盤オープンフォーラム2015

    大学などの学術界では、研究成果や研究データを広く公開し、社会一般からアクセス可能にすることで、より幅の広いアプローチを生み、新たな研究やイノベーションの創出につなげようという「オープンサイエンス」への期待が高まっています。NIIは、大学・研究機関等の学術コミュニティの研究・教育活動に不可欠な学術情報基盤(学術情報ネットワーク、認証基盤、学術コンテンツサービス、クラウド活用支援サービス)の整備・拡充を推進しています。学術情報基盤をより便利で使い易く、さらに安心で安全なものへと発展させていく中でオープンサイエンスにも着目し、年のフォーラムではオープンサイエンスを支援する上で学術情報基盤に求められているものは何か、何を充実すべきかを全国の大学・研究機関の皆様と共に議論していきます。 ※学術情報基盤オープンフォーラム2015は終了いたしました。多数のご参加、誠にありがとうございました。 講演映像

    yuiseki
    yuiseki 2015/04/16
  • 巨視的物体の新たなテレポート方法の開発に成功 - 国立情報学研究所 / National Institute of Informatics

    国立情報学研究所(所長:喜連川 優)とロシア科学アカデミーの研究チームは、可視可能な大きさの物体をテレポートする新たな方法を開発しました。 テレポーテーションは、 ある物体(より正確にいうと物体の量子状態)を、情報を送信せず、1つの場所から別の場所に送る方法です。 原子や光子等の微小な粒子のテレポーテーションは実験でも実現されていますが、それよりも大きな物体のテレポーテーションは困難であることが知られています。今回、研究チームは、巨視的物体においても存在する新たな「もつれ状態」を見つけることにより、これを克服する方法を開発しました。このもつれ状態を使って、何千以上という原子のテレポーテーションが可能であることが証明されました。 詳細はこちら New Journal of Physics誌

    巨視的物体の新たなテレポート方法の開発に成功 - 国立情報学研究所 / National Institute of Informatics
    yuiseki
    yuiseki 2014/07/01
  • 情報学研究データリポジトリ ニコニコ動画コメント等データ 申請

    「ニコニコ動画コメント等データ」申請 申請・ダウンロード手順 「ニコニコ動画コメント等データ」は以下の手順で申請・ダウンロードしてください。 以下の申請フォームに必要事項を入力して下さい。 (株)ドワンゴが定めた「利用規約」及び国立情報学研究所が定めた「ダウンロードサービス規約」を良く読み,同意いただける場合はチェック欄にチェックして下さい。(同意いただけない場合はデータはご利用頂けません。) 入力した内容を確認の上,「送信」ボタンをクリックしてください(別のWebサーバに接続します)。 ダウンロード用のWebページが表示されます。表示に従ってデータをダウンロードして下さい。 注: 入力いただいたデータは統計及びデータを利用した研究業績の収集・整理に利用します。氏名,所属についても,なるべく正式名をご記入下さい。できれば和英両方の記入をお願いします。 また,メールアドレスはデータへのア

    yuiseki
    yuiseki 2013/06/17