並び順

ブックマーク数

期間指定

  • から
  • まで

161 - 200 件 / 219件

新着順 人気順

オープンデータの検索結果161 - 200 件 / 219件

  • 2019年度のオープンデータ・ビッグデータに関する優れた取り組みの表彰 - ニュース | 一般社団法人オープン&ビッグデータ活用・地方創生推進機構

    VLEDの前身であるオープンデータ流通推進コンソーシアム時代から、オープンデータに関する優れた取り組みを、勝手に選んで勝手に表彰する「勝手表彰」を行ってきました。 2013年度から始まり、今年度で7回目を迎えます。毎年、事務局が候補をリストアップし、VLED 利活用・普及委員会の主査・副主査・委員が審査を行い、選定しています。 対象は、当初、オープンデータに関する取り組みとしていましたが、回数を重ねる中で範囲を広げ、オープンデータに限定せず、データ公開・活用に関する取組み、また、データを用いた地方創生への取組みなどを対象としています。 また、昨年度からは、オープンデータに関する取り組み率が100%になった都道府県を「コンプリート賞」として表彰しています。 なお記載している名称、受賞者、概要等については、事務局が選定する際に作成したものです。受賞者に確認後、随時更新させて頂きますので、ご了承

      2019年度のオープンデータ・ビッグデータに関する優れた取り組みの表彰 - ニュース | 一般社団法人オープン&ビッグデータ活用・地方創生推進機構
    • https://open_contents_datasets.gitlab.io/project_home/

      • QMNIST:手書き数字の画像データセット(MNIST改良版)

        図1 QMNISTに含まれる「手書き数字」の例 ※データセットの配布元: 「facebookresearch/qmnist: The QMNIST dataset」。BSDライセンス。 ※出典: Cold Case: The Lost MNIST Digits. Chhavi Yadav, Léon Bottou. arXiv:1905.10498 QMNISTは、MNISTの改良版/再構築版として、NIST Special Database 19から抽出&加工して作られたサブセットである。MNISTの代わりとして、主に画像認識を目的としたディープラーニング/機械学習の研究や初心者向けチュートリアルで使われることが想定される。 中身の画像データやラベルはMNISTデータセット(以下、MNIST)とほぼ同じであるが、 が異なる。 まず6万件に増やした理由については、論文「Cold Case:

          QMNIST:手書き数字の画像データセット(MNIST改良版)
        • 誰でも使える統計オープンデータ

          この度、『誰でも使える統計オープンデータ』の開講にあたり、入門編となる「社会人のためのデータサイエンス入門」を特別開講しております。 本講座では、データ分析の基本的な知識を学ぶことができます。『誰でも使える統計オープンデータ』の受講前に学習していただくことで、より理解が深まるかと思います。この機会に、ぜひご受講ください。 ※『《特別開講》社会人のためのデータサイエンス入門』は、修了証の発行はございません。 講座内容 オープンデータである統計データを活用したデータサイエンスをわかりやすく解説します。 今、様々な意思決定の場で、統計的な思考力によって様々な課題を解決していく能力、すなわち“データサイエンス”力の高い人材が求められている。本コースでは“データサイエンス”力の向上を目指し、事例なども踏まえ、e-Stat(政府統計の総合窓口)、統計GIS(jSTAT MAP)、API機能等を使い、統

            誰でも使える統計オープンデータ
          • Kickstarting AI for Code: Introducing IBM’s Project CodeNet | IBM Research Blog

            Project CodeNet is a large dataset aimed at teaching AI to code. Project CodeNet is a large dataset aimed at teaching AI to code that consists of some 14M code samples, about 500M lines of code, in 55+ different programming languages. "Software is eating the world,” US entrepreneur Marc Andreessen famously wrote in 2011. Fast-forward to today – software is in financial services and healthcare, sma

              Kickstarting AI for Code: Introducing IBM’s Project CodeNet | IBM Research Blog
            • シェアサイクルのオープンデータ、GBFS形式で公開~公共交通オープンデータ協議会 「ドコモ・バイクシェア」「HELLO CYCLING」の場所・利用可能台数

                シェアサイクルのオープンデータ、GBFS形式で公開~公共交通オープンデータ協議会 「ドコモ・バイクシェア」「HELLO CYCLING」の場所・利用可能台数
              • IBM、ソフトウェア開発へのAI活用を促進する大規模データセット「Project CodeNet」を公開

                IBMは2021年5月11日(米国時間)、AIによるコードの理解と変換をサポートする大規模なオープンソースデータセット「Project CodeNet」を公開した。 このデータセットは、50以上のプログラミング言語で作成され、約1400万のコードサンプルで構成されている。コードの行数は総計約5億行に及び、AI向けのソースコードセットとして最大規模だという。C++やC、Java、Pythonのようなモダン言語で書かれたものが多いものの、COBOLやPascal、FORTRANといったレガシー言語によるものも含んでいる。 Project CodeNetの目的は? Project CodeNetは現在のコーディングにおける3つの主なユースケースに対応する。第一に「コード検索」(COBOLなどのレガシー言語を含む、コード間の自動変換)、第二に「コードの類似性」(異なるコード間の重複と類似性を特定す

                  IBM、ソフトウェア開発へのAI活用を促進する大規模データセット「Project CodeNet」を公開
                • オープンアクセスなデータの課題(文献紹介)

                  2022年2月5日付で、医学誌“The Lancet”の399巻10324号に、短報“The challenges of open access data”が掲載されています。著者は英・ケンブリッジ大学のCarol Brayne氏らです。 短報では、アイルランドの研究プロジェクト“The Irish Longitudinal Study on Ageing”(TILDA)内において、TILDAが公開しているデータセットを利用した研究に関する調査が行われ、深刻な課題が特定されたことを紹介しています。 まず、いくつかの文献において、データの特性に対する不十分な理解、または分析におけるサンプリング方法等の不適切さが明らかになったこと等が報告されています。さらにソフトウェアの進歩によって、ハーキング(結果が判明した後に仮説を提示すること)の実践が容易になると述べられています。逆の順序で仮説を設計す

                    オープンアクセスなデータの課題(文献紹介)
                  • Reuters newswire:ロイターのニュース記事のトピック分類データセット

                    連載目次 データセット解説 Reuters newswire classification dataset(ロイターのニュースワイヤー分類データセット。以下、Reuters newswire)は、ニュース配信テキストが「46分野のどのトピックに該当するか」を判定するために使える、テキスト分類/文書分類用データセットである(図1、詳細は後述するがReuters-21578のサブセットとなっている)。 図1 Reuters newswireデータセットの内容例 ※元々のデータセットの配布元: David D. Lewis氏のサイト「Reuters-21578 Text Categorization Test Collection」。また、UCI Machine Learning Repository「Reuters-21578 Text Categorization Collection Da

                      Reuters newswire:ロイターのニュース記事のトピック分類データセット
                    • 交通事故統計情報のオープンデータ|警察庁Webサイト

                      「世界最先端デジタル国家創造宣言・官民データ活用推進基本計画」(令和2年7月17日閣議決定)に基づき、交通事故統計情報のオープンデータを公開しています。 データの概要、ファイル定義書、各種コード表、利用規約をご理解の上、ご活用ください。 なお、公表しているデータは公開時最新のものですが、後日新たな事実が判明した場合等にはデータの修正が行われる場合があります。その際、公開データを修正することはありませんので、別途公表している統計表と相違することがあります。 概要・利用規約 ・交通事故統計データの概要 ・利用規約

                      • Center for Open Science(COS)、Internet Archive(IA)と共同で科学研究プロセスに関連するオープンデータのアーカイブプロジェクトを実施

                          Center for Open Science(COS)、Internet Archive(IA)と共同で科学研究プロセスに関連するオープンデータのアーカイブプロジェクトを実施
                        • FastAPI を活用した オープンデータAPI の作成

                          2021.9.11 Python Charity Talks in Japan 2021.09

                            FastAPI を活用した オープンデータAPI の作成
                          • 熱海土石流から数日で「バーチャル被災地」公表、新しい災害対応が根付く予感

                            ドローンやSNS(交流サイト)などは、災害後の情報の取得・共有に欠かせないツールとなった。2021年7月3日に静岡県熱海市で発生した大規模な土石流でも、被災地の現況把握などに大きく貢献している。こういった災害対応の中でも筆者が特に注目しているのが、静岡県が被災後数日で「バーチャル被災地」となる3次元モデルを構築した点だ。被災前から進めていた地形の3次元モデル化の取り組みと、被災直後に技術者有志が集まってそのモデルを分析したことが奏功した。

                              熱海土石流から数日で「バーチャル被災地」公表、新しい災害対応が根付く予感
                            • 大阪市立図書館、同館のデジタルアーカイブに収録されたオープンデータコンテンツの二次利用条件をCC0ライセンスに変更 | カレントアウェアネス・ポータル

                              2019年10月17日、大阪市立図書館は、大阪市立図書館デジタルアーカイブに収録されたオープンデータコンテンツ(画像・メタデータ)について、同日より、二次利用条件をクリエイティブ・コモンズ・ライセンスのCC BY 4.0からCC0に変更したことを発表しました。 このことにより、出典(クレジット)表示を必須要件とせず、改変や商用利用を含め自由な利用が可能になったことが紹介されています。 デジタルアーカイブ オープンデータコンテンツの利用条件を変更しました(大阪市立図書館, 2019/10/17) https://www.oml.city.osaka.lg.jp/index.php?active_action=journal_view_main_detail&block_id=510&page_id=0&post_id=11038&comment_flag=1 参考: CA1925 - 大阪市

                              • 話題の新型コロナ対策サイト誕生のきっかけは東日本大震災 9年で進化した行政とテクノロジーのコラボ(古田大輔) - エキスパート - Yahoo!ニュース

                                東京都が公開した新型コロナウイルスに関する情報まとめサイトがわかりやすく、しかも、外部との連携にもオープンで使いやすいと評判です。台湾のIT担当大臣が機能向上に協力したことも話題になりました。 テクノロジーを活用して誰でも協力できるこういった取り組みは、突然始まったわけではありません。きっかけは、2011年3月11日でした。 「オープンガバメント」を体現したサイト政府や地方自治体など様々な機関が持つデータを外部にも使える形で公開する「オープンデータ」、そうやって開かれた政府や行政をつくっていく「オープンガバメント」。 東京都の新型コロナウイルス感染症対策サイトは、そういった考えを体現したサイトと言えます。 (新型コロナウイルス感染症対策サイトより) コロナウイルスの陽性患者数の変化やその属性などをオープンデータへのリンクとともにまとめる。しかも、わかりやすくチャートで表示するそのソースコー

                                  話題の新型コロナ対策サイト誕生のきっかけは東日本大震災 9年で進化した行政とテクノロジーのコラボ(古田大輔) - エキスパート - Yahoo!ニュース
                                • GitHub - ndl-lab/pdmocrdataset-part1: デジタル化資料OCRテキスト化事業において作成されたOCR学習用データセット

                                  You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                    GitHub - ndl-lab/pdmocrdataset-part1: デジタル化資料OCRテキスト化事業において作成されたOCR学習用データセット
                                  • Use Case | 3D都市モデルを活用したソリューション開発の事例紹介 | PLATEAU [プラトー]

                                    Field防災・防犯環境・エネルギーモビリティ・ロボティクスその他モニタリング洪水エリアマネジメント衛星市民参加インフラ管理開発許可地震土砂災害交通ID連携都市計画・まちづくり自動運転地域活性化・観光データ作成 Tags可視化OpenFOAMCesiumJSシミュレーションCFDデジタルツインGISThree.jsUnreal EngineUnityAR/VRVPSROSArcGISダッシュボードPostGISAIIoTQGISPyTorchOpenCVゲーミフィケーションReactドローンTerriaJS人流データSLAMROS2BlenderジオコーディングLinked Open DataRDFARCoreOmniverseUE4CesiumForUnrealAR.jsBabylon.js

                                      Use Case | 3D都市モデルを活用したソリューション開発の事例紹介 | PLATEAU [プラトー]
                                    • 無償で利用できる「約16万件の口コミデータ」 マイスタースタジオとNIIが提供

                                      情報・システム研究機構国立情報学研究所(NII)は2022年8月18日に、マイスタースタジオが運営する口コミサイト「みん評」の口コミデータ「みんなの評判口コミデータセット」を研究用データセットとして無償提供すると発表した。 マイスタースタジオとNIIは、同日に「学術研究分野向けのデータ提供」で提携しており、今回のデータ提供はその活動の一環となる。データは、NIIのデータセット共同利用研究開発センターが運営する情報学研究データリポジトリを通じて提供される。 約16万件の口コミデータを利用可能 みん評は、多様な商品やサービスを取り上げ、実際にそれらを利用した消費者による口コミを収集しているサイト。4000を超える商品やサービスの口コミが約22万件投稿されている。今回提供されるデータセットは、2017年1月16日~2022年7月12日にみん評に投稿された約4700の商品やサービスに対する約16万

                                        無償で利用できる「約16万件の口コミデータ」 マイスタースタジオとNIIが提供
                                      • 表面欠陥の大規模データセットが登場 機械の自動検査に期待あり【AI×製造】(論文) | AIDB

                                        非効率な工作機械の欠陥検出 産業界の物体分類問題は、深層学習の登場以降注目を集めています。しかし、多くの分野では深層学習を適用させるためのデータセットがまだまだ不足しています。 産業界における分類タスクの1つに、工作機械の部品の表面検査があります。予期しない機械の故障を防ぐことができるため、この検査を高精度・低コストで行うことは非常に関心が高まっています。 工作機械の部品の欠陥検出における課題に対して、どのような研究が行われているのでしょうか。 ドイツにあるカールスルーエ工科大学のTobias Schlagenhaufらの研究を紹介します。 研究者らは、表面の異常検出を行うシステムの開発のための有効なデータセットを作成しました。 ▼論文情報 タイトル:Industrial Machine Tool Component Surface Defect Dataset 著者:Tobias Sch

                                          表面欠陥の大規模データセットが登場 機械の自動検査に期待あり【AI×製造】(論文) | AIDB
                                        • E2234 – 「データ引用原則の共同宣言」:データ引用を学術界の慣習に

                                          「データ引用原則の共同宣言」:データ引用を学術界の慣習に 文教大学文学部・池内有為(いけうちうい) クラリベイト・アナリティクス・ジャパン株式会社・野村紀匡(のむらのりまさ) 名古屋大学宇宙地球環境研究所・能勢正仁(のせまさひと) 2020年1月,筆者らが所属する研究データ利活用協議会(Research Data Utilization Forum:RDUF;E1831参照)のリサーチデータサイテーション小委員会は,国際組織FORCE11(The Future of Research Communications and e-Scholarship)による「データ引用原則の共同宣言(Joint Declaration of Data Citation Principles:JDDCP)」の日本語訳を公開した。FORCE11は研究データの流通や利活用を推進する活動を行っており,2014年に公

                                            E2234 – 「データ引用原則の共同宣言」:データ引用を学術界の慣習に
                                          • 第2回「図書館」(仮称)リ・デザイン会議を開催します!(5/16)

                                            タイムスケジュール(予定) 14:00~14:05 オープニングトーク14:05〜15:00 第1部:全体セッション15:00~16:30 第2部:セッション116:30~18:00 第2部:セッション218:00〜18:10 クロージングトーク18:40〜     アフターパーティ セッション内容(第1部) 全体セッション:「図書館」(仮称)を再設計(リ・デザイン)する 三浦なつみ(図書館司書・Library Resource Guide 35号 特集責任編集) 2020年の新型コロナによる図書館休館を契機に、「図書館」(仮称)のリ・デザインは始まりました。 昨年度は11月の第22回図書館総合展フォーラムを中心に、3回のリ・デザイン会議を行いました。また年末にはアドベントカレンダーとして、参加者のいろいろな「図書館観」を発表しました。Library Resource Guide 35号で

                                            • 機械学習の回帰データとしては、ボストン住宅価格データではなく、カリフォルニア住宅価格データを使おう

                                              結論・サンプルコード 回帰のデータセットが欲しい場合、ボストンデータセットではなく、カリフォルニアデータセットを使いましょう。 ソースコード from sklearn.datasets import fetch_california_housing california_housing = fetch_california_housing() train_x = pd.DataFrame(california_housing.data, columns=california_housing.feature_names) train_y = pd.Series(california_housing.target) train_x.head() train_y.head() 結果 0 4.526 1 3.585 2 3.521 3 3.413 4 3.422 背景 ボストン住宅価格データはポリ

                                                機械学習の回帰データとしては、ボストン住宅価格データではなく、カリフォルニア住宅価格データを使おう
                                              • GitHub - robvanvolt/DALLE-datasets: This is a summary of easily available datasets for generalized DALLE-pytorch training.

                                                You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                                  GitHub - robvanvolt/DALLE-datasets: This is a summary of easily available datasets for generalized DALLE-pytorch training.
                                                • Japanese Fake News Dataset | Taichi Murayama

                                                  Overview Fake news has caused significant damage to various fields of society, e.g., economy, politics, and health problems. To counter this problem, various fake news datasets have been constructed. These existing datasets have focused almost exclusively on the factuality aspect of the news. Can we fully understand “fake news” and various events it causes based on these datasets given factuality

                                                    Japanese Fake News Dataset | Taichi Murayama
                                                  • AI研究開発用3Dモーションデータセットを無料で公開 | 株式会社バンダイナムコ研究所

                                                    株式会社バンダイナムコ研究所(以下、バンダイナムコ研究所)は、AI技術(機械学習と深層ニューラルネットワーク分類技術など)の研究開発に使用できる3Dモーションデータセットを、4月28日よりGitHubにて無料公開いたします。 バンダイナムコ研究所では、メタバース及びxR技術など三次元モーションを使用する研究開発を手がけています。現在、ゲームや映像に登場するCGキャラクターは、事前にアクターの方々に演技していただき、その動きをデータ化し再現させるモーションキャプチャ技術や、専門のクリエイターが手作業により制作することがほとんどです。 しかし、今後メタバースをはじめとしたコンテンツの規模が拡大すると、個性的なキャラクターや多彩なモーションが必要不可欠になり、従来の制作過程では限界を迎えることが予想されます。 一方、このようなAIを用いたモーション研究開発は、性別や動作、演技といった様々なパター

                                                    • 言語データセットには多量の重複文が潜んでいる!

                                                      3つの要点 ✔️ 現在のデータセットには、学習データとテストデータに重複がある ✔️ モデルが重複データをそのまま記憶してしまう ✔️ 重複データを削除する事でモデルも良くなる Deduplicating Training Data Makes Language Models Bette written by Katherine Lee, Daphne Ippolito, Andrew Nystrom, Chiyuan Zhang, Douglas Eck, Chris Callison-Burch, Nicholas Carlini (Submitted on 14 Jul 2021) Comments: Published on arxiv. Subjects: Computation and Language (cs.CL); Machine Learning (cs.LG) cod

                                                        言語データセットには多量の重複文が潜んでいる!
                                                      • COCO dataset:セグメンテーションなどに使える大規模なカラー写真の画像データセット

                                                        COCO dataset:セグメンテーションなどに使える大規模なカラー写真の画像データセット:AI・機械学習のデータセット辞典 データセット「COCO」について説明。約33万枚のカラー写真(教師ラベル付きは20万枚以上)の画像データとアノテーション(=教師ラベル)が無料でダウンロードでき、物体検知/セグメンテーションや、キーポイント検出/姿勢推定、キャプション作成などに利用できる。

                                                          COCO dataset:セグメンテーションなどに使える大規模なカラー写真の画像データセット
                                                        • Food-101:料理カラー写真(アップルパイや餃子など)の画像データセット

                                                          連載目次 データセット解説 Food-101データセット(The Food-101 Data Set)(以下、Food-101)は、101種類の「料理カラー写真」(アップルパイや餃子など)の画像データセットである(図1、元データは「foodspotting.com」だが、現在ではサイト自体が存在しないようである)。 class_names = [ 'Apple pie',  # 0:アップルパイ 'Baby back ribs',  # 1:ベビーバックリブ 'Baklava',  # 2:バクラバ 'Beef carpaccio',  # 3:牛肉のカルパッチョ 'Beef tartare',  # 4:牛肉のタルタル 'Beet salad',  # 5:ビートサラダ 'Beignets',  # 6:ベニエ 'Bibimbap',  # 7:ビビンバ 'Bread pudding',

                                                            Food-101:料理カラー写真(アップルパイや餃子など)の画像データセット
                                                          • ソフォスらが2000万件のデータセットを公開、マルウェア検出の機械学習モデル開発目指す

                                                            Sophos AIとReversingLabsがマルウェア検出の機械学習モデル発見につながる2000万のデータセットを公開した。マルウェアに関する、整備済みの大規模なデータセットが広く公開されたことで業界全体でマルウェア検出機能強化につながる可能性がある。

                                                              ソフォスらが2000万件のデータセットを公開、マルウェア検出の機械学習モデル開発目指す
                                                            • ウェザーニュースの花粉データでPythonアプリを作りたい(その1) - 43号線を西へ東へ

                                                              昨年は花粉の当たり年だったようで、初めて花粉症になりました。ヒノキの頃だったと記憶していますが、かなり辛かった記憶があります。花粉症の方はこの辛さを長年経験されていたのですね。頭が下がります。 さて、ウエザーニュースには全国各地の花粉飛散データのダウンロードが行えます。常識の範囲内なら無料で使えるようなので、ログ作りのためにPythonでデータを取り込むコードを作りたいと思います。 本記事は準備編になります。 情報収集 先ほど思い立ったところなので、本日は情報収集をして、まとめておきたいと思います。 公式のリンク先 ポールンロボによる観測・解析:花粉飛散数データの無料ダウンロード CSV形式とAPIの2パターン選べます。 APIの型 そもそもAPIとは何なのでしょうか? API (Application Programming Interface)とは、簡単に言うと「サービスが持つ便利な機

                                                                ウェザーニュースの花粉データでPythonアプリを作りたい(その1) - 43号線を西へ東へ
                                                              • citylines.co

                                                                citylines.co is a collaborative platform for mapping the transit systems of the world!

                                                                  citylines.co
                                                                • OpenAI Data Partnerships

                                                                  Working together to create open-source and private datasets for AI training. We are introducing OpenAI Data Partnerships, where we’ll work together with organizations to produce public and private datasets for training AI models. Modern AI technology learns skills and aspects of our world — of people, our motivations, interactions, and the way we communicate — by making sense of the data on which

                                                                    OpenAI Data Partnerships
                                                                  • DFFT|デジタル庁

                                                                    DFFTとはDFFT(Data Free Flow with Trust:信頼性のある自由なデータ流通)とは、「プライバシーやセキュリティ、知的財産権に関する信頼を確保しながら、ビジネスや社会課題の解決に有益なデータが国境を意識することなく自由に行き来する、国際的に自由なデータ流通の促進を目指す」というコンセプトです。DFFTは、2019年1月にスイス・ジュネーブで開催された世界経済フォーラム年次総会(ダボス会議)にて、安倍総理(当時)が提唱し、2019年6月のG20大阪サミットにおいて各国首脳からの支持を得て、首脳宣言に盛り込まれました。 安倍総理大臣による世界経済フォーラム年次総会演説(外務省) 最近の取組G7 産業・技術・デジタル大臣会合の開催結果 2024年3月14日及び15日に、イタリア・ヴェローナ及びトレントにおいて、G7産業・技術・デジタル大臣会合が開催され、河野デジタル大臣

                                                                      DFFT|デジタル庁
                                                                    • 横浜市IRに関するパブコメのテキスト分析 - Qiita

                                                                      0.はじめに 「広報よこはま」8月号が投函されていたので、早速読む。いつも家計相談で「えっ2人で月の食費が5万円ってたかすぎるの!?」など参考にさせてもらっていて楽しく読んでいた。今月は横浜市IRのパブコメ(今年の4月ころにやっていたんですね)についての記事があったので、見てみると、パブコメが1万件ほど寄せられたとのこと。パブコメにこんなにコメント寄せられることは少ないと思われるので、 生データないかな~と思って見てみるとあった! 生のテキストデータは、誹謗中傷などの情報を加工後に公開されていた。 横浜市は、パブコメの論点を5つほどに分類していたけど、 もっと論点あるんじゃないか、とか、 パブコメをもとに修正した「横浜IR(統合型リゾート)の方向性(案)」にどんな意見が反映されたんだろうか などと思ったので、とりあえず基本的な分析をやってみることに。 1.パブコメまとめ報告書に記載されてい

                                                                        横浜市IRに関するパブコメのテキスト分析 - Qiita
                                                                      • Know Your Data

                                                                        Know Your Data helps researchers, engineers, product teams, and decision makers understand datasets with the goal of improving data quality, and helping mitigate fairness and bias issues.

                                                                          Know Your Data
                                                                        • MRI画像のAI解析などで利用できる「脳画像ビッグデータ」を公開 国際電気通信基礎技術研究所ら研究グループ

                                                                          国際電気通信基礎技術研究所(ATR)と東京大学、日本医療研究開発機構(AMED)は2021年8月30日、複数疾患の脳画像ビッグデータを一般公開したと発表した。多くの施設で統一のプロトコルで撮像した複数精神疾患のfMRI(functional Magnetic Resonance Imaging:機能的磁気共鳴画像)データと、旅行被験者データを合わせてデータベース化したもので、オンラインプラットフォームでダウンロードの申請ができる。 ビッグデータ公開に携わったのは、ATR脳情報通信総合研究所の田中沙織氏(認知機構研究所 数理知能研究室 室長)と、東京大学大学院医学系研究科/東京大学国際高等研究所の笠井清登氏(ニューロインテリジェンス国際研究機構<IRCN> 教授)らの研究グループ。 MRI画像をAIで解析するためのデータとして利用 研究グループによると「AI(人工知能)技術の発展には、オープ

                                                                            MRI画像のAI解析などで利用できる「脳画像ビッグデータ」を公開 国際電気通信基礎技術研究所ら研究グループ
                                                                          • Iris Dataset:あやめ(花びら/がく片の長さと幅の4項目)の表形式データセット

                                                                            Iris Dataset:あやめ(花びら/がく片の長さと幅の4項目)の表形式データセット:AI・機械学習のデータセット辞典 データセット「Iris」について説明。150件のあやめの「表形式データ(花びら/がく片の長さと幅の4項目)」+「ラベル(3種類のあやめの分類)」が無料でダウンロードでき、多クラス分類問題などのディープラーニングや統計学/データサイエンスに利用できる。scikit-learnとTensorFlowにおける利用コードも紹介。

                                                                              Iris Dataset:あやめ(花びら/がく片の長さと幅の4項目)の表形式データセット
                                                                            • オープンデータとは?2つの特徴や活用事例についてわかりやすく解説!

                                                                              2013年、あるIT用語が大きな注目を浴び、流行語大賞にノミネートされました。膨大なデータのことを表す「ビッグデータ」という言葉です。続けて2014年あたりからは「オープンデータ」という言葉にも注目が集まっています。 オープンデータとはどのようなものか、なぜ注目されているのか、その理由と活用事例についてご紹介します。 オープンデータとは名前のとおり「公開されたデータ」のことを示しています。 オープンデータは、主に国や地方公共団体、事業者が公開しているデータで、貯金に関する調査や住まいに関する調査などの生活に関するものや景気動向の調査など、さまざまなデータが公開されています。 オープンデータにはどんな目的がある? 総務省のホームページでは、オープンデータの意義・目的として以下の3つが紹介されています。 国民参加や官民協働の推進を通じた諸課題の解決、経済活性化行政の高度化や効率化透明性や信頼の

                                                                                オープンデータとは?2つの特徴や活用事例についてわかりやすく解説!
                                                                              • 第6回「東京都における都市のデジタルツイン社会実装に向けた検討会」 杉本臨時委員提出資料

                                                                                "I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)

                                                                                  第6回「東京都における都市のデジタルツイン社会実装に向けた検討会」 杉本臨時委員提出資料
                                                                                • Open Buildings

                                                                                  A dataset of building footprints to support social good applications Building footprints are useful for a range of important applications, from population estimation, urban planning and humanitarian response, to environmental and climate science. This large-scale open dataset contains the outlines of buildings derived from high-resolution satellite imagery in order to support these types of uses.

                                                                                    Open Buildings

                                                                                  新着記事