タグ

日本とデータに関するshion214のブックマーク (10)

  • 画像生成AIに照明革命 日本と世界で同時に“神ツール”登場 (1/3)

    この連載ではおなじみのキャラクター「明日来子さん」に右側からライトを当ててみた。左がIC-Lightを適用したもので、右がオリジナル。環境はWebUI Forge用の拡張機能を使用 5月8日に、「ControlNet」など画像生成AI関連の著名研究者であるイリヤスフィール(lllyasviel)さんが発表した「ICライト(Imposing Consistent Light、印象的な一貫的なライト)」が盛り上がりました。入力した画像をもとに、後から指定した照明効果を踏まえた画像を生成する技術です。 画像生成AIで照明効果がつけられる「ICライト(IC-Light)」 発表された学習済みモデルは、「ライトを指定すると、キャラクターのデータに合わせてテキストのプロンプトに合わせて独自に背景を生成するもの」「キャラクターとライトの影響を加味して、別の背景画像と合成するもの」の2種類があります。これ

    画像生成AIに照明革命 日本と世界で同時に“神ツール”登場 (1/3)
  • Microsoft、日本にAIデータセンター 4400億円投資 - 日本経済新聞

    【シリコンバレー=渡辺直樹】米マイクロソフトが日でデータセンターを拡充する。2年間で29億ドル(約4400億円)を投じる。人工知能AI)の開発や運用に適した、大量の演算処理ができる最先端の半導体などを組み込む。日政府でも生成AIの活用が始まるなか、国内で個人データや機密情報を管理できる体制を整える。日への投資額としては過去最大となる。AIがデータを学習し、推論するための計算能力はデータ

    Microsoft、日本にAIデータセンター 4400億円投資 - 日本経済新聞
  • 日本列島の弥生時代と古墳時代のほぼ全ての銅鏡が示された分布図が話題となる→可視化されたことで地域的な差異などが一目瞭然に、分類毎の分布図も公開される

    かぬそぬ @omisoi 🖥Computational Archaeologist,計算考古学者/🎓歴史地理情報処理,Agent-based model,人口動態推定等/🗾歴史GIS Dev github.com/AsPJT/PAX_SAPI… /📷LiDAR/🪦古墳Tomb/🏳️‍⚧️Nonbinary github.com/AsPJT かぬそぬ @omisoi 日列島の弥生時代と古墳時代のほぼ全ての銅鏡の分布図が完成しました〜😆 ほとんどのデータは「日列島出土鏡集成(2016年)」です。盾形銅鏡など2017年以降の出土鏡も一部入れています。 データ内部に遺跡時期や鏡式の情報があるので、条件付きの結果も出すことができます☺️ 大きさの比較も簡単♪ pic.twitter.com/RmYCuzl5cx

    日本列島の弥生時代と古墳時代のほぼ全ての銅鏡が示された分布図が話題となる→可視化されたことで地域的な差異などが一目瞭然に、分類毎の分布図も公開される
  • 東工大など、日本語に強い大規模言語モデル「Swallow」を無償で公開

    東京工業大学(東工大)と産業技術総合研究所(産総研)の両者は12月19日、現在公開されている中で、日語に強い生成AIの基盤である「大規模言語モデル」(LLM)としては最大規模となる「Swallow」を、米・MetaのLLM「Llama 2」の日語能力を拡張することで構築し、Webサイト「TokyoTech-LLM」にて一般公開したこと、またオープンで商用利用も可能なことを共同で発表した。 同成果は、東工大 情報理工学院 情報工学系の岡崎直観教授、同・横田理央教授、産総研の共同研究チームによるもの。今回、東工大は主にデータの語彙拡張によるモデル学習・推論効率の改善に取り組み、産総研はモデル構築に必須である大規模計算資源としてAI橋渡しクラウド(ABCI)を提供すると同時に、主に継続学習によるモデルの日語能力の改善を担当したとしている。 産総研のAI橋渡しクラウド「ABCI」(出所:東工

    東工大など、日本語に強い大規模言語モデル「Swallow」を無償で公開
  • データベース概論Ⅰ | 筑波大学オープンコースウェア|TSUKUBA OCW | 北川博之

    データベースシステムに関する入門。データベースの基概念、データモデリング、リレーショナルデータモデル、データベース言語SQL、リレーショナルデータベース設計論、物理的データ格納法、問合せ処理等について講述する。 (2018年度) 【教科書】 「データベースシステム」(北川博之著、オーム社) 北川 博之筑波大学 計算科学研究センター教授1978年東京大学理学部物理学科卒業。1980年同大学理学系研究科修士課程修了。日電気(株)勤務の後、筑波大学電子・情報工学系講師、同助教授を経て、現在、筑波大学計算科学研究センター教授。理学博士(東京大学)。データベース、データ統合、データマイニング、ストリーム処理、情報検索、ビッグデータ等の研究に従事。著書「データベースシステム」(オーム社)等。日データベース学会会長、ACM SIGMOD日支部委員長等を歴任。情報処理学会フェロー、電子情報通信学会

    データベース概論Ⅰ | 筑波大学オープンコースウェア|TSUKUBA OCW | 北川博之
  • 住所正規化のデモ機能を作ったので、日本のヤバい住所を入力してみた

    はじめに 数か月ほど前、住所の正規化が話題になりました。こちらの記事が特に有名ですね。 関連して、こちらの記事も話題になりました。 当時はほかにも色々な人が日のヤバい住所の例をあげてくれて、とても楽しかったです。 実は弊社でもAddressianという住所正規化サービスを提供しています。初めて目にする変わった住所を見かけたら、とりあえず自社のAPIに投げてみて「おお、正規化できた」「すごい!」などといいながら遊んで働いています。 サービスは無料で利用できますが、今までは利用の手順が面倒でした。 ユーザー登録する APIキーを発行する 住所正規化APIを呼び出すプログラムを用意する(サンプルコードあり) プログラムを実行して住所を正規化する そこで、もっと気軽に住所正規化を試してもらえるように、ユーザー登録しなくても使えるデモ機能を作ってみました。 デモ機能の概要 住所正規化デモ画面 こち

    住所正規化のデモ機能を作ったので、日本のヤバい住所を入力してみた
  • 日本における「名寄せ」と「照合」の黒歴史

    健康保険証、銀行口座、年金記録――個人のマイナンバーに別人の情報がひも付けられるトラブルが後を絶たない。多くの事案に共通するのは、自治体や関係機関の職員が氏名や生年月日などを基にマイナンバーや住民データを照会した際に、誤って同姓同名の人の情報を引き出してひも付けてしまうというケースだ。 こうした情報のひも付けをする際、職員が住民データの照合や突合、人確認に使うのが「氏名」「生年月日」「性別」「住所」、いわゆる基4情報といわれるものだ。 だがこの4情報は、コンピューターによる自動処理とは絶望的に相性が悪い。例えば氏名は「邊」「邉」など旧字・異体字の揺らぎや外字の処理が煩雑なうえ、婚姻による改名もある。よくある氏名の場合、氏名も生年月日も同一というケースが頻発する。住所は時期によって変わるうえ、人によって書き方が「一丁目四番」から「1―4」まで一意ではない。 こうした曖昧な識別符号を代替す

    日本における「名寄せ」と「照合」の黒歴史
  • 国土交通省が「Cities: Skylines」のMOD“SkylinesPLATEAU”を公開。日本の3D都市モデルを反映したマップを作成できる

    国土交通省が「Cities: Skylines」のMOD“SkylinesPLATEAU”を公開。日の3D都市モデルを反映したマップを作成できる ライター:蒼之スギウラ 2023年5月22日,国土交通省主導による“Project PLATEAU”が,Paradox Interactiveの都市建設シム「Cities: Skylines」で利用できるMOD「SkylinesPLATEAU」を,Steamワークショップで公開した。 #PLATEAU GitHubにて、都市育成シミュレーションゲーム"Cities:Skylines"のMOD「SkylinesPLATEAU」を公開しています! 現実の都市データを舞台としたまちづくりシミュレーションを体験することができます。 是非ご活用ください!https://t.co/6E8GEJLNsV pic.twitter.com/AejxaWx5jk—

    国土交通省が「Cities: Skylines」のMOD“SkylinesPLATEAU”を公開。日本の3D都市モデルを反映したマップを作成できる
  • データオーケストレーションツールDagsterの紹介

    データオーケストレーションとは データオーケストレーションという言葉をご存知でしょうか?日ではまだ耳慣れない言葉ですが、data orchestrationでgoogle検索すると実に3000万件以上ヒットし、世界的には十分に市民権を得ている言葉です。Databricksではデータオーケストレーションを以下のように説明しています。 データオーケストレーションとは データオーケストレーションとは、複数のストレージからサイロ化したデータを取り出し、組み合わせて整理し、分析に利用できるようにするための自動化されたプロセスです。 このプロセスでは、レガシーシステム、クラウドベースのツール、データレイクといったあらゆるデータセンターが接続されます。データは標準形式に変換されるため、理解しやすく、容易に意思決定に利用できます。 オーケストレーションとは、コンピュータシステム、アプリケーション、および

    データオーケストレーションツールDagsterの紹介
  • 書名一覧 | 日本古典籍くずし字データセット

    データセットダウンロード くずし字データセット全体をまとめてダウンロードするには、以下のZIPファイルをダウンロードしてください。 くずし字データセットダウンロード: 全体(字形画像除く)(ZIP 4906.06 MB) / 全体(字形画像含む)(ZIP 7354.19 MB) データセット一覧 日古典籍くずし字データセットの書名一覧です。国文研書誌ID(その他のID含む)または書名をクリックすると、日古典籍くずし字データセットの詳細ページに移動します。また2019年11月に公開または更新したデータは、国文研書誌IDの背景を黄色として、見分けやすくしています。

  • 1