並び順

ブックマーク数

期間指定

  • から
  • まで

81 - 120 件 / 1264件

新着順 人気順

学習用の検索結果81 - 120 件 / 1264件

  • 全国1000校超「DXハイスクール」に デジタル教育拠点 - 日本経済新聞

    文部科学省は全国の高校の2〜3割にあたる1000校超をデジタル教育の拠点校となる「DXハイスクール」に指定する方針を固めた。デジタル社会を担う人材を育てる裾野を広げ、トップ層の増加につなげる。全小中学生に配った学習用端末の更新費を含め、小中高のデジタル環境整備に約5年で6千億〜8千億円を投じる方針だ。政府が経済対策に合わせて策定する2023年度補正予算案に関連経費を盛る。複数年にわたって使える

      全国1000校超「DXハイスクール」に デジタル教育拠点 - 日本経済新聞
    • MetaのAIのトレーニングに使われた書籍データセット「Books3」には村上春樹やスティーブン・キングの著作も含まれている

      Metaが開発する大規模言語モデル「LLaMA」などのトレーニングに使用された書籍データセット「Books3」は、知的財産権や著作権に対する侵害の疑いが指摘されています。そんなBooks3に含まれる書籍の内訳やBooks3が抱える問題点について、テクノロジー系ライターのアレックス・リーズナー氏が解説しています。 Erotica, Atwood, and 'For Dummies': The Books Behind Meta’s Generative AI - The Atlantic https://www.theatlantic.com/technology/archive/2023/09/books3-ai-training-meta-copyright-infringement-lawsuit/675411/ These 183,000 Books Are Fueling the

        MetaのAIのトレーニングに使われた書籍データセット「Books3」には村上春樹やスティーブン・キングの著作も含まれている
      • 音声からプログラムを自動的に作るautocodeを作った|shi3z

        なんか吾輩の昔のブログを読みたいという酔狂な奴がいて、何でも最近会社を立ち上げたらしくて売上が1億を超えたところらしい。 他ならぬ友が会社を立ち上げて苦労している時に、吾輩の昔のブログのタイトルだけ覚えていて、それが見たいのだという。 吾輩は主にAI学習用に自分のブログのアーカイブを持っている。 持っているのだがHTML形式のため非常に読みにくい。 そこでHTMLタグ除去コードを書こうと思ったのだが、今からそんなもの書くのは芸がないので、まず音声入力を受け取って、それを音声認識した結果をClaude-3に投げてプログラムとして出力するプログラムを書いてみた。 これのミソは、喋るだけでコードが出来上がることである。 実際に使うとこうなる。 python autocode.py Recording... Recording finished. Special tokens have been

          音声からプログラムを自動的に作るautocodeを作った|shi3z
        • Kaggleで始める機械学習入門 - Qiita

          機械学習を学んで何かをコードを作ってみよう、と思うときにネックになるのが学習用データと実行環境ですよね。何千件もあるデータを用意するのは大変ですし、初学者にとって高価なGPUを購入するのはハードルが高いです。 そこで機械学習のプラットフォームであるKaggleを利用し、チュートリアルでタイタニック生存者予測に取り組んでみます。 Kaggleにユーザ登録する まずKaggleを開き、Registerボタンをクリックします。Googleアカウントでユーザ登録するか、メールからユーザ登録するか、お好きな方でどうぞ。 Kaggleは英語のみですので、DeepLなどで翻訳しながら進めると良いかもしれません。 コンペに参加する ユーザ登録できたら、「Competitions」を開き、おそらく先頭に表示されているであろう「Titanic」を選んでください。次のURLから直接アクセスしてもOK。 http

            Kaggleで始める機械学習入門 - Qiita
          • スーパーコンピュータ「富岳」で学習した大規模言語モデル「Fugaku-LLM」を公開 : 富士通

            PRESS RELEASE 2024年5月10日 東京工業大学 東北大学 富士通株式会社 理化学研究所 名古屋大学 株式会社サイバーエージェント Kotoba Technolgies Inc. スーパーコンピュータ「富岳」で学習した大規模言語モデル「Fugaku-LLM」を公開 日本語能力に長け、研究・ビジネス利用にも期待 要点 日本の計算機技術を用いて開発した日本語能力に優れた大規模言語モデルを公開 スーパーコンピュータ「富岳」の性能を最大限に活用した分散並列学習を実現 AI基盤モデルを科学研究に活用する「AI for Science」など革新的な研究やビジネスにつながる 概要 東京工業大学 学術国際情報センターの横田理央教授の研究チームと東北大学 大学院情報科学研究科の坂口慶祐准教授、富士通株式会社 人工知能研究所の白幡晃一シニアプロジェクトディレクター、理化学研究所 のMohamed

              スーパーコンピュータ「富岳」で学習した大規模言語モデル「Fugaku-LLM」を公開 : 富士通
            • 「AIと著作権に関する考え方について(素案)」の速報解説①|ゲーム・エンタメと法律@弁護士前野

              ※ 本記事で解説している「考え方」は、R6.1.23に更新されています。更新版の解説は以下のnoteをご参照ください。 2023年12月20日、文化審議会著作権分科会法制度小委員会の資料として、文化庁の「AIと著作権に関する考え方について」の素案が示されました(以下「考え方」と表記します)。 2024年3月の取りまとめが予定されており、内容は変更になる可能性がありますが、速報的に内容を抜粋し、ご紹介いたします。 ※ 速報の性質上、内容を適宜更新する場合がありますので、ご了承ください。 「考え方」の構成生成AIと著作権の検討においては「学習・開発段階」と「生成・利用段階」とを、それぞれ分けて考える必要があります。 「考え方」でも、①学習・開発段階、②生成・利用段階に分けて、それぞれ見解が示されています。また、③生成物の著作物性、④その他の論点についての見解も示されています。 なお、分量の都合

                「AIと著作権に関する考え方について(素案)」の速報解説①|ゲーム・エンタメと法律@弁護士前野
              • 米 NYタイムズ 著作権侵害でオープンAIとマイクロソフトを提訴 | NHK

                アメリカの新聞大手、ニューヨーク・タイムズは、記事が許可なくAIの学習用に使われ、著作権を侵害されたとして、生成AIのChatGPTを開発したアメリカのベンチャー企業、オープンAIと、提携するIT大手のマイクロソフトを提訴しました。 今後、メディアのAIへの対応に影響が及ぶのか注目されます。 ニューヨーク・タイムズは27日、著作権を侵害されたとして、生成AIのChatGPTを開発したオープンAIと、オープンAIと提携するIT大手、マイクロソフトをアメリカの裁判所に提訴しました。 訴状などによりますと、記事が許可なくAIの学習用に使われて著作権が侵害され、損害額は数十億ドル、日本円で数千億円にのぼると主張しています。 ニューヨーク・タイムズはことし8月にサービスの利用規約を変更し、AIに記事や写真などを学習させることを原則、禁止していて、アメリカの大手メディアがオープンAIなどのAIの開発企

                  米 NYタイムズ 著作権侵害でオープンAIとマイクロソフトを提訴 | NHK
                • AI歌声ライブラリ「LAUGH DiAMOND (ラフダイヤモンド)」プロジェクト始動!

                  ひょんな事から、とある芸能事務所に入ることになり、 篁 響季、風祭 朝陽、小紫 桃果、山田 花音らは ユニット「LAUGH DiAMOND」を結成することになったが、デビューどころか、自分たちの曲も用意してもらえず目下日々自主練(≒放置)状態の憂き目に遭っている。 あまりにも放置されているため、自分たちで路上ライブを試みるが…。 そしていつの日か、ライブハウスでたくさんの曲で ライブをやることが LAUGH DiAMOND の目標に… そんな彼女たちに、 あなたの曲を歌わせてあげてくれませんか? 「LAUGH DiAMOND」プロジェクトとは? 最新のディープラーニング技術を駆使したAI歌声ライブラリでもあり、 「篁 響季(たかむら・ひびき)」「風祭 朝陽(かざまつり・あさひ)」 「小紫 桃果(こむらさき・ももか)」「山田 花音(やまだ・かのん)」 で結成された夢見るシンガーユニット「LA

                    AI歌声ライブラリ「LAUGH DiAMOND (ラフダイヤモンド)」プロジェクト始動!
                  • カシオ 個人情報12万件余流出 学習用アプリに不正アクセス受け | NHK

                    カシオ計算機は、高校などで利用されている学習用アプリのデータベースに不正アクセスがあり、12万件余りの個人情報が流出したと発表しました。 発表によりますと、流出したのは全国およそ240の小中学校や高校などで使われ、個人でも利用できる学習用アプリ「ClassPad. net」に登録されている国内外の利用者の氏名やメールアドレス、学校名、学年、出席番号など、12万件余りです。 今月11日、アプリのデータベースに障害が発生していることがわかり、解析を進めた結果、情報の流出が判明したということです。 会社によりますと、システムの誤操作などによってセキュリティー設定の一部が解除されていたため、第三者が不正アクセスできる状態となっていて、データベースには、第三者から金銭を要求するメッセージが残されていたということです。 カシオ計算機は「多大なご迷惑とご心配をおかけし深くお詫び申し上げます」とし、データ

                      カシオ 個人情報12万件余流出 学習用アプリに不正アクセス受け | NHK
                    • 日英2言語対応の大規模言語モデルPLaMo-13Bを研究・商用利用可能なオープンソースソフトウェアライセンスで公開 - 株式会社Preferred Networks

                      株式会社Preferred Networks(本社:東京都千代田区、代表取締役 最高経営責任者:西川徹、以下、PFN)は、開発した130億パラメータの事前学習済み大規模言語モデル PLaMo™-13B(Preferred Language Model、プラモ)を、研究・商用で利用可能なオープンソースソフトウェア(OSS)ライセンスで本日公開(https://huggingface.co/pfnet/plamo-13b)しました。本モデルは、現在公開されている同規模のパラメータ数の事前学習済み言語モデルと比べ、大規模言語モデルのベンチマーク評価(lm-evaluation-harness)において、日英2言語をあわせた能力で世界トップレベルの高い性能を示しています。 日英2言語での性能比較 (ベンチマークスコアの偏差値の平均を各言語のスコアとしてプロット) (*) より正しい比較のため、公開

                        日英2言語対応の大規模言語モデルPLaMo-13Bを研究・商用利用可能なオープンソースソフトウェアライセンスで公開 - 株式会社Preferred Networks
                      • 夏の和菓子で植物細胞を再現(デジタルリマスター)

                        1970年群馬県生まれ。工作をしがちなため、各種素材や工具や作品で家が手狭になってきた。一生手狭なんだろう。出したものを片付けないからでもある。性格も雑だ。もう一生こうなんだろう。(動画インタビュー) 前の記事:寝台列車を「見送る」だけの旅(デジタルリマスター) > 個人サイト 妄想工作所 高校では生物選択だった 水菓子にするからには、動物細胞より植物細胞のほうが適している気がする。なんとなく。 ではさっそく、細胞の観察をしてみよう。 学習用の安い顕微鏡がちょうど家にある。雑草からむしってきた葉っぱをプレパラートに載せて、覗いてみた、が。 いつどのタイミングで買ったか思い出せない顕微鏡。 お、細胞!植物細胞!細胞壁! 倍率の上げ方が悪いのか、サンプルの処理の仕方が悪いのか、細胞の内部構造まではよく判らなかった。まあ、判ったところでそれを真似て菓子にするなんてできそうにないけどな。 というわ

                          夏の和菓子で植物細胞を再現(デジタルリマスター)
                        • 【9月16日版】アマゾンで24時間以内に値下がりした売れ筋商品ランキング | 激安!特価・タイムセール・クーポン観測所

                          激安!特価・タイムセール・クーポン観測所 Amazon・楽天・ヤフーショッピング等のタイムセール、限定クーポン、最新のリアルタイム売れ筋ランキングなど、激安&特価で販売中の商品情報を紹介していくブログです。 Amazonで24時間以内に値下げされた商品を売れ筋ランキング順で紹介します。 本記事は、パソコン・周辺機器、家電&カメラカテゴライズされた商品のランキングです。 ⇒その他売れ筋商品情報はブログランキング ランキング第1位 Apple AirPods Pro(第2世代) ​​​​​​​ ホワイト 35313円 (2023年09月16日 20時42分時点の価格) 24時間の価格下落率:5% ランキング第2位 Apple AirTag 4個入り 13164円 (2023年09月16日 20時42分時点の価格) 24時間の価格下落率:7% ランキング第3位 PlayStation VR2(C

                            【9月16日版】アマゾンで24時間以内に値下がりした売れ筋商品ランキング | 激安!特価・タイムセール・クーポン観測所
                          • 生成AIの学習データに児童虐待画像 米大学研究者が指摘 - 日本経済新聞

                            米スタンフォード大の研究者は20日、画像生成AI(人工知能)の学習用データセット「LAION(ライオン)5B」が1000件以上の児童の性的虐待画像を含んでいたと発表した。多くの画像生成AIが同データを使って学習しており、不適切な画像を生成する恐れがあると警告している。ライオン5Bはインターネット上の50億枚以上の画像のURL(アドレス)を集約したデータセットだ。報告書を発表したスタンフォード大

                              生成AIの学習データに児童虐待画像 米大学研究者が指摘 - 日本経済新聞
                            • 鈴木寛「日本の教員はミラクル」、その働きに理解とリスペクトをと話す理由 | 東洋経済education×ICT

                              教員の労働環境などの課題が指摘され、コロナ対応も大変であったにもかかわらず、思考・判断・表現を重視して主体的・対話的で深い学びへの転換を目指した学習指導要領改訂後初めてのPISAで成果を出した日本の学校教員のミラクルな働きには感謝と敬意を表したいと思います。 ──前回、OECD加盟国中最下位だった学校におけるICTの利用状況も改善しました。 「学校でのICTリソースの利用しやすさ」指標はOECD平均を上回り、5位まできました。ただ、学校間や地域間で格差があるのが実情です。ICT利活用が進んでいるのは全国約1700市町村のうちの200程度と見ています。 GIGAスクール構想によって小中学校に配布された学習用端末の更新についても、経済対策で総額2643億円の基金が創設されることになり、ハード面の問題は解決されました。次はソフト面の人の手当てなどです。都市部では、非常勤のICT支援員を集めること

                                鈴木寛「日本の教員はミラクル」、その働きに理解とリスペクトをと話す理由 | 東洋経済education×ICT
                              • 2023年12月20日文化庁「AIと著作権に関する考え方について(素案)」についての考察(1)|知的財産・IT・人工知能・ベンチャービジネスの法律相談なら【STORIA法律事務所】

                                1 はじめに 2023年12月20日に文化審議会著作権分科会法制度小委員会(第5回)が開催され、そこで文化庁が「AIと著作権に関する考え方について(素案)」を公表しました(以下「素案」といいます。) 本記事では、素案のうち、まずは「(1) 学習・開発段階」について、私なりに検討をしたいと思います。 なお、2024年1月15日に文化審議会著作権分科会法制度小委員会(第5回)が開催され、そこでさらにバージョンアップされた素案が公表されますので、本記事はそれまでの暫定的な検討ということになります。 ということで、短命な?記事ですが、早めに公開することにも意味があるだろうと思い、公開します。 以下、素案を適宜分割し、引用した上で当該引用部分についてのコメントを記載していきます。また、適宜見出しを付けていきます。 2 素案についての考察 (1) 導入部分 AIと著作権に関する考え方について(素案)

                                  2023年12月20日文化庁「AIと著作権に関する考え方について(素案)」についての考察(1)|知的財産・IT・人工知能・ベンチャービジネスの法律相談なら【STORIA法律事務所】
                                • 「オホーツクに消ゆ」リメイク版、Switchで発売へ 「17歳以上相当」 Steam版も

                                  オホーツクに消ゆは、堀井氏がシナリオを手掛けたアドベンチャーゲーム。1984年にPC-8801向けにリリースされて話題になり、ファミコン版は87年に発売された。 24年夏発売のリメイク版のタイトルは「北海道連鎖殺人 オホーツクに消ゆ ~追憶の流氷・涙のニポポ人形~」で、開発元はジー・モード。 任天堂公式YouTubeチャンネルの紹介動画では冒頭に「この映像では対象年齢が『17歳以上』相当と見込まれるゲームソフトを紹介しています」と表示されており、Switch版発売時には年齢制限がかかりそうだ。 関連記事 「ポートピア」は「ドラクエ」の前フリだった 堀井雄二氏のゲーム哲学 「ポートピア連続殺人事件」は、RPGのコマンド操作の練習をしてもらうために発売したという。「ドラクエは常に初心者に親切でありたい」と堀井雄二さんは話す。 AI体験版「ポートピア連続殺人事件」で40年前の記憶を呼び覚まされた

                                    「オホーツクに消ゆ」リメイク版、Switchで発売へ 「17歳以上相当」 Steam版も
                                  • 「OpenAIはもはやオープンではない」国立情報学研究所・黒橋所長がLLM研究語る

                                    「研究開発が一部の組織の寡占状態にあることは健全とは思えない」――。 米OpenAI(オープンAI)の「ChatGPT」など大規模言語モデル(LLM)が注目を集める中で、国立情報学研究所所長で京都大学特定教授の黒橋禎夫氏が2023年9月27日、「日経クロステックNEXT 東京 2023」(主催:日経BP、東京国際フォーラム)に登壇し、「OpenAIはもはやオープンではない」とLLM研究の課題を指摘。その上で日本の取り組みを紹介した。 自然言語処理研究は、一貫して機械翻訳向け 黒橋氏は「生成AIの仕組みと社会へのインパクト、データ基盤から知識基盤の時代へ」と題して基調講演を行った。まず自然言語処理の研究の歴史から、ChatGPTをはじめとしたLLMの影響について語った。 自然言語処理の研究はコンピューターの利用が始まった1940年代半ばから始まり、「一貫して機械翻訳がキラーアプリだった」と黒

                                      「OpenAIはもはやオープンではない」国立情報学研究所・黒橋所長がLLM研究語る
                                    • SF作家たちが「作家の寛大さを悪用するAIトレーニングは許せない」として著作権当局に規制を要請

                                      ジェネレーティブAIは高度な文章や画像を生成できる一方で、AIをトレーニングするためのデータの扱いがしばしば問題になっています。作家活動の支援として著作権関連のサポートも行う非営利団体のアメリカSFファンタジー作家協会(SFWA)は、アメリカ著作権局に対して提出した書簡の中で、AIトレーニングに作品が使用されることに反対する理由について明確にしました。 SFWA Comments on AI to US Copyright Office - SFWA https://www.sfwa.org/2023/11/03/sfwa-comments-on-ai-to-us-copyright-office/ Science Fiction and Fantasy Writers Take Aim at AI Freeloading * TorrentFrea https://torrentfrea

                                        SF作家たちが「作家の寛大さを悪用するAIトレーニングは許せない」として著作権当局に規制を要請
                                      • 新たな超高率機械学習トランジスタがAIのエネルギー消費量を99%削減する | TEXAL

                                        AIの学習には、非常に多くのコンピューティング・パワーとエネルギーが必要となる。そのため、この処理にはNVIDIA のDGX-1のような機械学習用サーバーが用いられる。だが、今回ノースウェスタン大学の研究者らが『Nature Electronics』誌に発表した研究において紹介されているナノ電子デバイスは、現在の技術の100倍少ないエネルギーで、大量のデータを解析し、解析のためにデータをクラウドに転送することなく、リアルタイムで人工知能(AI)タスクを実行することを可能にするという。 ノースウェスタン大学の研究者らが開発したナノ電子デバイスは、多くの機械学習システムのバックボーンである分類(大量のデータを分析し、重要なビットにラベルを付けること)のタスクを実行するように設計されている。 「今日、ほとんどのセンサーはデータを収集し、それをクラウドに送信し、そこでエネルギー消費の激しいサーバー

                                          新たな超高率機械学習トランジスタがAIのエネルギー消費量を99%削減する | TEXAL
                                        • 【11月30日版】アマゾンで24時間以内に値下がりした売れ筋商品ランキング | 激安!特価・タイムセール・クーポン観測所

                                          激安!特価・タイムセール・クーポン観測所 Amazon・楽天・ヤフーショッピング等のタイムセール、限定クーポン、最新のリアルタイム売れ筋ランキングなど、激安&特価で販売中の商品情報を紹介していくブログです。 Amazonで24時間以内に値下げされた商品を売れ筋ランキング順で紹介します。 本記事は、パソコン・周辺機器、家電&カメラカテゴライズされた商品のランキングです。 ⇒その他売れ筋商品情報はブログランキング ランキング第1位 JBL TOUR PRO 2 ワイヤレスイヤホン bluetooth ハイブリッド ノイズキャンセリング/マルチポイント/IPX5/ワイヤレス充電対応/スマートタッチディスプレイ搭載/ブラック/JBLTOURPRO2BLK 小 24500円 (2023年11月30日 22時24分時点の価格) 24時間の価格下落率:11% ランキング第2位 SteelSeries ラ

                                            【11月30日版】アマゾンで24時間以内に値下がりした売れ筋商品ランキング | 激安!特価・タイムセール・クーポン観測所
                                          • 130億パラメータの大規模言語モデル「LLM-jp-13B」を構築~NII主宰LLM勉強会(LLM-jp)の初期の成果をアカデミアや産業界の研究開発に資するために公開~ - 国立情報学研究所 / National Institute of Informatics

                                            2023/10/20 130億パラメータの大規模言語モデル「LLM-jp-13B」を構築 ~NII主宰LLM勉強会(LLM-jp)の初期の成果をアカデミアや産業界の研究開発に資するために公開~ 大学共同利用機関法人 情報・システム研究機構 国立情報学研究所(NIIエヌアイアイ、所長:黒橋 禎夫、東京都千代田区)は、本年5月から、自然言語処理及び計算機システムの研究者を中心として、大学・企業等から500名以上が参加するLLM勉強会(LLM-jp)を主宰しています。7月から、計算資源としてデータ活用社会創成プラットフォームmdx*1を活用し、パラメータ数*2130億の大規模言語モデル(LLM)の構築を開始しました。このたび、同LLMの事前学習及びチューニングが終了し、モデルを公開しましたので、お知らせします。 同モデルはLLM研究開発としては初期段階のものであり、モデルの性能を示す評価値はこれ

                                              130億パラメータの大規模言語モデル「LLM-jp-13B」を構築~NII主宰LLM勉強会(LLM-jp)の初期の成果をアカデミアや産業界の研究開発に資するために公開~ - 国立情報学研究所 / National Institute of Informatics
                                            • アコースティックのリコーダーにBluetooth-MIDI搭載!?カスタマイズ自在なイタリアのlunaticaを試してみた|DTMステーション

                                              すでに昨年から国内でも発売されているのでご存じの方もいらっしゃると思いますが、イタリアのメーカー、ARTinoiseからユニークなリコーダー、lunatica(海外での名称はre.corder)が発売されています(税込実売価格37,400円)。これはアコースティックなリコーダーであり、電源がなくても、吹けばそのまま演奏できる縦笛でありながら、電源を入れるとBluetooth-MIDIに対応したデバイスとして機能し、さまざまな楽器音での演奏が可能になります。しかもMIDI化した際には、内部のさまざまなセンサーが動き出し、傾きを変えることでビブラートのかかり具合を変えたり、横に回転させることでPANを動かすなど、さまざまなコントロールも可能になっています。 ARTinoiseの無料配布するiOS/Android用のアプリを利用することで、ゲーム感覚で演奏を学習できる機能を持っているので、リコー

                                                アコースティックのリコーダーにBluetooth-MIDI搭載!?カスタマイズ自在なイタリアのlunaticaを試してみた|DTMステーション
                                              • 「2025~2026年にはAIモデルの学習費用が1兆円を超えて人類に脅威をもたらすAIが登場する」とAI企業・AnthropicのCEOが予言

                                                AIの開発にはGPUやAIアクセラレータからなる大規模な計算資源が必要です。AI企業Anthropicのダリオ・アモデイCEOはAIモデルの学習費用が今後数年で約100億ドル(約1兆5400円)に達すると推測しています。 Transcript: Ezra Klein Interviews Dario Amodei - The New York Times https://www.nytimes.com/2024/04/12/podcasts/transcript-ezra-klein-interviews-dario-amodei.html 大規模言語モデルやマルチモーダルAIモデルの学習には、大量のGPUやAIアクセラレータが必要です。NVIDIAやAMD、Intelといった半導体企業はAIの学習を効率的に実行できるチップの開発を進めていますが、それらのAI特化チップは性能の高さと引き換

                                                  「2025~2026年にはAIモデルの学習費用が1兆円を超えて人類に脅威をもたらすAIが登場する」とAI企業・AnthropicのCEOが予言
                                                • 【AI倫理・法務に関わる人必見!】AIに関する国内外のルールメイキングの状況 (2023年12月版) - ABEJA Tech Blog

                                                  今日は、法務・コンプライアンス・AI倫理担当の古川が担当させていただきます。 これで4回目のアドベントカレンダーです。筆者の経歴などは過去の記事で書きましたので省略します。若干追加するならば、Global Partnership On AI(GPAI)というOECDが運営するAIの適切な利活用に関する取り組みの日本の専門家委員を1月からやっております。GPAIを通じてAI倫理だとか責任あるAIの国際的な様々な取り組みに関与させていただいています。 今年も去年に従って「AI倫理ニュース振り返り2022年」を書こうと思ったのですが、より興味が高いであろう国内外のルールメーキングの状況をお話しします。といっても、EU、US、日本だけですが。 1.EU EUはAI法案が非常に重要です。2021年にAI法案をリリースしています。その後、議会による修正案が出ています。基本的にはこの議会の修正版までが一

                                                    【AI倫理・法務に関わる人必見!】AIに関する国内外のルールメイキングの状況 (2023年12月版) - ABEJA Tech Blog
                                                  • 【連載】生成AIと著作権~文化審議会著作権分科会法制度小委員会「考え方」を踏まえて~第1回|知的財産・IT・人工知能・ベンチャービジネスの法律相談なら【STORIA法律事務所】

                                                    【連載】生成AIと著作権~文化審議会著作権分科会法制度小委員会「考え方」を踏まえて~ 本連載は、2024年3月15日に文化審議会著作権分科会法制度小委員会「AIと著作権に関する考え方について」(以下「考え方」」といいます)が公表されたことを受けて、2024年4月時点でのAIと著作権に関する法的論点とその基本的な考え方について網羅的に整理したものです。 本連載の作成にあたっては、「考え方」をベースに、関連する各書籍や論文等を参照し、かつ私自身が実務で経験したことを最大限盛り込んでいます。 特に「上野達弘・奥邨弘司(編)「AIと著作権」勁草書房、2024年」は、2024年時点の最新の論点について、理論的・実務的な観点から極めて詳細な検討がされている書籍であり、本連載作成に際しても大いに参考にしています。 本連載では、網羅的、かつ最新の知見を盛り込みつつも、学説の対立の紹介は最小限にとどめて、で

                                                      【連載】生成AIと著作権~文化審議会著作権分科会法制度小委員会「考え方」を踏まえて~第1回|知的財産・IT・人工知能・ベンチャービジネスの法律相談なら【STORIA法律事務所】
                                                    • Mistral-Instruct-7Bで日本語WikipediaからJSON形式でクイズを作ることに成功した|shi3z

                                                      高性能と名高いMistral-Instruct-7Bで日本語WikipediaからJSON形式でクイズを作ることに成功。これで日本語版データセットの開発が捗るはず。 とりあえず機内での実験のためGGUF(8bit)で試した。GGUFで動くならGPUならもっと動くだろう >>> data={"prompt":"""<s>[INS]以下の説明文を読みなさい[/INS] ... 樋口 真嗣(ひぐち しんじ、1965年9月22日 - )は、日本の特技監督・映画監督・映像作家・装幀家。 ... ガイナックス、GONZO、Motor/lieZを経てオーバーロード所属。アニメ特撮アーカイブ機構副理事長や、IT企業のユビキタスエンターテインメントにおいてチーフ・ビジョナリー・オフィサーも務める。 ... 愛称は「シンちゃん」(由来などは#人物像で詳述)。妻は、スタジオジブリでのハーモニー処理をしている高屋

                                                        Mistral-Instruct-7Bで日本語WikipediaからJSON形式でクイズを作ることに成功した|shi3z
                                                      • ChatGPT、学習用データを提供しなくてもチャット履歴が残せるように

                                                          ChatGPT、学習用データを提供しなくてもチャット履歴が残せるように
                                                        • 画像生成AIの病理学的論考 |嘯(しゃお)

                                                          画像生成AIが広く使われるようになり、既に1年半以上が経過した。Midjourneyのサービス開始が2022年7月、Stable diffusionの公開が2022年8月である。画像生成AIは、文字を打ち込むことで画像を生成するという画期的な技術であり、その手軽さや品質から「創作」との相性がよくも思えるが、実際は様々な課題が表出し、現在解決に至っているとは言えない。単なる画像生成だけでなく、画像編集技術や付随的な陰影算出技術などが開発されているにも関わらず、である。画像生成AIに対する意見というのは好意的なものから否定的なものまで幅広く、その意見の幅は興味深い。ここでは、なぜ課題が生まれ、何が問題となっているのか、なぜ分断が生まれるのかという点に注目し、その背景的心理などを言語化し考察したい。生成AI利用の是非を問うものではなく、なぜ分断がここまで起きているのか、という点に注目する。あくま

                                                            画像生成AIの病理学的論考 |嘯(しゃお)
                                                          • 月間はてなブックマーク数ランキング(2024年6月) - はてなブックマーク開発ブログ

                                                            はてなブックマークのブックマーク数が多い順に記事を紹介する「はてなブックマーク数ランキング」。2024年6月のトップ50です*1。 順位 タイトル 1位 フルリモートで相手に気持ちよく仕事をしてもらうためのコツあれこれ 2位 去年の夏くらいに「余り野菜は焼いて麺つゆとお酢を混ぜた液に放り込むといい」と教えてくれた方、あなたは暑い夏献立に悩む主婦を救いました - Togetter [トゥギャッター] 3位 【ChatGPT】英語学習用に素敵な先生を錬成したよ! - はげあたま.org 4位 実家の近所に住むじいさんを車に乗せて買い物に連れて行った三日後 5位 「言い方がキツイ人」は、いったい何を考えているのか。 | Books&Apps 6位 旦那さんと同じタイプかも。力になれれば。 7位 先住民目線で語る、Mrs. Green AppleのMV「コロンブス」問題 | ユロックの母 8位 無

                                                              月間はてなブックマーク数ランキング(2024年6月) - はてなブックマーク開発ブログ
                                                            • 良質なAI学習用データ、巨額で囲い込み OpenAIなど - 日本経済新聞

                                                              対話型AI(人工知能)「Chat(チャット)GPT」を手掛ける米オープンAIやLLM(大規模言語モデル)開発に取り組むテック大手がAIの学習用データの囲い込みを進めている。メディアなど企業のコンテンツ使用では、数億ドルを対価にする許諾契約も出てきた。開発企業には良質な情報源の確保と法的リスクの回避という狙いがあるなか、提供企業にとっては新たな収益源になるなど、AI向けデータを巡る契約では双方に商機が広がりつつある。

                                                                良質なAI学習用データ、巨額で囲い込み OpenAIなど - 日本経済新聞
                                                              • ブラウザ上で可愛いフィルターを実現!TensorFlow.jsを使ったリアルタイム顔認識 - ICS MEDIA

                                                                顔認識技術を利用したアプリケーションは身近なところにあります。たとえば、カメラで映した顔に猫耳やリボンなどのスタンプを自由に追加できる加工アプリ「SNOW」や、ビデオ会議ツール「Zoom」、「Microsoft Teams」で使用できるフィルター機能などがあります。これらの機能は、フェイストラッキング技術を利用しています。 この技術はアプリだけでなく、ウェブブラウザ上でも実現できます。今回は、Googleが開発した機械学習用JavaScriptライブラリ「TensorFlow.js」を使って、ウェブカメラでリアルタイムに顔が認識されるデモを作成してみました。 TensorFlow.jsとは TensorFlow.jsは、Pythonで広く利用されている機械学習ライブラリ「TensorFlow」をJavaScript用にラップしたもので、ブラウザ上で機械学習モデルを手軽に利用できるようにする

                                                                  ブラウザ上で可愛いフィルターを実現!TensorFlow.jsを使ったリアルタイム顔認識 - ICS MEDIA
                                                                • (〓]消しゴム300個持ちは消しゴムフローチャートを作って遊んでもらいたい[〓)|消しゴムが好きな人

                                                                  (〓]←可愛い はじめにこんにちは。消しゴムが好きな人です。 突然ですが、あなたには好きなものはありますか? その好きなものは仲間集めや語らいに苦労はしませんか? (苦労しない方は本当におめでとうございます。) ちなみに、マイナージャンルのオタク(私)はいつも悩んでいます。 まず、仲間が簡単には見つかりません。 みつからないから、人口を増やしたい。布教したい。 しかしマイナーすぎて興味を持ってもらうことが難しい。 (特に「消しゴム」は難易度がダンチ) だから仲間が増えない!以下無限ループ。 マイナージャンルオタクあるあるじゃないでしょうか?(違ったらごめんなさい) とにかく、私は消しゴム友達が増えないことに日々寂しさを募らせているのです。そもそもコミュ障だということは棚に上げて、嘆きます。 ですが、 ある日突然、閃きました そうだ、アレだ!!! あの〜〜……アレ! !!!フローチャートがい

                                                                    (〓]消しゴム300個持ちは消しゴムフローチャートを作って遊んでもらいたい[〓)|消しゴムが好きな人
                                                                  • 「エヌビディアのGPUサーバーが確保できない」、国内のLLM開発企業が悲鳴

                                                                    生成AI(人工知能)ブームが過熱する現在、大規模言語モデル(LLM)の開発に必要なAI用GPU(画像処理半導体)インフラの確保が難しくなっている。特にパブリッククラウドを利用するユーザーがLLM開発に適したGPUサーバーのインスタンスを確保できない状態が続いており、LLMを開発する国内企業が悲鳴をあげている。このままGPUインフラを十分に確保できなければ、国内企業による独自LLMの開発が想定以上に遅れる恐れがある。 「LLMの開発に使いたい米NVIDIA(エヌビディア)のAI用GPU『NVIDIA A100』を搭載するGPUサーバーは、大手パブリッククラウドではほぼ確保できない状態だ。先週(2023年8月最終週)は1台も確保できなかった」――。そう語るのは、AI開発のスタートアップであるストックマークのResearch Divisionを率いる近江崇宏執行役員だ。 Amazon Web S

                                                                      「エヌビディアのGPUサーバーが確保できない」、国内のLLM開発企業が悲鳴
                                                                    • 「カスタマイズできるGPT」に脆弱性。簡単だからこそ危険が潜む

                                                                      「カスタマイズできるGPT」に脆弱性。簡単だからこそ危険が潜む2023.12.03 11:00 Maxwell Zeff - Gizmodo US [原文] ( 福田ミホ ) 大事なデータをペラペラ開示しちゃうかも、と。 OpenAIは、カスタマイズしたチャットボットのマーケットプレイス「GPT Store」を立ち上げようとしています。 GPT Storeでは誰でも自分の用途に合わせたChatGPTを作れて、さらにそれを公開し、販売までできます。カスタマイズしたChatGPTは単に「GPT」と呼ばれ(ややこしくてすみません)、たとえばボードゲームのルールを解説してくれるGPTとか、算数を教えてくれるGPTといったものが考えられています。 目的に合わせてより詳細で信頼性の高い回答をしてくれるチャットボットがたくさんできるなら、それはかなりありがたいことです。が、サイバーセキュリティ企業のAd

                                                                        「カスタマイズできるGPT」に脆弱性。簡単だからこそ危険が潜む
                                                                      • GPT4oを使って、訓練無しで物体検出(BBox)ができるか試してみる

                                                                        今日も今日とてopenAIの新発表が機械学習界隈を賑わせていますね。 今回は、2024/05/14に発表されたGPT4oについてです。 返答速度があがったり画像認識精度があがったり音声会話の性能が良くなったりと色々話題が尽きません。 具体的にどのあたりが凄くなったのかは僕以外にもまとめている人が多そうなのでこの記事では触れません。 個人的に特に気になっているのが画像認識の精度向上部分で、今回は画像認識精度がどの程度あがったのか?というのを画像系機械学習の主要なタスクであるBBoxによる物体認識というタスクで簡単にチェックしてみようと思います。 BBoxとは BBoxはBoundingBoxの略で、画像内の特定のオブジェクトを囲むために使用される長方形のボックスの事を指します。 BoundingBoxの定義は以下の通り このBBox検出は画像系機械学習モデルの基本的なタスクであり、自動運転の

                                                                          GPT4oを使って、訓練無しで物体検出(BBox)ができるか試してみる
                                                                        • バグバウンティにおける XSS の具体的な脅威の事例まとめ - blog of morioka12

                                                                          1. 始めに こんにちは、morioka12 です。 本稿では、バグバウンティで実際にあった脆弱性報告の事例をもとに、XSS の具体的な脅威(Impact)についていくつか紹介します。 1. 始めに 免責事項 想定読者 2. XSS (Cross Site Scripting) HackerOne Top 10 Vulnerability Types Escalation (Goal) 3. XSS の脅威 (Impact) 3.1 Response Body から Session ID の奪取 3.2 Local Storage から Access Token の奪取 3.3 IndexedDB から Session Data の奪取 3.4 メールアドレスの改ざん 3.5 パスワードの改ざん 3.6 管理者アカウントの招待 3.7 POST Based Reflected XSS 4.

                                                                            バグバウンティにおける XSS の具体的な脅威の事例まとめ - blog of morioka12
                                                                          • AI開発に黄色信号? 市場急成長で“学習用データ枯渇”の懸念 解決策といわれる「合成データ」とは何か

                                                                            生成AIの普及が続く現在、ある調査によれば、2024年のAIの市場規模は全世界で1840億ドル(約28兆円)に達すると見られている。さらに市場の拡大は続き、30年までに8267億ドル(約127兆円)となる見込みだ。 しかし、そんな生成AIの快進撃の裏側では、AIの普及・進化に必要な学習用データが枯渇する懸念があるという。 その解決策として期待されているのが「合成データ」(synthetic data)と呼ばれるものだ。 合成データとは何か? まず合成データとは何か、なぜそれが注目されているかについて見て行こう。GPU分野のトップランナーである米NVIDIAは、公式ブログ上で合成データを次のように定義している。 合成データとは、コンピュータ・シミュレーションやアルゴリズムが、現実世界のデータの代替として生成する注釈付き情報のことである。別の言い方をすれば、合成データは、現実世界から収集された

                                                                              AI開発に黄色信号? 市場急成長で“学習用データ枯渇”の懸念 解決策といわれる「合成データ」とは何か
                                                                            • ニューヨーク・タイムズの訴訟でChatGPTが立往生の可能性(現代ビジネス) - Yahoo!ニュース

                                                                              ChatGPTの事前学習データの使用料をめぐって、ニューヨーク・タイムズがOpenAIを訴えました。これは、情報の価値がどのようにして生じるかという問題の基本に関わるものであり、生成AIの将来に大きな影響を与えます。しかし、簡単に答えが出るものではありません。 【写真】生成系AIはウェブ記事サイトを壊滅させるか?ある日突然、革命的地殻変動が 米紙ニューヨーク・タイムズは、ChatGPTの開発者であるOpenAIに対して、事前学習のデータの利用に関して支払いを求める訴訟を起こしました。 この問題は、「情報や知識に関する社会的制度をどう構築するか?」という問題の本質に関わっており、大変重要です。 最初にこれまでの経緯を見ると、ニューヨーク・タイムズはその記事を無断でAIの訓練に用いることを禁止しています。したがって、OpenAIが事前学習でニューヨーク・タイムスの記事を使っていないと証明できな

                                                                                ニューヨーク・タイムズの訴訟でChatGPTが立往生の可能性(現代ビジネス) - Yahoo!ニュース
                                                                              • Findyデータ基盤のアーキテクチャと技術スタック - Findy Tech Blog

                                                                                1. はじめに Findyでデータエンジニアとして働いている ひらき(hiracky16)です。 この記事ではFindyで取り組んでいるデータ基盤について紹介します。 Findyでは2023年からデータエンジニアを採用し本格的にデータ基盤構築に着手しています。 これまではBigQuery(Google Cloud)を中心としたデータ蓄積・利活用をしていました。 今後もっとデータ分析、機械学習などのデータ利用を加速するためにデータマネジメントが不可欠だと考えており、データエンジニアを採用しています。 まだ1人目のデータエンジニアがジョインしてから半年間くらいの取り組みですが、現時点のアーキテクチャや技術スタック、伸びしろや展望などを記します。 1. はじめに 2. これまでのデータ基盤の伸びしろ 3. 現状のデータ基盤アーキテクチャ 3.1. 本番環境のIaC化と開発環境の準備 3.2. デ

                                                                                  Findyデータ基盤のアーキテクチャと技術スタック - Findy Tech Blog
                                                                                • 今週のはてなブックマーク数ランキング(2024年6月第3週) - はてなブックマーク開発ブログ

                                                                                  はてなブックマークのブックマーク数が多い順に記事を紹介する「はてなブックマーク数ランキング」。6月10日(月)~6月16日(日)〔2024年6月第3週〕のトップ30です*1。 順位 タイトル 1位 【ChatGPT】英語学習用に素敵な先生を錬成したよ! - はげあたま.org 2位 「言い方がキツイ人」は、いったい何を考えているのか。 | Books&Apps 3位 この17年間で電通の内勤に起こっていたこと(私見)。|小島 雄一郎 4位 DoCoMoの25周年スペシャルムービーを見ると凄まじく感情が動くので書き殴ってしまった | Books&Apps 5位 Amazonで役員の時間をお願いする場合の雛形が良くできている話→「事前に流れがわかる」「ウチのミーティングで導入してほしい」無駄な会議が減りそうな予感 - Togetter [トゥギャッター] 6位 ASCII.jp:情報整理の決定

                                                                                    今週のはてなブックマーク数ランキング(2024年6月第3週) - はてなブックマーク開発ブログ