misshikiのブックマーク / 2023年1月5日

AI 激動の年！2022年の人工知能10大トレンドと必読論文

misshiki 2023/01/05

リンク

AI×医用画像の現状と可能性_2022年版/AI×medical_imaging_in_japan_2022

AI×医用画像の現状と可能性_2020年上半期版/AI×medical imaging in japan (first half of 2020)

misshiki 2023/01/05

150ページのスライド資料。

ディープラーニング

リンク

PyTorch discloses malicious dependency chain compromise over holidays

HomeNewsSecurity PyTorch discloses malicious dependency chain compromise over holidays PyTorch has identified a malicious dependency with the same name as the framework's 'torchtriton' library. This has led to a successful compromise via the dependency confusion attack vector. PyTorch admins are warning users who installed PyTorch-nightly over the holidays to uninstall the framework and the counter

misshiki 2023/01/05

こっちの記事がくわしい。

PyTorch

リンク

PyTorchのnightlyに侵害　「すぐにアンインストールしてください」

Python用深層学習用フレームワーク「PyTorch」のnightly版が侵害されたとして、プロジェクトがアンインストールを呼び掛けた。2022年12月25日から30日の間にインストールされたパッケージが対象だ。 Linux Foundationのプロジェクト、PyTorch Foundationは2022年12月31日（米国時間）、Python用深層学習用フレームワーク「PyTorch」のnightly版ユーザーに対し「すぐにnightly版とtorchtritonをアンインストールし、最新版をインストールしてください」と呼び掛けた。12月25日から30日の間にpipを介してインストールされたパッケージが侵害されていたとしている。このパッケージは、Python Package Index（PyPI）コードリポジトリで侵害された悪意あるtorchtritonをインストールし、実行すると

misshiki 2023/01/05

“このtorchtritonは、ユーザーの/etc/hosts、/etc/passwdなどのファイルを読み込み、h4ck.cfdというドメインにアップロードする。”

PyTorch

リンク

OpenAIリリースの音声認識モデル「Whisper」APIの無償提供を開始 | Ledge.ai

インター・ラボ株式会社は12月15日、人工知能研究組織OpenAIが開発した音声認識モデル「Whisper」を利用した音声文字起こし APIである「Whisper API」の無償提供を開始したことを発表した。OpenAIは、文章から画像を生成するAI「DALL・E2」や、自然で多彩な文章を生成するAI「GPT-3」などを開発している。高い音声認識精度を持つWhisperを用いたAPIを無償提供し、外部サービスと連携するなど幅広いユーザーが利用できるようにする。また、プログラミングの知識を持たない人でもブラウザでかんたんに利用できるWebサービスも提供する。画像はWhisper公式Githubより Whisperとは、OpenAIが開発した汎用的な音声認識モデルで、現在GitHubにおいて公開されている。教師あり学習で68万時間というデータを学習しており、高い音声認識精度を持つ。音声翻訳や言

misshiki 2023/01/05

“インター・ラボ株式会社は12月15日、人工知能研究組織OpenAIが開発した音声認識モデル「Whisper」を利用した音声文字起こしAPIである「WhisperAPI」の無償提供を開始したことを発表”

リンク

Manim：Pythonで使える数学アニメーションライブラリ

そのYouTubeチャンネルの動画作りに使われているアニメーションエンジンがPythonのライブラリとして公開されている↓ Manim: Mathematical Animation Engine Manimは、正確なプログラマティックアニメーションのためのエンジンであり、数学の解説ビデオを作成するために設計されています。 Manimには2つのバージョンがあることに注意してください。このリポジトリは、3Blue1Brownの作者がアニメーション動画作成のために始めた個人プロジェクトで、動画固有のコードはこちらから入手できます。このリポジトリを2020年に開発者グループがフォークし、現在のコミュニティエディションとなりました。こちらはより安定し、より適切にテストされ、コミュニティの貢献に迅速に対応し、より親しみやすく始められることを目標としています。詳細はこちらのページを参照してください

misshiki 2023/01/05

“Manimは、正確なプログラマティックアニメーションのためのエンジンであり、数学の解説ビデオを作成するために設計されています。”3Blue1Brownで使われているとのこと。

リンク

DifFaceで、低画質な顔画像を高画質化する

1.はじめに今回ご紹介するのは、最近画像生成でよく使われているDiffusion Model を使った、低画質の顔画像を高画質化する DifFace という技術です。＊この論文は、2022.12に提出されました。 2.DifFaceとは？下記の様に、高画質と低画質の顔画像のペアをDiffusion Modelに学習させることによって、低画質の顔画像から高画質の顔画像を予測します。 3.コードコードはGoogle Colabで動かす形にしてGithubに上げてありますので、それに沿って説明して行きます。自分で動かしてみたい方は、この「リンク」をクリックし表示されたノートブックの先頭にある「Open in Colab」ボタンをクリックすると動かせます。最初に、MinicondaというPython環境をインストールします。インストール後、自動的にリセットが掛かるため「セッションがクラッ

misshiki 2023/01/05

“最近画像生成でよく使われているDiffusion Model を使った、低画質の顔画像を高画質化する DifFace という技術”

コンピュータビジョン

リンク

機械学習による競馬予想で安定して勝てるのか？ (2022年に半年奮闘した上での考察)

この記事は競馬AI / 予想Tech Advent Calendar 2022 の23日目です。はじめに「機械学習による競馬予想で安定して勝てるのか？」ということで、半年ほど奮闘して実感したことや思ったことを書きます。対象は中央競馬(JRA)の開催レースです。「馬柱」や「上がり3ハロン」のような一般的な競馬用語は知っている前提で書くので、競馬初心者の方は調べて詳しくなりながらお読みください。また、この記事では詳細なコードの内容までは紹介しません。自己紹介普段はLinuxサーバ上でコマンドを叩くことで生計を立てています。開発職ではありません。得意なコマンドは uptime です。競馬歴はダイワスカーレットが現役の頃からで、競馬ゲームのウイニングポストもよくプレイしていました。好きな馬はヒカリデユールです。あらまし職場の先輩が「機械学習で競馬予想AI作ろうとしてる。自分で

misshiki 2023/01/05

機械学習

リンク

Muse: Text-To-Image Generation via Masked Generative Transformers

Muse: Text-To-Image Generation via Masked Generative Transf ormers Huiwen Chang*, Han Zhang*, Jarred Barber†, AJ Maschinot†, José Lezama, Lu Jiang, Ming-Hsuan Yang, Kevin Murphy, William T. Freeman, Michael Rubinstein†, Yuanzhen Li†, Dilip Krishnan† *Equal contribution. †Core contribution. We present Muse, a text-to-image Transf ormer model that achieves state-of-the-art image generation performance

misshiki 2023/01/05

“Muse:マスクされたジェネレーティブトランスフォーマーによるテキストから画像への生成”

リンク

Lior⚡ on Twitter: "GoogleAI just released "Muse", a text-to-image generation/editing model via Masked Generative Transformers: - Achi… https://t.co/8z94VKweoF"

misshiki 2023/01/05

“GoogleAI は、Masked Generative Transformers によるテキストから画像への生成/編集モデルである「Muse」をリリースしました: - 新しい SOTA を実現 ”

リンク

GitHub - NVIDIA-Merlin/dataloader: The merlin dataloader lets you rapidly load tabular data for training deep leaning models with TensorFlow, PyTorch or JAX

You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

misshiki 2023/01/05

“merlin-dataloader を使用すると、TensorFlow、PyTorch、および JAX の推奨モデルをすばやくトレーニングできます。”

リンク

GitHub - NVIDIA/NeMo: A scalable generative AI framework built for researchers and developers working on Large Language Models, Multimodal, and Speech AI (Automatic Speech Recognition and Text-to-Speech)

Large Language Models and Multimodal Accelerate your generative AI journey with NVIDIA NeMo Framework on GKE (2024/03/16) An end-to-end walkthrough to train generative AI models on the Google Kubernetes Engine (GKE) using the NVIDIA NeMo Framework is available at https://github.com/GoogleCloudPlatform/nvidia-nemo-on-gke. The walkthrough includes detailed instructions on how to set up a Google Clou

misshiki 2023/01/05

“NVIDIA NeMo は、自動音声認識 (ASR)、テキスト音声合成 (TTS)、大規模言語モデル (LLM)、および自然言語処理 (NLP) に取り組んでいる研究者向けに構築された会話型 AI ツールキットです。”

リンク

https://twitter.com/ogawa_yutaro_22/status/1608616960023203840

misshiki 2023/01/05

“ニューラルネットワークの歴史まとめ”

ディープラーニング

リンク

世界初！超音波AI技術により非破壊で冷凍マグロの鮮度の評価に成功 : 富士通

地域を変更富士通グループ各国の位置情報の一覧です。アルファベット順の索引から国/地域別に地域と連絡先情報を選択できます。

misshiki 2023/01/05

“冷凍マグロの重要な品質指標の一つである鮮度について、超音波AI技術（注1）を活用することで、冷凍状態のまま非破壊で評価することに世界で初めて成功”

人工知能

リンク

元旦名物の航空機による固定資産税調査はその分析にAIが使われるようになっていてごまかしが効きにくい「税を取ることについては有能」

ところてん @tokoroten 例の元旦に航空機飛ばして写真とって増改築チェックして、固定資産税の脱税野郎を検知する奴、最近はAIが使われてるらしいすよ高くなっているか、低くなっているかって書かれているので、航空写真じゃなくて、SAR画像使ってるんじゃないかなー緑シートじゃダメな予感 city.saitama.jp/006/003/003/01… pic.twitter.com/ppadW8ban0 2023-01-03 09:10:18

misshiki 2023/01/05

“元旦に航空機飛ばして写真とって増改築チェックして、固定資産税の脱税野郎を検知する奴、最近はAIが使われてるらしい”

人工知能

リンク

死後、自分の葬儀で蘇り参列者と会話する、幽霊のような驚きのAI技術 : カラパイア

AI 技術はめまぐるしい進歩を遂げているが、リアルな幽霊を生み出すという最新技術が登場した。自身の葬儀でホログラムとなって蘇り、参列者と会話を交わすことができるのだという。これはスタートアップ企業『StoryFile』が手掛けている「ホログラフィック会話ビデオ体験」サービスだ。公開された映像には、今年6月に亡くなった87歳の女性の葬儀で、死んだはずの女性がモニター越しから、リアルタイムで参列者と会話しているのがわかる。まるでまだ生きているかのような自然な表情と会話に、参列やの多くは驚きを隠せなかったそうだ。広告 AI lets a deceased woman address her own funeral 自分の葬儀で故人が蘇る驚きのAI 技術イギリスのノッティンガムで、今年6月26日にマリーナ・H・スミスさん（享年87歳）という女性が他界した。 7月29日に執り行われたマリーナさ

misshiki 2023/01/05

“AIツール会社『StoryFile』の技術を使用し、故人となったマリーナさんの姿をモニターに映し出し、参列者と会話させた。”

人工知能

リンク

AUTOMATIC1111版WebUIで自動音楽生成｜IT navi｜note

昨年（2022年）12月、画像生成AIのStable Diffusionを利用して、入力したプロンプトに沿った楽曲を自動生成するRiffusionが公開されました。今回は、Riffusionの仕組みとこれをAUTOMATIC1111版WebUIで利用する方法について説明します。 Riffusionのデモサイトの画面１．Riffusionの仕組み　Riffusionは、Seth Forsgren氏とHayk Martiros氏が作成した自動音楽生成AIモデルで、昨年12月にデモサイトが公開され、コード、ウェブアプリ、モデルチェックポイントも公開されています。以下のデモサイトでは、入力したプロンプトに沿った楽曲をseed値を切り替えながらループ再生してくれます。 Riffusionは、Stable Diffusion（SD）に調整を加えて、プロンプトから関連する楽曲のスペクトログラム（音の

misshiki 2023/01/05

“プロンプトに沿った楽曲を自動生成するRiffusioの仕組みとこれをAUTOMATIC1111版WebUIで利用する方法について説明”

人工知能

リンク

Cool Japan Diffusion 2.1.0 の取扱説明書 - なにメモ

はじめにインストール方法使い方 Text-to-Imageの使い方 Image-to-Imageの使い方プロンプトの形式キャラクター編背景編 ChatGPT編応用編公開にあたってのメッセージクリエイターの方々へユーザの方々へ付録プロンプトの形式詳細はじめに本記事では、2023/1/3に公開する予定の画像生成AI、Cool Japan Diffusion (for learning) 2.1.0 の取り扱い方について説明します。まず、インストール方法をざっくり説明します。その後、使い方の説明、特にプロンプトのテンプレートを説明します。最後に、クリエイターの方々へ、ユーザの方々へメッセージをお送りします。なお、現在、Hugging Face上でデモを行っているので、そちらを使うのが楽です。インストール方法基本的には、Web UIを想定しています。ほとんど

misshiki 2023/01/05

“2023/1/3に公開する予定の画像生成AI、Cool Japan Diffusion (for learning) 2.1.0 の取り扱い方について説明”

人工知能

リンク

AIに「普段澄ましている清楚な優等生美少女の感情丸出しガチギレ顔」を描いてもらった

ハッピーゼリーポンチ @hapijelly912 AIに対して段々欲望に素直になってきて、「普段澄ましている清楚な優等生美少女の感情丸出しガチギレ顔お願いします」と頼み、自分の性癖を最新のテクノロジーで丁寧に確認しました #midjourny pic.twitter.com/ALRVQOwn6b 2022-12-27 21:07:15

misshiki 2023/01/05

“「普段澄ましている清楚な優等生美少女の感情丸出しガチギレ顔お願いします」と頼み、自分の性癖を最新のテクノロジーで丁寧に確認”

人工知能

リンク

「AIがあれば司書なんていらない」という人間の意見を見かけたので、AI側の見解を聞いてみたら至極真っ当な意見が返ってきた

読書猿『独学大全』14刷26万部（紙＋電書） @kurubushi_rm くるぶし（読書猿の中の人：一人でやってます）『ライティングの哲学』（共著）。『独学大全』。『問題解決大全』『アイデア大全』共々、各種電書版、台湾語版、韓国語版あり。マシュマロの解答まとめはこちら。scrapbox.io/marshmallow-rm readingmonkey.blog.fc2.com

misshiki 2023/01/05

人工知能

リンク

ニューヨーク市、学校での「ChatGPT」利用を禁止

ニューヨーク市教育局は、管轄する学校組織のオンライン端末およびインターネットネットワークにおける「ChatGPT」へのアクセスを禁止した。 ChatGPTは、オンラインの膨大な情報源を基に、ユーザーの質問に会話形式で回答するほか、小論文を書いたり、絵を描いたりすることもできるAI搭載チャットボットだ。ニューヨーク市教育局は米国時間1月3日、教育ニュースサイトChalkbeatに対し、「学生の学習に対する悪影響と、コンテンツの安全性や正確性に関する懸念」を理由に、同サービスの利用を制限することを明らかにした。「疑問に対する回答を迅速かつ簡単に得ることができるかもしれないが、学問や人生で成功を収めるために不可欠となる、クリティカルシンキングや問題解決のスキル育成にはつながらない」と、同局広報のJenna Lyle氏は語った。学生や教員は、学校組織と関係のない端末からChatGPTに接続す

misshiki 2023/01/05

“ニューヨーク市教育局は、管轄する学校組織のオンライン端末およびインターネットネットワークにおける「ChatGPT」へのアクセスを禁止した。”

人工知能

リンク

https://twitter.com/kurubushi_rm/status/1609837101000044544

misshiki 2023/01/05

人工知能

リンク

Microsoft and OpenAI Working on ChatGPT-Powered Bing in Challenge to Google

Microsoft could soon get a return on its $1 billion investment in OpenAI, creator of the ChatGPT chatbot, which gives humanlike text answers to questions. Microsoft is preparing to launch a version of its Bing search engine that uses the artificial intelligence behind ChatGPT to answer some search queries rather than just showing a list of links, according to two people with direct knowledge of th

misshiki 2023/01/05

“Microsoft と OpenAI が ChatGPT を利用した Bing に取り組み、Google に挑戦”

リンク

AIが匿名のチェスプレーヤーの正体を特定してプライバシーリスクをもたらす可能性

複雑な領域で人間の意思決定能力を超えるAIの出現により、将棋や囲碁、チェス、ストラテジーゲームなどでAIが人間を凌駕するようになりました。そんな中、チェスの駒運びからプレイヤーが誰なのかを高い精度で特定できるAIが発表され、オンラインチェスにおけるプライバシーが脅かされているのではないかと危惧されています。 Detecting Individual Decision-Making Style:Exploring Behavioral Stylometry in Chess (PDFファイル)https://papers.nips.cc/paper/2021/file/ccf8111910291ba472b385e9c5f59099-Paper.pdf AI unmasks anonymous chess players, posing privacy risks | Science | A

misshiki 2023/01/05

“チェスの駒運びからプレイヤーが誰なのかを高い精度で特定できるAIが発表され、オンラインチェスにおけるプライバシーが脅かされているのではないかと危惧されています。”

人工知能

リンク

学習データに最適化されすぎて本来の目的が達成できなくなる「過学習」と同様の現象はAIだけでなく社会全体で起こっているという主張

機械学習における過学習(過剰適合／オーバーフィッティング)とは、AIが学習データのみに最適化されてしまい、未知のデータに対する予測能力が低くなってしまうという現象です。そんな過学習と同様の現象が機械学習分野だけでなく社会全体のさまざまな場面でも発生していると、Google傘下の人工知能研究所・Google Brainの研究者であり近年の画像生成AIに広く用いられている「拡散モデル」の論文執筆者でもあるJascha Sohl-Dickstein氏が主張しています。 Too much efficiency makes everything worse: overfitting and the strong version of Goodhart’s law | Jascha’s blog https://sohl-dickstein.github.io/2022/11/06/strong-Go

misshiki 2023/01/05

人工知能

リンク

2022年、NEWS読者に最も注目されたIT業界ワードトップ5　AIがワンツーフィニッシュ、3位は？

2022年、NEWS読者に最も注目されたIT業界ワードトップ5　AIがワンツーフィニッシュ、3位は？：IT流行語アワード2022（1/3 ページ） IT業界における流行語を決める「IT流行語アワード」。読者の皆さまに、2022年に話題になったIT用語やイベント、事件などの中から「今年一番話題になったのはこれだ！」というワードを教えていただきました。 2022年もさまざまなことがありました。尼崎市でUSBメモリ紛失が起きたり、イラスト生成AIが一気に普及したり──しかし、これらのワードは流行語大賞には選ばれていません。ITmedia NEWS読者の皆さんにとってはぴんと来ないものもあるかもしれません。 IT業界における流行語は何だったのか。ITmedia NEWSは「IT流行語アワード」を開催。読者の皆さまに、2022年に話題になったIT用語やイベント、事件などの中から「今年一番話題になった

misshiki 2023/01/05

“AI分野が圧倒的な注目度を集めていました。”

人工知能

リンク

AI、輪郭現すシンギュラリティー　大規模モデルの衝撃 - 日本経済新聞

NIKKEI Primeについて朝夕刊や電子版ではお伝えしきれない情報をお届けします。今後も様々な切り口でサービスを開始予定です。

misshiki 2023/01/05

人工知能

リンク

日本のAI導入効果がアメリカの7分の1程度しかないのはなぜなのか｜piqcy｜note

AI白書によると、日本では平均して米国の7分の1程度しかAI導入の効果が出ていません。特に「製造工程、製造設備」、「データ分析の高度化」の売上向上効果は10分の1以下に留まっています。機械学習の活用に携わる身としては2022年最も衝撃的なデータでした。え、でもそれってほんとなの?なんでなの?という疑問を本記事で深掘りするとともに、解決策を考えてみたいと思います。日本では平均して米国の7分の1程度しかAI導入の効果しか出ていないAI白書2022ではAI導入の効果を日米の企業にヒアリングをしています。AIの導入で「5%以上の売上増加」があったと回答した日本の企業数は米国の1/4~1/11になっています(下図左)。特に「製造工程、製造設備」では1/10、「データ分析の高度化」では1/11です。「10%以上のコスト削減効果」があったと回答した日本の企業数も同程度の差があります(下図右)。同じ「A

misshiki 2023/01/05

“AI白書によると、日本では平均して米国の7分の1程度しかAI導入の効果が出ていません。”

リンク

2023年年頭所感　日本ディープラーニング協会理事長松尾豊より

ディープラーニングを中心とする技術による日本の産業競争力の向上を目指す「日本ディープラーニング協会」（理事長：松尾　豊　東京大学大学院工学系研究科　教授、以下JDLA）は、2023年の年頭にあたり謹んで新年のご挨拶を申し上げます。皆様、あけましておめでとうございます。昨年は、ディープラーニングのインパクトが改めて大きく認識された年でした。大きくは、画像生成AIと、ChatGPTに代表される大規模言語モデルの２つが大きく注目を集めました。皆様はどのようにこうした技術をご覧になられていたでしょうか。画像生成AIは、OpenAIのDALL·E 2、少人数の研究所で運営するMidjourney、ロンドンのスタートアップの提供するStable Diffusionなどが次々とリリースされました。Diffusion Model（拡散モデル）という技術で、画像の修正を段階的に行うことで、ユーザが入力

misshiki 2023/01/05

ディープラーニング

リンク

データ・AI人材育成を　慶応大教授安宅和人氏 - 日本経済新聞

NIKKEI Primeについて朝夕刊や電子版ではお伝えしきれない情報をお届けします。今後も様々な切り口でサービスを開始予定です。

misshiki 2023/01/05

“政府の役割は。「データとAIが分かり、使い倒せる人材を育てなければならない。”

リンク

PublickeyのIT業界予想2023。クラウドのコスト上昇懸念、Passkeyの普及、AIによる開発支援の進化、WebAssembly環境の充実など

PublickeyのIT業界予想2023。クラウドのコスト上昇懸念、Passkeyの普及、AIによる開発支援の進化、WebAssembly環境の充実など新年明けましておめでとうございます。今年もPublickeyをどうぞよろしくおねがいいたします。さて今年最初の記事では2023年のIT業界、特にPublickeyが主な守備範囲としているエンタープライズ系のIT業界はどうなるのか、Publickeyなりに期待を込めた予想をしてみたいと思います。エネルギー価格の上昇、セキュリティへの注目などまずは予想の前提として、IT業界に影響を与えそうな現状についての認識を明らかにしておきたいと思います。グローバルな視点で見たときに、IT業界だけでなく世界経済に大きな影響を与えているのは石油や天然ガスを始めとするエネルギー価格の上昇とインフレでしょう。エネルギー価格の上昇はロシアによるウクライナ

misshiki 2023/01/05

“プロフェッショナルなシステム開発も、ビジネスの現場での非プログラマによる業務改善のためのシステム開発やサービス活用においても、AIによる支援機能を備えたツールが一般的になっていくと予想されます。”

人工知能

リンク

PatternedAI - Seamless Pattern Maker with Artificial Intelligence

Guaranteed seamless patternsGenerate repeatable, unique patterns in seconds for any surface without any visible seams Turn text into unique, royalty-free patternsDescribe what you want to start generating your own patterns

misshiki 2023/01/05

“AI を使用して、製品に固有のパターンを生成します。”

人工知能

リンク

タグ

2023年1月5日のブックマーク (32件)

お知らせ

今週のはてなブックマーク数ランキング（2024年8月第4週）

今週のはてなブックマーク数ランキング（2024年8月第3週）

今週のはてなブックマーク数ランキング（2024年8月第2週）

公式Twitter

キーボードショートカット一覧

公式Twitter

はてなのサービス