HomeNewsSecurityPyTorch discloses malicious dependency chain compromise over holidays PyTorch has identified a malicious dependency with the same name as the framework's 'torchtriton' library. This has led to a successful compromise via the dependency confusion attack vector. PyTorch admins are warning users who installed PyTorch-nightly over the holidays to uninstall the framework and the counter
Python用深層学習用フレームワーク「PyTorch」のnightly版が侵害されたとして、プロジェクトがアンインストールを呼び掛けた。2022年12月25日から30日の間にインストールされたパッケージが対象だ。 Linux Foundationのプロジェクト、PyTorch Foundationは2022年12月31日(米国時間)、Python用深層学習用フレームワーク「PyTorch」のnightly版ユーザーに対し「すぐにnightly版とtorchtritonをアンインストールし、最新版をインストールしてください」と呼び掛けた。12月25日から30日の間にpipを介してインストールされたパッケージが侵害されていたとしている。 このパッケージは、Python Package Index(PyPI)コードリポジトリで侵害された悪意あるtorchtritonをインストールし、実行すると
インター・ラボ株式会社は12月15日、人工知能研究組織OpenAIが開発した音声認識モデル「Whisper」を利用した音声文字起こしAPIである「WhisperAPI」の無償提供を開始したことを発表した。OpenAIは、文章から画像を生成するAI「DALL・E2」や、自然で多彩な文章を生成するAI「GPT-3」などを開発している。 高い音声認識精度を持つWhisperを用いたAPIを無償提供し、外部サービスと連携するなど幅広いユーザーが利用できるようにする。また、プログラミングの知識を持たない人でもブラウザでかんたんに利用できるWebサービスも提供する。 画像はWhisper公式Githubより Whisperとは、OpenAIが開発した汎用的な音声認識モデルで、現在GitHubにおいて公開されている。教師あり学習で68万時間というデータを学習しており、高い音声認識精度を持つ。音声翻訳や言
そのYouTubeチャンネルの動画作りに使われているアニメーションエンジンがPythonのライブラリとして公開されている↓ Manim: Mathematical Animation Engine Manimは、正確なプログラマティックアニメーションのためのエンジンであり、数学の解説ビデオを作成するために設計されています。 Manimには2つのバージョンがあることに注意してください。 このリポジトリは、3Blue1Brownの作者がアニメーション動画作成のために始めた個人プロジェクトで、動画固有のコードはこちらから入手できます。 このリポジトリを2020年に開発者グループがフォークし、現在のコミュニティエディションとなりました。こちらはより安定し、より適切にテストされ、コミュニティの貢献に迅速に対応し、より親しみやすく始められることを目標としています。詳細はこちらのページを参照してください
1.はじめに 今回ご紹介するのは、最近画像生成でよく使われているDiffusion Model を使った、低画質の顔画像を高画質化する DifFace という技術です。 *この論文は、2022.12に提出されました。 2.DifFaceとは? 下記の様に、高画質と低画質の顔画像のペアをDiffusion Modelに学習させることによって、低画質の顔画像から高画質の顔画像を予測します。 3.コード コードはGoogle Colabで動かす形にしてGithubに上げてありますので、それに沿って説明して行きます。自分で動かしてみたい方は、この「リンク」をクリックし表示されたノートブックの先頭にある「Open in Colab」ボタンをクリックすると動かせます。 最初に、MinicondaというPython環境をインストールします。インストール後、自動的にリセットが掛かるため「セッションがクラッ
この記事は 競馬AI / 予想Tech Advent Calendar 2022 の23日目です。 はじめに 「機械学習による競馬予想で安定して勝てるのか?」 ということで、半年ほど奮闘して実感したことや思ったことを書きます。 対象は中央競馬(JRA)の開催レースです。「馬柱」や「上がり3ハロン」のような一般的な競馬用語は知っている前提で書くので、競馬初心者の方は調べて詳しくなりながらお読みください。 また、この記事では詳細なコードの内容までは紹介しません。 自己紹介 普段はLinuxサーバ上でコマンドを叩くことで生計を立てています。開発職ではありません。得意なコマンドは uptime です。 競馬歴はダイワスカーレットが現役の頃からで、競馬ゲームのウイニングポストもよくプレイしていました。好きな馬はヒカリデユールです。 あらまし 職場の先輩が「機械学習で競馬予想AI作ろうとしてる。自分で
Muse: Text-To-Image Generation via Masked Generative Transformers Huiwen Chang*, Han Zhang*, Jarred Barber†, AJ Maschinot†, José Lezama, Lu Jiang, Ming-Hsuan Yang, Kevin Murphy, William T. Freeman, Michael Rubinstein†, Yuanzhen Li†, Dilip Krishnan† *Equal contribution. †Core contribution. We present Muse, a text-to-image Transformer model that achieves state-of-the-art image generation performance
Large Language Models and Multimodal Accelerate your generative AI journey with NVIDIA NeMo Framework on GKE (2024/03/16) An end-to-end walkthrough to train generative AI models on the Google Kubernetes Engine (GKE) using the NVIDIA NeMo Framework is available at https://github.com/GoogleCloudPlatform/nvidia-nemo-on-gke. The walkthrough includes detailed instructions on how to set up a Google Clou
地域を変更 富士通グループ各国の位置情報の一覧です。 アルファベット順の索引から国/地域別に地域と連絡先情報を選択できます。
AI技術はめまぐるしい進歩を遂げているが、リアルな幽霊を生み出すという最新技術が登場した。自身の葬儀でホログラムとなって蘇り、参列者と会話を交わすことができるのだという。 これはスタートアップ企業『StoryFile』が手掛けている「ホログラフィック会話ビデオ体験」サービスだ。 公開された映像には、今年6月に亡くなった87歳の女性の葬儀で、死んだはずの女性がモニター越しから、リアルタイムで参列者と会話しているのがわかる。 まるでまだ生きているかのような自然な表情と会話に、参列やの多くは驚きを隠せなかったそうだ。 広告 AI lets a deceased woman address her own funeral 自分の葬儀で故人が蘇る驚きのAI技術 イギリスのノッティンガムで、今年6月26日にマリーナ・H・スミスさん(享年87歳)という女性が他界した。 7月29日に執り行われたマリーナさ
昨年(2022年)12月、画像生成AIのStable Diffusionを利用して、入力したプロンプトに沿った楽曲を自動生成するRiffusionが公開されました。 今回は、Riffusionの仕組みとこれをAUTOMATIC1111版WebUIで利用する方法について説明します。 Riffusionのデモサイトの画面1.Riffusionの仕組み Riffusionは、Seth Forsgren氏とHayk Martiros氏が作成した自動音楽生成AIモデルで、昨年12月にデモサイトが公開され、コード、ウェブアプリ、モデルチェックポイントも公開されています。 以下のデモサイトでは、入力したプロンプトに沿った楽曲をseed値を切り替えながらループ再生してくれます。 Riffusionは、Stable Diffusion(SD)に調整を加えて、プロンプトから関連する楽曲のスペクトログラム(音の
はじめに インストール方法 使い方 Text-to-Imageの使い方 Image-to-Imageの使い方 プロンプトの形式 キャラクター編 背景編 ChatGPT編 応用編 公開にあたってのメッセージ クリエイターの方々へ ユーザの方々へ 付録 プロンプトの形式詳細 はじめに 本記事では、2023/1/3に公開する予定の画像生成AI、Cool Japan Diffusion (for learning) 2.1.0 の取り扱い方について説明します。 まず、インストール方法をざっくり説明します。 その後、使い方の説明、特にプロンプトのテンプレートを説明します。 最後に、クリエイターの方々へ、ユーザの方々へメッセージをお送りします。 なお、現在、Hugging Face上でデモを行っているので、そちらを使うのが楽です。 インストール方法 基本的には、Web UIを想定しています。 ほとんど
ニューヨーク市教育局は、管轄する学校組織のオンライン端末およびインターネットネットワークにおける「ChatGPT」へのアクセスを禁止した。 ChatGPTは、オンラインの膨大な情報源を基に、ユーザーの質問に会話形式で回答するほか、小論文を書いたり、絵を描いたりすることもできるAI搭載チャットボットだ。 ニューヨーク市教育局は米国時間1月3日、教育ニュースサイトChalkbeatに対し、「学生の学習に対する悪影響と、コンテンツの安全性や正確性に関する懸念」を理由に、同サービスの利用を制限することを明らかにした。 「疑問に対する回答を迅速かつ簡単に得ることができるかもしれないが、学問や人生で成功を収めるために不可欠となる、クリティカルシンキングや問題解決のスキル育成にはつながらない」と、同局広報のJenna Lyle氏は語った。 学生や教員は、学校組織と関係のない端末からChatGPTに接続す
Microsoft could soon get a return on its $1 billion investment in OpenAI, creator of the ChatGPT chatbot, which gives humanlike text answers to questions. Microsoft is preparing to launch a version of its Bing search engine that uses the artificial intelligence behind ChatGPT to answer some search queries rather than just showing a list of links, according to two people with direct knowledge of th
複雑な領域で人間の意思決定能力を超えるAIの出現により、将棋や囲碁、チェス、ストラテジーゲームなどでAIが人間を凌駕するようになりました。そんな中、チェスの駒運びからプレイヤーが誰なのかを高い精度で特定できるAIが発表され、オンラインチェスにおけるプライバシーが脅かされているのではないかと危惧されています。 Detecting Individual Decision-Making Style:Exploring Behavioral Stylometry in Chess (PDFファイル)https://papers.nips.cc/paper/2021/file/ccf8111910291ba472b385e9c5f59099-Paper.pdf AI unmasks anonymous chess players, posing privacy risks | Science | A
機械学習における過学習(過剰適合/オーバーフィッティング)とは、AIが学習データのみに最適化されてしまい、未知のデータに対する予測能力が低くなってしまうという現象です。そんな過学習と同様の現象が機械学習分野だけでなく社会全体のさまざまな場面でも発生していると、Google傘下の人工知能研究所・Google Brainの研究者であり近年の画像生成AIに広く用いられている「拡散モデル」の論文執筆者でもあるJascha Sohl-Dickstein氏が主張しています。 Too much efficiency makes everything worse: overfitting and the strong version of Goodhart’s law | Jascha’s blog https://sohl-dickstein.github.io/2022/11/06/strong-Go
2022年、NEWS読者に最も注目されたIT業界ワードトップ5 AIがワンツーフィニッシュ、3位は?:IT流行語アワード2022(1/3 ページ) IT業界における流行語を決める「IT流行語アワード」。読者の皆さまに、2022年に話題になったIT用語やイベント、事件などの中から「今年一番話題になったのはこれだ!」というワードを教えていただきました。 2022年もさまざまなことがありました。尼崎市でUSBメモリ紛失が起きたり、イラスト生成AIが一気に普及したり──しかし、これらのワードは流行語大賞には選ばれていません。ITmedia NEWS読者の皆さんにとってはぴんと来ないものもあるかもしれません。 IT業界における流行語は何だったのか。ITmedia NEWSは「IT流行語アワード」を開催。読者の皆さまに、2022年に話題になったIT用語やイベント、事件などの中から「今年一番話題になった
AI白書によると、日本では平均して米国の7分の1程度しかAI導入の効果が出ていません。特に「製造工程、製造設備」、「データ分析の高度化」の売上向上効果は10分の1以下に留まっています。機械学習の活用に携わる身としては2022年最も衝撃的なデータでした。え、でもそれってほんとなの?なんでなの?という疑問を本記事で深掘りするとともに、解決策を考えてみたいと思います。 日本では平均して米国の7分の1程度しかAI導入の効果しか出ていないAI白書2022ではAI導入の効果を日米の企業にヒアリングをしています。AIの導入で「5%以上の売上増加」があったと回答した日本の企業数は米国の1/4~1/11になっています(下図左)。特に「製造工程、製造設備」では1/10、「データ分析の高度化」では1/11です。「10%以上のコスト削減効果」があったと回答した日本の企業数も同程度の差があります(下図右)。同じ「A
ディープラーニングを中心とする技術による日本の産業競争力の向上を目指す「日本ディープラーニング協会」(理事長:松尾 豊 東京大学大学院工学系研究科 教授、以下JDLA)は、2023年の年頭にあたり謹んで新年のご挨拶を申し上げます。 皆様、あけましておめでとうございます。 昨年は、ディープラーニングのインパクトが改めて大きく認識された年でした。大きくは、画像生成AIと、ChatGPTに代表される大規模言語モデルの2つが大きく注目を集めました。皆様はどのようにこうした技術をご覧になられていたでしょうか。 画像生成AIは、OpenAIのDALL·E 2、少人数の研究所で運営するMidjourney、ロンドンのスタートアップの提供するStable Diffusionなどが次々とリリースされました。Diffusion Model(拡散モデル)という技術で、画像の修正を段階的に行うことで、ユーザが入力
PublickeyのIT業界予想2023。クラウドのコスト上昇懸念、Passkeyの普及、AIによる開発支援の進化、WebAssembly環境の充実など 新年明けましておめでとうございます。今年もPublickeyをどうぞよろしくおねがいいたします。 さて今年最初の記事では2023年のIT業界、特にPublickeyが主な守備範囲としているエンタープライズ系のIT業界はどうなるのか、Publickeyなりに期待を込めた予想をしてみたいと思います。 エネルギー価格の上昇、セキュリティへの注目など まずは予想の前提として、IT業界に影響を与えそうな現状についての認識を明らかにしておきたいと思います。 グローバルな視点で見たときに、IT業界だけでなく世界経済に大きな影響を与えているのは石油や天然ガスを始めとするエネルギー価格の上昇とインフレでしょう。 エネルギー価格の上昇はロシアによるウクライナ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く