並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 43件

新着順 人気順

deeplearningの検索結果1 - 40 件 / 43件

  • 大規模言語モデル (LLM) の技術と最新動向

    マルチメディア,分散,協調とモバイル(DICOMO2024)シンポジウムでの招待講演の資料です。 https://dicomo.org/

      大規模言語モデル (LLM) の技術と最新動向
    • OpenSSHの脆弱性 CVE-2024-6387についてまとめてみた - piyolog

      2024年7月1日、OpenSSHの開発チームは深刻な脆弱性 CVE-2024-6387 が確認されたとしてセキュリティ情報を発出し、脆弱性を修正したバージョンを公開しました。この脆弱性を発見したQualysによれば、既定設定で構成されたsshdが影響を受けるとされ、影響を受けるとみられるインターネット接続可能なホストが多数稼動している状況にあると報告しています。ここでは関連する情報をまとめます。 概要 深刻な脆弱性が確認されたのはOpenSSHサーバー(sshd)コンポーネント。脆弱性を悪用された場合、特権でリモートから認証なしの任意コード実行をされる恐れがある。 悪用にかかる報告などは公表時点でされていないが、glibcベースのLinuxにおいて攻撃が成功することが既に実証がされている。発見者のQualysはこの脆弱性の実証コードを公開しない方針としているが、インターネット上ではPoC

        OpenSSHの脆弱性 CVE-2024-6387についてまとめてみた - piyolog
      • レコメンドアルゴリズム入門:基礎から応用まで実装に必要な知識を解説 - Qiita

        1: 購入 0: 閲覧(したが購入してない) -: 未観測 ユーザーベース型 ユーザー同士の類似度を計算 「あなたと購入履歴の似たユーザーはこんな商品を買っています」 行を各ユーザーのベクトルとみなして、似たユーザーを見つける(上位N人) 似たユーザーが購入しているアイテムを推薦する(N人の平均値などで購入しそうな順に提示) アイテムベース型 アイテム同士の類似度を計算 「この商品を買ったユーザーはこんな商品も買ってます」 列を各アイテムのベクトルとみなして、類似度の高いアイテムを推薦する(上位M件) 類似度計算には、コサイン類似度やJaccard類似度が使われる。 類似度を計算する際に、未観測「-」は適当な値(0, 0.5など)で埋めるか、無視をする。 ログデータを使うため、情報の少ない新規アイテム/新規ユーザーに弱いコールドスタート問題がある。 コンテンツベースフィルタリング アイテム

          レコメンドアルゴリズム入門:基礎から応用まで実装に必要な知識を解説 - Qiita
        • 角刈りオジサンから美少女ボイス 「GPU不要で超低遅延」なリアルタイム音声変換ソフトを見てきた

          ブースは、韓国の音声AI企業Supertoneが出展したもの。角刈りオジサンの美少女ボイスは、リアルタイム音声変換ソフト「SHIFT」のデモによるものだった。このSHIFT、少女だけでなく少年、成人女性、成人男性、渋いおじいさん、悪魔などさまざまな声がプリセットされており、リアルタイムかつ高精度に声を変換できるのが特徴。 独自の音声合成基盤モデル「NANSY」(Neural Analysis & Synthesis)を採用しており、ユーザーの声の事前学習も、10秒程度のサンプルスクリプトを読み上げるだけで完了。ユーザーとキャラクターの音声の混合比率や感情の表現度合い、音の高低なども細かく調整可能だ。 同様の技術として「RVC」(Realtime Voice Changer)などが有名だが、快適に利用するにはNVIDIAの高性能なGPUを必要とする。一方、SHIFTはCPUのみで47ミリ秒と

            角刈りオジサンから美少女ボイス 「GPU不要で超低遅延」なリアルタイム音声変換ソフトを見てきた
          • もはや仮歌は自分の歌でOK?AIでボーカルを自在に差し替えるSoundID VoiceAI。声を楽器に差し替えることも|DTMステーション

            毎日のように、新たな生成AIのシステムが発表され、1年前には想像もつかなかったような時代に入ってきていますが、また非常にユニークで画期的なシステムが登場してきました。ヨーロッパのラトビアのメーカー、Sonarworksが開発したSoundID VoiceAI、というもので、ボーカルトラックをまったく別のシンガーが歌ったものに差し替えるというソフトです。つまり歌詞やメロディーはそのままに、違う歌声に差し替えることができる、というわけです。それに近いことはSynthesizer Vの「オーディオ・ノート変換」機能を利用することで実現していましたが、SoundID VoiceAIではプラグインエフェクトとして声を変換できるため、より手軽に扱えるほか、非常に多くのシンガーが利用できるというのがメリットとなっています。 さらにSoundID VoiceAIがすごいのは変換ターゲットが必ずしも人間のボ

              もはや仮歌は自分の歌でOK?AIでボーカルを自在に差し替えるSoundID VoiceAI。声を楽器に差し替えることも|DTMステーション
            • 【都知事選2024】AIによるマニフェストへの質疑応答システム「AIあんの」の裏側を公開します!|Jun Ito

              安野たかひろ事務所 技術チームリーダーの伊藤です。 安野は大学時代の友人で、彼が今回の選挙戦で実現しようとしている、老若男女の意見を募り、誰も取り残さないことを旨とする選挙活動・民主主義の形に共感し、ぜひ力になりたいと思いPdM・エンジニアとして手伝いをしております! この記事では、先日公開になった「AIあんの」のシステムについて、技術者の観点から、実現しようとしている状態と、技術的な裏側について解説してみようと思います。 AIあんのとはAIあんのは、安野たかひろの政策を学習したAI応答システムが、本人のアバターと声色によって、Youtube Liveと電話という2つの経路で、みなさまのご意見やご質問に回答するシステムです。 配信でAIあんのに質問したい場合は、以下からアクセスしてみてください。 (URLは変更になる場合があります。その際はアカウントから配信を探してみてください。) また電

                【都知事選2024】AIによるマニフェストへの質疑応答システム「AIあんの」の裏側を公開します!|Jun Ito
              • 自動プロンプト最適化をやってみた - Algomatic Tech Blog

                はじめまして!データサイエンティストの山内(@jof_5)です。 本記事では、日々、プロンプト開発されている皆様に向けて、プロンプトを効率的に開発する手法の一つである「自動プロンプト最適化」について記載いたします。 1. プロンプトエンジニアリングの必要性と課題 2. 自動プロンプト最適化について 2-0. 最適なプロンプトとは何か?☕ 2-1. 自動プロンプトの概要 2-2. 自動プロンプト最適化のアーキテクチャ ①Task Executor: LLMによるタスクの実行 ②Output Evaluator: 出力の評価 ③ Prompt Improver: 最適なプロンプトの生成 3. 実験結果と考察 3-1. 自動プロンプト最適化の有効性の検証 3-2. 最適化プロンプトの生成過程 3-3. 最適化されたプロンプトの特徴 3-4. プロンプト生成用LLM(Prompt Improver

                  自動プロンプト最適化をやってみた - Algomatic Tech Blog
                • Generative Models

                  2024年6月13日に大阪大学大学院 情報科学研究科で行った「情報科学特別講義Ⅰ」の講義資料です。 https://www.ist.osaka-u.ac.jp/japanese/news/newsDetailNews.php?id=308

                    Generative Models
                  • BM42: New Baseline for Hybrid Search - Qdrant

                    For the last 40 years, BM25 has served as the standard for search engines. It is a simple yet powerful algorithm that has been used by many search engines, including Google, Bing, and Yahoo. Though it seemed that the advent of vector search would diminish its influence, it did so only partially. The current state-of-the-art approach to retrieval nowadays tries to incorporate BM25 along with embedd

                      BM42: New Baseline for Hybrid Search - Qdrant
                    • DeepLearning系の将棋AIがRyzenのiGPUで簡単に動いた(ふかうら王編) - シンギュラリティ実験ノート

                      DeepLearning系の将棋AIがRyzenのiGPUで簡単に動いた、の続報で今回はふかうら王についてである。ふかうら王はやねうらお氏によって作られたdlshogi互換エンジンである。 ふかうら王の導入手順 Windows版実行ファイルは下記のページから辿っていき、ふかうら王の実行ファイル詰め合わせYaneuraOu-v7.6.1+20220511b.master-deep-windows.zipをダウンロードする。 yaneuraou.yaneu.com ふかうら王の導入手順は下記のページを見てほしい。 ふかうら王のインストール手順 · yaneurao/YaneuraOu Wiki · GitHub 上記ページに説明があるが、実行ファイル詰め合わせには以下の種類のふかうら王が含まれている。私が導入したのはORT-CPUとORT-DMLである。 ORT-CPU onnxruntime

                        DeepLearning系の将棋AIがRyzenのiGPUで簡単に動いた(ふかうら王編) - シンギュラリティ実験ノート
                      • AMD ROCmを使うことで何ができるのか - シンギュラリティ実験ノート

                        MINISFORUM UM790 Proを注文した後、AMDもROCmというソフト(NVIDIAのCUDAに該当するもの)を提供していることを知った。このAMD ROCmを使うことで、UM790 Proで動作が期待できるAI関連ソフトについて書きたい。 ROCmでMNIST ROCmについて正確に知りたい方は本家のページを見ていただきたい。 www.amd.com ROCmを使ってAMDのGPUでMNIST(文字(数字)認識の機械学習サンプルプログラム)を動作させた報告を幾つか見つけた。まず下記サイトではノートPCのRyzenのAPU(CPU+iGPU)で無理やりであるがMNISTを動かした様子。 blog.ingage.jp こちらはAMDのGPUとして何を使ったかはわからないが、やはりMNISTを動作させている。 qiita.com 基本的にはこちらに書いてある通りにやれと書かれている

                        • NVIDIA、AIトレーニング用合成データ生成モデル「Nemotron-4 340B」を商用利用可でリリース

                          米NVIDIAは6月14日(現地時間)、LLMのトレーニング用オープン合成データ生成モデルシリーズ「Nemotron-4 340B」を発表した。独自のオープンモデルライセンス(PDF)の下、「あらゆる業界の商用アプリケーション向けLLM」のトレーニングに使うデータセットを合成できるとしている。つまり、商用利用も可能だ。 LLMの開発では、高品質で多様なデータセットでのトレーニングが不可欠だが、ネットなどから収集したデータには偏りや不正確なものが含まれる可能性があり、量にも限りがある。そのため、合成データの生成に注目が集まっている。 Nemotron-4 340Bには、合成データ生成のパイプラインを形成するbase、instruct、rewardの3つのモデルが含まれる。baseモデルは、9兆個のトークでトレーニングされたカスタマイズの基盤となるモデル。独自データを組み込むことで、このモデル

                            NVIDIA、AIトレーニング用合成データ生成モデル「Nemotron-4 340B」を商用利用可でリリース
                          • Free Voice Isolator and Background Noise Remover | ElevenLabs

                            Extract crystal-clear speech from any audio Our vocal remover strips background noise for film, podcast, and interview post production

                              Free Voice Isolator and Background Noise Remover | ElevenLabs
                            • DeepLearning系の将棋AIがRyzenのiGPUで簡単に動いた - シンギュラリティ実験ノート

                              DeepLearning系の将棋AI(dlshogiやふかうら王)をRyzenのiGPU(CPU内蔵GPU)で動かすのは大変だと思っていた。しかし、今日、なにげなくWindows11環境にDeepLearning系の将棋AIをインストールしたところ、onnxruntimeを使えばDeepLearning系の将棋AI(dlshogiやふかうら王)がiGPUで簡単に動くことが分かった。 これまでの経緯 RyzenのGPUで将棋AIを動かすには、ROCmというAMDのGPU用ドライバが必要だと思っていた。そのため苦労してUbuntu環境でROCmをインストールしたり、onnxruntimeをROCmに対応させるためUbuntuでonnxruntimeをビルドし直したりしていた。興味のある方はこれまでの記事を見てもらいたい。 将棋AI dlshogi(Python版)を1000ドルPCで動かす -

                                DeepLearning系の将棋AIがRyzenのiGPUで簡単に動いた - シンギュラリティ実験ノート
                              • 【ICASSP2024】ニューラルボコーダ&音声変換全論文まとめ

                                はじめに こんにちは、Parakeet株式会社リサーチャーの今井(X: Nuts)です。 4月に韓国ソウルで開催された音声・信号処理に関するトップカンファレンスICASSP2024にて発表されたニューラルボコーダの全論文9本と音声変換の全論文21本をまとめました(抜けがあったらご連絡ください)。 ※本記事ではプレプリントとして投稿されている論文のみリンクを貼っており、また添付している画像もプレプリントから、もしくは公開されているデモページ等からのみ引用しています。 ニューラルボコーダ全論文まとめ Fregrad: Lightweight and Fast Frequency-Aware Diffusion Vocoder paper: https://arxiv.org/abs/2401.10032 code: https://github.com/signofthefour/fregra

                                  【ICASSP2024】ニューラルボコーダ&音声変換全論文まとめ
                                • Kaggle Grandmaster振り返り

                                  画像系に参加することが比較的多いですが、NLP系も嗜む程度にやったりしてます 参加スタイルはソロで始めてそこそこの順位になったあたりで声かけてもらった方とチームを組むパターンが多いです kaggleとの出会い コンペに興味を持ったきっかけは、kaggleについて紹介しているweb記事をたまたま見かけたことでした。 もともと新卒入社した会社でDeepLearning関連のプロジェクトをやっていたのですが、社内にあまりノウハウが確立されておらず手探りで案件を進める日々を送っていました。自分なりに技術書を読んだり、webにある情報をかき集めたりしながら何とかやっていたものの、我流でやり続けることに漠然とした不安を感じていました。 そんな中、しばらくして転職活動をしてる際にたまたまkaggle取り組みについて紹介している記事を見かけます。kaggle自体は知っていて5年くらい前にアカウントだけ作っ

                                    Kaggle Grandmaster振り返り
                                  • 超低遅延AIボイスチェンジャーが開く世界

                                    Parakeet株式会社でResearcherをしている金子(nadare)です。CPUで動く軽量AIボイスチェンジャーParavoの研究開発をしております。 本記事ではParavoのアピールポイントである0.06秒の遅延へのこだわりとそれを実現するための技術について解説したいと思います。 ボイスチェンジャーの歴史 従来型ボイスチェンジャー 従来のボイスチェンジャーは主にピッチ(声の高低)やフォルマント(声道の性質)を変え、それに様々なエフェクトをかけることで音声の変換を行っていました。これの実現にはハードウェアを使う方法、ソフトウェアを使う方法など様々ありますが、声に関する専門知識と入力する声を人力で調整するテクニックが必要でした。 疑似リアルタイムAIボイスチェンジャー 近年ではAI技術の発達により、ピッチやフォルマントを信号処理的に変えるのではなく、ディープラーニングの力によって特定

                                      超低遅延AIボイスチェンジャーが開く世界
                                    • 2024年6月20日のヘッドラインニュース

                                      松屋が夏のスタミナメニューとして、コチュジャンかおる濃厚コク旨もつダレが食欲をそそる「カルビホルモン丼」を2024年6月25日(火)10時から提供開始します。ぷりっとした歯ごたえのホルモンと、鉄板でジューシーに焼き上げたカルビ、食感のいいにんにくの芽を濃厚コク旨もつダレで絡めた丼となっており、価格は税込980円(みそ汁付)です。 夏のスタミナメニュー「カルビホルモン丼」新発売|松屋フーズ https://www.matsuyafoods.co.jp/whatsnew/menu/68347.html ちなみに、過去の同月同日にはこんな記事を掲載していました。 史上最も「地球に似た環境の惑星」が12.5光年かなたで発見される - GIGAZINE Samsungがテレビに「ベンチマーク測定値を不正に高性能にする機能」を仕込んでいたことが判明 - GIGAZINE 「警官になるには頭が良すぎる」

                                        2024年6月20日のヘッドラインニュース
                                      • Tsubame4.0でコンテナ環境を作る

                                        Tsubameミニキャンプが開催され、東工大のTSUBAME4.0を触る機会がありました。 TSUBAMEでコンテナを使ったDeepLearning環境構築方法とTipsを紹介したいと思います。 未検証ですが、他の国内スパコンでも使えると予想しています。 TSUBAME4.0とは Tsubame4.0は東工大が有するスーパーコンピュータです。Tsubame4.0はNVIDIAの最新GPUであるH100を960枚(4枚/ノード x 240ノード)備えたスーパーコンピュータです。 その他概要は、公式のユーザマニュアルなどご覧ください。 コンテナを使った環境構築 今回は、コンテナを起動し、その中に必要なライブラリを書き込んでいくという方法を採用します。スパコンは実験環境で使うことが多いと思いますので、一旦はこれで十分かと思います。 コンテナは、上記で述べたnvidia謹製のpytorchコンテナ

                                          Tsubame4.0でコンテナ環境を作る
                                        • AlphaFoldの進化史: 初代からAlphaFold3まで - どこから見てもメンダコ

                                          AlphaFold3が発表されたのでこれまでの技術的変遷を復習します。 初代AlphaFold (2019) インパクト: 深層学習によるゲームチェンジ 手法概要 ① 残基間距離行列の予測ステップ ② 二面角(ΦΨ)の数理最適化ステップ Note: 距離行列予測は苦しい AlphaFold2 (2021) インパクト: 驚異的な高精度と可用性 手法概要 ① データ準備 ② Evoformerによる特徴抽出 ③ 残基ベース立体構造予測 Note: SE(3) 同変な構造予測モデル AlphaFold3 (2024) インパクト: 折り畳みから分子間相互作用へ ①全原子拡散モデルによる分子構造生成 ② 長大な条件付けネットワーク ③ 相互作用を重視した蒸留データセット AlphaFold4(いつかな?) 次は構造分布の予測? 拡散モデルによる構造分布予測 参考書籍 初代AlphaFold (2

                                            AlphaFoldの進化史: 初代からAlphaFold3まで - どこから見てもメンダコ
                                          • GraphRAGを試しました。(Neo4jでナレッジグラフを作成) - Qiita

                                            昨日、最近話題となったGraphRAGを試しました。 GraphRAGとは、データをナレッジグラフの形式で保管し、RAGで検索する際にはナレッジグラフで回答を探すという技術です。通常のRAGと比べると、基本的には正しい情報だけが含まれているため、精度が高くなります。マイクロソフトも先日RAGとGraphRAGを比較する研究レポートを発表しました。⇩(GraphRAGの特徴と、どんな場合にRAGより精度高いのかを多角的に説明しています。) ナレッジグラフ(Knowledge Graph)とNeo4j ナレッジグラフは主に、ノード(node)とリレーションシップ(relationship)で構成されて、単語ごとの関係を表しています。(GoogleやYahooなどの検索エンジンもナレッジグラフに基づいて検索を行っています) ナレッジグラフを自動的に作成するために最もよく使われているライブラリはN

                                              GraphRAGを試しました。(Neo4jでナレッジグラフを作成) - Qiita
                                            • OpenSSHの脆弱性 CVE-2024-6387についてまとめてみた - piyolog

                                              2024年7月1日、OpenSSHの開発チームは深刻な脆弱性 CVE-2024-6387 が確認されたとしてセキュリティ情報を発出し、脆弱性を修正したバージョンを公開しました。この脆弱性を発見したQualysによれば、既定設定で構成されたsshdが影響を受けるとされ、影響を受けるとみられるインターネット接続可能なホストが多数稼動している状況にあると報告しています。ここでは関連する情報をまとめます。 概要 深刻な脆弱性が確認されたのはOpenSSHサーバー(sshd)コンポーネント。脆弱性を悪用された場合、特権でリモートから認証なしの任意コード実行をされる恐れがある。 悪用にかかる報告などは公表時点でされていないが、glibcベースのLinuxにおいて攻撃が成功することが既に実証がされている。発見者のQualysはこの脆弱性の実証コードを公開しない方針としているが、インターネット上ではPoC

                                                OpenSSHの脆弱性 CVE-2024-6387についてまとめてみた - piyolog
                                              • Diffsynth Studioをローカル環境に構築する方法とDiffutoonのインストール手順

                                                こんな人にオススメの記事です!Diffsynth Studioをローカル環境に構築したい人Diffutoonをインストールしたい人生成AIに興味を持っている人Stable Diffusionなど数多くの生成AIソフトが最近ではありますよね。 最近、X(旧:twitter)でdiffutoonという動画をアニメーションに変換するプログラムがバズっていました。 Diffutoon is an amazing diffusion model for video. https://t.co/tw4ByQchks#artificialintelligence #machinelearning #ml #AI #deeplearning #computervision #AIwithPapers #metaverse #Diffutoon pic.twitter.com/VusAihojMk — Xt

                                                  Diffsynth Studioをローカル環境に構築する方法とDiffutoonのインストール手順
                                                • OpenSSHの脆弱性 CVE-2024-6387についてまとめてみた - piyolog

                                                  2024年7月1日、OpenSSHの開発チームは深刻な脆弱性 CVE-2024-6387 が確認されたとしてセキュリティ情報を発出し、脆弱性を修正したバージョンを公開しました。この脆弱性を発見したQualysによれば、既定設定で構成されたsshdが影響を受けるとされ、影響を受けるとみられるインターネット接続可能なホストが多数稼動している状況にあると報告しています。ここでは関連する情報をまとめます。 概要 深刻な脆弱性が確認されたのはOpenSSHサーバー(sshd)コンポーネント。脆弱性を悪用された場合、特権でリモートから認証なしの任意コード実行をされる恐れがある。 悪用にかかる報告などは公表時点でされていないが、glibcベースのLinuxにおいて攻撃が成功することが既に実証がされている。発見者のQualysはこの脆弱性の実証コードを公開しない方針としているが、インターネット上ではPoC

                                                    OpenSSHの脆弱性 CVE-2024-6387についてまとめてみた - piyolog
                                                  • なぜAIの研究室がロボティクス研究?新たな研究分野への挑戦と今後の展望。 | 東京大学松尾研究室 - Matsuo Lab

                                                    松尾研は人工知能の研究を推進していることはよく知られていますが、ロボティクス研究にも注力していることはご存じない方も多いのではないでしょうか? 今回は、そんな松尾研のロボティクス研究の目的やこれまでの経緯、活動の全体像、今後の展望について、修士時代のロボット研究の立ち上げから活躍している博士課程所属 松嶋 達也さんと、ロボットチームのアドバイザーをしている松尾研講師である岩澤 有祐さんにお話を伺いました。 「知能の実現」を掲げる松尾研で、深層学習を用いたロボット学習を推進。 ー松尾研ではなぜロボティクス研究を推進しているのですか? 松嶋:松尾研がロボティクス研究を進めるのは、実世界と相互作用を持つ実機を使うことで、松尾研の目標である「知能とは何かを解き明かす」ことに近付くことができると考えるためです。 身体を持つシステムとしてのロボットの実装やデータ取得を通じて、汎用的で適応性の高い「かし

                                                    • DALL-E 3で制作するyoutubeロゴデザイン: モニター | タブレット - 八尾市本買取(全国対応)BooksChannel本屋物語

                                                      booksch.hatenablog.com DALL-E 3で制作するyoutubeロゴデザイン: モニター | タブレット 以下で、「DALL-E 3で制作する音楽関連ロゴデザイン: ヘッドホン | マイク」を紹介させて頂きましたので、… note.com こちらでは、youtubeなどをupしたり、推薦Videoを紹介する時に、使えるモニターやタブレット版の[Prompt]を配置させて頂きます。もしも お気に召すことがありましたら アレンジしてご使用頂ければ幸いです。"Books Channel" を変更してご使用下さい。 Create a sleek, modern, and eye-catching logo design for 'Books Channel' YouTube content curator. The logo should prominently featur

                                                        DALL-E 3で制作するyoutubeロゴデザイン: モニター | タブレット - 八尾市本買取(全国対応)BooksChannel本屋物語
                                                      • [論文紹介]On-the-fly Data Augmentation for Forecasting with Deep Learning

                                                        [論文紹介]On-the-fly Data Augmentation for Forecasting with Deep Learning 論文 On-the-fly Data Augmentation for Forecasting with Deep Learning Summary on-the-fly*データ拡張の形式化 シーズナル分解とbootstrapに基づくOnDAT手法の提案 8つのbenchmark datasetsでSOTAを達成 *on-the-flyは、ミニバッチ内を指す Introduction 時系列予測は、実世界での活用が最も難しい。一方研究分野では、ARIMAやExponential Smoothingなどの統計的な手法だけではなく、NHITSやN-BEATS、ES-RNNなどのNNも優れた予測性能を出している。 DeepLearning(DL)には十分なデ

                                                          [論文紹介]On-the-fly Data Augmentation for Forecasting with Deep Learning
                                                        • BLIPというモデルについて調べてみた | IIJ Engineers Blog

                                                          地方拠点の一つ、九州支社に所属しています。サーバ・ストレージを中心としたSI業務に携わってましたが、現在は技術探索・深堀業務を中心に対応しています。 2018年に難病を患ったことにより、定期的に入退院を繰り返しつつ、2023年には男性更年期障害の発症をきっかけに、トランスジェンダーとしての道を歩み始めてます。 最近Stable-Diffusionが流行っておりますが 久しぶりの投稿です。昨年まで師匠のsyucchinと一緒にGPT&RAGのお仕事をしてまして、しばらくの間燃え尽きて灰になっていました。 当面GPTはお腹いっぱいってことで、再びNarrowモデルに立ち戻って、現在2022年頃にやりこんでたWhisperの振り返りとか、その他ローカルLLMに関する調査を細々とやっていたりします。私は多分特化型モデルともいわれるNarrow Modelが好きなようでしてですね、久々にWhispe

                                                            BLIPというモデルについて調べてみた | IIJ Engineers Blog
                                                          • [Q&A] pyannote.audioを利用した際のエラーについて - Qiita

                                                            pyannote.audioを利用して話者分離の機能を実装しようとしたところ、speechbrainがインストールされていないとエラーが出てきました。 ですが、すでにspeechbrainはバージョン1.0.0をインストールしており、エラー解消方法がわからず投稿させていただきました。 解決方法をご存知の方がいらっしゃいましたらご教示いただけないでしょうか。 Google colabでテスト実行した際は問題なく処理が進みましたが、 アナコンダを利用してジュピターラボで実行するとエラーが発生します。 発生しているエラー 'speechbrain' must be installed to use 'speechbrain/spkrec-ecapa-voxceleb' embeddings. Visit https://speechbrain.github.io for installation

                                                            • 月とBooks Channel LOGO 他 - 八尾市本買取(全国対応)BooksChannel本屋物語

                                                              booksch.hatenablog.com 月とBooks Channel LOGO 他 月とBooks Channel LOGO TEST 作品001 作品002 作品003 モノクロの優雅さと鮮やかな風船の交差 Outtakes 以下noteのouttakesです。どうぞ、よろしくお願い致します。 note.com 作品001 作品002 作品003 1071日目4記事noteにupさせて頂きました。 どうぞ、よろしくお願い致します。 note.com note.com note.com note.com note version 内容が多少異なる場合があります。 note.com 本日のtag… #AIart #DALLE3 #DALLE3art #OpenAI #Deeplearning #ダリスリー #ダリスリーアート #AIArtImagine #私の作品紹介 #AIとやって

                                                                月とBooks Channel LOGO 他 - 八尾市本買取(全国対応)BooksChannel本屋物語
                                                              • Qwen2-1.5B MAGIシステムの3つの人格(MELCHIOR、BALTHASAR、CASPER)が意見を出し、最終的に Qwen MAGIシステム として結論を導くコードです。 - Qiita

                                                                Qwen2-1.5B MAGIシステムの3つの人格(MELCHIOR、BALTHASAR、CASPER)が意見を出し、最終的に Qwen MAGIシステム として結論を導くコードです。機械学習DeepLearningポエムChatGPTQwen 6つのプロンプトを組み込んで、それぞれについて Qwen MAGIシステムの3つの人格(MELCHIOR、BALTHASAR、CASPER)が意見を出し、最終的に Qwen MAGIシステム として結論を導くコードです。 このコードでは、各人格がそれぞれの視点から意見を出し合い、その後に最終的な結論を Qwen MAGIシステム としてまとめます。これにより、エヴァンゲリオンのマギシステムのように協調して結論を導くプロセスをシミュレートしています。 プロンプト:世界のエネルギー問題を解決するための最適な方法は何ですか? MAGI-1 MELCHIO

                                                                  Qwen2-1.5B MAGIシステムの3つの人格(MELCHIOR、BALTHASAR、CASPER)が意見を出し、最終的に Qwen MAGIシステム として結論を導くコードです。 - Qiita
                                                                • 動画生成AIモデルが流行ってますね。 連続する5枚、10枚、15枚の画像を一つの「動画」、あるいは「時間のスナップショット」として捉え、それらを高次元のベクトルに圧縮し、再構成するコード。 - Qiita

                                                                  動画生成AIモデルが流行ってますね。 連続する5枚、10枚、15枚の画像を一つの「動画」、あるいは「時間のスナップショット」として捉え、それらを高次元のベクトルに圧縮し、再構成するコード。機械学習DeepLearningポエムChatGPTQwen タイトル: "タイムライン・リフレクター: 5フレームの冒険" 近未来の2080年、科学者たちの間で新たなプロジェクトが勃興していた。「タイムライン・リフレクター」プロジェクトと名付けられたこの研究は、連続する5枚、10枚、15枚の画像を一つの「動画」、あるいは「時間のスナップショット」として捉え、それらを高次元のベクトルに圧縮し、再構成する技術を開発しようとするものだった。 プロジェクトの主導者である科学者、エレン博士は、この技術を「ビジュアルタイムマシン」と呼び、彼女の目標は、過去の瞬間を再現し、未来の瞬間を予測することだった。 エレン博士

                                                                    動画生成AIモデルが流行ってますね。 連続する5枚、10枚、15枚の画像を一つの「動画」、あるいは「時間のスナップショット」として捉え、それらを高次元のベクトルに圧縮し、再構成するコード。 - Qiita
                                                                  • Woman in the Dunes | DALL-E 3 - 八尾市本買取(全国対応)BooksChannel本屋物語

                                                                    booksch.hatenablog.com Woman in the Dunes | DALL-E 3 作品001 作品002 作品003 note version 内容が多少異なる場合があります。 note.com 本日のtag… #WomanintheDunes #砂の女 #AIart #DALLE3 #DALLE3art #OpenAI #Deeplearning #ダリスリー #ダリスリーアート #AIArtImagine #私の作品紹介 #AIとやってみた #私のDALLE3 #私のDALLE3art You meet BooksChannel 八尾市 店舗店頭買取URL ご紹介 八尾市版 | 八尾市 そして近隣にお住まいのお客様専用 八尾市本買取 | 古書古本買取 | LP買取は地元BooksCannnel店舗 booksch.net https://booksch.net/

                                                                      Woman in the Dunes | DALL-E 3 - 八尾市本買取(全国対応)BooksChannel本屋物語
                                                                    • Mamba AI Model は 状態遷移マシンとの大胆な解釈。状態遷移関数が、ゲートアテンション + MLPで表現されていると仮定します。 それはそれとして、チューリングマシンのシミュレータ。 - Qiita

                                                                      Mamba AI Model は 状態遷移マシンとの大胆な解釈。状態遷移関数が、ゲートアテンション + MLPで表現されていると仮定します。 それはそれとして、チューリングマシンのシミュレータ。機械学習DeepLearningポエムChatGPTQwen タイトル: "Mamba AI Model: 状態遷移のシンフォニー" by Qwen. 2175年、情報科学の新たな地平線が開けていた。その中でも、Mamba AI Modelはその特異性と革新的な設計により、注目を集めていた。 Mamba AI Modelは、状態遷移マシンの大胆な解釈とでも呼べるような、革新的な設計を持つAIだった。その内部では、ゲートアテンションモデルとマルチレイヤーパーセプトロン(MLP)が組み合わさり、複雑な状態遷移関数を形成していた。 ゲートアテンションモデルは、Mamba AI Modelが特定の状態に集中

                                                                        Mamba AI Model は 状態遷移マシンとの大胆な解釈。状態遷移関数が、ゲートアテンション + MLPで表現されていると仮定します。 それはそれとして、チューリングマシンのシミュレータ。 - Qiita
                                                                      • 架空の説明文テキストを  Qwenモデル が理解しているかを検証しています。とのテーマをシュミレートしてみます。 - Qiita

                                                                        架空の説明文テキストを  Qwenモデル が理解しているかを検証しています。とのテーマをシュミレートしてみます。機械学習DeepLearningポエムChatGPTQwen 架空の説明文を生成し、その内容に対する質問と回答を生成する一連の処理を行います。 架空の説明文を Qwenモデル が理解しているかを検証しています。 Iteration 1: Generated Topic: 「AI(人工知能)と計算機科学」についての記事を作成します。 はじめに: AIと計算機科学の基本的な概念、目的、そして関係性を説明します。 AI Generated Wikipedia-style Article: AI (人工知能)とは、計算機が人間の思考や学習を模倣し、その結果、自己改善する能力を持つ技術のことです。この技術は、問題解決、情報処理、データ分析、自然言語処理など、多くの分野で広く使用されています

                                                                          架空の説明文テキストを  Qwenモデル が理解しているかを検証しています。とのテーマをシュミレートしてみます。 - Qiita
                                                                        • データ中心のAI: Data-Centric AIによるアプローチ - Qiita

                                                                          はじめに 現在、AI開発において、ノーコード、ローコード、AutoML、AIの民主化などが注目されており、また、Generative AIは世界的なブレークスルーを起こしつつあります。 ChatGPT をはじめとした大規模言語モデル(LLM)のビジネス活用はその可能性を急速に広げるなか、RAG(Retrieval Augmented Generation)やFine-tuningなどの独自カスタマイズの要望が高くなってきており、様々なAIプロダクトが、対応を始めてきています。 このような取り組みに対しては、データ品質が悪いとモデル精度が劣化していく可能性があり、高品質なデータが必要となります。このような現状からData-Centric AIが再注目される可能性があると考え、本記事にて概要をまとめておきたいと思います。 Data-Centric AIとは Data-Centric AIは、米

                                                                            データ中心のAI: Data-Centric AIによるアプローチ - Qiita
                                                                          • モノクロームで描かれた神秘的な女性の流れるような衣装のスケッチ - 八尾市本買取(全国対応)BooksChannel本屋物語

                                                                            booksch.hatenablog.com モノクロームで描かれた神秘的な女性の流れるような衣装のスケッチ note version 内容が多少異なる場合があります。 note.com 本日のtag… #モノクローム #神秘的な女性 #流れるような衣装 #スケッチ #AIart #DALLE3 #DALLE3art #OpenAI #Deeplearning #ダリスリー #ダリスリーアート #AIArtImagine #私の作品紹介 #AIとやってみた #私のDALLE3 #私のDALLE3art You meet BooksChannel 八尾市 店舗店頭買取URL ご紹介 八尾市版 | 八尾市 そして近隣にお住まいのお客様専用 八尾市本買取 | 古書古本買取 | LP買取は地元BooksCannnel店舗 booksch.net https://booksch.net/shop

                                                                              モノクロームで描かれた神秘的な女性の流れるような衣装のスケッチ - 八尾市本買取(全国対応)BooksChannel本屋物語
                                                                            • 自己評価 DALL-E 3AI画像 ; キングが飛び出す日 ???他 - 八尾市本買取(全国対応)BooksChannel本屋物語

                                                                              booksch.hatenablog.com 自己評価 DALL-E 3AI画像 キングが飛び出す日 ??? 感想 : トランプをキングが飛び出すAI画像。あまりimageするものが、1回目で出てくることはないのですが、これは1回目。 何といいますか、窮屈な世界を「打ち破る」といいますか?そういうものを表現したかったのですが、…??? ちょっと感じて頂けましたか??? 壮大なBOOK CHANNELのロゴ AI画像生成の何が凄いかって申しますと、作っていて なんだってできる???という錯覚に陥るコトです。これは大変危険でもありますから、理性をもって引き続き、実験を繰り返して行きたいものだと思っています。 note version 内容が多少異なる場合があります。 note.com 本日のtag… #AIart #DALLE3 #DALLE3art #OpenAI #Deeplearning

                                                                                自己評価 DALL-E 3AI画像 ; キングが飛び出す日 ???他 - 八尾市本買取(全国対応)BooksChannel本屋物語
                                                                              • AI Art Imagine :「アイデアから数秒で画像へ」マガジンを発行致しました。 - 八尾市本買取(全国対応)BooksChannel本屋物語

                                                                                booksch.hatenablog.com AI Art Imagine :「アイデアから数秒で画像へ」マガジンを発行致しました。 本日noteにて「AI Art Imagine :アイデアから数秒で画像へマガジン」を発行致しました。どうぞ、よろしくお願い致します。 note.com note version 内容が多少異なる場合があります。 note.com 本日のtag… #アイデアから数秒で画像へ #AIart #DALLE3 #DALLE3art #OpenAI #Deeplearning #ダリスリー #ダリスリーアート #私の作品紹介 #AIとやってみた #私のDALLE3 #私のDALLE3art You meet BooksChannel 八尾市 店舗店頭買取URL ご紹介 八尾市版 | 八尾市 そして近隣にお住まいのお客様専用 八尾市本買取 | 古書古本買取 | LP買

                                                                                  AI Art Imagine :「アイデアから数秒で画像へ」マガジンを発行致しました。 - 八尾市本買取(全国対応)BooksChannel本屋物語
                                                                                • Generative AI for Everyoneを受講してみた - STORES Product Blog

                                                                                  こんにちは。STORES 開発企画室の上杉です。 なんとなく個人的なテーマで、生成AIの利用を社内に広めたいと思っています。この度、Courseraで公開されている Generative AI for Everyone という生成AIのコースを受けてみたので紹介してみたいと思います。 はじめに Courseraはオンライン教育プラットフォームの一つで、2012年にスタンフォード大学のコンピューターサイエンス教授である Andrew Ngさん が始めたプラットフォームです。Andrew Ngさんは深層学習の分野でGPUの活用を提唱した人物であり、数年前にはこのプラットフォームでMachine Learningのコースを提供し話題になりました。私も以前Machine Learningを受講し、機械学習に関する理解を深めることができました。 ここ数ヶ月の生成AIの変化は非常に速く、追いつくのもや

                                                                                    Generative AI for Everyoneを受講してみた - STORES Product Blog