タグ

AIに関するn2szのブックマーク (479)

  • 「AIに仕事を奪われた絵師」な訳だが|走り書き

    「当然の時代の流れだった」と思っているという話。 最初に書いておくとこれはAIに反対する記事ではないので、規制を推奨する内容を期待して開いた人はブラウザバックをお勧めする。 あと推敲全然しないで思いつくままに書いてるから、すごく読みづらい。 それでも良いという人は以下にどうぞ。 2年ちょっとくらい前まで、イラストっていた。 ただし、バリバリ企業と契約とかして1枚10万とか取っているプロイラストレーターではない。 ココナラとかSkebとかSKIMAとか、そういうコミッションサイトでフリゲーやTRPGVtuber用の立ち絵イラストを1枚1万弱で売り捌いている、いわゆる「アマチュア底辺絵師」だった。 (そう呼ばれる層にいた、という意味で「底辺」という言葉をあえて使う) 絵のクオリティは全身立ち絵で1万円ついたらいい方ってくらいの、「X(旧Twitter)でよく見るちょっと絵が上手い人」のラ

    n2sz
    n2sz 2024/07/17
  • ゆっくり解説動画を一瞬で作れるAIアプリ「NoLang」の使い方まとめ

    「NoLang」は「○○の解説動画を作って」と入力するだけで解説動画を作成できるウェブアプリです。新たに、画面端にキャラクターを2体配置して対話形式で物事を解説する「ゆっくり解説」形式の動画が作成可能になったので、実際に試してみました。 【🔥重大発表】🐬NoLang 2.0をリリースしました!! ついに、「ゆっくり解説」形式の動画生成や縦型ショート動画の作成が可能に! 他にも動画の長さ指定、プロンプトによるスタイル制御、画像生成AIなど新機能が目白押し。 圧倒的進化を遂げたNoLangを是非お試しください!https://t.co/WcRBvKLhP1 pic.twitter.com/JOFN8t45KK— マーベリック|生成AI@NoLang (@sayhi2ai_jp) July 7, 2024 ・目次 ◆1:NoLangのアカウント登録 ◆2:「ゆっくり解説」形式の動画を作る設定

    ゆっくり解説動画を一瞬で作れるAIアプリ「NoLang」の使い方まとめ
    n2sz
    n2sz 2024/07/16
    公開されるのは検索汚染だけど、自分の学習用に会話形式にして勉強するのはアリかな…って一瞬思ったけど、ChatGPTで十分だし動画である必要がないな。
  • チャットAI「Claude」すごい新機能「Artifacts」の使い方、全部教えます (1/6)

    Anthropicは6月21日、同社の開発する大規模言語モデル「Claude」シリーズの最新版となる「Claude 3.5 Sonnet」を発表。利用制限はあるものの同社のチャット型AIサービス「Claude.ai」で無料で利用可能になった。 同時にユーザーがClaudeとやり取りしながらコンテンツを作成できる新機能「Artifacts」が、さらに25日にはプロジェクトごとに資料やプロンプトを集約できる「Project」が実装された。この記事では、新機能Artifactsを使うときに知っておきたいことをメインに紹介する。 なお、Claude 3.5 Sonnetの前の世代である大規模言語モデル「Claude 3」シリーズおよび「Claude.ai」については、こちらの記事に。Claude 3.5 Sonnetについての基的なスペックなどはこちらの記事に詳しい。 Artifactsのキモは

    チャットAI「Claude」すごい新機能「Artifacts」の使い方、全部教えます (1/6)
    n2sz
    n2sz 2024/07/06
  • 自称彼女の正体推理ゲーム『Inverted Angel』7月5日配信へ。自由入力した推理をAIが“だいたいのニュアンス”で判定 - AUTOMATON

    ホーム ニュース 自称彼女の正体推理ゲーム『Inverted Angel』7月5日配信へ。自由入力した推理をAIが“だいたいのニュアンス”で判定 開発者のSCIKA氏は7月5日、『Inverted Angel』を7月5日19時にリリースすると告知した。対応プラットフォームはPCSteam)となっている。作は6月末のリリースを目指して制作が進められていたが、Steamの審査の関係もあり7月5日のリリースとなったようだ。 『Inverted Angel』は、恋人を名乗る見知らぬ女性の正体にAIによるニュアンス判定と共に迫る、Kawaii FutureミステリーADVだ。作では、ある日主人公の住むアパートの部屋へ、見覚えのない女性が突然訪ねてくる。インターフォン越しに対応したところ、彼女は主人公の恋人だと主張。扉を開けてくれないことに憤っている。さらに彼女は、当の知り合いであるかのように

    自称彼女の正体推理ゲーム『Inverted Angel』7月5日配信へ。自由入力した推理をAIが“だいたいのニュアンス”で判定 - AUTOMATON
  • 無料で複数の生成AIを同時実行・比較できる「天秤AI byGMO」 ~履歴保持機能の追加でより便利に/GPT-4o、Gemini 1.5 Pro、Claude 3 Sonnetのほか、Perplexityも利用可能

    無料で複数の生成AIを同時実行・比較できる「天秤AI byGMO」 ~履歴保持機能の追加でより便利に/GPT-4o、Gemini 1.5 Pro、Claude 3 Sonnetのほか、Perplexityも利用可能
    n2sz
    n2sz 2024/07/04
  • 角刈りオジサンから美少女ボイス 「GPU不要で超低遅延」なリアルタイム音声変換ソフトを見てきた

    ブースは、韓国の音声AI企業Supertoneが出展したもの。角刈りオジサンの美少女ボイスは、リアルタイム音声変換ソフト「SHIFT」のデモによるものだった。このSHIFT、少女だけでなく少年、成人女性、成人男性、渋いおじいさん、悪魔などさまざまな声がプリセットされており、リアルタイムかつ高精度に声を変換できるのが特徴。 独自の音声合成基盤モデル「NANSY」(Neural Analysis & Synthesis)を採用しており、ユーザーの声の事前学習も、10秒程度のサンプルスクリプトを読み上げるだけで完了。ユーザーとキャラクターの音声の混合比率や感情の表現度合い、音の高低なども細かく調整可能だ。 同様の技術として「RVC」(Realtime Voice Changer)などが有名だが、快適に利用するにはNVIDIAの高性能なGPUを必要とする。一方、SHIFTはCPUのみで47ミリ秒と

    角刈りオジサンから美少女ボイス 「GPU不要で超低遅延」なリアルタイム音声変換ソフトを見てきた
    n2sz
    n2sz 2024/07/04
    自分でやるとき、変換された声だけ聞きたいのだけど自分の声が聞こえちゃうのはどうにかならんものかね
  • Metaがテキストから3Dモデルを1分で生成するツール「3D Gen」を発表

    2024年7月2日に、Metaが60秒以内にテキストから高品質な立体形状とテクスチャを備えた3Dアセットを生成できる「Meta 3D Gen」を発表しました。Metaは、3D Genを使うと従来の3~10倍の速度で3Dアセットを生成できるとしています。 Meta 3D Gen | Research - AI at Meta https://ai.meta.com/research/publications/meta-3d-gen/ Meta Unveils 3D Gen: AI that Creates Detailed 3D Assets in Under a Minute https://www.maginative.com/article/meta-unveils-3d-gen-ai-that-creates-detailed-3d-assets-in-under-a-minute/

    Metaがテキストから3Dモデルを1分で生成するツール「3D Gen」を発表
    n2sz
    n2sz 2024/07/03
  • 動画生成AIについて:一番星はてのは目をゆっくり開き、踊れるか

    Krita の AI Diffusion プラグイン、SD のインターフェースとしてかなり良い。話題の LCM によるライブペイントも便利だし、イラストレーションツールだからレイヤーや選択ツールが使えるのが強い。すでに SD でできたことだが、こんな感じの変換が素早く、気持ちよく行える。https://t.co/bUPOZrKs1n pic.twitter.com/0hn8iMHHms — Naoto Yokoyama (@builtinnya) November 18, 2023 これらを ControlNet8 で入力して AnimateDiff を使えば済むと考えていたが、甘かった。 動画生成 AI に期待しているのは、この2枚の画像の間のフレームを説得力のある形で補間することである。しかし、7秒という長さでは、例えば次の動画1のようになってしまう。 動画1. 図1と図2を使い、パラ

    動画生成AIについて:一番星はてのは目をゆっくり開き、踊れるか
  • エンジニアにも知って欲しいChatGPT基本テクニック - Qiita

    はじめに ChatGPTブームがひと段落した感がありますが、周りのエンジニアChatGPTを活用している姿をあまり見みません。 基的なテクニックを理解すれば、エンジニアこそChatGPTを活用できると思うので、普段使用しているテクニックをいくつかピックアップして紹介します。 プロンプトの記載方法 Markdown記法で指示する 色々なところで紹介されていますが、回答や処理の精度を上げる方法としてChatGPTへの指示にMarkdown記法を使用することがオススメされています。 例えば下記のような文章による指示を行おうとした場合

    エンジニアにも知って欲しいChatGPT基本テクニック - Qiita
  • AI動画の品質が仕事に使えるレベルになってきた (1/4)

    Luma AIが6月12日に公開した動画生成AIサービス「Dream Machine」が、月に無料で30回まで試せることもあって、大きな話題となっています(「ついに来た! 無料で試せる動画生成AI『Luma Dream Machine』」参照)。ただ、技術情報は出ておらず、どういう関係や経緯で出しているかは一切不明です。 ※記事の配信先によっては動画や図版がうまく表示されないことがあります。その場合はASCII.jp掲載の記事をご覧ください 手軽に高品質な動画が生成できる「Luma AI」のサービス Luma AIはこの連載でも何回か紹介してきたように、大量の写真から3Dモデルを生成するサービスからスタートし、昨年12月には3Dモデル生成サービス「Genie」で参入しているAIスタートアップ企業です(連載第41回「3Dスキャンの進化がすごい」参照)。生成AIの3D化技術で先行していることか

    AI動画の品質が仕事に使えるレベルになってきた (1/4)
    n2sz
    n2sz 2024/07/02
  • 「よーしパパ、Ollama で Llama-3-ELYZA-JP-8B 動かしちゃうぞー」 - Qiita

    はじめに こんにちは、KDDIアジャイル開発センターのはしもと(仮名)です。 エンドレス水出しコーヒーの時期になりましたね。 今回は、Ollama を使って日語に特化した大規模言語モデル Llama-3-ELYZA-JP-8B を動かす方法をご紹介します。 このモデルは、日語の処理能力が高く、比較的軽量なので、ローカル環境での実行に適しています。さあその性能は如何ほどに!!!!????はやくAIは俺から仕事を奪え。 Llama-3-ELYZA-JP-8Bとは Llama-3-ELYZA-JP-8Bは、ELYZA社が開発した日語に特化した大規模言語モデルです。Meta社の「Llama 3」シリーズをベースに、日語での追加学習を行っています。80億パラメータという比較的小さなモデルサイズながら、「GPT-3.5 Turbo」や「Claude 3 Haiku」、「Gemini 1.0 P

    「よーしパパ、Ollama で Llama-3-ELYZA-JP-8B 動かしちゃうぞー」 - Qiita
    n2sz
    n2sz 2024/06/29
  • 【都知事選2024】AIによるマニフェストへの質疑応答システム「AIあんの」の裏側を公開します!|Jun Ito

    安野たかひろ事務所 技術チームリーダーの伊藤です。 安野は大学時代の友人で、彼が今回の選挙戦で実現しようとしている、老若男女の意見を募り、誰も取り残さないことを旨とする選挙活動・民主主義の形に共感し、ぜひ力になりたいと思いPdMエンジニアとして手伝いをしております! この記事では、先日公開になった「AIあんの」のシステムについて、技術者の観点から、実現しようとしている状態と、技術的な裏側について解説してみようと思います。 AIあんのとはAIあんのは、安野たかひろの政策を学習したAI応答システムが、人のアバターと声色によって、Youtube Liveと電話という2つの経路で、みなさまのご意見やご質問に回答するシステムです。 配信でAIあんのに質問したい場合は、以下からアクセスしてみてください。 (URLは変更になる場合があります。その際はアカウントから配信を探してみてください。) また電

    【都知事選2024】AIによるマニフェストへの質疑応答システム「AIあんの」の裏側を公開します!|Jun Ito
    n2sz
    n2sz 2024/06/28
  • 自分専用AIを作る グーグル「NotebookLM」を家電取説・辞書・時刻表で使う

    自分専用AIを作る グーグル「NotebookLM」を家電取説・辞書・時刻表で使う
    n2sz
    n2sz 2024/06/25
  • 話題のClaude「Artifacts」は対話型AIにおける「UX革命」である|梶谷健人 / 新著「生成AI時代を勝ち抜く事業・組織のつくり方」

    ChatGPTのライバルサービスの一つである「Claude」が、彼らのサーバーが一時パンクするくらい話題になっている。 その理由は、運営元のAnthropicが発表した2つのリリースだ。 リリースの1つ目は新しい大規模言語モデル「Claude 3.5 Sonnet」のリリース。そしてもう一つが、今回の話題の中心である「Artifacts」機能のリリースだ。 「Claude 3.5 Sonnet」は、ほぼ全てのベンチマークでOpenAIの最新モデル「GPT-4o」を打ち負かしており、処理スピードは前モデルの「Claude 3 Opus」の2倍で、API費用は1/5程度に下がっている。 シンプルに性能、速度、費用面などの面でトップクラスの大規模言語モデルが登場したのだ。 しかし、今回Claudeが話題になっている理由は「Claude 3.5 Sonnet」というよりも、もうひとつのリリースであ

    話題のClaude「Artifacts」は対話型AIにおける「UX革命」である|梶谷健人 / 新著「生成AI時代を勝ち抜く事業・組織のつくり方」
    n2sz
    n2sz 2024/06/23
  • 加熱するLLM開発競争に冷や水、オープンモデルの組み合わせだけでGPT-4o越えの事実

    加熱するLLM開発競争に冷や水、オープンモデルの組み合わせだけでGPT-4o越えの事実 2024.06.21 Updated by Ryo Shimizu on June 21, 2024, 18:19 pm JST 世界中の企業や政府が狂ったようにNVIDIAのGPUを買い漁る流れはそろそろ潮時かもしれない。 いくつかの興味深い事象が起きているからだ。 昨日発表されたKarakuri社のLLM、「KARAKURI LM 8x7B Instruct v0.1」は、非常に高性能な日語LLMだ。Karakuri社は今年の一月にも非常に高性能な70Bモデルを引っ提げて業界に旋風を巻き起こした。この最新のLLNは、日語向けオープンLLMとしては初の「命令実行」チューニングを施されている。それだけでなく、RAGと呼ばれる、複数の知識を組み合わせてより正解に近い答えを導く技術や、Function

    加熱するLLM開発競争に冷や水、オープンモデルの組み合わせだけでGPT-4o越えの事実
    n2sz
    n2sz 2024/06/21
  • AnthropicがClaude 3.5 Sonnetを突如発表、ベンチマーク結果はGPT-4oに匹敵

    チャットボットAI「Claude」を開発するAnthropicが新モデルとなる「Claude 3.5 Sonnet」を2024年6月21日に発表しました。これは今後リリースされるClaude 3.5ファミリーの最初となるモデルで、ベンチマーク結果はOpenAIのGPT-4oに匹敵するとのことです。 Introducing Claude 3.5 Sonnet \ Anthropic https://www.anthropic.com/news/claude-3-5-sonnet Anthropicによると、Claude 3.5 Sonnetは大学院レベルの推論力、大学学部レベルの知識とコーディング能力を持つとのこと。Claude 3 Opusなど従来のClaudeモデルと比較し、ニュアンスやユーモア、複雑な指示を理解する能力が著しく向上し、自然で親しみやすい口調で高品質のコンテンツを書く能力

    AnthropicがClaude 3.5 Sonnetを突如発表、ベンチマーク結果はGPT-4oに匹敵
    n2sz
    n2sz 2024/06/21
  • PostgreSQLを生成AIの情報源として使える高速ベクトルデータベース化拡張「Pgvectorscale」がオープンソースで公開。Pgvectorをさらに高性能化

    PostgreSQLのマネージドサービスなどを提供しているTimescaleは、PostgreSQLで高速なベクトルデータベース機能を実現する拡張機能「Pgvectorcale」をオープンソースとして公開したことを発表しました。 大規模言語モデルを用いた生成AIの注目度が高まる中で、文章や画像、音声といったデータの特徴を数値で表現するベクトル化(もしくはエンベディング)により、大規模言語モデルで扱えるようにすることへの注目も高まってきています。 ベクトルデータベースは、このベクトル化された膨大なデータの保存や類似度の検索などが可能です。 例えば、RAG(Retrieval Augmented Generation)と呼ばれる手法により大規模言語モデルの回答に外部のデータベースから取得したデータを組み込むことができます。こうした場面でベクトルデータベースが活用されます。 高速ベクトルデータベ

    PostgreSQLを生成AIの情報源として使える高速ベクトルデータベース化拡張「Pgvectorscale」がオープンソースで公開。Pgvectorをさらに高性能化
    n2sz
    n2sz 2024/06/21
  • AIでラフを線画に整えるだけの無料webアプリ『sketch2lineart』公開|とりにく

    結論から言うと、こんなことができます。 カラーイラストを線画にすることも可能です。 先日、AI-AssistantV3なるお絵描き補助AIフリーソフトを公開したのですが、多くの方から『私のPCじゃ動かん!』というご意見をいただきました。 わかる~!ちょっとAIに興味あるだけの人が20万↑のPCに手を出せるわけないよね。それが当に使えるモノかどうかもまだわからないのに。 私もできる範囲で動作サポートするものの(抜けていたらすみません!) 元々のPCのスペック問題自体はどうしようもないジレンマに葛藤していました。 ならばスマホからでも動くシンプルなwebアプリ作ったろうじゃん!!! と思ったので作りました。 機能限定版AI-AssistantV3みたいな立ち位置だと思って下さい。まぁ微妙にアルゴリズム違うんで厳密には別物ですが。 【追記】勘違いする方もいるっぽいので明記しておきます! こちら

    AIでラフを線画に整えるだけの無料webアプリ『sketch2lineart』公開|とりにく
    n2sz
    n2sz 2024/06/21
  • Luma Dream Machine プロンプトガイド|npaka

    以下の記事が面白かったので、簡単にまとめました。 ・FAQ and Prompt Guide: Luma Dream Machine 1. Image to Video のプロンプトガイド・生成ページの画像アイコンをクリックして JPG、JPEG、PNG画像をアップロードします。シーンを説明するプロンプトを提供することもできます。 ・「Enhance Prompt」を有効にすると、シーンで何が起きてほしいかを説明するだけで済みます。 <image of a car> + “a red car driving on a road” ・希望する出力が得られない場合は、「Enhance prompt」なしで試すことができます。この場合、画像とシーンで何が起きてほしいかを説明する必要があります。 強化されていないプロンプトでは、モーションがまったく見られないか、モーションがほとんど見られなくなる可

    Luma Dream Machine プロンプトガイド|npaka
    n2sz
    n2sz 2024/06/18
  • “AI野々村真”が高齢者の話し相手に!本人仰天の完成度で介護現場の人手不足解消に一助「すごい野々村真」|FNNプライムオンライン

    AI野々村真”が高齢者の話し相手に!人仰天の完成度で介護現場の人手不足解消に一助「すごい野々村真」 大手芸能事務所スターダストプロモーションや、学研ココファン、Spiral.AIなど9社は17日、AI音声対話型デジタルヒューマン「AI野々村真」を開発し、介護施設などで実証実験を開始したと発表した。 社会の高齢化が進み、介護やシニア向け介護施設での人員確保が課題となるなか、AIデジタルヒューマンが高齢者の話し相手になることで、高齢者の認知機能の改善や施設のサービス満足度の向上を目指すほか、介護施設利用者とのコミュニケーションをAIが担うことで、介護職員の人材不足の解決にも繋がっていくことを期待しているという。 野々村真さんは、数々の情報番組に出演し、高齢者にも親しみやすいキャラクターである事から、AIデジタルヒューマンに選ばれたという。 野々村さんは、「先日撮影をさせて頂きましたが、AI

    “AI野々村真”が高齢者の話し相手に!本人仰天の完成度で介護現場の人手不足解消に一助「すごい野々村真」|FNNプライムオンライン
    n2sz
    n2sz 2024/06/17
    マルチリンガルな野々村真…