タグ

ブックマーク / ascii.jp (19)

  • 音楽生成AIの進化速度に舌をまく、無料でも試せるStable Audio 2.0を使う (1/2)

    著作権侵害を未然に防ぐ機能も持つ 昨年紹介した音楽生成AI「Stable Audio」が「Stable Audio 2.0」となり大きく進化した。 生成AIがブレイクするきっかけを作った画像生成AI「Stable Diffusion」を開発したStability AIによる音楽生成AIだ。2023年8月にバージョン 1.0をリリースした際にはこの連載でも紹介した。グーグルの「MusicLM」のようにプロンプトを与えることで、音楽を作り出す音楽生成AIで、Stable Diffusionのようにステップを経て徐々に生成が完了する“拡散モデル”を使用しているのが特徴だ。Stable Audio 2.0では、モデルが新しくなったのが最大の改良点だ。ある入力に対応して生成される出力に関して、生成のルールやパターンを決めるのがモデルである。つまり、知識やアルゴリズムを持つ中核部分が改良されたことにな

    音楽生成AIの進化速度に舌をまく、無料でも試せるStable Audio 2.0を使う (1/2)
  • 画像生成AI「Stable Diffusion」使うなら「ComfyUI」のワークフローが便利です (1/4)

    プロンプト:1 girl, photorealistic, solo, perfect lighting, sailor dress, looking at viewer, long hair, black hair, two side up, ネガティブプロンプト:illustration, 3d render, (worst quality:2), (low quality:2), (normal quality:2), signature, watermark, username, open mouth

    画像生成AI「Stable Diffusion」使うなら「ComfyUI」のワークフローが便利です (1/4)
  • 日本発の画像生成AIサービスがすごい 無料アップスケーラー「カクダイV1」 (1/4)

    「カクダイV1」でアップスケールした画像(左)、「Midjouney v6」で作成したオリジナル画像(右) 画像の描き込みを増やして高画質にする、日発の生成アップスケーラー「カクダイV1」が2月7日に発表されて話題になりました。東大出身ベンチャーのMavericksが開発したもので、画像生成AI「Stable Diffusion」生成環境「ComfyUI」向けの技術として無料公開されています。人気アップスケーラー「Maginific AI」を超える製品にまでに成長していくのか注目です。 Stable Diffusionのアップスケールは難しかった カクダイを紹介する前に、まずは画像生成AIとアップスケーラーとの関係についてお話します。 Stable Diffusion登場後の画像生成AI技術を使ったアップスケーラーは、単に画像を拡大させるだけの用途ではなくなりました。画像を拡大するとき、

    日本発の画像生成AIサービスがすごい 無料アップスケーラー「カクダイV1」 (1/4)
  • 画像生成AI「Stable Diffusion」使い倒すならコレ! 「ComfyUI」基本の使い方 (1/3)

    前回はStable Diffusionをブラウザーで利用するためのUIとして「Stable Diffusion web UI(AUTOMATIC1111版)」、「Fooocus」と共に多く使われている「ComfyUI」のインストール方法を紹介した。とりあえず画像の生成はできたので、あらためてインターフェースを詳しく見ていこう。 まずは前回の手順に従いインストールした「ComfyUI」を起動。この画面が出ていなければ「Load Default」をクリックしよう。 いくつかの四角いパーツが、カラフルなケーブルのようなもので接続されているのが見える。 ComfyUIでは配置されたそれぞれのパーツを「ノード」と呼ぶ。それぞれのノードは「モデルをロードする」「プロンプトを書く」といった機能を持っている。これらをブロックのように組み合わせて利用したい機能を構築していくのが「ノードベース」と呼ばれるCo

    画像生成AI「Stable Diffusion」使い倒すならコレ! 「ComfyUI」基本の使い方 (1/3)
  • 控え目に言って革命。OpenAI、動画生成AIモデル「Sora」発表

    OpenAIは2月15日(現地時間)、テキストから最大1分間の動画を生成できる動画生成AIモデル「Sora」を大量のデモ動画と共に発表した。複数のキャラクター、特定の種類の動き、被写体と背景の正確な詳細を含む複雑なシーンを生成することができるという。 プロンプトから破綻のない動画を生成 Introducing Sora, our text-to-video model. Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W Prompt: “Beautiful, snowy… pic.twitter.com

    控え目に言って革命。OpenAI、動画生成AIモデル「Sora」発表
  • 画像生成AI「Stable Diffusion」を使い倒す! モジュラーシンセみたいな「ComfyUI」をインストール (1/3)

    sponsored キャンペーン期間は2024年4月22日まで 14900K&RTX 4080 SUPERで2万円オフ!! サイコム春キャンペーンで得するオススメ構成はコイツ sponsored 三井デザインテックにkintoneを導入した富士通Japan 基幹システム連携と伴走に強み sponsored kintoneで営業システムを刷新 アサヒ飲料をコムチュアがサポート sponsored はじめて買ったパソコンを安心して使う!「セキュリティ初心者のための三原則」 sponsored JN-34VC165UQRをレビュー 3440×1440ドットで165Hz駆動!湾曲ウルトラワイドでFPSにも使えるオールラウンダー sponsored クリエイティブな作業にも活用できる広色域&高速応答 4KのRAPID IPSディスプレーはワンランク上のゲーミング環境を約束!MSI「MAG 322UP

    画像生成AI「Stable Diffusion」を使い倒す! モジュラーシンセみたいな「ComfyUI」をインストール (1/3)
  • “世界生成AI”到来か 画像生成AIのゲームエンジン化が進む (1/5)

    Midjourneyの生成画像。12月のアップデートv6では、写真と変わらないような画像が生成されることが話題となっている。この画像のような世界を動き回れるようになるのだろうか(筆者作成) 画像生成AIサービス「Midjourney」のオフィスアワーがあったのが1月4日。アメリカ時間で1月3日ですかね。オフィスアワーというのは、MidjourneyがDiscord上で月に1回開いて、いろいろユーザー向けに今後どのようにサービスが展開されるのかを説明するミーティングです。その会合に参加していたNick St. Pierreさんの報告によると、Midjourneyのデイヴィッド・ホルツCEOが「2024年末までにホロデッキに到達できる」と話したと言うんですね。「2024 年末までには、リアルタイムのオープンワールドが実現できればと思っています」とも言い、画像生成AIが、単にイラストといった画

    “世界生成AI”到来か 画像生成AIのゲームエンジン化が進む (1/5)
  • デジタル庁「ChatGPTを業務に組み込むための手引き」を公開

    河野太郎デジタル相は8月25日、デジタル庁が作成した「ChatGPTを業務に組み込むためのハンズオン」をX(旧Twitter)にポストした。 デジタル庁で公開している「ChatGPTを業務に組み込むためのハンズオン」。 ぜひ、参考にしてください。https://t.co/zgC9j4eKGm — 河野太郎 (@konotarogomame) August 24, 2023 同資料は、デジタル庁が中央省庁向けに開催したワークショップの資料を8月4日に一般公開した物。テキスト生成AIへの入出力の設計方法を学ぶ内容で、OpenAIの「GPTモデル」に関する基礎知識に始まり、同モデルの特性や注意点、「GPT API」の仕組みなど、学習に必要とされる情報を全46ページに渡って扱っている。

    デジタル庁「ChatGPTを業務に組み込むための手引き」を公開
  • ノキア、新ロゴを発表! 60年ぶりにデザインを変更

    ノキアは2月26日(現地時間)、ロゴデザインをおよそ60年ぶりにリニューアルしたことを公表した。 より現代的でデジタルなデザインに変更 新しいロゴは、旧ロゴの特徴であったイエールブルー(YALE BLUE)と呼ばれる青色を捨て、状況に応じて適用するいくつかのパターンが用意されている。 This is Nokia, but not as the world has seen us before. Our new brand signals who Nokia is today. We’re unleashing the exponential potential of networks and their power to help reshape the way we all live and work. https://t.co/lbKLfaL2OI#NewNokiapic.twitte

    ノキア、新ロゴを発表! 60年ぶりにデザインを変更
  • Googleが設計した次世代通信プロトコル「QUIC」とは?

    プライム・ストラテジー「KUSANAGI」の開発チームの石川です。 「KUSANAGI」はWordPressをはじめとするCMSを高速に動作させる世界最速クラスの仮想マシンです。わたしたちは「KUSANAGI」を開発して皆様にご利用いただくほか、お客様のウェブサイトを「KUSANAGI」で運用しています。 この連載では、「KUSANAGI」の開発やお客様とのお話の中で感じた課題や実際の運用の中で得た知見などをお伝えしています。 今回は次世代のHTTPとも呼ばれる「HTTP/3」の裏側で使われている「QUIC(クイック)」についてお話ししたいと思います。 Googleが通信パフォーマンス改善について追求した「QUIC」 QUICはもともとGoogleによって設計されたトランスポート層の通信プロトコルです。 Googleがプロトコルを開発することを意外に思う人がいるかもしれませんが、Googl

    Googleが設計した次世代通信プロトコル「QUIC」とは?
  • iPhone対応“自動文字起こし”アプリ「UDトーク」賢い使い方を開発者に聞いた (1/5)

    アプリや専用デバイスを使った、日語の「自動文字起こし」に関連するサービスには、近年多くの関心が集まっている。背景にはスマホやAIを活用する音声認識テクノロジーが飛躍を遂げたことや、コロナ禍の影響を受けてリモートワークが普及したことなどがある。iPhoneに対応する「UDトーク」も自動文字起こしに対応する注目のアプリだ。開発者に特徴を聞いた。 iPhone/iPadでも使える日語対応の自動文字起こしアプリ コミュニケーション支援・会話の見える化アプリをうたう「UDトーク」は、Shamrock Records(シャムロック・レコード)の代表兼エンジニアである青木秀仁氏が開発を手がけている。 モバイル版アプリはiOS/Android/Fire OSの各プラットフォームに対応する。ほかにも音声認識の結果を修正したり、事前に作成した原稿をスマホやタブレットに送信する一部機能を搭載するMac版/

    iPhone対応“自動文字起こし”アプリ「UDトーク」賢い使い方を開発者に聞いた (1/5)
  • 生まれ変わったFacebook OrigamiはSketch連携でプロトタイピングの新定番なるか

    各社から続々と新プロダクトがリリースされるプロトタイピングツール戦国時代。Facebookが公開しているプロトタイピングツール「Origami Studio」の実力は? 以前書いた記事でOrigamiプロトタイピングツールを紹介しましたが、そのときはまだQuartz Composerの付属ツールに過ぎませんでした。Origamiを使うと優れたプロトタイプを作成できましたが、Quartz Composerの要件に戸惑う人が多かったのも事実です。Origamiとはいったいどのようなツールで、どんな人が利用するのでしょうか? 「よく使っているソフトとOrigamiだけを使いたい。たとえばSketchと連携してくれたら!」 こんなことをFacebookで聞いたり、少なくとも同じことを考えたりしている人は多いでしょう。 2017年のはじめにFacebookのOrigamiは全面的に見直され、スタンド

    生まれ変わったFacebook OrigamiはSketch連携でプロトタイピングの新定番なるか
  • アドビ調査「人事評価は時代遅れ、多くの時間を費やし無駄」

    アドビシステムズは4月5日、米国の1500人の会社員を対象に実施した調査「Performance Reviews Get a Failing Grade(パフォーマンスレビューに不合格判定)」の結果をブログ内で公表した。 人事評価の多くは時代遅れで、多くの時間を費やさなくてはならないストレスフルなものと認識され、調査によると、従来型の人事評価が従業員やマネージャーからいかに非生産的で無意味だと思われているかを明らかにしているという。 調査対象となった従業員の88%は、ランク付けや数値の評価をともなう文書によるレビューなど、体系的な従来型の人事評価を定期的に受けなければならないと答えている。 しかし、こうしたレビューが同僚間の競争を激化させ、人間関係上のストレスを増やしており、感情的なやりとりや退職にも繋がるとも回答している。 主な調査結果は以下のようになっている。 従業員とマネージャーの多

    アドビ調査「人事評価は時代遅れ、多くの時間を費やし無駄」
  • SVG線画が美しいリッチアニメーションの作り方 (1/2)

    ページ遷移が楽しい繊細で滑らかな動き CSS3を使った滑らかな動きと大胆なタイポグラフィが魅力的な「Beatrice Creations」。黒と白を基調とした至ってシンプルなデザインながら、つい全ページを見てみたくなる、飽きのこない演出が施されている。 Béatrice Créationsでは、複数ある作品のロゴにSVGが使われており、作品ページを移動するたびに美しいカーブを描く。軽量で、枠線や線画によって繊細でリッチな世界観を演出する、今注目のSVGアニメーションを有効に活かしたサイトだ。 今回はこのサイトをヒントに、SVGの基と、CSS3アニメーションを使った動かし方を解説する。CSSHTMLのみで次のような枠線とテキストを描き、最終的にはjQueryを使って色を変えるデモを制作する。 STEP 1:SVGのパスを作成する アニメーションを作る前に、Illustratorを使って素

    SVG線画が美しいリッチアニメーションの作り方 (1/2)
  • 演説下手の候補に読ませたい「モンロー式説得術」

    駅前に停車した選挙カーから出てきた若者は、弱々しい声で「○○駅前の皆さまお騒がせします。○○党の○○○○でございます」と演説を始めた。どんな内容なのかと思ったが、小声で名前しか言わないので立ち止まらずに改札に向かった。私が電車に乗るまでの数分間の出来事だから、もしかすると彼は演説の名手なのかもしれない。だが恐らくは、党部から演説原稿を受け取っただけで、街頭演説の「極意」のような指導は受けていない新人候補だろう。 私が新人記者・編集者だったころは「文章が下手だから転職しろ」とか「この業界に向いていないから辞めろ」とか、さんざん先輩社員から嫌みを言われた。今から思えば、先輩たちの意見は正しくて、初期の記事を読み返すと確かにひどい。今でも上手な文章を書いている自覚はないが、昔は当にひどかった。ただ、や雑誌はたくさん読んでいたので、原稿を書くとき、ゼロから考えるのではなくて、自分が上手だと思

    演説下手の候補に読ませたい「モンロー式説得術」
  • 絶対見ておきたい有名企業のスマホサイトまとめ (1/5)

    この記事で取り上げているスマートフォンサイトの「BEFORE & AFTER」を以下の記事で紹介しています。合わせてご覧ください。 日のスマホサイトは2年間でこんなに変わった iPhoneAndroidの普及を背景に、スマートフォンのブラウザー向けにコンテンツや表示を最適化した「スマートフォンサイト」(スマホサイト)を開設する企業が増えている。当初はiPhone(iOS)の標準UIに倣った画一的なデザインが多かったが、最近では独特のレイアウトや斬新な色使いの個性的なスマートフォンサイトも増えてきた。 ここでは、Web制作者が見ておきたいスマートフォンサイトを紹介する。実務で参考にできるように、対象を日語の企業サイトに絞り、業種別に分類してまとめた。スマートフォンサイトの制作に入る前にチェックしておこう。

    絶対見ておきたい有名企業のスマホサイトまとめ (1/5)
  • jQuery作者が明かす「jQuery Mobile」の魅力

    JavaScriptをWebデザイナーでも扱える身近な存在に変えた「jQuery」。世界中の有名サイトで使われている人気フレームワークの作者=ジョン・レッシグ(John Resig)氏が次に注目したのが「モバイル」です。2010年10月に最初のアルファ版がリリースされた「jQuery Mobile」は、モバイルWebアプリケーションフレームワークの命として、多くの開発者の関心を集めています。 稿では、11月13日に開幕するWeb Directions East 2010に合わせて来日予定のジョン・レッシグ氏が、jQuery Mobileの魅力(の一部)を紹介します。(編集部) クロスブラウザーやブラウザー固有の問題を避け、高いインタラクションを手軽に組み込むには jQueryのようなJavaScriptライブラリーの利用が欠かせません。jQueryはDOMへアクセスしたり、イベントを付

    jQuery作者が明かす「jQuery Mobile」の魅力
  • 話題の新画像フォーマット「WebP」をOS Xで使う (1/2)

    連載「Apple Geeks」は、Apple製ハードウェア/ソフトウェア、またこれらの中核をなすOS X/iOSに関する解説をあますことなくお贈りする連載です(連載目次はこちら)。 UNIX使い向けをはじめ、Apple関連テクノロジー情報を知りつくしたいユーザーに役立つ情報を提供します。 最近、iPhone 4のホームボタンの調子が悪いんです。押しても反応が鈍く、2度押しに失敗すること度々。ああ、ストレスたまりまくり。何か良い解決法は? さて、今回は、Googleが新たに公開した画像形式「WebP」(ウェッピー)について。同品質のJPEGに比べファイルサイズは10~80%と高圧縮率が話題の画像フォーマットを、OS Xで試してみよう。 What's 「WebP」 WebPについて述べる前に、Googleがなぜ新しい静止画像フォーマットを普及させようとしているのか、その部分から解説してみたい

    話題の新画像フォーマット「WebP」をOS Xで使う (1/2)
    kudakurage
    kudakurage 2010/10/14
    WebP!
  • iPhoneがJavaScript+SQLiteでGPSレコーダーに! (1/5)

    JavaScriptを使ってGPSデータを取得できるようになったiPhone OS 3.0。前回は、現在の位置情報を取得し、Googleマップに表示する方法を紹介しました。後編は、位置情報と日時をデータベースにどんどん記録していくプログラムを作ってみましょう。 Safariのデータベースを使う iPhoneに搭載されているSafariは、HTML5で追加される予定のAPI「Client-side database storage」を先行実装しており、ブラウザーが用意しているローカルデータベースにJavaScriptを使ってデータを保存できます。 iPhoneのSafariはデータベースエンジンとして「SQLite」を実装しています。SQLiteは、SQLのすべての命令には対応していませんが、簡単なWebアプリケーション用途であれば十分な機能を持つデータベースエンジンです。個々のテーブルは「

    iPhoneがJavaScript+SQLiteでGPSレコーダーに! (1/5)
  • 1