タグ

ブックマーク / ascii.jp (31)

  • 『第七王子』のEDクレジットを見ると、なぜ日本アニメの未来がわかるのか (1/4)

    アニメ『転生したら第七王子だったので、気ままに魔術を極めます』を制作したアニメスタジオ「つむぎ秋田アニメLab」櫻井司社長へのロングインタビューを前後編でお届けする (C)謙虚なサークル・講談社/「第七王子」製作委員会 人気急上昇のなろう原作アニメが、他作品とひと味違う理由 たびたびX(Twitter)のトレンド入りを果たすなど、テレビアニメ『転生したら第七王子だったので、気ままに魔術を極めます』(以下、『第七王子』)が好評だ。 実はこの作品の制作スタジオ「つむぎ秋田アニメLab」の社は秋田県にあり、プロダクション成果物の多くを内製で生みだしている。2024年5月にはバンダイナムコフィルムワークスとの業務提携が発表されたことでも注目を集めた。 元請け・下請けの関係が複雑に絡み合い、海外への依存度も高い一般的なアニメ制作とはまったく異なるプロセスで生み出された作の舞台裏について、スタジオ

    『第七王子』のEDクレジットを見ると、なぜ日本アニメの未来がわかるのか (1/4)
  • AI動画の品質が仕事に使えるレベルになってきた (1/4)

    Luma AIが6月12日に公開した動画生成AIサービス「Dream Machine」が、月に無料で30回まで試せることもあって、大きな話題となっています(「ついに来た! 無料で試せる動画生成AI『Luma Dream Machine』」参照)。ただ、技術情報は出ておらず、どういう関係や経緯で出しているかは一切不明です。 ※記事の配信先によっては動画や図版がうまく表示されないことがあります。その場合はASCII.jp掲載の記事をご覧ください 手軽に高品質な動画が生成できる「Luma AI」のサービス Luma AIはこの連載でも何回か紹介してきたように、大量の写真から3Dモデルを生成するサービスからスタートし、昨年12月には3Dモデル生成サービス「Genie」で参入しているAIスタートアップ企業です(連載第41回「3Dスキャンの進化がすごい」参照)。生成AIの3D化技術で先行していることか

    AI動画の品質が仕事に使えるレベルになってきた (1/4)
  • 情報整理の決定版「NotebookLM」が最高すぎる。こういうのがほしかったのよ!! (1/7)

    最新のアプリやサービスのニュースを書くのが仕事の筆者にとって情報の整理は永遠の課題だ。 もちろん書くことを仕事にしている人に限らず、氾濫する大量の情報を必要な時に取り出して利用したいという欲求は多くの人が持っているはずだ。 以前は手書きノートやファイルのような紙媒体に保存していた情報も、時代とともに完全にデジタルに移行し、EvernoteMicrosoft OneNoteNotionといったメモを作成することに特化したクラウドアプリを利用している人も多いだろう。 筆者はおそらく普通の人よりは多くのサービスに触れているはずだが、どれも帯に短したすきに長しに感じてしまい、複数のメモアプリに情報が散乱してしまっているのが実情だ。 そこで6月6日に日でも提供が開始されたグーグルの「NotebookLM」だ。 「AI駆動型のリサーチ、執筆アシスタント」と説明されているように、参照文献(ソース)

    情報整理の決定版「NotebookLM」が最高すぎる。こういうのがほしかったのよ!! (1/7)
  • 革命レベルの動画生成AI「Kling」 ついに「Sora」対抗が出てきた

    中国SNS「快手(Kuaishou)」は、テキストから最大2分間の動画を生成できる動画生成モデル「可灵(Kling)」を開発。多数のサンプル動画を掲載するデモサイトを公開した。 テキストから最大2分間のフルHD動画を生成 A Chinese AI video generator just dropped before we got access to Sora Can generate 2-minute videos at 30fps, 1080p quality, available on the KWAI iOS app with a Chinese phone number A few generations from their site: 1. pic.twitter.com/NEmWiqKHiO — Rowan Cheung (@rowancheung) June 6, 20

    革命レベルの動画生成AI「Kling」 ついに「Sora」対抗が出てきた
  • 無料版「ChatGPT」機能増えまくり GPTs、Web検索、画像入力、データ分析など可能に

    OpenAIは5月30日、同社のチャット型AIChatGPT」の無料版ユーザーに向けて、これまで有料版サブスクライバーしか利用できなかったGPTs、ウェブブラウジング、データアナリシスといった機能を公開した。 これまで使えなかった機能を大盤振る舞い All ChatGPT Free users can now use browse, vision, data analysis, file uploads, and GPTs. https://t.co/NTXSalAV6q — OpenAI (@OpenAI) May 29, 2024 公開が始まった5月13日からGPT-4o自体は無料版ユーザーにも利用は可能(制限あり)だったが、今回の更新でそれ以外の多くの有料版専用機能が利用できるようになった形だ。 これまで無料版のChatGPTは外部インターネットにアクセスできなかったので、トレーニ

    無料版「ChatGPT」機能増えまくり GPTs、Web検索、画像入力、データ分析など可能に
  • 中国のガジェットレビューがメッチャまとも&有用になっていたのにはワケがあった (1/2)

    中国のガジェットレビューの質が格段に上がっている 中国ブランドのガジェットがどんどん日で買えるようになっている。そこで日で売られる商品のレビューと、中国の同等機種のレビューを見ていると、どうにも中国のレビューがすごく良くなっていることに気づいた。日のほうがスゴい、酷いという比較をする意図はない。あくまで中国のレビューは中国のレビューで有用になったと解釈してほしい。 近年こそ筆者はガジェットレビュー記事をあまり書かないが、2000年代は中国の物価が安かったことから、さまざまな中国製ガジェットを購入して自腹レビューしていた。自腹レビューなのは、原稿料でも十分に元が取れるほど安かったというのもあるし、中国の各メーカーが外国人の取材を受けることに慣れてなくて、そもそも対応してくれなかったというのもある。 当時の中国における製品レビューは日のレビューに比べ、どれも比べ物にならないほど内容が貧

    中国のガジェットレビューがメッチャまとも&有用になっていたのにはワケがあった (1/2)
    hagakuress
    hagakuress 2024/05/26
    ネットワークに繋がるすべてのデバイスは監視されています!とか載ってないのか?
  • ChatGPTのライバル「Claude 3」の使い方 良い点、悪い点まとめ (1/5)

    3月4日の公開以来、「Claudeやばくない?」「GPT-4を越えた」と、界隈で話題の「Claude 3」は、OpenAIの元メンバーによって設立されたAIベンチャー「Anthropic」が開発する最新の大規模言語モデル(LLM)だ。今回はChatGPTのライバルClaude 3の有料版を2週間ほどヘビーに使ってみて感じたことを、良い点と悪い点どちらも書いていきたいと思う。 Claude 3とは? 既報の通り、Claude 3はAnthropicが開発する大規模言語モデルの名称だ。 パラメーターのサイズなどが異なる3つのモデルがラインアップされている。 「Claude 3 Opus」は最も知能が高く、複雑なタスクでも最高のパフォーマンスを発揮する強力なモデル。APIやデータベースを介した複雑なアクションの計画や実行、インタラクティブコーディングなどの高度な活用が想定されている。 「Clau

    ChatGPTのライバル「Claude 3」の使い方 良い点、悪い点まとめ (1/5)
  • アップル、高度な言語理解を持つ新型AIモデル「MM1」を発表

    アップルの研究チームは3月14日、画像とテキストを理解し処理する能力を持つマルチモーダル大規模言語モデル「MM1」を発表した。今のところ論文のみの公開で、一般公開の時期は明かされていない。 一部ベンチマークではGPT-4Vをも凌ぐ性能を発揮 複数(30億、70億、300億)のパラメータサイズを備えるMM1は、10億以上の画像および30兆語以上のテキスト、GitHubのコード例などの多様なデータセットを用い、教師なし学習と教師あり学習を組み合わせる独自の方法で学習され、多様なタスクに対して高い精度を示すという。 各種ベンチマークの結果によると、30億および70億パラメーターのモデルはそれぞれのモデルサイズにおいて過去最高を記録。特にVQAv2(画像理解)、TextVQA(画像内のテキスト情報)、ScienceQA(科学知識)、MMBench(マルチモーダル)、MathVista(数学)などの

    アップル、高度な言語理解を持つ新型AIモデル「MM1」を発表
  • 日本発のリアルタイム画像生成AIサービスが熱い 大手にとっては“イノベーションのジレンマ”に (1/3)

    Akuma.ai http://akuma.ai 2024年2月、日発のクラウド型画像生成サービスAkuma.aiが、リアルタイム画像生成機能「AIキャンバス」を搭載したことが話題になりました。3月1日には生成枚数が延べ1200万枚に達したと発表。リアルタイム画像生成技術「LCM」を組み入れたサービスですが、高度なPC環境が不要で、タブレットなどからでも簡単に使えるため、国内外の幅広い層にウケたという経緯です。 🎉生成画像1200万枚突破🎉 リアルタイム「AIキャンバス」生成枚数が1200万枚を突破しました! たくさんご利用いただきありがとうございます。 今後とも #AkumaAI の応援よろしくお願いします🦑 プレスリリースはこちら:https://t.co/Yf3tjxjCsS — Akuma.ai (@AkumaAI_JP) March 1, 2024 日発の画像生成AI

    日本発のリアルタイム画像生成AIサービスが熱い 大手にとっては“イノベーションのジレンマ”に (1/3)
  • これは便利!「Stable Diffusion」が超簡単に始められる「Stability Matrix」 (1/3)

    これは便利!「Stable Diffusion」が超簡単に始められる「Stability Matrix」 複数のUI環境のインストールや更新がワンクリックで可能に 画像生成AI「Stable Diffusion」をブラウザーで使うために必要なのがUI環境。筆者が入門したときは「Stable Diffusion WebUI(AUTOMATIC1111版)」しか選択肢がなかったが、現在は「ComfyUI」「Fooocus」「Stable Diffusion WebUI Forge」など様々な種類が出ている。 これらは基的に別のアプリケーションなので、それぞれ環境設定・インストールをする必要があり、パソコンの中に複数の環境が乱立しがちだ。 さらに、これらのUIで利用するモデル(Checkpoint)やVAE(高画質化ツール)、LoRA(追加学習モデル)などもUIごとに必要になる。シンボリックリ

    これは便利!「Stable Diffusion」が超簡単に始められる「Stability Matrix」 (1/3)
  • 画像生成AI、安いPCでも高速に 衝撃の「Stable Diffusion WebUI Forge」 (1/4)

    Stable Diffusion Forgeを表示した様子。基的な操作は既存のStable Diffusion WebUI AUTOMATIC1111とほぼ同じ 画像生成AI「Stable Diffusion」用の新しいユーザーインターフェース「Forge」が2月6日に登場しました。開発したのは、これまで「Controlnet」や「Fooocus」などStable Diffusion関連の様々な重要技術を開発してきたillyasviel(イリヤスベル)さん。何よりインパクトが大きいのは、グラフィックボードのVRAM容量が小さい安価なPCでも最新版のStable Diffusion XL(SDXL)が動かせることです。 RTX 40シリーズが求められたSDXL SDXLは、2023年8月にStablity AIが発表した画像生成AI。高画質な出力ができる一方、コミュニティーサイトで話題にな

    画像生成AI、安いPCでも高速に 衝撃の「Stable Diffusion WebUI Forge」 (1/4)
  • 日本発の画像生成AIサービスがすごい 無料アップスケーラー「カクダイV1」 (1/4)

    「カクダイV1」でアップスケールした画像(左)、「Midjouney v6」で作成したオリジナル画像(右) 画像の描き込みを増やして高画質にする、日発の生成アップスケーラー「カクダイV1」が2月7日に発表されて話題になりました。東大出身ベンチャーのMavericksが開発したもので、画像生成AI「Stable Diffusion」生成環境「ComfyUI」向けの技術として無料公開されています。人気アップスケーラー「Maginific AI」を超える製品にまでに成長していくのか注目です。 Stable Diffusionのアップスケールは難しかった カクダイを紹介する前に、まずは画像生成AIとアップスケーラーとの関係についてお話します。 Stable Diffusion登場後の画像生成AI技術を使ったアップスケーラーは、単に画像を拡大させるだけの用途ではなくなりました。画像を拡大するとき、

    日本発の画像生成AIサービスがすごい 無料アップスケーラー「カクダイV1」 (1/4)
  • 控え目に言って革命。OpenAI、動画生成AIモデル「Sora」発表

    OpenAIは2月15日(現地時間)、テキストから最大1分間の動画を生成できる動画生成AIモデル「Sora」を大量のデモ動画と共に発表した。複数のキャラクター、特定の種類の動き、被写体と背景の正確な詳細を含む複雑なシーンを生成することができるという。 プロンプトから破綻のない動画を生成 Introducing Sora, our text-to-video model. Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W Prompt: “Beautiful, snowy… pic.twitter.com

    控え目に言って革命。OpenAI、動画生成AIモデル「Sora」発表
    hagakuress
    hagakuress 2024/02/17
    しょうもない賢しらってんな感漲るコメントがダイジェスト上位で萎えるよな。
  • 【自腹レポ】アップルVision Proの「歴史的価値」はなにかを考える(西田宗千佳) (1/3)

    Vision Proを購入して一週間ほどが経過した。その間筆者は毎日使っている。 SNS上ではVision Proを使った動画がバズる一方で、「結局できることはほかと同じではないか」「過去にも似たようなものはあった」という話が出てくる。 では、Vision Proは、コンピュータの歴史上どう位置付けられるべきなのか? マイクロソフトの「HoloLens」やMeta Quest、果ては初代MacintoshやWindowsのことまで考え、まとめてみよう。 Vision Proがしていることは 「空間にオブジェクトを並べることだけ」だが…… 空間にアプリケーションのウィンドーを浮かべ、それらを並べて空間を活用して作業をする。 極論すれば、Vision Proがやっているのはこれだけだ。 映画は「巨大なウィンドーを空中に配置して楽しむ」ことだし、複数の作業をするのも同様。巨大な恐竜を空中に表示す

    【自腹レポ】アップルVision Proの「歴史的価値」はなにかを考える(西田宗千佳) (1/3)
  • “世界生成AI”到来か 画像生成AIのゲームエンジン化が進む (1/5)

    Midjourneyの生成画像。12月のアップデートv6では、写真と変わらないような画像が生成されることが話題となっている。この画像のような世界を動き回れるようになるのだろうか(筆者作成) 画像生成AIサービス「Midjourney」のオフィスアワーがあったのが1月4日。アメリカ時間で1月3日ですかね。オフィスアワーというのは、MidjourneyがDiscord上で月に1回開いて、いろいろユーザー向けに今後どのようにサービスが展開されるのかを説明するミーティングです。その会合に参加していたNick St. Pierreさんの報告によると、Midjourneyのデイヴィッド・ホルツCEOが「2024年末までにホロデッキに到達できる」と話したと言うんですね。「2024 年末までには、リアルタイムのオープンワールドが実現できればと思っています」とも言い、画像生成AIが、単にイラストといった画

    “世界生成AI”到来か 画像生成AIのゲームエンジン化が進む (1/5)
  • 画像生成AI「DALL·E 3」の性能が凄まじい。これを無料で使わせるマイクロソフトは本気で競合をつぶしに来ている (1/3)

    10月1日頃、OpenAIの新しい画像生成AI「DALL·E 3(ダリ3)」が徐々に使えるようになり、その性能の高さから話題になっています。まずサプライズで使えるようになったのがマイクロソフトのBingチャット。日語で「の画像を作ってください」などと入れるだけでかわいいの画像が出てくると。これが無料で使えるのは衝撃的です。マイクロソフトが巨大資で他の会社をつぶしに来たなという感じですね。どう考えても、今のところはサーバーコストが果てしなくかかる赤字サービスなのは間違いないので……。 「ラーメンべる女の子」が描ける! なにより衝撃的だったのは、「アニメ風の少女とが遊んでいる姿を作ってください」というリクエストに対し、一発で完璧な正解を出してきたことです。Stable Diffusionだと苦手とされていた指も適切に描写されています。もうひとつの着目点はオブジェクト間の関係性です

    画像生成AI「DALL·E 3」の性能が凄まじい。これを無料で使わせるマイクロソフトは本気で競合をつぶしに来ている (1/3)
  • 米国速報:Windows11が9月26日に「Copilot」を正式搭載で150を超える新機能&新Surfaceも!

    米マイクロソフトは、現地時間9月21日に発表会を開催し、26日にWindows11の最新アップデートをおこない、AIツール「Copilot」を正式に実装すると発表。同時にSurfaceの新モデルも公開した。 Copilotは、9月26日からWindows11への無料アップデートの一部として提供され、今秋には Bing、Edge、Microsoft 365 Copilot にも展開される。公開されるWindows11は150を超える新機能を備え、Copilotのパワーと、ペイント、フォト、ClipchampなどのアプリにAIを活用した新機能が加わる。 ○Copilotのプレビュー版は常にタスクバー上に表示されるか、Win+Cショートカットを使用して起動可能となる。 ○ペイントアプリでは、生成AIによるCocreatorのプレビューに加え、背景の削除とレイヤーが追加され、画像作成にAIが活用で

    米国速報:Windows11が9月26日に「Copilot」を正式搭載で150を超える新機能&新Surfaceも!
    hagakuress
    hagakuress 2023/09/22
    そういうOSってスマホ系からくるかなぁと10年くらい前には思ってたけど、Windowsが切り開いたなぁ。
  • NTTは過疎エリアで「スターリンク」を借りたらどうか (1/4)

    自民党が防衛費を捻出するためにNTT株の売却を検討している。 その報道に対して、NTTの島田明社長は「株式の売却は政府が考えること。ただ、NTT法については時代にマッチしなくなった部分があるので見直した方がいい」とコメントした。 NTT法とは、1985年、NTTの前身にあたる電電公社が民営化された際に「日電信電話公社法」が廃止となり、新たに「日電信電話株式会社法」(NTT法)が成立されたのが発端だ。 その後、1988年にNTTデータ、1992年にNTTドコモが分社化され、現在のところ、NTT法の規制対象はNTT(持株)、NTT東日NTT西日の3社となっている。 NTT法では、NTT株の発行済み株式総数の1/3以上を政府が保有する義務が定められており、現時点で34.35%の株を所有している。 つまり、政府がNTT株を売却するにはNTT法の見直しが必要となってくるのだ。

    NTTは過疎エリアで「スターリンク」を借りたらどうか (1/4)
    hagakuress
    hagakuress 2023/09/13
    まぁ、Twitterの公共性がーとか言い出す連中も居るくらいだからな。。ユニバーサルサービス基金で頑張れ。そもそも濡れ手に粟の既得権業種なんだから。
  • アニメの常識、画像生成AIが変える可能性「AnimateDiff」のすごい進化 (1/3)

    原画と原画の間にあたる画像を複数枚入れることで、自然な連続性のある動きを作る。アニメの基となる「中割」作業を画像生成AIが実現する可能性が出てきました。鍵になっているのは「AnimateDiff」という技術。8月に入って、様々なユーザーのアップデートによって機能拡張が進められています。それは完全な画像生成AIで作られるアニメの可能性を垣間見せるほどのものです。 16コマ/2秒の短い動画が生成できる AnimateDiffは7月10日に発表された、上海AIラボ、香港中文大学、スタンフォード大学の共同研究による技術画像生成AI「Stable Diffusion」の仕組みとデータセットを利用しつつ、数百万の動画を学習させた「モーションモジュール」と呼ばれるデータセットを別途に参照させることで、連続するキャラクターの動きを生成可能にするというのが基原理です。生成できる時間は、16コマ/2秒

    アニメの常識、画像生成AIが変える可能性「AnimateDiff」のすごい進化 (1/3)
  • デジタル庁「ChatGPTを業務に組み込むための手引き」を公開

    河野太郎デジタル相は8月25日、デジタル庁が作成した「ChatGPTを業務に組み込むためのハンズオン」をX(旧Twitter)にポストした。 デジタル庁で公開している「ChatGPTを業務に組み込むためのハンズオン」。 ぜひ、参考にしてください。https://t.co/zgC9j4eKGm — 河野太郎 (@konotarogomame) August 24, 2023 同資料は、デジタル庁が中央省庁向けに開催したワークショップの資料を8月4日に一般公開した物。テキスト生成AIへの入出力の設計方法を学ぶ内容で、OpenAIの「GPTモデル」に関する基礎知識に始まり、同モデルの特性や注意点、「GPT API」の仕組みなど、学習に必要とされる情報を全46ページに渡って扱っている。

    デジタル庁「ChatGPTを業務に組み込むための手引き」を公開