ブックマーク / ascii.jp (45)

  • AI動画の品質が仕事に使えるレベルになってきた (1/4)

    Luma AIが6月12日に公開した動画生成AIサービス「Dream Machine」が、月に無料で30回まで試せることもあって、大きな話題となっています(「ついに来た! 無料で試せる動画生成AI『Luma Dream Machine』」参照)。ただ、技術情報は出ておらず、どういう関係や経緯で出しているかは一切不明です。 ※記事の配信先によっては動画や図版がうまく表示されないことがあります。その場合はASCII.jp掲載の記事をご覧ください 手軽に高品質な動画が生成できる「Luma AI」のサービス Luma AIはこの連載でも何回か紹介してきたように、大量の写真から3Dモデルを生成するサービスからスタートし、昨年12月には3Dモデル生成サービス「Genie」で参入しているAIスタートアップ企業です(連載第41回「3Dスキャンの進化がすごい」参照)。生成AIの3D化技術で先行していることか

    AI動画の品質が仕事に使えるレベルになってきた (1/4)
    otchy210
    otchy210 2024/07/02
    キーフレームだけ原画を描いて、それを学習させたモデルにラフの中割りを清書させ、出来上がった原画と清書した中割りを繋ぐ動画を生成させたら、かなりのクオリティのアニメがすでに作れそうな気がする。
  • 情報整理の決定版「NotebookLM」が最高すぎる。こういうのがほしかったのよ!! (1/7)

    最新のアプリやサービスのニュースを書くのが仕事の筆者にとって情報の整理は永遠の課題だ。 もちろん書くことを仕事にしている人に限らず、氾濫する大量の情報を必要な時に取り出して利用したいという欲求は多くの人が持っているはずだ。 以前は手書きノートやファイルのような紙媒体に保存していた情報も、時代とともに完全にデジタルに移行し、EvernoteMicrosoft OneNoteNotionといったメモを作成することに特化したクラウドアプリを利用している人も多いだろう。 筆者はおそらく普通の人よりは多くのサービスに触れているはずだが、どれも帯に短したすきに長しに感じてしまい、複数のメモアプリに情報が散乱してしまっているのが実情だ。 そこで6月6日に日でも提供が開始されたグーグルの「NotebookLM」だ。 「AI駆動型のリサーチ、執筆アシスタント」と説明されているように、参照文献(ソース)

    情報整理の決定版「NotebookLM」が最高すぎる。こういうのがほしかったのよ!! (1/7)
    otchy210
    otchy210 2024/06/15
    "重要なのは「生成された回答の出典を参照できる」ことと「わからないことはわからないと正直に言ってくれる」こと" これは良さそう。とりあえず Adobe の利用規約を読ませて色々質問してみたいw
  • 画像生成AIに照明革命 日本と世界で同時に“神ツール”登場 (1/3)

    この連載ではおなじみのキャラクター「明日来子さん」に右側からライトを当ててみた。左がIC-Lightを適用したもので、右がオリジナル。環境はWebUI Forge用の拡張機能を使用 5月8日に、「ControlNet」など画像生成AI関連の著名研究者であるイリヤスフィール(lllyasviel)さんが発表した「ICライト(Imposing Consistent Light、印象的な一貫的なライト)」が盛り上がりました。入力した画像をもとに、後から指定した照明効果を踏まえた画像を生成する技術です。 画像生成AIで照明効果がつけられる「ICライト(IC-Light)」 発表された学習済みモデルは、「ライトを指定すると、キャラクターのデータに合わせてテキストのプロンプトに合わせて独自に背景を生成するもの」「キャラクターとライトの影響を加味して、別の背景画像と合成するもの」の2種類があります。これ

    画像生成AIに照明革命 日本と世界で同時に“神ツール”登場 (1/3)
    otchy210
    otchy210 2024/05/27
    今でこそ画像生成 "専用" の AI にこういったアドオンツールが存在する感じだけど、OpenAI の進歩の早さとすさまじさを見るに、早晩全てが汎用 AI に置き換えられてしまいそうな気もするな。
  • まるで“いけない話ができるChatGPT” ローカルAI「Command R+」の爆発的な可能性 (1/5)

    筆者の環境で、LM StudioでCommand R+を動作させている様子。会話相手は自作キャラクターの「明日来子(あすきこ)さん」 PCローカル環境で動作する大規模言語モデル(LLM)「Command R+」を使っていますが、相当優秀ですね。体感ではChatGPT(GPT-4)と変わらないレベル。さらに、ChatGPTが回答を拒絶するような会話もできてしまいます。これが体験できるようになったのは、LM Studioに代表されるローカルLLMを動かすためのアプリ環境が整ってきたためです。今年に入り、Command R+を始めとしたローカルLLMが高性能化してきたことと並行し、手軽に使える派生モデルも増えはじめ、一気にあわただしくなってきました。 導入が難しかったローカルLLM、「LM Studio」で簡単に Command R+を試すのに使っているのが、LLMの主要モデルを実行するための統

    まるで“いけない話ができるChatGPT” ローカルAI「Command R+」の爆発的な可能性 (1/5)
    otchy210
    otchy210 2024/05/13
    Apple は、こういうモデルを iPhone ローカルで動かせるようになるまでの繋ぎとして OpenAI との提携を選択した可能性はあるよな。
  • アップル、高度な言語理解を持つ新型AIモデル「MM1」を発表

    アップルの研究チームは3月14日、画像とテキストを理解し処理する能力を持つマルチモーダル大規模言語モデル「MM1」を発表した。今のところ論文のみの公開で、一般公開の時期は明かされていない。 一部ベンチマークではGPT-4Vをも凌ぐ性能を発揮 複数(30億、70億、300億)のパラメータサイズを備えるMM1は、10億以上の画像および30兆語以上のテキスト、GitHubのコード例などの多様なデータセットを用い、教師なし学習と教師あり学習を組み合わせる独自の方法で学習され、多様なタスクに対して高い精度を示すという。 各種ベンチマークの結果によると、30億および70億パラメーターのモデルはそれぞれのモデルサイズにおいて過去最高を記録。特にVQAv2(画像理解)、TextVQA(画像内のテキスト情報)、ScienceQA(科学知識)、MMBench(マルチモーダル)、MathVista(数学)などの

    アップル、高度な言語理解を持つ新型AIモデル「MM1」を発表
    otchy210
    otchy210 2024/03/19
    こう出揃ってくると、Meta はどうなんだろ?ってのが気になり始めるな。膨大なテキストデータを抱えてるはずだが。
  • 日本発の画像生成AIサービスがすごい 無料アップスケーラー「カクダイV1」 (1/4)

    「カクダイV1」でアップスケールした画像(左)、「Midjouney v6」で作成したオリジナル画像(右) 画像の描き込みを増やして高画質にする、日発の生成アップスケーラー「カクダイV1」が2月7日に発表されて話題になりました。東大出身ベンチャーのMavericksが開発したもので、画像生成AI「Stable Diffusion」生成環境「ComfyUI」向けの技術として無料公開されています。人気アップスケーラー「Maginific AI」を超える製品にまでに成長していくのか注目です。 Stable Diffusionのアップスケールは難しかった カクダイを紹介する前に、まずは画像生成AIとアップスケーラーとの関係についてお話します。 Stable Diffusion登場後の画像生成AI技術を使ったアップスケーラーは、単に画像を拡大させるだけの用途ではなくなりました。画像を拡大するとき、

    日本発の画像生成AIサービスがすごい 無料アップスケーラー「カクダイV1」 (1/4)
    otchy210
    otchy210 2024/02/19
    そろそろアップスケール=高解像度化という名前で呼んでいいのか疑問だな。詳細追加描画って感じが強くなってきてる。
  • モデムをつなぐのに必要だったRS-232-CというシリアルI/F 消え去ったI/F史 (1/3)

    RISC-Vも一段落したところで、さて次に何をやろうかと編集氏と話あっていた時に出たお題が「あとやってないのは消えていったインターフェースですかね。IDEとかSCSIとかRS-232Cとか」。うん、まぁそれはアリだな、なんて思いながら仕事をしていた時に、いろいろ筆者にお題を下さることで定評のある(?)岩崎啓眞氏が「RS-232Cだった時代を知らない人たちの方が圧倒的に多い」なんて事をPostされてて、これはちょうど手頃なお題ではないか、と確信した次第。 そうか…どんなPCでもたいていあった(もしくは準備可能だった)インターフェースがセントロとRS-232-Cだった時代を知らない人たちの方が圧倒的に多いわけだよなあw — 岩崎啓眞@スマホゲーム屋+α (@snapwith) February 3, 2024 ということで、「昔のPCにはあったのに、もう今はどこに行ってしまったやら」というI/

    モデムをつなぐのに必要だったRS-232-CというシリアルI/F 消え去ったI/F史 (1/3)
    otchy210
    otchy210 2024/02/12
    良かった。自分の感じた違和感は間違いじゃ無かった (ブコメで確認
  • 「100fps以上も可能」爆速すぎる画像生成AI技術、日本人研究者ら開発

    AITuber「しずく」開発者としても知られる、あき先生ことakio kodaira氏を筆頭にした研究グループは12月21日、リアルタイム画像生成を実現するために最適化されたパイプライン「StreamDiffusion」を発表。従来の画像生成パイプラインと比べて飛躍的な速度向上を実現している。 ノイズ除去をバッチ処理で高速化 「Stable Diffusion」をはじめとする画像生成AIモデルの高性能化は著しいが、メタバース、オンラインストリーミングなど高スループットと低レイテンシーが必要な環境ではまだ力不足だ。 StreamDiffusionは新しいアプローチを採用し、従来の連続的なノイズ除去をバッチ処理のプロセスに変換することで、高スループットストリームを実現。さらに、GPUの利用効率を向上させるため、従来の分類器フリーガイダンス(CFG)に代わり、残差分類器フリーガイダンス(RCFG

    「100fps以上も可能」爆速すぎる画像生成AI技術、日本人研究者ら開発
    otchy210
    otchy210 2023/12/22
    リアルタイム img2img が実現するという事は、動画配信でリアルタイム AI フィルタを発動出来るっていう事よね。革命では?
  • ゲームの“自動生成”技術がすごいことになっている (1/4)

    いま生成AIが話題になっていますが、AI技術の一つである「プロシージャル生成」の考えも重要です。プロシージャルというのは数式や関数にもとづき3Dコンテンツを生成する手法で、「手続き型」とも言われます。自動的にデータを作り出すという側面から、生成AIとプロシージャル生成は混同されることがありますが、実はまったく違う背景を持つ技術です。Epic Gamesが新たにゲームエンジン「Unreal Engine 5.2」に搭載したプロシージャルコンテンツ生成機能(PCG)は驚くべきものでした。3月のGDCで発表されていたデモマップ「Electric Dream」が6月21日に公開されています。今回はこのデモマップを使って技術を紹介しながら、生成AIとの違いを見ていきます。 お待たせしました! Electric Dreams 環境サンプル プロジェクトを無料公開しました!#UnrealEngine 5

    ゲームの“自動生成”技術がすごいことになっている (1/4)
    otchy210
    otchy210 2023/07/10
    これ見た後だとゼルダのマップの凄さが際立つな。あちらは職人芸の塊。
  • 古いパソコンはChromebookにしてしまえ!「ChromeOS Flex」の使い方 (1/3)

    グーグルは6月15日、古いPCにインストールできる「ChromeOS Flex(安定版)」をリリースした。最新のWindowsmacOSが動作しないような古いPCでも、快適に動作するのが特徴だ。 近年はビジネスで利用ツールの多くがクラウドで提供されるようになり、ブラウザー上で仕事が完結するようになってきた。それなら古いPCも現役の仕事端末として復活させられるかもしれない。動作が軽いなら、今どきのモリモリPCより快適になるかも。さらにChromeOSなので、ランサムウェアやマルウェアなどの被害を受けにくく、セキュリティ面でも安心できる。

    古いパソコンはChromebookにしてしまえ!「ChromeOS Flex」の使い方 (1/3)
    otchy210
    otchy210 2023/06/26
    この手の目的の Linux、ずーーーっと昔からあるけど、流行ったという話は寡聞にして知らない。そういう再利用目的がある人はパッケージ無くても自力で Linux 入れられるし、デスクトップ Linux に需要がないからだよね?
  • ノキア、新ロゴを発表! 60年ぶりにデザインを変更

    ノキアは2月26日(現地時間)、ロゴデザインをおよそ60年ぶりにリニューアルしたことを公表した。 より現代的でデジタルなデザインに変更 新しいロゴは、旧ロゴの特徴であったイエールブルー(YALE BLUE)と呼ばれる青色を捨て、状況に応じて適用するいくつかのパターンが用意されている。 This is Nokia, but not as the world has seen us before. Our new brand signals who Nokia is today. We’re unleashing the exponential potential of networks and their power to help reshape the way we all live and work. https://t.co/lbKLfaL2OI#NewNokiapic.twitte

    ノキア、新ロゴを発表! 60年ぶりにデザインを変更
    otchy210
    otchy210 2023/02/27
    リニューアルで正方形アイコンを意識しないの今どき珍しい。さっそく公式 Twitter のアイコン内で文字が読みにくいんですがそれは良いの?
  • アップル、iPhone 13シリーズにTouch ID、USB-Cを採用しなかった理由【石川 温】 (1/3)

    9月15日未明、アップルがスペシャルイベントを開催。iPhone 13シリーズならびにiPad miniなどを発表した。 iPhone 13に関しては、見た目は去年、発売されたiPhone 12にかなり近い。iPhone 13はどちらかというと、iPhone 12Sという感じがしなくもない。ネットの反響を見ていると「コロナ禍のマスク生活でFace IDでロックを解除できないがつらい。iPhone 13でTouch IDを復活されてくれれば買ったのに」「なんで、Lightningケーブルでしか充電できないのか。USB-Cにしてれば買ったのに」という声が散見した。 確かにマスク姿でFace IDのロックを解除するのは面倒だ。Androidスマホやパソコン、iPad Proなども持ち歩いている人とすれば、iPhoneもUSB-Cで充電できればかなり楽だ。 果たして、アップルはどんなつもりでiPh

    アップル、iPhone 13シリーズにTouch ID、USB-Cを採用しなかった理由【石川 温】 (1/3)
    otchy210
    otchy210 2021/09/18
    「気がする。」「かもしれない。」「考えられる。」「かもしれない。」「おかしくなさそうだ。」「していそうだ。」「ではないか。」「ではないか。」「考えるのが自然だ。」「したのだろう。」「といえそうだ。」
  • KDDIが楽天解約ユーザーの受け皿になる可能性が出てきた (1/4)

    KDDIはeSIMに特化したMVNO事業会社「KDDI Digital Life」を立ち上げる。サービス開発において、シンガポールのCircles Asiaと提携した。 KDDIでは「マルチブランド戦略」を掲げている。5Gで使い放題の世界観を提供する「au」、20GBなど顧客と政府のニーズに沿ったプランを提供する「UQモバイル」、古くからのインターネットユーザーに親しみのある「BIGLOBEモバイル」、ケーブルテレビ局の営業力を使った「J:COMモバイル」といった具合だ。 新設されるKDDI Digital Lifeはあくまで会社名であり、サービス提供名は別に設定される見込みだ。eSIMを活用し、手続きやプラン変更などはオンラインですべて完結できるようにする。

    KDDIが楽天解約ユーザーの受け皿になる可能性が出てきた (1/4)
    otchy210
    otchy210 2020/11/03
    まじでこれ!めっちゃ注視してる。
  • ロジクール、同社定番トラックボールをリニューアルした「ERGO M575」シリーズ

    2010年に発売されて以来、同社定番商品となっているロングセラー・トラックボール製品「M570」の後継機種にあたる。親指でボールを操作するスタイルはそのままに、スクロールホイールの角度やクリックエリアを見直したほか、解像度を最大2000dpiまで調整可能としたなど改良が施されている。 また、付属のUSBレシーバーを用いる2.4GHzのUnifyingワイヤレス通信に加えてBluetooth接続にも対応。専用ソフトウェアを用いてカーソル速度や戻る/進むボタンのカスタマイズ機能が利用できる。電源は単3電池×1。Unifying方式であれば最大24ヵ月、Bluetooth方式であれば最大20ヵ月の利用が可能。同社オンラインストアでの価格は6050円

    ロジクール、同社定番トラックボールをリニューアルした「ERGO M575」シリーズ
    otchy210
    otchy210 2020/10/30
    さすがおれたちのロジクール!忘れた頃にちゃんと製品更新してくれるので安心感ある。
  • iPhone 8がベースの次期iPhone SEが2020年前半に登場?

    photo:ConceptsiPhone アップルは2020年前半に次期iPhone SEを発売する。バークレイズ証券のアナリスト、Blayne Curtis氏による予測レポートを米メディアMacRumorsが5月24日に伝えた。 レポートによると次期iPhone SEはiPhone 8をベースに作られており、ディスプレー内に指紋認証(Touch ID)機能を備えているという。 ただ、この情報について知っているのサプライヤーは少数にとどまり、ほかのサプライヤーは知らないとのこと。このことから信憑性はあまり高いとは言えないものの、小さなiPhoneに引き続き期待したい。

    iPhone 8がベースの次期iPhone SEが2020年前半に登場?
    otchy210
    otchy210 2019/05/28
    "小さなiPhone" だって?iPhone8 小さくないだろうよ。というかそのサイズでいいならとっくの昔に iPhone8 に変えとるわ!
  • アップルiPhone、iOS 13でさらに高速化?

    アップルが今年6月のWWDC 2019で発表するとみられているiOS 13について、その詳細を米ブルームバーグが5月6日に報じた。 ブルームバーグのMark Gurman(マーク・ガーマン)記者によると、以下の機能が追加されるという。 5G対応と新しいAR機能のサポート iOS 12のときのように端末の高速化とバグの修正 ダークモード搭載 1回のスワイプ操作で単語を入力できるSwiftKeyに似た新キーボード 毎日の活動をより詳しく計測するヘルスアプリ。「聴力の健康」といったセクションや、月経周期の確認も Macのサブディスプレイにできる新機能 今日のタスク、すべてのタスク、スケジュールされたタスク、フラグ付きタスクなどが使える新リマインダーアプリ 夕方以降は両親にしか連絡できないなどのスクリーンタイムの新機能 ユーザーがもっとを読むようになる報酬機能をつけたブックスアプリ iMessa

    アップルiPhone、iOS 13でさらに高速化?
    otchy210
    otchy210 2019/05/08
    SE がサポートされるか否か。話はそれからだ。
  • 「ノッチなしスマホ」の魅力と課題 (1/3)

    ノッチレスの全画面を実現したOPPO「Find X」 筆者撮影 スマホの画面上部の切り欠き(ノッチ)は、iPhone Xの採用をきっかけに、モバイル業界全体のトレンドになっています。一方、画面が単純な矩形ではなくなることから、賛否両論の多いデザインでした。 そんな中、11月9日にはノッチのない全画面ディスプレーを実現したOPPOの「Find X」が日でも発売されます。他にも、これまでにないアイデアで「ノッチレス」を目指すスマホが増えてきました。 ●iPhone Xでトレンドになった「ノッチ」 スマホ画面のノッチは「Essential Phone」が採用したことで世に知られるようになり、2017年の「iPhone X」で一般に普及。その後、Androidスマホのメーカー各社が続々と追従しました。

    「ノッチなしスマホ」の魅力と課題 (1/3)
    otchy210
    otchy210 2018/11/07
    "技術的に妥協した感も否めません" じゃなくて、妥協以外の何ものでも無かろうよ。Apple が採用したから許されるみたいな風潮どうなん?
  • ASCII.jp:インターネットが高速で安全に接続できる「Thunderbolt 3 10G」が先行販売|アスキーストア’s セレクション

    Thunderbolt 3 10Gは大容量転送、ハイスピード接続に最適なイーサネットアダプターです。Thunderbolt 3接続により、高速で安全な有線ネットワークに接続でき、ギガビットイーサネットの最大10倍のパフォーマンスを発揮。10G Base-Tネットワークのほかに、100 Base-T、1G、2.5G、5Gなど低速度接続もサポートします。 体サイズは約11.4×8.0×2.7cmで、重量は約240gと持ち運びに便利です。そのほか、Thunderbolt 3ケーブルは約0.5m、動作環境はmacOS 10.3.4、Windows 10以降。 アスキーストアでは、2万9160円(税込)で販売中です。さらに詳しい仕様はアスキーストアでチェックしてください。 【先行販売】大容量転送に最適なハイパースピード接続! Thunderbolt 3 10G イーサネットアダプタをアスキーストア

    ASCII.jp:インターネットが高速で安全に接続できる「Thunderbolt 3 10G」が先行販売|アスキーストア’s セレクション
    otchy210
    otchy210 2018/10/24
    無線より盗聴の可能性が低いから安全?なのか?安全性で言えば現行の無線暗号の安全度と実質的な差は無いように思うが。
  • iPhoneの大事なデータを挿すだけで簡単バックアップ可能なMFiカードリーダー

    サンワサプライは8月29日、充電しながらiPhone内の写真や動画、連絡先を自動的にバックアップできる、パソコン不要のMFiカードリーダー「400-ADRIP010W」を発売した。価格は5980円で、直販サイト「サンワダイレクト」で購入できる。 体にmicroSDカードを挿入し、ACアダプターに挿してライトニングケーブルにつなげば自動的にバックアップできる。バックアップには事前に専用のアプリをインストールしておく必要がある。

    iPhoneの大事なデータを挿すだけで簡単バックアップ可能なMFiカードリーダー
    otchy210
    otchy210 2018/08/30
    いまやっている行動を変える事無くプラスアルファの能力を付加するデザインが素敵。とは言え、無線充電が普及するまでの過渡期の製品で、名前が Qubii とは、何かの皮肉かw
  • 日本版Surface Goの価格が「妥当」といえる理由 (1/3)

    米国で399ドルという低価格が注目を浴びたマイクロソフトの「Surface Go」ですが、日版は税抜き6万4800円という価格になり、疑問の声が上がっています。価格差の理由はOfficeをバンドルしたことにあります。なぜ日版は価格のインパクトを犠牲にしてまで、Officeをバンドルしたのでしょうか。 ■衝動買いしたくなっても「Go」できない価格に Surface Goはシリーズ最小かつ最安という点が強調されています。個人的に最安といえば99ドルで投げ売りされていたSurface RTを思い出さずにはいられないのですが、Surface Goは最初から安いのです。 最近、「Go」という名前が付いた製品は増えていますが、英語では気軽に持ち出せるというニュアンスがあります。小型軽量の新モデルにふさわしい名称であると同時に、お店で見かけたら「レジにGo」しやすい価格でもあるのです。 ところが日

    日本版Surface Goの価格が「妥当」といえる理由 (1/3)
    otchy210
    otchy210 2018/07/13
    それが MS のビジネスのやり方だし、それで利益が上がるんだろうし、ブーブー文句言ってる層はどのみち買わないし、あれ?何も問題ないんじゃない?