AIリップシンクにまた大きな波が訪れました。
AIリップシンクにまた大きな波が訪れました。
それなりの性能で、普通のパソコンとしてある程度使えてしまうと評判のN95やN100といったCPU(Alder Lake-N)搭載機であれば、メモリー 16GB+SSD 500GBモデルであっても2万円ちょっとで買えてしまいます。 これでWindows 11までインストールされていますから、注目されるのも当然でしょう。 ▲CPUがN95、メモリーが16GB、SSDが500GBなのに2万400円ですちなみに、メモリーが8GBのモデルならもっと安く、1万7000円くらいで買えることすらあります。OS単体より安かったりしますから、世の中の仕組みってよくわかりませんよね。 Alder Lake-Nが何者かというと、第12世代Core iのEコアだけで構成されたかのようなCPUです。 2~3万円の価格帯で搭載されているのは4コア/4スレッドモデルで、実力としては、第11世代のCore i3よりも若干低
仮想的なシステムであり、実際の普及は想定されていない。 言語学習や異文化コミュニケーションのツールとしての可能性がある。 結論ローマ字運動とJaphalbetは、どちらも日本語の表記をラテン文字化する試みという点で共通していますが、その目的、アプローチ、そして想定される使用範囲に大きな違いがあります。ローマ字運動が日本の近代化と識字率向上を主眼としていたのに対し、Japhalbetは国際的な日本語学習とコミュニケーションの促進を目指しています。 また、ローマ字運動が日本語の文法構造をほぼそのまま維持したのに対し、Japhalbetはより大胆な文法の簡略化を提案しています。これは、Japhalbetが非日本語話者にとっての理解のしやすさを重視しているためです。 結果として、ローマ字運動は日本社会に一定の影響を与え、特に技術分野での応用を見出しましたが、Japhalbetは現時点では理論的な提
現役グラビアカメラマンでありエンジニアでもある西川和久氏による生成AIグラビア連載の第27回は、前回に続いて最新の画像生成AIモデル Stable Diffusion 3 Medium について。 『生成AIグラビアをグラビアカメラマンが作るとどうなる?連載』記事一覧』 前回に引き続きStable Diffusion 3 Mediumの話連載第26回にSD3 Medium(以降SD3 Medium)の話を書いたが、今回はその続きとなる。 前回の記事ではSD3 Mediumの特徴として Baseモデルなのに高画質。そして日本人含むアジア系もOK 商用利用不可。個人レベルでの商用利用は、クリエイターライセンス($20/月)を契約 結構な頻度で致命的な問題が発生する Promptで左右など、位置関係が指示でき再現可能。文字もOK(英語のみ) 生成環境は現状でComfyUI(系)のみ。基本Work
Googleがオープンな言語モデル「Gemma 2」を開発者向けに公開しました。90億パラメータと270億パラメータの2サイズを提供しています。 さて、この1週間の気になる生成AI技術をピックアップして解説する「生成AIウィークリー」(第53回)では、生成する動画時間の延長や無音ビデオに適した音を生成するなど動画AIに関する内容が盛りだくさんです。 生成AI論文ピックアップ 既存のAIが生成する動画の時間を長くするモデル「ExVideo」、Stable Video Diffusion生成動画を5倍以上の長さに拡張 言語より視覚に重きを置く、オープンなマルチモーダル大規模言語モデル「Cambrian-1」はGPT-4VやGemini Proと同等レベル イベントカメラを使用するAIビデオ超解像技術「EvTexture」、特にテクスチャ領域で画質向上 長い動画を理解できるオープンソースなAIモ
ギターのような形状ながら全く新しい楽器「インスタコード」(InstaChord)を成功させたInstaChord代表取締役ゆーいちさんが、手のひらサイズの新しいガジェット楽器「かんぷれ -KANTAN Play core-」を発表しました。 (▲画像:かんぷれ -KANTAN Play core-) スイッチサイエンス、M5Stack Technologyなど日本と中国をまたぐ開発体制を活用したこの製品は、6月8日午前10時からKibidangoでクラウドファンディングがスタートしました(かんぷれプロジェクトページ)。 この新しい楽器には3つの側面があります。まず、使いやすい楽器であるということ。次に、DTMなど音楽スキルを持っている人にとって非常に有用なツールであるということ。最後の一つが、通常の楽器を弾くことが困難な人が演奏を楽しめるバリアフリーな楽器であるということです。 筆者はイン
ガジェット全般、サイエンス、宇宙、音楽、モータースポーツetc... 電気・ネットワーク技術者。実績媒体Engadget日本版, Autoblog日本版, Forbes JAPAN他 テスラのCybertruckはその型破りなデザインが最大の魅力ですが、その分オーナーに求められる取り扱い上の注意点も独特なところが数多くあります。 たとえば新車で購入し、納車後35kmしか走行していないとしてもクーラント漏れは保証対象として扱われません。また、洗車前には「洗車モード」に切り替えるようマニュアルに記されているのを知らずに洗車して、数時間Cybertruckが何も反応しなくなった人もいます。さらに、自動で閉まるフロントトランクの指挟み防止機能強化のアップデートを試すため、実際に指を挟んでみたところ、切断されそうになった人もいます。 多くの人々に懸念されるのが、そのデザインの特徴である角張ったボディ
2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第49回目は、生成AI最新論文の概要5つを紹介します。 生成AI論文ピックアップ アニメの“中割り”を生成してアニメーションに仕上げる「ToonCrafter」 1枚の画像とモーションデータからダンス動画を生成するAIモデル「MusePose」 リアルタイムでストリーミング動画を変換するAIモデル「StreamV2V」 写真1枚から人物やキャラクターの話す動画を生成するモデル「V-Express」 人の手で塗った数枚の線画から、残りのアニメーションを自動彩色できるAIモデル アニメの“中割り”を生成してアニメーションに仕上げる「ToonCrafter」アニメーション制
ITPROTECH 14インチ 3840×1100ピクセル・製品名「LCD14HCV-IPSW」 ・タッチ非対応 ・実勢価格2万5000円前後 「価格重視」で選ぶか、「解像度重視」で選ぶか…でツイ廃モニターの製品選びの基本方針が決まりそうだが、これに加えて、最近の「ツイ廃モニター」の流行の特殊機能「タッチ操作」対応かどうかで選ぶ人も多そうだ。 タッチ操作対応モデルは、タッチ操作非対応のモデルに対しては、2000円~3千円ほど高くなる傾向にある。 タッチ操作は、メインモニターからツイ廃モニターに対して、マウスカーソルを持って行きにくい環境下、使いにくい状況下において、ツイ廃モニター側のスクロール操作などをしたいときには威力を発揮しそうではある。 筆者は、この表中、最も解像度が高い3840×1100ピクセル解像度の液晶パネルを採用する、14インチ画面サイズのITPROTECH「LCD14HCV
2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第45回目は、生成AI最新論文の概要5つを紹介します。 生成AI論文ピックアップ 高精度なニューラルネットワーク・アーキテクチャ「KAN」をMITなどの研究者らが開発 1手先のトークン予測ではなく、4手先のトークンを同時に予測するモデルをMetaなどが開発 医療分野に特化したマルチモーダル大規模言語モデル「Med-Gemini」をGoogleが開発 大規模言語モデルが答えに相当するベンチマークを事前に学習し、高い評価を出していた? AIカンニング問題を指摘した研究 一貫性の高い長編ビデオをテキストから生成するAIモデル「StoryDiffusion」 高精度なニューラ
ガジェット全般、サイエンス、宇宙、音楽、モータースポーツetc... 電気・ネットワーク技術者。実績媒体Engadget日本版, Autoblog日本版, Forbes JAPAN他 多数のアップル製品ユーザーが、突然Apple IDからログアウトされ、ログインしようとするとパスワードをリセットするよう求められる事例の報告がSNSなどに相次いでいます。 この現象に関する報告は、米国時間で4月26日の夜が最も多かったようですが、アップルのウェブサイトにあるステータスページでは異常として検知されていませんでした。 問題はApple IDのログアウトと、それに伴うパスワード変更を求められる点が共通しているようですが、Apple IDのパスワードのリセットは提案されただけで必須ではなかったとの報告もあります。 またそれ以外でも、ユーザーのデバイスの個別の設定によって様々な問題が発生しているようです
テクニカルジャーナリスト。東京工芸大学特別講師。monoAI Technology顧問。IT技術、半導体技術、映像技術、ゲーム開発技術などを専門に取材を続ける。スポーツカー愛好家。 新しいHMD(Head Mounted Display)機器が発売されると、話題の中心となるスペックは、映像パネルの種類、解像度、重さ、バッテリー容量、ユーザー位置、コントローラ位置などの各種トラッキング機構などについてが多い。 しかし、最近では接眼レンズをはじめとした、進化著しい光学系に関心が集まることも増えてきた。 そんな最中の2024年2月2日、ついに北米市場にてAppleが「Apple Vision Pro」(以下、AVP)の販売を開始した。 さっそく、各所でAVPの光学系の分析が始まっており、光学系ベンチャーのHyperVisionは、かなり詳しい独自の分析と考察を自社ブログサイトに掲載している。 本
2024年1月9日から12日までラスベガスで開催されたCES 2024を取材しました。ここではあまり取り上げられてないネタをいくつか書こうと思います。 最初のネタはカラーの電子ペーパー。電子ペーパーと言えば昔のKindleに代表される、電子ブックリーダーとして使われるものというイメージが強いと思います。 カラーの電子ペーパーもありますが、色数や発色の制限、そして画面が暗いことから主流にはなっていません。なおCESの会場でも何社かがカラー電子ペーパーを搭載したタブレットを出展していました。 電子ペーパーを開発する E Ink社でも様々なタイプのカラー製品を出しており、新たな使い道を模索しているところです。 その中の1つ「E Ink Prism 3」は文字を表示するディスプレイというより、色を変えられるカラーパネル用途に開発されました。 CES 2024では、スマートフォンメーカーのInfin
人気連載『生成AIウィークリー』で取り上げている注目論文を見ると、そこに中国IT企業の名前が頻繁に登場します。 EC大手のアリババ(Alibaba)、ゲーム大手のテンセント(Tencent)、TikTokの運営元であるBytedanceなどが常に顔を出しており、画像・音声・アニメーションと、生成AIのあらゆる分野で中国に勢いがあることがわかります。 そんな中、テンセントがなかなか衝撃的な技術を発表しました。「PhotoMaker」という画像生成AIです。これでなければできない、というものではないのですが、「ファインチューニングの事前作成不要」「元画像が少なくても良い」のに、人物のアイデンティティを維持した画像を生成できるというメリットがあります。 これまでは既存の画像AIモデルに多数の写真を読み込ませて本人性を学習させたものから新たなAIモデルやその簡易版であるLoRAモデルを作ってきまし
テクノエッジ編集部では、生成AIグラビア実践ワークショップ第4回を開催します。講師は、人気連載「生成AIグラビアをグラビアカメラマンが作るとどうなる?」の著者である西川和久さんです。 高価なゲーミングPCがなくても自分で高速な画像生成ができるサービス「生成AI GO」を無料で使いながら、生成AIに関する知見とグラビアカメラマンとしての豊かな経験から得られた最新かつ実践的なテクニックを学べます。 なお、ワークショップ内で使用するプロンプトは、受講者向けにドキュメントとして公開し、その場でコピペするだけで画像生成を体験できる、非常に簡単な仕組み。生成した画像はその場で自分のパソコンに保存できます。 第4回は、1月23日、オンラインにて開催いたします。なお、今回お申し込みいただいた方は、第3回の動画アーカイブを視聴いただけます。 グラビアカメラマンが教える、生成AIグラビア実践ワークショップ 申
ただ、「危害を加えてはならない」という言葉が、従来のポリシーに記されていた「軍事・戦争用途」での使用禁止も含むのかとの問いに対しては明言せず「軍によるものも含め、『武器の開発や使用、他者への危害、財産の破壊、サービスやシステムの安全保障を侵害する不正な活動』に対するわれわれの技術の使用は認められない」との返答でした。 OpenAIからすれば、これまでポリシーの使用禁止リストに「軍事・戦争」の明記があったことで、契約額が高額になる国防総省など政府関連の仕事を獲得することができなかったと考えられ、改訂によってその道が開かれる可能性が考えられます。 2022年にOpenAIが発表した論文の筆頭著者でサイバーセキュリティ企業Trail of BitsのエンジニアリングディレクターであるHeidy Khlaaf氏は、The Interceptに、新しいポリシーは安全性よりも合法性を重視したように見え
ガジェット全般、サイエンス、宇宙、音楽、モータースポーツetc... 電気・ネットワーク技術者。実績媒体Engadget日本版, Autoblog日本版, Forbes JAPAN他 イーロン・マスク氏が所有するソーシャルメディアプラットフォーム、X(Twitter)は今年、ピアツーピア決済機能の提供を開始するとブログ投稿で述べました。 Xはブログの副題に「2024年は変革の年になる」と記しており、その一環であるピアツーピアの支払い機能の実装によって「より多くのユーザーに利便性と商取引の機会」が解放されるだろうと述べています。 ただ、この支払い機能がいつごろ利用可能になるのか、具体的にどのように使えるようになるのかといったことはブログ記事では明らかにされていません。
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く