サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
GWの過ごし方
www.techno-edge.net
ヴァイブコーディングで筆者がもっぱら使っているのはClaude Codeです。が、今日、ちょっとした異変が起きました。
スマホとSIMを求めて世界を取材中。メディアへ執筆多数。海外・中国通信関連の記事や講演承ります。noteや動画配信もやってます。 2026年4月19日に中国・北京で行われたヒューマノイド型ロボットのハーフマラソン大会で、スマートフォンメーカーのHONORが開発したロボット「Lightning(閃電)」がものすごい記録を叩き出しました。 21.0975kmのハーフマラソンを50分26秒で走り切り、人間の男子ハーフマラソン世界記録を7分以上も上回ってゴールしたのです。さらに2位と3位もHONOR製ロボットで、表彰台はすべてHONORが独占しました。 このイベントは「2026北京亦荘ヒューマノイドロボット・ハーフマラソン」という大会で、市街地と公園を組み合わせた実際のハーフマラソンコースを、人と人型ロボットが走る内容です。 前年の優勝タイムは2時間40分台だったと言われており、わずか1年で「人間
ガジェット全般、サイエンス、宇宙、音楽、モータースポーツetc... 電気・ネットワーク技術者。実績媒体Engadget日本版, Autoblog日本版, Forbes JAPAN他 イーロン・マスク氏は木曜日、xAIが独自のAIモデルを強化する過程で、部分的にOpenAIのモデルを利用したことを認めました。この強化プロセスは「Distilling」、日本語で「蒸留(知識抽出)」と呼ばれます。 マスク氏は現在、OpenAIを当初の非営利団体という使命に背いて、営利組織に転換させてとして、OpenAIとそのCEOサム・アルトマン氏および社長のグレッグ・ブロックマン氏を提訴しています。 木曜日に証言台に立ったマスク氏は、OpenAI側の弁護士からの反対尋問で、xAIがGrokを訓練するためにOpenAIのモデルに対して蒸留技術を使用したかどうかを問われ、「一般的に、すべてのAI企業が(そうして
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第142回)は、オープンソースで最高精度の「DeepSeek-V4」や、Claude Opus 4.5に迫る精度の270億パラメータであるマルチモーダルAIモデル「Qwen3.6-27B」を取り上げます。 また、情報密度を最大化して自己進化するAIエージェント「GenericAgent」や、テキストからプレイ可能なWebゲームを自動生成するオープンソースAI「OpenGame」をご紹介します。 そして、生成AIウィークリーの中でも特に興味深いAI技術や研究にスポットライトを当てる「生成AIクローズアップ」では、検索するたびにAIがその場で画像を描き出し、クリックするたびに深掘りして画像をさらに描き続けてくれる新感覚のビジュアルブラウザ「Flipbook」を別の単体記事で取り上げています。
筆者がClaude Codeを使って開発している「LipSync Avatar」は、NVIDIA DGX Spark互換機「ASUS Ascent GX10」上で動くリアルタイム対話アバターシステムです。 LLMが返答を生成し、クラウドTTSで音声合成し、MuseTalkでリップシンク映像をリアルタイムに合成して表示します。今回はその進捗について報告します。 筆者がタモリさんと山中教授の番組の取材を受けて出演したときに、クリスタルメソッドというAIスタートアップに協力してもらい、その途中バージョンを番組内でお見せしていますが、LipSync Avatarは、それとは別に筆者が独自で構築しているシステムです。 亡き人と対話するサービスはすでに商用化もされていますが、やはり自分の手で作り上げたい。個々の要望は違いますし、大切な人との交流手段を他人の手に委ねたくはないという気持ちもあります。 幸
映画やゲーム、ガジェットの発表前に出てくる短い予告映像を、最近では「ティザー」「ティザートレーラー」と呼ぶことが増えています。でも、英語の teaser の発音に近いカタカナ表記は、本来なら「ティーザー」です。「ティザー」では、長音、音引き「ー」がひとつ足りません。
生成AIグラビアをグラビアカメラマンが作るとどうなる? 連載記事一覧 生成AI画像で任意の顔に似せるには?筆者がこの連載でよく使う言葉、顔LoRA。これは例えばZ-ImageやZ-Image-Turboなど、モデルにない顔をai-toolkitやsd-scriptsを使い学習、LoRAを作り、これを当てて生成、うまく当たれば激似になる生成AI画像(動画も可能)の必殺技だ。またLoRAはご存知のように学習元のモデルにしか効かないため、例えばZ-Image-Turbo用で作ったLoRAは、Qwen-Imageには当たらない。 ただ学習にはある程度のVRAM容量が必要なので環境が作れない場合、WaveSpeedなどサービスを使いLoRAを作る方法もある。サービスにもよるが1回1ドルちょっと安く、ローカルで作るより時間もかからない。筆者も面倒な時や急ぐ時はローカルに環境があるにも関わらず、サービス
2026年4月20日にファーウェイは中国でスマートフォンやウェアラブルデバイスの新製品を発表しました。中国国内ではスマートフォン販売数でシェアに出るなど完全復活状態のファーウェイ、今回の新製品も話題となる製品がそろっているので紹介します。
1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。 今回は、検索するたびにAIがその場で画像を描き出し、画像内の一部分をクリックするたびに深掘りして詳細な画像をさらに描き続けてくれるビジュアルブラウザ「Flipbook」を取り上げます。 これは元OpenAI研究者Zain Shah氏、Slack出身のEddie Jiao氏、Apple出身のDrew Carr氏の3名によって開発されたプロジェクトで、リアルタイムにオンデマンドでAI生成される無限の画像をブラウジングできるというWebサービスです。 このシステムでは、画面に表示されるすべてのページが1枚の画像として構成されています。画像の中の気になる部分をクリックすると、その対象をさらに深く掘り下げた新しい画像が次々と
スマホとSIMを求めて世界を取材中。メディアへ執筆多数。海外・中国通信関連の記事や講演承ります。noteや動画配信もやってます。 毎月のように海外取材をこなしている私ですが、いまでも海外の担当者とのインタビューは得意とは言えません。特にスマートフォンの新製品発表会後に、開発者や関係者にインタビューすることはよくあります。もちろん今ではインタビューの会話を録音しておき、後からAIアプリでまとめることで、かなり高い精度で文字起こしや翻訳までをこなしてくれます。 ところがインタビューが何本も続いたり、PCを持ってきていないときにキーパーソンインタビューが急に始まることもあります。実はグーグルの「Pixel 9 Pro」をボイスレコーダー用に持ち運んではいるものの、かばんの中に入れっぱなしのため、いざ使おうと思ったときに、電池切れで使えない、なんてこともよくあります。そのため「Pixel 10」シ
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第141回)は、家庭用PCで動く商用利用可能なBaidu開発の画像生成AI「ERNIE-Image」や、Opus 4.6に迫るコーディング性能のAIモデル「MiniMax M2.7」のオープンウェイト化を取り上げます。 また、1枚の画像からゲーム向け3Dワールドを生成できるAIモデル「HY-World 2.0」と、アリババが発表したオープンウェイトAIモデル「Qwen3.6-35B-A3B」をご紹介します。 そして、生成AIウィークリーの中でも特に興味深いAI技術や研究にスポットライトを当てる「生成AIクローズアップ」では、サイトに訪問するだけで自分のPCでどのAIモデルがローカル動作するかを判定してくれるサイト「CanIRun.ai」を別の単体記事で取り上げています。
ChatGPTの新しい画像AIモデル、ChatGPT Images 2.0が使えるようになりました。 日本語テキストがちゃんとできるようになったと評判なので、試してみました。 OpenAI、ChatGPT Images 2.0発表。「思考機能」備え画像出力の精度、一貫性、視覚的な整合性高める。日本語も上達 | テクノエッジ TechnoEdge
■MicrosoftがWindows 11向け日本語IME「Copilot Keyboard」を無料公開
Tech Journalist. Editor at large @TechnoEdgeJP テクノエッジ主筆 / ファウンダー / 火元 マイクロソフトがゲームのサブスクXbox Game Passを大幅に値下げしました。 改定後の新価格は、全部入り最上位プランのXbox Game Pass Ultimate が1か月1550円。PCのみのPC Game Pass は1300円。 2025年10月の急激な値上げでは、Ultimateが旧価格の月1450円からいきなり月2750円に達していたため、約半年で倍近くに上げて半額近くに下げたことになります。 一方で、アクティビジョンの巨額買収で手に入れた看板ソフトのひとつCall of Duty シリーズ(CoD)の新作は、Ultimateプランの特典であるDay Oneリリース、つまり通常の発売日と同時に定額カタログに入る対象から除外。 今後の
1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。 今回は、サイトに訪問するだけで自分のPCでどのAIモデルがローカル動作するかを判定してくれるサイト「CanIRun.ai」(Can your machine run AI models?)を取り上げます。 ▲Apple M5 Pro 24GBでのcanirun.aiトップ画面 ▲さまざまなデバイスで試せるため、デバイス購入前に確認することもできる 開発者midudev氏が、手元のマシンでどのAIモデルが実際に動かせるのかを一瞬で判定できるWebサービス「CanIRun.ai」を公開しました。インストールや登録は一切不要、サイトにアクセスするだけでGPUやメモリを自動検出して、各モデルに対する動作判定を6段階で色分け
サムスン電子ジャパンは2026年4月21日、JR東日本と協業し、2027年上半期に海外で発売するSamsung Galaxyスマートフォンで訪日旅行者向けSuicaアプリ「Welcome Suica Mobile」が利用できることを目指すと発表しました。 あわせて、モバイルSuicaおよびWelcome Suica MobileにおけるSamsung Payによる決済サービスの開始も目指すとしています。 ■「Galaxyなら来日すぐSuicaが使える」へこれまで訪日旅行者がSuicaをスマートフォンで使うには、対応するiPhoneやFeliCa搭載の国内向けAndroid端末が必要でした。今回の協業が実現すれば、海外で購入したSamsung Galaxy端末を持ったまま来日し、入国後すぐに電車・バス・買い物でSuicaを使えるようになります。 インバウンド需要が高まる中、キャッシュレス・交
Appleは次の最高経営責任者(CEO)として、現ハードウェアエンジニアリング担当SVPのジョン・ターナス氏を指名しました。 2026年9月1日付でターナス氏がCEOを引き継ぐと同時に、現CEOのティム・クック氏はエグゼクティブ・チェアマン(代表取締役会長)に就任します。
Googleは2026年4月21日、Webブラウザ ChromeにAIアシスタントGeminiを統合した「Gemini in Chrome」の国内提供を開始しました。 Windows / macOS / Chromebook Plus デスクトップ版のChromeブラウザで本日より順次、段階的に利用可能になります。 ■ Geminiがサイドパネルで常駐、タブを跨いでコンテキスト化Gemini in Chrome は昨年米国で提供が始まった機能。2026年1月にはUIの刷新と同時に基盤モデルが最新のGemini 3.1になり、複数タブの同時読み取りや、Gmail / カレンダー / YouTube / Googleマップ連携など多数の機能が加わりました。 従来の単体アプリ版やWeb版のGemini では、見ているウェブサイトについて要約などのタスクを与えたいとき、URLを渡して読ませる(割と
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第140回)は、AIがPCを“操作する側”から“PC自体”になる新概念「Neural Computers」や、競技プログラミングで単独1位を達成したAI「GrandCode」を取り上げます。 また、一部のコーディング評価でClaude Opus 4.6やGPT-5.4を上回るオープンソースAI「GLM-5.1」や、アイデアを入力するだけで国際会議レベルの研究論文を自動生成するGoogle開発のAI「PaperOrchestra」をご紹介します。 そして、生成AIウィークリーの中でも特に興味深いAI技術や研究にスポットライトを当てる「生成AIクローズアップ」では、Suno v5以上の精度を示す、商用利用可能な日本語楽曲対応ローカル音楽生成AI「ACE-Step 1.5 XL」を別の単体記事
600MBの増加で、ベンチマークが5ポイント上がっています。1.15GBから1.75GBへの53%増に対して、品質は7%向上。FP16のQwen3 8B(16.38GB)にはまだ及ばないものの、メモリは9.4分の1です。MMLU Redux、MuSR、GSM8K、HumanEval+、IFEval、BFCLv3と広範なベンチマークで均等にスコアが伸びている、というのがPrismMLの説明です。 8GBのMacBook Neoで動かしてみる前回のBonsai 8Bは、PrismMLフォーク版のllama-serverが必要でした。GGUF形式で、専用のQ1_0_g128カーネルを通して動きます。 Ternary BonsaiはMLX形式のみ。つまりApple Siliconネイティブです。HuggingFaceのモデルID は `prism-ml/Ternary-Bonsai-8B-mlx-
中国・深圳在住。コミュニティ運営、事業開発、リサーチャーの3分野で活動。中国最大のオープンソースアライアンス「開源社」唯一の国際メンバー。MakerFaire 深圳、MakerFaire シンガポールなどの運営に携わる。早稲田大学非常勤講師。@tks これまでのカメラにおけるAIは、手振れ補正のように、どちらかといえば機械側の都合で動くものだった。それがここにきて、少し変わってきている。ドローン大手のDJIが展開する Osmo Pocketシリーズは、カメラとジンバルを統合した、カメラ側でどう撮影するかアシストする可能性を秘めたカメラだ。シリーズ4製品めとなったOsmo Pocket 4は、AI機能をハードウェアとファームウェア、スマホアプリを含むソフトウェアの両面で進化させ、AIが単に映像を整えるのではなく、「誰を撮りたいのか」「どう見せたいのか」といった撮影者の意図に入り込んできている
前回のビジュアライザーは、WAV/MP3 を読み込んで、WebAudio の AnalyserNode で帯域を分けて、歌詞の内容からシーンを自動分類して、2D Canvas 上でパーティクルと波形を踊らせる、というやつ。 あれはあれで気に入っていて、Xに上げた動画もそれなりに反応があったのですが、もっと面白い、見たことのないようなものにしたいという欲求がありました。波形だけって、よくあるパターンじゃないですか。 そのきっかけを作ってくれたのが、清水亮さんです。4月15日のデイリーAIニュースで「これすごいよ」と紹介していたのがSparkJSという技術。紹介してから数時間後には本人がsparkjs-skill — SparkJS という API リファレンスを Claude Code 用スキル形式に整理したものを公開してくれていて、実例として示されていた使い方が面白かったので、「じゃあ自分
いきなりですが、iPhoneアプリ開発者となりました。 筆者は今、浅草橋の極狭オフィスにいます。机の上にあるのは、M2 MacBook Air(24GBのUnified Memory)と、iPhone Air。Air-Airコンビ。 自宅のDGX Spark互換機で動かしている妻のAIアバター「LipSync Avatar」は、Ollamaで動くLLMと、SakuraSpeechによるボイスクローンTTS(Text To Speech)、MuseTalkのリップシンク。それをWebSocket経由でブラウザに飛ばして、iPhoneやAndroidタブレットで表示し、音声で対話できるところまでは完成しています。 ただ、これはDGX Spark互換機(ASUS Ascent GX10)ありきのシステム。TailscaleでVPN接続できるとはいえ、外部からはネット接続必須です。 だったら、iP
ガジェット全般、サイエンス、宇宙、音楽、モータースポーツetc... 電気・ネットワーク技術者。実績媒体Engadget日本版, Autoblog日本版, Forbes JAPAN他 OpenAIのサム・アルトマンCEOの邸宅は、先週金曜日に火炎瓶が投げ込まれ、敷地の門が焼ける被害を被ったばかりですが、こんどは同邸宅に向けた発砲事件が発生しました。 地元紙The San Francisco Standardによると、事件は4月12日午前1時40分頃に発生し、アルトマン邸前に停まった車から敷地内に向けて発砲があったとされています。このときの銃声は、アルトマン邸の警備員も聞いたとのことです。 幸いにも、防犯カメラの映像は発砲後に逃走した車のナンバープレートを判別可能な状態で捉えており、警察はその情報をもとにすぐに車両の所有者が25歳のアマンダ・トムであることを確認、トムと交際している23歳のム
1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。 今回は、2026年4月2日にリリースされた、オープンソース音楽生成モデル「ACE-Step」の最新かつ最上位バージョンとなる「ACE-Step 1.5 XL」を取り上げます。GitHubリポジトリはこちら。 モデルのバリエーションとして、用途や環境に合わせて「xl-base」「xl-sft」「xl-turbo」の3種類がMITライセンスで提供されています。 ベンチマーク結果によると、XLモデルは最高峰の商用モデルであるSuno v5をすべての評価指標において上回るトップスコアを示しています。 各評価指標は、音響的なクリアさ(AudioBox)、音楽としての自然さや完成度(SongEval)、指示したジャンルや雰囲気
ガジェット全般、サイエンス、宇宙、音楽、モータースポーツetc... 電気・ネットワーク技術者。実績媒体Engadget日本版, Autoblog日本版, Forbes JAPAN他 AIスタートアップ企業のGeneral Reasoningは、主要なAIモデルの現実世界に対する分析能力を調べるため、英国プレミアリーグの2023-24シーズンを仮想的に再現し、試合結果予想を競わせる「KellyBench」と称するシミュレーションを行いました。 この研究に用いられたのはAnthropic Claude Opus 4.6、OpenAI GPT-5.4、Google Gemini 3.1 Pro、 Gemini 3.1 Flash Lite Preview、Z.AI GLM-5、Moonshot Kimi K2.5、xAI Grok 4.20、Acree Trinityの8種類です。 研究者は各
Whisperで自動文字起こしして、LCS類似度ベースでアラインメントして、シーンキーワード辞書でビジュアルを切り替える、というところまで作り込んで、さらに改修しようとしたら、なぜかリモートアクセス不能に。また1時間かけて行くのもめんどくさい。 「これも欲しい」「これも追加したい」が止まらなくなって、気がついたらビジュアライザーを骨格から作り直していました。今回はその顛末です。 ビジュアライザーの出来としては満足したのですが、今回は別の曲のリリックビデオを作りたくて、そのためには手元で動かせるソフトが必要。じゃあ再びMacBook Neoに登場してもらおうということになりました。 前回は24GBの豊富なメモリを搭載したM2 MacBook Air。それと同等のことが前世代のiPhoneレベルのMacBook Neoでできるのか。 で、今回の曲のテーマですが、生成AIがプロンプトでさまざまな
AI活用やハイブリッドワークの加速を背景に、可搬性・接続性・メンテナンス性およびユーザビリティの三点を重点強化しています。 ThinkPad X1 Carbon Gen 14 Aura Edition | 14″ プレミアム超軽量 AI ノート PC | レノボ・ ジャパン フラッグシップのThinkPad X1 Carbon Gen 14 Aura Editionには、2014年のユニボディ採用以来の革新という新筐体構造「スペースフレーム」を採用。 3D積層でレイアウトを改善し、冷却機構の大型化で性能と静音性向上、ヒンジ小型化でタッチパッド大型化、メンテナンス性の向上を実現しました。 全体の特徴として、すべての機種で内蔵5Gまたは4G LTEへのカスタマイズが可能。法人向けには最大5年間データ通信量制限なしで利用できる「Lenovo ConnectIN」にも対応し、場所を選ばない働き方を
ガジェット全般、サイエンス、宇宙、音楽、モータースポーツetc... 電気・ネットワーク技術者。実績媒体Engadget日本版, Autoblog日本版, Forbes JAPAN他 53年ぶりの有人月探査ミッション「アルテミス2号」の宇宙飛行士らは先日、宇宙船の窓から見える地球をバックにした自撮り写真をNASAの地上管制センターに届けました。 各種報道で紹介されたこれらの写真は、iPhone 17 Proで撮影されています。 NASAの公式Flickrページに公開されている情報によれば、全3枚の写真がiPhoneによるものだとわかります。 今回、宇宙船内にiPhoneが持ち込まれたことに関しては、アップルは正式には関与していないとのことですが、飛行士らは宇宙服のポケットにiPhone 17 Pro Maxを携えており、ほかにもGoPro Hero 11など民生品が使用されているることが、
次のページ
このページを最初にブックマークしてみませんか?
『テクノエッジ TechnoEdge』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く