サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
ブックレビュー
www.techno-edge.net
このところUdioやSonautoの新機能搭載で押され気味だったAI作曲サービスの「Suno」が反撃に出ました。 バージョン3.5のEarly Access版(有料プランユーザーのみに提供)を利用すると、これまでの2分間制限が最長4分まで拡大。延長時間も従来の1分を2分に伸ばしています。これだけの長さがあれば大抵のポピュラー曲はエンディングまでいけます。 4分の曲をUdioで生成しようとすると、8回の命令が必要になります。さらに、生成に要する時間はUdioの方がはるかに長くかかるので、全体としての作業時間には大きな差が生じます。それがSuno 3.5ならば数秒でできてしまうのです。 また、Style of Musicのキーワードがサジェストされるようになっていて便利です。文字数制限は相変わらずきついですけど。 さらにうれしいのは、日本語歌詞の読み方が、従来は間違いが多かったのが、ほぼ問題な
JR青梅駅のすぐ近くに、「マイコン博物館」という場所があります。正式なオープン前ですが、先日、そこにお邪魔してきました。今回はその展示物に絡めて個人的なコンピュータ史を振り返ってみます。 マイコン博物館を運営している科学技術継承財団の代表理事である吉崎武さんの案内で、1時間以上かけて展示物を見ることができました。移転・拡張費用を募るクラウドファンディングを支援した知人に誘ってもらって訪問したのですが、これが実に素晴らしいものでした。 パーソナルコンピュータの歴史をリアルタイムで体験していた自分の世代にとってはまさにその時代のコンピュータたちですし、少し上の世代で日本のマイコン・パソコン・ワークステーション業界を牽引してこられた吉崎さんによる解説で初めて知ることが多く、これはもう記録しておかねば、という気持ちになりました。 というわけで、当時の断片的な思い出とコンピュータの実機をカップリング
ガジェット全般、サイエンス、宇宙、音楽、モータースポーツetc... 電気・ネットワーク技術者。実績媒体Engadget日本版, Autoblog日本版, Forbes JAPAN他 インターネットの根幹を支えている、世界に13台しかないDNSルートサーバーの1台が、4日間にわたり、他との同期を失う不具合を起こしていたことが分かりました。 同期を失っていたのは、Cogent Communicationsが管理するDNSルートサーバー。DNSとは、Domain Name Systemの略称で、人々がインターネットにアクセスするときに使うドメイン名とIPアドレスの紐付けを管理する役割を果たしています。 インターネットはこのDNSを階層的に構築しており、その最上階層にあるのが13台のルートサーバーです。 たとえば、誰かがブラウザーを開いてWikipediaを閲覧しようと思い、Wikipediaへ
ガジェット全般、サイエンス、宇宙、音楽、モータースポーツetc... 電気・ネットワーク技術者。実績媒体Engadget日本版, Autoblog日本版, Forbes JAPAN他 AIスタートアップのHumaneは同社初で唯一の製品であるAi Pinを2023年11月に発表、2024年4月に出荷し始めたばかりでしたが、早くも会社の売却を検討中であるとの報道があります。 Humane Ai Pinはピンバッジのように胸元に装着でき、音声入力やタップ、ジェスチャーで対話型AIを操作するコンセプトのウェアラブルデバイス。 AIはマイクロソフト・OpenAIとの提携により、内蔵のセルラー通信機能を通じてクラウド上の最新AIプラットフォームを利用できます。 具体的な使い方としては、音声によるAIとの会話でメッセージを作成し送信したり、翻訳デバイスとして使ったり、搭載するカメラでAIにものを見せて
ガジェット全般、サイエンス、宇宙、音楽、モータースポーツetc... 電気・ネットワーク技術者。実績媒体Engadget日本版, Autoblog日本版, Forbes JAPAN他 中国国家サイバースペース管理局(CAC)は、習近平国家主席の思想と政治哲学に関する著書などでトレーニングされた大規模言語モデル(LLM)を搭載するAIシステムを開発しました。 英Financial Times(FT)によると、このAIの強化には、現在の中国国家主席が書いたとされる「新時代の中国の特色ある社会主義に関する習近平の思想」略して「習近平思想」についての12冊の書籍と、それに基づいた政府規則、政策文書、国営メディアの報道、その他の公式文書が用いられているとのこと。FTはこのAIシステムを、ChatGPTをもじって『Chat Xi PT』と紹介しています。 FTはさらに、ある文書には習近平氏への言及が8
■Upscaleの基本Stable Diffusionを使った生成AI画像の場合、SD 1.5、SDXL共に推奨解像度があり、例えばよく使う縦横比の2:3だと、それぞれ512x768 と 832x1,216となっている。 これより大きい画素数を指定すると、妙に体が長かったり、顔が複数出て来たり…オカルト的な絵となるケースが多い。 ではフルHDサイズの画像を作るにはどうすれば?というと、上記で生成した画像に対して2.5倍もしくは1.58倍すればフルHDとなるのはお分かりいただけると思うが、これをUpscaleと呼んでいる。 手順は大きく分けて、txt2img中にUpscaleする方法と、一旦 txt2imgで画像を作り、できた画像を img2imgでUpscaleする方法の2パターンがある。 筆者の場合は前者がほとんどで、後者は何か理由がない限り使わなかった(単にできた画像をimg2imgへ
慶應義塾大学卒業後、新卒で出版社の宝島社に入社。独立後はケータイジャーナリスト/ライターとして幅広い媒体で執筆、コメントなどを行う。ケータイ業界が主な取材テーマ。 「Gemini 1.5 Pro」「Gemini 1.5 Flash」「Project Astra」などなど、AI一色だったグーグルのGoogle I/Oですが、Androidの新展開として発表されたトピックスの中に、サラッと日本向けのGoogleメッセージに関する言及がありました。 日本ではKDDIと協力し、RCS対応のGoogleメッセージを展開してゆく趣旨の内容です。 これを受け、KDDIも16日にGoogleメッセージを採用していくことを発表。具体的な時期は明かされていませんが、今後、同社の取り扱う端末にはプリインストールアプリとしてGoogleメッセージが内蔵されていくことになります。 KDDIに確認したところ、同じRC
著書に『宇宙世紀の政治経済学』(宝島社)、『ガンダムと日本人』(文春新書)、『教養としてのゲーム史』(ちくま新書)、『PS3はなぜ失敗したのか』(晋遊舎)、共著に『超クソゲー2』『超アーケード』『超ファミコン』『PCエンジン大全』(以上、太田出版)、『ゲーム制作 現場の新戦略 企画と運営のノウハウ』(MdN)など。 アップルは5月21日未明、iPhoneのシステムアップデート iOS 17.5.1を配信しました。 公式リリースでは「データベース破損により削除した写真が写真ライブラリに再表示されることがまれにある」問題を修正したと述べています。 今回の修正前、iOS 17.5にアップデートした複数のユーザーが、「削除したはずの写真が、突如として写真ライブラリに復活した」と大手掲示板Redditなどに報告していました。 削除した写真が「最近の項目」トップに現れる現象で、なかには「数年前に消した
ガジェット全般、サイエンス、宇宙、音楽、モータースポーツetc... 電気・ネットワーク技術者。実績媒体Engadget日本版, Autoblog日本版, Forbes JAPAN他 ハリウッドスターのスカーレット・ヨハンソンは、声の使用を断ったにもかかわらずOpenAIが「不気味なほど自分に似た」AI音声を発表したことに「ショックを受け、怒り」を覚えたと述べ、同社のサム・アルトマンCEOに対し経緯の説明を求める声明を出しました。 事の発端は、OpenAIが先週発表した新しい音声アシスタントのうち、「Sky」と呼ばれるものの声がヨハンソンに非常に似ていたこと。 アルトマン氏は生成AIモデル「GPT-4o」の発表に合わせて、X(Twitter)に「her」とだけ記した謎の投稿をしていました。 発表で「Sky」の声を聞いたOpenAIコミュニティやSNSでは、映画『her / 世界でひとつの彼
DrummerとはなんだったのかSession Playersは、自分で全部の音をプレイしなくても、それっぽい伴奏をしてくれる無料で使えるLogic Proの中のバーチャルセッションミュージシャン。10年前からあるDrummerがドラム限定とはいえまさにそういった機能でした。Drummerは部分的にiPhone、iPad版のGarageBandでも使うことができ、ベーシックなトラックを作る際には重宝しています。こちらにはキャラ名と似顔絵が残っています。 シンガーソングライターの伴奏に適したようなタイプから、クラシックなハードロック、60年代のビートバンド、現代的なバーサタイルなドラマーまで、さまざまなキャラクターを持ったドラマーが用意されていて、その中から曲調に合わせて適したものを選んで、「この曲はレッド・ツェッペリンっぽい曲だからドラマーはジョン・ボーナムっぽい叩き方ができるLoganに
「Snapdragon Dev Kit for Windows」という名前が示すとおり、このPCはソフトウェア開発者を対象として販売される製品で、Arm版Windows 11向けのアプリを開発できるように設計されています。 重さわずか2.1ポンド(約953g)の薄型フォームファクターを採用した外観は、黒いMac miniといった趣で、ディスプレイ、キーボード、マウス、Wi-Fi 7(または有線LAN)をつなぐだけでWindowsデスクトップとして使えます。 (▲画像:Snapdragon Dev Kit for Windows 仕様表) 昨年発表された「Windows 開発キット 2023」も似たような見た目でしたが、Snapdragon Dev Kit for WindowsはSnapdragon X Eliteによる優れたパフォーマンスが期待でき、仮に一般向けとして発売しても十分に売れ
Microsoftは5月20日(現地時間)、新しい「Copilot+ PC」カテゴリの製品として、第11世代のSurface Proと第7世代のSurface Laptopを発表しました。国内でも6月18日に発売されます。 マイクロソフト、ARM版の新型Surfaceと『Copilot+ PC』発表。全部覚えるRecallなどWindows 11のローカルAI強化 | テクノエッジ TechnoEdge マイクロソフトがWindows 11『Copilot+ PC』イベントを開催し、Snapdragon X Elite / Plusプロセッサを搭載した新型 Surface Pro (第11世代)および Surface Laptop (第7世代)を発表しました。
Recallは、かつてWindows 10に搭載されていた『タイムライン』の拡張版といった機能。アクティブな画面のスナップショットを数秒ごとに常時取得し、スライダーで遡ったり、Copilotを通じて内容を検索できる機能です。 記録したスナップショットはCopilot によるAI検索が可能。たとえば数日前にWEBで検索して見たページが思い出せないような場合、覚えている要素、たとえば「赤い車」や「白いスニーカー」などと検索すると、撮影されたスナップショットの中から該当するものを見つけてくれます。 単に過去の画像を表示するだけではなく、その時に使用していたアプリを開くこともできるようになるとのことです。 (▲画像:Recall機能のデモ。スライダーで過去に遡って画面を見られる) スナップショットはPCのローカルストレージ内に保存し、デバイス上の暗号化とBitLockerで保護します。特定のユーザ
ITPROTECH 14インチ 3840×1100ピクセル・製品名「LCD14HCV-IPSW」 ・タッチ非対応 ・実勢価格2万5000円前後 「価格重視」で選ぶか、「解像度重視」で選ぶか…でツイ廃モニターの製品選びの基本方針が決まりそうだが、これに加えて、最近の「ツイ廃モニター」の流行の特殊機能「タッチ操作」対応かどうかで選ぶ人も多そうだ。 タッチ操作対応モデルは、タッチ操作非対応のモデルに対しては、2000円~3千円ほど高くなる傾向にある。 タッチ操作は、メインモニターからツイ廃モニターに対して、マウスカーソルを持って行きにくい環境下、使いにくい状況下において、ツイ廃モニター側のスクロール操作などをしたいときには威力を発揮しそうではある。 筆者は、この表中、最も解像度が高い3840×1100ピクセル解像度の液晶パネルを採用する、14インチ画面サイズのITPROTECH「LCD14HCV
マイクロソフトはクアルコム製のSnapdragon Xシリーズを搭載した第7世代Surface Laptopを発表しました。どちらも同社が提唱する新たなWindows PCカテゴリ「Copilot+ PC」に属します。
マイクロソフトがWindows 11『Copilot+ PC』イベントを開催し、Snapdragon X Elite / Plusプロセッサを搭載した新型 Surface Pro (第11世代)および Surface Laptop (第7世代)を発表しました。 新型 Surface Pro はシリーズ初の有機ELディスプレイを選択でき、性能は(二世代前の) Surface Pro 9比で90%高速。統合NPUのAI処理性能(TOPS)は、AppleのM4 iPad Proより約20%高速をうたいます。 新たな純正アクセサリとして、合体しても外しても使える新型キーボード Surface Pro Flex Keyboard を用意します。 ■ Windows PCの新たなカテゴリ『Copilot+ PC』新型 Surface シリーズを披露した一方で、イベントの主題はマイクロソフトが提唱する新
2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第47回目は、生成AI最新論文の概要5つを紹介します。 生成AI論文ピックアップ GPU上でネイティブ動作する並列処理が可能な新プログラミング言語「Bend」とランタイムシステム「HVM2」 2D画像から3Dコンテンツを生成する「CAT3D」をGoogleが開発 大規模言語モデルは追加学習や新知識で幻覚生成が増加。Googleなどが調査 画像とテキストを使った長文生成が得意なAIモデル「Chameleon」をMetaが開発 Transformerを超える「Mamba」は視覚認識タスクに必要か? 開発した「MambaOut」モデルで検証 GPU上でネイティブ動作する並列
ガジェット全般、サイエンス、宇宙、音楽、モータースポーツetc... 電気・ネットワーク技術者。実績媒体Engadget日本版, Autoblog日本版, Forbes JAPAN他 X(旧Twitter)のオーナー、イーロン・マスク氏は、Xのサービスがこれまで使用してきたドメインである「twitter.com」から「x.com」に移行したことをXへの投稿で明らかにしました。 マスク氏は「すべてのコアシステムがX.comになった」と述べています。記事執筆時点で、ブラウザーからXにアクセスすると、ウィンドウ下部に「XのURLが変更される予定です。ただし、プライバシーとデータ保護の設定は変わりません」と表示されます。またログインしていない状態ではデフォルトの背景色が黒に変わっています。 1年ほど前にTwitterはXに名称が変わりました。ロゴマークに描かれた空に羽ばたく青い鳥もどこかへ飛び去り
テクノエッジは、5月25日から6月9日にかけてオンラインおよびオフラインで開催される技術書オンリーイベント「技術書典16」に出展します。 技術書典:技術書オンリーイベント 技術書典は、ITや機械工作とその周辺領域について書かれた技術書に特化した技術書オンリーイベントです。 オンライン販売とオフラインイベントの両方を開催する点が特徴で、第16回となる今回は5月25日から6月9日まで技術書典のWebサイトで開催するとともに、5月26日には池袋サンシャインシティにて1日限りのオフラインイベントが開催されます。 テクノエッジでは、これまでオンラインで開催してきた「生成AIグラビア実践ワークショップ」全6回の内容をまとめた解説書を技術書典で販売します。 ワークショップの内容に加えて、画像生成AIを利用するためのPCスペックやセットアップなどを新規に書き下ろすとともに、講師である西川和久さんによる監修
なお、ワークショップ内で使用するプロンプトは、受講者向けにドキュメントとして公開し、その場でコピペするだけで画像生成を体験できる、非常に簡単な仕組み。生成した画像はその場で自分のパソコンに保存できます。 第1期全6回を好評のうちに終了して先月から始まった第2期からは、これまで使っていたフロントエンドのAUTOMATIC 1111を、新しい技術が比較的早いタイミングで使えるComfyUIに切り替え、5月22日、オンラインにて開催いたします。 本ワークショップでは、高価なゲーミングPCがなくても自分で高速な画像生成ができるサービス「生成AI GO」のサーバをお借りしています。なお、生成AIGOはComfyUIには未対応ですが、第1期ワークショップで使用したAUTOMATIC1111には対応しています。 なお、今回お申し込みいただいた方は、前回分の動画アーカイブを視聴いただけます。 グラビアカメ
アップルは4月にApp Storeの審査基準を変更し,レトロゲーム機エミュレータを解禁。それ以降、様々な任天堂ゲーム機用ソフトが遊べる「Delta」などのエミュレータアプリが人気を集めています。
ガジェット全般、サイエンス、宇宙、音楽、モータースポーツetc... 電気・ネットワーク技術者。実績媒体Engadget日本版, Autoblog日本版, Forbes JAPAN他 アップルは、毎年5月に行われれる世界各地でアクセシビリティを考える一日(Global Accessibility Awareness Day:GAAD)に合わせ、障害を持つ人たちに新たな体験を提供すべく、アップル製品への複数の新機能追加を発表しました。 今回発表された新機能のうち、iPhoneやiPadを対象とするものとしては、アイトラッキング(Eye Tracking)機能をはじめとして、カスタマイズ可能なVocal Shortcuts機能、Music Haptics機能、Vehicle Motion Cues機能などがあります。 アイトラッキングまず、一般ユーザーでも気になりそうなアイトラッキング機能は、
著書に『宇宙世紀の政治経済学』(宝島社)、『ガンダムと日本人』(文春新書)、『教養としてのゲーム史』(ちくま新書)、『PS3はなぜ失敗したのか』(晋遊舎)、共著に『超クソゲー2』『超アーケード』『超ファミコン』『PCエンジン大全』(以上、太田出版)、『ゲーム制作 現場の新戦略 企画と運営のノウハウ』(MdN)など。 Googleは5月15日の「Google I/O」イベントで、Androidスマートフォンに掛かってきた電話に詐欺の疑いがある場合、ユーザーに警告する機能をテスト中であることを発表しました。 これは Gemini Nano、すなわちAndroid端末内で、オフラインで動くAIを活用した機能。通話内容から「詐欺にありがちな会話パターン」を検知し、ユーザーにリアルタイムで警告して電話を切るよう促します。不審な動きの例としては、社会保障番号や銀行情報の入力を求めることを挙げています。
問題の部分は、動画開始後1分を過ぎたあたり。レトロなフィルムカメラを手に持つ青年が、「なんでレバーが最後まで動かないの?」と質問したところ、GoogleのAIは即座にいくつかの回答を提示し、最後に最も最適と思われる答えを強調表示しました。 ところが、その強調された答えは「裏蓋を開けて、そっとフィルムを取り出す」というものでした。もし、フィルムカメラ世代の人々やカメラ好きな人々がこの答えを示されたなら、きっと慌てることでしょう。 (▲画像:「裏蓋を開けてそっとフィルムを取り出す」回答をハイライト。) 手巻き式のカメラでフィルム巻き上げレバーが途中で止まるようになったら、それはいま使っているフィルムカートリッジの撮影可能枚数が終了したことを意味します。 そうなった場合は、カメラ内にあるフィルムをカートリッジ内に完全に巻き戻してから取り出し、現像にまわすというのが正しい手順です。 ところがGoo
バージョンアップは公式ページで13日と書かれていたのでずっと待っていたのですが、14日にはApp Storeからアップグレードできるようになっていました。米国時間で、ということのようです。 早速使ってみたので、そのファーストインプレッションをお届けします。 実際に使っている様子は、毎週水曜日正午にYouTubeライブしている番組「AIライブハウス」にてご覧いただけます。 さて、まず試したいのはStem Splitter。完成された楽曲のオーディオデータからボーカル、ベース、ドラム、その他の4トラックを抜き出す技術です。Stem(ステム)というのは、木の枝分かれのように、楽器パートごとのデータに分離したトラックのこと。 現代のマルチトラックレコーディングでは、1つのトラックに1つの楽器を割り当てることで、その楽器にあったエフェクトやボリュームの変化などを後から処理できますが、ステムにしておく
lllyasviel氏復活第一弾のIC-Light前回(第23回)にControlNetやFooocus、stable diffusion webui forgeを作ったlllyasviel氏、ここ数ヶ月Xなどに書き込みが無いと書いたが、いきなり驚くべき仕掛けを提げての復活。その名もIC-Light(Imposing Consistent Light)。Stable Diffusionの技術を使って、照明を自由にコントロールできる仕掛けだ。 これまでStable Diffusionでは、SD 1.5、SDXLに関わらず、Promptで光や照明などの指示はできたのだが、どのように反映されるかは、Modelやその他の設定しだい。例えば backlight, soft bounced lighting, soft natural lighting, candolelight, neon ligh
[名称] Quick Disk、QD、クイックディスク (参考製品名 「QD2」他) [種類] 磁気ディスク [記録方法] 磁気記録 [メディアサイズ] 78×78×3mm [記録部サイズ] 直径約72mm(実測) [容量] 128KB(片面64KB) [登場年] 1984年頃~ ひとつ、またひとつと消えていき、記憶からも薄れつつあるリムーバブルメディア。この連載では、ゆるっと集めているメディアやドライブをふわっと紹介します。 ロストメモリーズの記事一覧「Quick Disk」(クイックディスク、QD)は、ミツミ電機と日立マクセルによって開発された磁気ディスクのひとつ。ドライブをミツミ電機、メディアを日立マクセルが製造し、どちらも低コストを重視して開発されているのが特徴です。 1984年というと、ちょうど3.5インチFD(マイクロフロッピーディスク)がISOで標準規格化された頃で、普及する
OpenAIは5月14日、ChatGPTのGPT-4oを使えるマルチモーダルなMacアプリを公開しました。chat.openai.comにアクセスしてダウンロードリンクが表示されれば利用できます(現在利用できるユーザーはPlusプランの購読者のみ)。ChatGPTアプリはこれでiPhone、Androidに続いてMac版が公開されたことになります。Windows版は年内に登場予定です。 機能としてはiPhoneアプリと同様で、現状ではGPT-4oの音声モデルや、カメラの映像を見ながら音声で対話したりといったことはできません。使われている音声モデルも、従来のものと同じで、遮られても会話をスムーズに続けたりといった機能は実装されていません。歌うこともできません。
フリーランスライター。1969年京都府生まれ。バイク雑誌編集者に憧れて上京し経歴を開始。ラジコン飛行機雑誌、サンゴと熱帯魚の雑誌、デジモノの雑誌をそれぞれ7〜10年編集長として作る。趣味人の情熱を伝えるのがライフワーク。@takuta Appleイベント「Let Loose」で発表された新製品。実際に手にしてみた印象は、iPad Pro 13インチの驚異的薄さと、Apple Pencil Proの機能の強力さ。とはいえ、現実問題として購入するならiPad Airが好バランスではないかと思う。 100g軽くなって、予想より大幅性能向上とにかく、M4搭載のiPad Proはすごい。筆者が試用したのは13インチモデル。バッテリー容量の関係なのか、今回のiPad Proは11インチモデルの5.3mmに対して、5.1mmととても薄い。前モデルが6.4mmだったことを考えると、1.3mmも薄くなってい
次のページ
このページを最初にブックマークしてみませんか?
『テクノエッジ TechnoEdge』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く