アップルが打ち出したAIフレームワーク「Apple Intelligence」ですが、個々の機能についてはわかるものの、全体像がつかみにくいものになっています。
![Apple Intelligenceはどのように開発されたのか? 中核をなすオンデバイスAIモデルとPrivate Cloud Computeについて今わかっていること(CloseBox) | テクノエッジ TechnoEdge](https://cdn-ak-scissors.b.st-hatena.com/image/square/1838d5264fe7b478857457c6c17d358d770bb4e3/height=288;version=1;width=512/https%3A%2F%2Fwww.techno-edge.net%2Fimgs%2Fogp_f%2F17173.png)
エンジニアです。他にもDIY、3Dプリンタなどが趣味です。visionOSのディベロッパーになるぞ!という企画ものをYouTubeで公開してます。観てね。 ついに発売されたApple Vision Pro。これを待ち侘びていたのは熱心なAppleファンだけではありません。アプリの開発者もこの日が来るのを一日千秋の思いで待ち侘びていました。 というのもこうしたAR環境のアプリの開発では、実際のデバイスでないと確認できない機能がたくさんあるからです。 例えばわかりやすいのはセンサーから情報を得るアプリ、シミュレータだとそもそも開発できないか、できても決まったセンサーのパターンで反応を試す程度のことしかできません。 また、3Dオブジェクトの配置や大きさ、ウィンドウとの距離感など、いままでの経験がいまひとつ役に立たない、今回の新しい空間プラットフォーム特有の勘所なども実機でないと試せません。 他に
1971年福井県生まれ。得意ジャンルは、パソコン・デジタルAV・家電、ネットワーク関連など「電気かデータが流れるもの全般」。主に、取材記事と個人向け解説記事を担当。 「ねんがんの Apple Vision Proをてにいれたぞ!」 ▲Vision Pro米国版 「そう かんけいないね」なんて言わないでほしい。 確かに最低でも3500ドル(約52万円)というのは高価だし、現状は英語環境のみでの動作だ。後述するが、いわゆる「技適」もない。不便な点も留意すべき点も多々ある。 しかし、使ってみると確実に「これは未来の1つの形だ」と感じる。過去さまざまな機器で試みられてきた方向性を、アップルが大きな予算とコストをかけ、一気に新しい次元まで持ち込んだ。 それはどういうことなのか。実機写真とともにファーストインプレッションをお届けしたい。 ハワイでVision Proをゲット今回、Vision Proは
エンジニアです。他にもDIY、3Dプリンタなどが趣味です。visionOSのディベロッパーになるぞ!という企画ものをYouTubeで公開してます。観てね。 どうも、バスケです。サンフランシスコの近くでエンジニアをやってます。2000年代の初め、Mac OS Xが出た頃から5年ほど、MacPower誌において「バスケの言い分」というコラムを書かせてもらってました。 久々に文章を書きませんか?という依頼をいただきまして、それではあのときの続きということでこのタイトルとなりました。今回は僕がハマっていることについて広く書いて良いということなので、Appleのことだけでなく3Dプリンタとか他のエンジニアリングトピックも拾っていければと思います。よろしくお願いします。 さて僕は古くからのMac周辺のエンジニアでして、かれこれ35年ほどAppleテクノロジーと共に生きてきました。 しばらくアプリとか作
1971年福井県生まれ。得意ジャンルは、パソコン・デジタルAV・家電、ネットワーク関連など「電気かデータが流れるもの全般」。主に、取材記事と個人向け解説記事を担当。 iPhone 15 Proへの実装が予定されていた「空間ビデオ撮影」機能が、iOS 17.2に実装された。 ▲iOS 17.2へアップデートしたiPhone 15 Proでは、空間ビデオが撮影可能に。「カメラ」の「フォーマット」から設定。動画でゴーグルのマークをオンにすると空間ビデオになる 空間ビデオといっても、左右の目それぞれ向けの映像を記録する、いわゆる「ステレオペア映像」。古典的なものなので、「空間ビデオ」という表現を大げさなものに感じられる人もいるかもしれない。 だが、この機能が多くの人が持つスマートフォンに搭載されたことには、非常に大きな価値がある。 ここで3D写真・3D動画の歴史とその視聴方法等について、歴史と今の
ガジェット全般、サイエンス、宇宙、音楽、モータースポーツetc... 電気・ネットワーク技術者。実績媒体Engadget日本版, Autoblog日本版, Forbes JAPAN他 外出中にiPhoneのパスコードを使う機会は意外と多いものですが、もし悪意ある誰かが、肩越しに覗き込むショルダーハッキングなどでパスコードを知り、そのiPhoneを盗むことができた場合、そのiPhoneは簡単にセキュリティを破られてしまいます。 Appleは、今後リリース予定のiOS 17.3に新しいiPhone保護機能を搭載し、悪意ある人物がiPhoneとパスコードの両方を盗むことができた場合でも、勝手にデバイスの設定を変更できなくする予定です。 この機能はStolen Device Protection(盗難デバイス保護)と呼ばれ、自宅や職場など日常的に長く過ごす場所にいるか、それ以外の場所にいるかで動作
イーロン・マスクによる買収以来、揺れ動いてきたTwitter(現在はXに改名)ですが、その内部がどのようになっていたのかはなかなか伺い知ることができません。筆者が個人的に参加しているポッドキャストbackspace.fmでは、TwitterのiOSアプリ開発に2010年から携わってきたソフトウェアエンジニアの丹羽善将(@niw)さんにその渦中の話を聞くことができました。 丹羽さんは、超有名テックブログのDaring Fireballで、世界で最も優れたiOS開発者の一人としてTwitter退社を惜しまれた人物です。 ▲Daring Fireballより 丹羽さんをゲストに迎えたエピソードは下のリンクからどうぞ。
発端はこのツイート。「本当のDTM」をやってらっしゃる方がいたら、それがなんなのか答えを教えてください!、という問いかけによって、世の中のDTMerを巻き込んだ大喜利がスタートしました。 これは一言申さねばなりません。なぜなら、筆者は本当のDTMを体験した数少ない生き残りだからです。 DTM(Desk Top Music)という言葉を最初に使った製品が登場したのは、1988年のこと。PC-9801用のDTMパッケージ「ミュージくん」です。MIDI音源として、LA音源のMT-32、PC-9801用MIDIインタフェース、ダイナウェアが開発した五線譜ベースのソフトウェアをバンドルしたものでした。2020年度未来技術遺産にも認定されています。 ▲ミュージくん ちなみにDTMというのは、DTP(Desk Top Publishing)から発想したローランドのネーミング。Macintoshとページプ
1971年福井県生まれ。得意ジャンルは、パソコン・デジタルAV・家電、ネットワーク関連など「電気かデータが流れるもの全般」。主に、取材記事と個人向け解説記事を担当。 Metaが「Meta Quest 3」を発表した翌週にアップルがWWDC23で「Apple Vision Pro」を発表したことで、またにわかにHMDに注目が集まってきている。 筆者も米・クパチーノのアップル本社で取材し、実機を体験することができた。 ▲Vision Pro。アップル本社内のスティーブ・ジョブズ・シアターで撮影 アップルはVision Proを「空間コンピュータ」と定義した。 一方で、Metaは違う考えを持っているようだ。 では両者は具体的にどう違うのか? 筆者はVision Proも取材できたし、MetaのCTOなどにも取材経験がある。だから、アップルのビジョンとMetaのビジョンの違いを、ある程度深掘りでき
WWDC23キーノートではVision Proが発表され、大きな注目を浴びています。しかし、発表が始まって1時間ちょっと前あたりに驚くべきシーンがあったのをみなさん、覚えているでしょうか? アップル基調講演の花形で、毎回何がしか面白い仕掛けをしてくる人物、ソフトウェアエンジニアリング担当上級副社長であるクレイグ・フェデリギが今回もやってくれました。 macOS Sonomaの新機能を軽くまとめたフェデリギはなぜか革ジャンでトリプルネックギターを肩から下げて、ギターソロを弾き始めたのです。次のAirPods紹介に繋げるために、「80年代メタルを聴いたり……」と、ただそのためだけに。 バックにはマーシャルの巨大なアンプ。ギターには旧アップルロゴと同じレインボウが入っています。 手元をアップにして彼が弾き始めたのはヴァン・ヘイレンのファーストアルバム「炎の導火線」から「Eruption」。当時は
アップルの世界開発者会議WWDC23初日である6月5日、基調講演の後に、Steve Jobs Theaterの地下ロビーでVision Proの実物が展示された。しかしこれは展示のみで、触れたりすることはできなかった。 そして6月5日の午後から6月6日にかけて、一部のジャーナリストがApple Park内の某所(場所は非公開)で、Vision Proを体験することができた。筆者は幸運にもその機会を得たので、知り得たことを、Q&A形式で回答しよう。 なお、その体験の舞台となった部屋は、アップルのプレゼンテーションに出てくるような広いリビングを模した部屋。筆者は大きな3人がけのソファーに座っており、前にローテーブル。正面は壁。そして、ローテーブルの左右には1人がけのソファーがあり、人がいるという状態だった。 正確には計測していないが、体験時間はおそらく40分ぐらい。前後にセッティングや順番待ち
アップルの予告通り、5月24日早朝、iPad版Logic Proが降ってきたので、さっそく試してみました。奥深いソフトなので、一挙に全部の機能を網羅したわけではありませんが、そのファーストインプレッションをお届けします。 Logic Proとは何か?Logic Proは、アップルがMac向けに提供している音楽制作アプリ。いわゆるDAW(Digital Audio Workstation)と呼ばれているジャンルのソフトで、アマチュアからプロフェッショナルまで、このソフトを使って制作しているミュージシャンは多くいます。 競合するソフトとしては、Cubase、Studio One、Ableton Liveほか多くありますが、その中でも一定のシェアを持っています。競合ソフトと比べて安価でありながら、それぞれのハイエンドエディションと比肩する機能を備えているため、これがわずか3万円で買えるということ
テクノエッジ編集部では、4月17日より、ポッドキャストをスタートします。人気のテック系ポッドキャスト「backspace.fm」の中に「TechnoEdge-Side」というチャンネルを設け、週1回のペースでお届けします。 backspace.fmは、2014年創刊。サンフランシスコ在住のエンジニアで人気YouTuberのドリキン、テック系編集者の松尾公也、テクノロジーライターの西川善司の3人が毎週末にテック系の話題を時折ゲストを交えながら語っています。Appleのポッドキャストチャートで1位を、JAPAN PODCAST AWARDでもノミネートされるなど、テック系ポッドキャストとしての地位を確立し、4700人以上の利用者数を持つ専用SNS「グルドン」、有料の会員向けコンテンツサービス「BSM」を運営しています。 TechnoEdge-Sideは、backspace.fmを運営しつつテク
高精度でリアルタイム処理も可能なAI声質変換ソフト(ボイスチェンジャー)「RVC」の記事が大変な反響を呼びました。Stable DiffusionやChatGPTなど生成系AIがメジャー化する中、世間からはそれほど大きな注目を浴びているわけではありませんが、音声AIも驚くべき速度で進化を遂げています。 AIボイチェン「RVC」の精度と学習・変換速度が革命的。コナンの蝶ネクタイ的リアルタイムボイチェンも可能(CloseBox) | テクノエッジ TechnoEdge 記事中でデモとしてお聞かせしたのは、筆者の妻の歌声を高精度に再現するもので、それはこのソフトのおそらく最大の特徴を生かしたものではありません。そこで、また実験をしてみることにしました。 今回は、ポッドキャストbackspace.fmを10年近く一緒にやっている友人であるドリキンのAIモデルをRVCで作ってみました。 backsp
ブロガー・著者・研究者。ブログLifehacking.jp管理人。著書に「ライフハック大全」「知的生活の設計」「リストの魔法」(KADOKAWA)など。理学博士。 @mehori Twitterへの懸念が広がるにつれて、移行先となるSNSが注目されるようになっています。それらについて、ソーシャルネットに詳しい堀正岳さんに前後編で解説してもらいます。前編は、Twitter創業者が支援していることで注目を浴びている「Nostr」についてフォーカスします。 イーロン・マスク氏がTwitterを買収して以来、サードパーティアプリの急な締め出し、説明のないアカウントの集団凍結、あるいは純粋にサービスの不安定さが増えるといった、ユーザーの不安をかきたてるニュースが毎日のように報じられています。
それを、完全とは言えないまでも、かなり元の人に肉薄する品質で再現できる技術がDiff-SVCです。元になる音声データが1時間くらいあれば、与えた音声を、希望する声質に変換することが可能になるのです。 しかも、基本的にお金はかかりません。AI歌声合成が、ちょっとハードルは高いものの、無料で使えて、データさえ集めてくれば誰でも手が出せる。AI歌声合成の民主化と言っていいでしょう。 筆者は10年近く前に旅立った妻の歌声を、UTAU-Synthという、短く切り出した音素をピッチや長さを合わせながら組み合わせていくソフトウェアで再構成しています。1フレーズずつ音素を繋いで、できるだけ不自然にならないように調整していくため、短くて数日、長いと数カ月も時間をかけて完成させていきますが、もうその作業をしなくてもよくなります。 ただ、自分で歌って、もしくは他のボーカルシンセソフトでボーカルトラックをDiff
ガジェット全般、サイエンス、宇宙、音楽、モータースポーツetc... 電気・ネットワーク技術者。実績媒体Engadget日本版, Autoblog日本版, Forbes JAPAN他 Twitterが、先週から突然、Tweetbotなどサードパーティ製クライアントアプリが動作しなくなった問題に関し「長年のAPIルールを執行している」とツイートしました。 さらに「これによって、一部アプリが動作しなくなる可能性がある」と続けたことで、ようやくアプリAPIのエラーが意図したものであることを認めた形になり、アプリ開発者や影響を受けたアプリのユーザーたちの疑問をひとつ晴らしました。 ただ、新たな疑問は「長年のAPIルール」とはいったいどれを指しているのか?というところ。Twtterはそれ以上の説明をせず、AlbatrossやiOS版Fenix、macOS版Twitterrificなど、一部のサードパ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く