Suno対抗のAI作曲サービスとして前評判の高かったUdioがパブリックベータとして一般公開されました。
Suno対抗のAI作曲サービスとして前評判の高かったUdioがパブリックベータとして一般公開されました。
米国のAIスタートアップSunoは、自社のAI作曲サービスである「Suno」をV3にバージョンアップしました。3月20日より、3からのカウントダウンをスタートしていましたが、日本時間の22日2時に、正式公開されました。 V3では、1回で作成できる曲の長さを従来バージョンであるV2の1分20秒をV3では2分までに伸ばし、インストゥルメンタル曲の指定、高音質化、多ジャンルへの対応など、多くの機能強化を行なっています。 これまではProおよびPremierの有償ユーザーのみがアルファ版を使えていましたが、正式版になったことで、無料ユーザーも1日10回、1回で2曲が同時に生成されるので、1日当たり最大20曲まで利用できることになります。 無料ユーザーアカウントで試してみましたが、V3がデフォルトとなっている他に、V3 Alpha版との大きな違いはありません(V2も選択できるようになっています)。
ディアナは、ネビルの農村で商人サリクの妻として知られている30歳の女性です。彼女は村で最も魅力的な女性の一人として広く認知されており、その美貌は訪れる商人や旅行者にも評判です。しかし、彼女の美しさに目が行きがちですが、ディアナの本当の魅力はその知性と商才にあります。 ディアナは商人としての夫をサポートすることで、自身も経済的な洞察力と交渉スキルを磨いてきました。彼女は村の外での取引にも積極的に関わり、新しい取引のチャンスを見つけ出すことで家族の生計を支えています。そのため、彼女は村の経済活動において重要な役割を果たしています。 一方で、ディアナは時に自分の意見を強く主張する傾向があり、これが近隣の村人や他の商人との間で小さな摩擦を生むこともあります。彼女は自分のビジネスセンスに絶対の自信を持っており、他人の意見や提案を軽視しがちです。このため、一部の村人からは少し傲慢と見なされています。
18年間テレビ番組制作者を務めたのち、文筆家として独立。家電から放送機器まで執筆・評論活動を行なう傍ら、子供の教育と保護者活動の合理化・IT化に取り組む。一般社団法人「インターネットユーザー協会」代表理事。 もういい加減にしろよと読者から怒られかねないのだが、まだまだキーボードの話である。 KeychronのK11 Proを購入し、散々いじくり回していたわけだが、まあさすがに自作までは時間ないし、キーボード改造もここまでかなと思っていた。ところが先日、PFUのHHKB Studioのお話を聞く機会があり、1995年当時の秋葉原の話などが出て、懐かしく思い出した。この記事はまもなくITmedia MONOistに掲載されると思うので、お楽しみにしていただきたい。 そのインタビューの中で、秋葉原のキーボード専門店「遊舎工房」の話が出て、そういえばまだ一度も行ったことないなと気づいた。だいたいこ
2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。2024年初っ端の第27回目は、「礼儀は不要」「モデルに質問させる」「良い解答には報酬」など、大規模言語モデルの返答が向上する「プロンプト26の原則」をはじめとする5つの論文をお届けします。 生成AI論文ピックアップ複数の自律AIエージェントが過去の経験を共有して未知のタスクを処理するモデル「Experiential Co-Learning」 画像から動く3Dシーンを生成する新モデル「DreamGaussian4D」 大規模言語モデルの返答が向上する「プロンプト26の原則」が公開。「礼儀は不要」「モデルに質問させる」「良い解答には報酬」など 220以上の生成タスクが実
1971年福井県生まれ。得意ジャンルは、パソコン・デジタルAV・家電、ネットワーク関連など「電気かデータが流れるもの全般」。主に、取材記事と個人向け解説記事を担当。 最近多いので「またですか」と言われそうだが、メカニカルキーボードの話をする。 先週、あるキーボードを買った。冷静に考えると「生まれて初めて」レベルのものであり、ちょっと面白い体験だった。だがいまや、「これが私にとってはベストだった」と確信するくらい気に入っている。 購入は「衝動買い」だったのだが、そこから考えた諸々のことは、「キーボードと人間」を考える上でけっこう重要なことではないか……と考えている。 というわけで、衝動買いから考えた話をお伝えしたい。 ※この記事は、毎週月曜日に配信されているメールマガジン『小寺・西田の「マンデーランチビュッフェ」』から、一部を転載したものです。今回の記事は2023年8月21日に配信されたもの
SDXL 1.0をAUTOMATIC1111で動かすにはStability AIが画像生成AIのStable Diffusion 1.5をリリースしたのは2022年10月20日。そこから約9ヶ月経った本日2023年7月27日、高画質な最新バージョンSDXL 1.0の登場となった。まだ全く使いこなせていないが、速報と言うことで、その絵をご覧頂きたい。 Stable Diffusion 1.5とSDXL 1.0の大きな違いはザックリ2点。 学習ベースが512✕512ドットから1,024✕1,024ドットへ 1pass式からBase→Refinerと言う2pass式になった 学習ベースの解像度がこれだけ違うと、当然出てくる絵に差が出る。1passから2passになった技術的な理由はさておき、Baseのままでもそれなりに見れ、更にRefinerを通すと解像度や質感が向上する。 BaseとRefin
AIを活用して声を学習し、本人そのままの高精度な声で生成する技術がここ数カ月で大きく進化しています。 RVCというAIボイスチェンジャー機能は、岸田首相の声真似を本人の前でデモするまでになり、AIフェイクボイスの問題が一部で取り沙汰されるようにもなりました。 そんな中、アップルがAIを使った人声の学習・生成機能「Personal Voice」を今年下半期のOSアップデートで提供すると発表しました。 iPhone、iPad、そしてAppleシリコンを搭載したMacで15分、ランダムに表示される150の文章を読み上げるだけで自分の声を学習することができ、テキストをタイプすると自分そっくりな声で相手に伝えることが可能になります。ただし、当初は英語のみです。 テキストした文章を音声化する機能(TTS、Text To Speech)をアップルは「Live Speech」という新機能で提供。これまでは
おいおいまたかよ、驚き屋かお前はと言われそうですが、またゲームチェンジャーなんですよ。ほんとすいません。全部AIが悪いんです。 AI関連はちょっと目を離すと取り残されてしまいます。後から来たのに追い越され、泣くのが嫌なら歩いていくしかないのです。今回、それが再びAI音声合成で起きました。 筆者はAIアートグランプリを受賞したおかげでいろいろなところから取材を受けたり自分でも解説記事を書いたりしていますが、その中で、Diffusion(拡散)モデルを使ったDiff-SVCというAI声質変換によってリアルな元音声を再現できると説明してきました。ですが、これからは「実は今は新しいAI技術を使っているんですよ」と付け加えなければいけません。 妻の歌声を合成するのに使っていたDiff-SVCから別の新しい技術に乗り換えてしまったのです。 Diff-SVCが出た後に、So-VITS-SVC(SoftV
ブロガー・著者・研究者。ブログLifehacking.jp管理人。著書に「ライフハック大全」「知的生活の設計」「リストの魔法」(KADOKAWA)など。理学博士。 @mehori Twitterへの懸念が広がるにつれて、移行先となるSNSが注目されるようになっています。それらについて、ソーシャルネットに詳しい堀正岳さんに前後編で解説してもらいます。前編は、Twitter創業者が支援していることで注目を浴びている「Nostr」についてフォーカスします。 イーロン・マスク氏がTwitterを買収して以来、サードパーティアプリの急な締め出し、説明のないアカウントの集団凍結、あるいは純粋にサービスの不安定さが増えるといった、ユーザーの不安をかきたてるニュースが毎日のように報じられています。
パスワードマネージャー大手の1Passwordが、パスワードなしで利用可能になる方針を発表をしました。今夏には新方式のパスキー(passkey)のみで1Passwordにアクセスできるようになります。 AppleがiOS 16でサポートしたことで知名度が一気に上がったパスキーは、パスワードレス認証の普及を目指すFIDOアライアンスが策定したWebAuth APIを利用する、真にパスワードレスな認証規格。 仕組みとしては、アカウント作成時に公開鍵と秘密鍵のペアを作成し、公開鍵をサーバー側に、秘密鍵をデバイス側に保管します。ログインする場合には、サーバー側から認証要求を行い、ユーザー側はデバイスに保管した秘密鍵を使って署名を送信。 この際、デバイス上ではユーザー認証としてFace IDなどの生体認証を利用します。サーバー側は公開鍵を使って署名を検証することで、正規ユーザーかどうかの確認を行いま
AppleがiPhone、iPad、Macで利用できるホワイトボードアプリ「フリーボード」の提供を開始しました。 12月14日にリリースされたiOS 16.2、iPadOS 16.2、そしてmacOS Ventura 13.1に含まれており、更新するとホーム画面にアイコンが現れます。無料で利用可能です。 手書き、写真や動画、スタンプからPDF書類まで自由に貼り付けフリーボードは、いわゆるホワイトボードアプリ。キャンバス上の好きな場所に手書きしたり、写真やビデオ、オーディオ、PDF書類、ウェブサイトや地図の位置情報へのリンク、付箋、図形、図表など、さまざまな種類のファイルを配置可能です。 Mac上ではFinderから各ファイルをドラッグ&ドロップで追加でき、iPhoneやiPadのカメラで撮影した写真やスキャンした文章を直接取り込むこともできます。 iPhone、iPadでは指での手書きも可
これでいいかと注文する際、実はもう1つ気になる製品がありました。それが、キオクシアの「TransMemory U301」。なんだよ同じじゃねーか、と思われるかもしれませんが、そうです。同じなんです。ただしこちらは、中国からの並行輸入品。同じく日本製をうたっていながら価格は64GBで980円(購入時)と、日本版より300円も安いんですよね。 ▲中国からの並行輸入品ですが、こちらも日本製とのこと もしや偽造品なのでは!?……と一瞬身構えましたが、それなら、木を隠すなら森の中。足がつきやすいAmazonのマケプレなんて使わず、個人売買サイトを活用するほうがバレにくいでしょう。 また、ただでさえ安めのUSBメモリーを偽造しても、うまみはほとんどないでしょう。よく狙われるのは、高額な512GBや1TBのmicroSDXCカード。試しに個人売買サイトで検索してみてください。購入してしまった被害者が大勢
イーロン・マスク率いる宇宙企業SpaceXの事業の一つである衛星インターネットサービス「Starlink」が、10月11日、日本で申し込みできるようになりました。 StarlinkはSpaceXが打ち上げた数千個の通信衛星を活用したサービスで、対象地域で小型のアンテナを設置すれば、高速・低遅延のインターネット回線が利用可能となります。ロシアによるウクライナ侵攻で分断されたインターネット通信を、イーロン・マスクがStarlink提供で支援したことで一躍有名になりました。 今回、対象となったのは東日本と北海道の一部。日本の他の地域は「順番待ち」となっています。北海道であっても札幌は対象外だけど函館は入っていたり、神奈川県の横須賀市は入っているけど小田原市では使えないなど、都道府県別になっているわけではないので住所を入れての確認が必要。利用価格は月額12,300円。アンテナやルータなどの初期設備
マイクロソフトが独自デザインの絵文字『Fluent emoji』1538種のデータをオープンソースで公開しました。 Microsoft 365のリアクション等でも使われるマイクロソフト版の最新デザイン絵文字 Fluent emoji 1538種について、3D表現のPNGファイルやベクタのSVG版、フラット版やハイコントラスト版など一式を含み、Github や Figma で誰でも自由に利用したり入手できます。 制限の少ないMITライセンスのため、自由に改変や配布、商用利用も可能(著作権表示と許諾表示は必要。MITライセンスを参照)。 現在の絵文字に欠けた新しい絵文字の素材にすることも、顔や動物や食べ物のアレンジ版を作ることも、自分のアプリや作品に導入することもできます。 Fluent Emoji は、マイクロソフトが2021年に全面刷新したスタイルの絵文字。モバイル機器やチャットアプリ、リ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く