ノンプログラマーな自分が、大規模言語モデル(LLM)の助力で、初めてまともに動くプログラムを完成させることができました。
![ドラムマシン、シンセ、サンプラーがわずか数分で完成。非プログラマーなのにClaude + Artifactsのプロンプト開発が楽しすぎて限度超える(CloseBox) | テクノエッジ TechnoEdge](https://cdn-ak-scissors.b.st-hatena.com/image/square/84e7b9be08ee7ba3f6f97af1e5031314586c08bc/height=288;version=1;width=512/https%3A%2F%2Fwww.techno-edge.net%2Fimgs%2Fogp_f%2F17598.png)
ノンプログラマーな自分が、大規模言語モデル(LLM)の助力で、初めてまともに動くプログラムを完成させることができました。
米国のAIスタートアップSunoは、自社のAI作曲サービスである「Suno」をV3にバージョンアップしました。3月20日より、3からのカウントダウンをスタートしていましたが、日本時間の22日2時に、正式公開されました。 V3では、1回で作成できる曲の長さを従来バージョンであるV2の1分20秒をV3では2分までに伸ばし、インストゥルメンタル曲の指定、高音質化、多ジャンルへの対応など、多くの機能強化を行なっています。 これまではProおよびPremierの有償ユーザーのみがアルファ版を使えていましたが、正式版になったことで、無料ユーザーも1日10回、1回で2曲が同時に生成されるので、1日当たり最大20曲まで利用できることになります。 無料ユーザーアカウントで試してみましたが、V3がデフォルトとなっている他に、V3 Alpha版との大きな違いはありません(V2も選択できるようになっています)。
そこで調子に乗って、このアルバムリリース直後に、バンドメンバーに日本の音楽誌がインタビューしたという想定で、ChatGPTに受け答えしてもらいました。その結果がこちら。 The Midnight Odyssey - 「The Odyssey of Echoes」リリース直後のインタビューインタビュアー: 鷹野隼人(Cosmic Prog Chronicles) ――まずは、素晴らしいアルバム「The Odyssey of Echoes」のリリースおめでとうございます。このアルバムを通じて表現したかった主なテーマは何ですか? ジェイク・ハーパー (リードボーカル & ギター)ありがとうございます。このアルバムでは、時間と空間を超えた旅、そして内面の探求をテーマにしています。私たちは、聴き手に音楽を通じて冒険を体験してもらいたいと考えています。 アルバム「The Odyssey of Echo
前回の記事では画像生成AIを使い、どこにでもいそうなありふれたおじさんを生成する流れを紹介しました。今回は、なぜおじさんを生成するのか、そこから何を得たいのか、その理由について述べたいと思います。 なお今回も画像は一部を除いて全てComfyUI上でSDXL DPO TurboとDeepShrinkを使って生成しました。前回同様、生成後に手を加えていませんが、大量に生成したものから抜粋しています。 おじさんは美しくない画像生成AIは魔法の道具ではありません。その仕組みに解明できていない部分はあっても、無から画像を生成するわけではないのです。今広まっている画像生成にも手法は幾つかありますが、大量の既存の画像を解析し、その表現が持つ何かしらの特徴を蓄積し、それを元に再表現を行うという点は共通しています。なおその解析等の処理は一般的に「学習」と呼ばれています。 生成できる表現が解析したデータに基づ
ガジェット全般、サイエンス、宇宙、音楽、モータースポーツetc... 電気・ネットワーク技術者。実績媒体Engadget日本版, Autoblog日本版, Forbes JAPAN他 デスクトップ版のFirefoxブラウザーに20年以上存在していたバグが先月、23歳のプログラミング初心者によって修正されました。 2002年、MacでMozilla browser(Firefoxの当時の名称)を使用していたアダム・プライス氏は、ツールチップの表示の問題に悩まされていました。このバグは、Mozillaツールバーのアイコンにマウスカーソルをポイントして表示されるツールチップ(説明書き)が、Commandキー(WindowsではAltキー)+Tabキーでウィンドウのフォーカスをほかのアプリに移したあとも表示され続けてしまうというもの。 この状態になってしまった場合、ツールチップを消すには再びFir
「VOCALOID β-STUDIO」の試用申し込み受け付けが開始されたという記事を書くとともに、実際に申し込みもしていました。リリース前の協力者による作例が少しずつ公開されてきた23日、初回受付分からの抽選が行われ、筆者は運良く当選しました。 当選の案内著名ボカロPで外れた方もいらしたようなので、かなりの難関だった模様ですが、せっかく試す機会を得られたので、まずはインプレッションを書いてみようと思います。 Cubaseユーザー以外の使い勝手VOCALOIDを開発するヤマハにとって、Cubaseを開発している独Steinbergは子会社。ヤマハのDAWにはCubase LEのライセンスが付属するなど、強い連携をしています。VOCALOIDと連動するVOCALOID Editor for Cubaseも早くから提供されていて、「VOCALOIDを使うならCubase」となるのは当然のことでし
使用したNegative Promptは、「1.無し」、「2.ほぼ最小限」、「3.筆者標準」、「4.embeddingsを使う」の4つパターン。 4番目だけ他と違い別途ファイルが必要となり、ダウンロードしたファイルを[Stable Diffusionのホームディレクトリ]/embeddingsへコピーする。Negative PromptでEasyNegativeなどをよく見かけるがそれだ。ここではng_deepnegative_v1_75tとbadhandv4が該当する。Promptで書く替わりに、特別に学習したModelで同じ効果を得られるようになっている。 無し (worst quality:2),illustration, 3d, painting, cartoons, sketch, illustration, 3d, sepia, (painting), cartoons, sk
百聞は一見に如かず。これってAI生成グラビア?AI画像生成に興味を持ったのは去年の年末頃だろうか。Twitterを眺めていると「どうやって撮った(作った)んだ?」と言う画像がたまに載っていたので調べると、Stable Diffusion Web UI (AUTOMATIC1111版)だった。 元々グラビアを撮っていたこともあり、あまり撮らなくなってもグラビア好きなのには違いなく、試したくなったのは言うまでもない。 AI生成画像は大きく分けて2種類あり、一つはイラスト系、もう一つはリアル系。筆者が興味を持ったのは後者。どこまで実写に迫れるのかがその興味の対象だ。百聞は一見に如かず。扉の写真はAI生成画像。現時点でこの程度の写りは容易にこなす。 とは言え、実際の撮影もそうなのだが、グラビア写真は数百枚撮ってカメラマンがある程度セレクトし納品したものが、納品先で更に絞られ、出版社などで更に絞り込
発端はこのツイート。「本当のDTM」をやってらっしゃる方がいたら、それがなんなのか答えを教えてください!、という問いかけによって、世の中のDTMerを巻き込んだ大喜利がスタートしました。 これは一言申さねばなりません。なぜなら、筆者は本当のDTMを体験した数少ない生き残りだからです。 DTM(Desk Top Music)という言葉を最初に使った製品が登場したのは、1988年のこと。PC-9801用のDTMパッケージ「ミュージくん」です。MIDI音源として、LA音源のMT-32、PC-9801用MIDIインタフェース、ダイナウェアが開発した五線譜ベースのソフトウェアをバンドルしたものでした。2020年度未来技術遺産にも認定されています。 ▲ミュージくん ちなみにDTMというのは、DTP(Desk Top Publishing)から発想したローランドのネーミング。Macintoshとページプ
ブロガー・著者・研究者。ブログLifehacking.jp管理人。著書に「ライフハック大全」「知的生活の設計」「リストの魔法」(KADOKAWA)など。理学博士。 @mehori Twitterへの懸念が広がるにつれて、移行先となるSNSが注目されるようになっています。それらについて、ソーシャルネットに詳しい堀正岳さんに前後編で解説してもらいます。前編は、Twitter創業者が支援していることで注目を浴びている「Nostr」についてフォーカスします。 イーロン・マスク氏がTwitterを買収して以来、サードパーティアプリの急な締め出し、説明のないアカウントの集団凍結、あるいは純粋にサービスの不安定さが増えるといった、ユーザーの不安をかきたてるニュースが毎日のように報じられています。
パスワードマネージャー大手の1Passwordが、パスワードなしで利用可能になる方針を発表をしました。今夏には新方式のパスキー(passkey)のみで1Passwordにアクセスできるようになります。 AppleがiOS 16でサポートしたことで知名度が一気に上がったパスキーは、パスワードレス認証の普及を目指すFIDOアライアンスが策定したWebAuth APIを利用する、真にパスワードレスな認証規格。 仕組みとしては、アカウント作成時に公開鍵と秘密鍵のペアを作成し、公開鍵をサーバー側に、秘密鍵をデバイス側に保管します。ログインする場合には、サーバー側から認証要求を行い、ユーザー側はデバイスに保管した秘密鍵を使って署名を送信。 この際、デバイス上ではユーザー認証としてFace IDなどの生体認証を利用します。サーバー側は公開鍵を使って署名を検証することで、正規ユーザーかどうかの確認を行いま
ガジェット全般、サイエンス、宇宙、音楽、モータースポーツetc... 電気・ネットワーク技術者。実績媒体Engadget日本版, Autoblog日本版, Forbes JAPAN他 Google Reseachが、入力されたテキストに応じて音楽を生成するツール「MusicLM」を発表しました。 MusicLMは、28万時間におよぶ音楽のデータセットを用いて学習したAIを使用し、Google Researchが言うところの「非常に複雑」なテキスト記述、たとえば「ディストーションの効いたギターリフのバッキングに乗る心地よいバイオリンの旋律」といったテキストから、忠実性の高い音楽を作り出せると説明されます。 実際のところは、提示されている出力例を聴いても全体的に音楽としてきちんと編曲されたものができあがるわけではないようです。またその音質は「24kHzの音楽」と説明されているものの、生成された
AIを使ってフォーカスの合っていない、または解像度が不足している写真を鮮明にする技術として、以前、GoogleがPixel 7に実装した「ボケ補整」を紹介しました。 関連記事:Pixel 7で昔の写真を鮮明に。AI「ボケ補整」を試してわかったその実力(CloseBox) 関連記事:iPhone 14 Proを買ったばかりなのにPixel 7を予約したただ一つの理由(CloseBox) うまくいくものも多く、少しずつ楽しむつもりでいたのですが、鮮明にしたい数百枚の写真は一気に補整を終えてしまい、実はそれ以降、Pixel 7を使うことはなくなってしまったのでした。 それというのも、Googleの技術は期待していた顔以外の部分の高精細化が判別できるレベルではなかったからです。以前から使っていたReminiというiOSアプリの方が写真全体の高精細化が可能なアルゴリズムを追加実装していたこともあり、
著書に『宇宙世紀の政治経済学』(宝島社)、『ガンダムと日本人』(文春新書)、『教養としてのゲーム史』(ちくま新書)、『PS3はなぜ失敗したのか』(晋遊舎)、共著に『超クソゲー2』『超アーケード』『超ファミコン』『PCエンジン大全』(以上、太田出版)、『ゲーム制作 現場の新戦略 企画と運営のノウハウ』(MdN)など。 実業家のイーロン・マスク氏によるTwitter社の買収は、紆余曲折あった後にようやく成立しました。報道陣が集まるTwitter本社の前では、段ボール箱を抱えて「たったいまクビにされたソフトウェアエンジニア」と語る二人組が現れ、Bloomberg や CNBC といった大手メディアの記者達から取材を受ける姿がありました。 しかしこの2人組、実はTwitterに務めた形跡がないイタズラであったことが明らかとなっています。 先週にはTwitter従業員の75%を解雇する計画とのうわさ
ガジェット 2024 Apr 16 Pixel Fold後継機の製品名は「Pixel 9 Pro Fold」?Pixel 9シリーズは標準/Pro/Pro XL/Pro Foldの4機種構成か これまでGoogleの折りたたみスマートフォン後継モデル、通称「Pixel Fold 2」が開発中であるとの噂話や、自称リーク画像は何度かお伝えしてきました。 テクノロジー 2024 Apr 15 OpenAI、日本語に最適化したGPT-4カスタムモデル提供。通常のGPT-4 Turboより最大三倍高速、トークン数削減でコスト効率向上 OpenAIが、日本語に最適化したGPT-4カスタムモデルの提供開始を発表しました。 ガジェット 2024 Apr 15 10周年を迎えたGoogle Homeスマートホーム、現在の立ち位置を考える(Google Tales) Gmailが先日、20周年を迎えました。
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く