ノンプログラマーな自分が、大規模言語モデル(LLM)の助力で、初めてまともに動くプログラムを完成させることができました。
ノンプログラマーな自分が、大規模言語モデル(LLM)の助力で、初めてまともに動くプログラムを完成させることができました。
イーロン・マスクによる買収以来、揺れ動いてきたTwitter(現在はXに改名)ですが、その内部がどのようになっていたのかはなかなか伺い知ることができません。筆者が個人的に参加しているポッドキャストbackspace.fmでは、TwitterのiOSアプリ開発に2010年から携わってきたソフトウェアエンジニアの丹羽善将(@niw)さんにその渦中の話を聞くことができました。 丹羽さんは、超有名テックブログのDaring Fireballで、世界で最も優れたiOS開発者の一人としてTwitter退社を惜しまれた人物です。 ▲Daring Fireballより 丹羽さんをゲストに迎えたエピソードは下のリンクからどうぞ。
使用したNegative Promptは、「1.無し」、「2.ほぼ最小限」、「3.筆者標準」、「4.embeddingsを使う」の4つパターン。 4番目だけ他と違い別途ファイルが必要となり、ダウンロードしたファイルを[Stable Diffusionのホームディレクトリ]/embeddingsへコピーする。Negative PromptでEasyNegativeなどをよく見かけるがそれだ。ここではng_deepnegative_v1_75tとbadhandv4が該当する。Promptで書く替わりに、特別に学習したModelで同じ効果を得られるようになっている。 無し (worst quality:2),illustration, 3d, painting, cartoons, sketch, illustration, 3d, sepia, (painting), cartoons, sk
百聞は一見に如かず。これってAI生成グラビア?AI画像生成に興味を持ったのは去年の年末頃だろうか。Twitterを眺めていると「どうやって撮った(作った)んだ?」と言う画像がたまに載っていたので調べると、Stable Diffusion Web UI (AUTOMATIC1111版)だった。 元々グラビアを撮っていたこともあり、あまり撮らなくなってもグラビア好きなのには違いなく、試したくなったのは言うまでもない。 AI生成画像は大きく分けて2種類あり、一つはイラスト系、もう一つはリアル系。筆者が興味を持ったのは後者。どこまで実写に迫れるのかがその興味の対象だ。百聞は一見に如かず。扉の写真はAI生成画像。現時点でこの程度の写りは容易にこなす。 とは言え、実際の撮影もそうなのだが、グラビア写真は数百枚撮ってカメラマンがある程度セレクトし納品したものが、納品先で更に絞られ、出版社などで更に絞り込
発端はこのツイート。「本当のDTM」をやってらっしゃる方がいたら、それがなんなのか答えを教えてください!、という問いかけによって、世の中のDTMerを巻き込んだ大喜利がスタートしました。 これは一言申さねばなりません。なぜなら、筆者は本当のDTMを体験した数少ない生き残りだからです。 DTM(Desk Top Music)という言葉を最初に使った製品が登場したのは、1988年のこと。PC-9801用のDTMパッケージ「ミュージくん」です。MIDI音源として、LA音源のMT-32、PC-9801用MIDIインタフェース、ダイナウェアが開発した五線譜ベースのソフトウェアをバンドルしたものでした。2020年度未来技術遺産にも認定されています。 ▲ミュージくん ちなみにDTMというのは、DTP(Desk Top Publishing)から発想したローランドのネーミング。Macintoshとページプ
ガジェット全般、サイエンス、宇宙、音楽、モータースポーツetc... 電気・ネットワーク技術者。実績媒体Engadget日本版, Autoblog日本版, Forbes JAPAN他 2021年にソフトバンクが1.7億ドルを投資し、評価額11.7億ドルのユニコーン企業として注目されていたソーシャルメディアアプリサービスのIRLが、6月27日をもってサービスを閉鎖しました。 IRLには、2022年年12月にユーザー数を偽り投資家を誤解させた可能性があるとして米証券取引委員会(SEC)が調査入りし、それを受けて取締役会はCEOのAbraham Shafi氏を停職処分にしていました(その後辞任)。 また、今年4月には取締役会による内部調査の結果、2000万人と公称していたユーザーのうち、95%が「自動化アカウントまたはボットアカウントによるもの」だったことが判明しています。 IRLは2017年に
ITジャーナリスト/Publickeyブロガー。IT系の雑誌編集者、オンラインメディア発行人を経て独立。2009年にPublickeyを開始しました。 クラウドをはじめとするITインフラの構成をコードで定義する、いわゆるInfrastructure as Codeツール「Pulumi」を提供するPulumi社は、自然言語からインフラ構成コードを自動生成する「Pulumi AI」を含む、AIを活用した新サービス群「Pulumi Insights」を発表しました。 PulumiはTypeScriptやPython、Go、Javaといった一般的なプログラミング言語を使ってインフラの構成コードを記述できるのが大きな特徴です。Pulumi Insightsは、そのPulumiをベースにした拡張機能です。 AIが130以上のインフラやサービスの構成コードを生成Pulumi Insightsの目玉機能が
高精度でリアルタイム処理も可能なAI声質変換ソフト(ボイスチェンジャー)「RVC」の記事が大変な反響を呼びました。Stable DiffusionやChatGPTなど生成系AIがメジャー化する中、世間からはそれほど大きな注目を浴びているわけではありませんが、音声AIも驚くべき速度で進化を遂げています。 AIボイチェン「RVC」の精度と学習・変換速度が革命的。コナンの蝶ネクタイ的リアルタイムボイチェンも可能(CloseBox) | テクノエッジ TechnoEdge 記事中でデモとしてお聞かせしたのは、筆者の妻の歌声を高精度に再現するもので、それはこのソフトのおそらく最大の特徴を生かしたものではありません。そこで、また実験をしてみることにしました。 今回は、ポッドキャストbackspace.fmを10年近く一緒にやっている友人であるドリキンのAIモデルをRVCで作ってみました。 backsp
おいおいまたかよ、驚き屋かお前はと言われそうですが、またゲームチェンジャーなんですよ。ほんとすいません。全部AIが悪いんです。 AI関連はちょっと目を離すと取り残されてしまいます。後から来たのに追い越され、泣くのが嫌なら歩いていくしかないのです。今回、それが再びAI音声合成で起きました。 筆者はAIアートグランプリを受賞したおかげでいろいろなところから取材を受けたり自分でも解説記事を書いたりしていますが、その中で、Diffusion(拡散)モデルを使ったDiff-SVCというAI声質変換によってリアルな元音声を再現できると説明してきました。ですが、これからは「実は今は新しいAI技術を使っているんですよ」と付け加えなければいけません。 妻の歌声を合成するのに使っていたDiff-SVCから別の新しい技術に乗り換えてしまったのです。 Diff-SVCが出た後に、So-VITS-SVC(SoftV
ガジェット全般、サイエンス、宇宙、音楽、モータースポーツetc... 電気・ネットワーク技術者。実績媒体Engadget日本版, Autoblog日本版, Forbes JAPAN他 米CNETは先週、昨年11月から公開されてきた一連の金融知識の解説記事を、AIで生成していたことを明らかにしました。 それまでは、著者名が「CNET Money Staff」とされ、あたかも人間のライターが書いているように見えていたものの、他のメディアなどから批判が相次いだこともあり、CNET編集長のConnie Guglielmo氏は、記事をAIで生成する実験を行っていると述べ、その理由を説明する記事を公開しています。 CNETは、AIによって生成された記事はすべて人間のスタッフが「レビュー、事実確認、編集」していると主張しています。しかし米国のテクノロジー系メディアFuturismは、このCNETのAIで
ユニクロがIBMのTシャツを発売しました。同社は企業ロゴやキャラクターの入ったTシャツを販売しているので不思議ではないのですが、今回はそこにIBMの表記はありません。「ユニクロがIBMのTシャツ売ってるよ」という話を聞いて、ユニクロのサイトで探してみたのですが、検索にも引っかかりません。 新作Tシャツを一つ一つ見ていくと、ありました。「レジェンズ・オブ・グラフィックス UT グラフィックTシャツ ポール・ランド(半袖・レギュラーフィット)」という商品。1500円です。 IBMをよく知る人なら目にしたことがあるはずの絵文字。「目 + 蜂 + M」を👁️🐝Mのように並べた、ジョーク的なロゴデザインですが、IBMがロゴの規定を厳密に定めている公式なものです。正式名称は「Rebus」。 このロゴは伝説的デザイナー、ポール・ランドが1981年にデザインしたもの。IBMのモットーである「THINK
著書に『宇宙世紀の政治経済学』(宝島社)、『ガンダムと日本人』(文春新書)、『教養としてのゲーム史』(ちくま新書)、『PS3はなぜ失敗したのか』(晋遊舎)、共著に『超クソゲー2』『超アーケード』『超ファミコン』『PCエンジン大全』(以上、太田出版)、『ゲーム制作 現場の新戦略 企画と運営のノウハウ』(MdN)など。 昨年11月にOpenAIがChatGPTを公開して以来、Googleの「Bard」やマイクロソフトの新たなBing検索エンジンやEdgeブラウザーも会話型AIサービスの大波に乗る事態となっています。 どれもが質問に対して自然な文体で賢い回答が期待されているなか、同じく言語モデルを使って『スーパーマリオブラザーズ』のステージを自動生成する「MarioGPT」の研究が公開されました。 コペンハーゲンIT大学研究チームは、「スーパーマリオ」のレベル(ステージ)を生成する新たな手法につ
1971年福井県生まれ。得意ジャンルは、パソコン・デジタルAV・家電、ネットワーク関連など「電気かデータが流れるもの全般」。主に、取材記事と個人向け解説記事を担当。 音声の書き起こしはライターにとって夢の技術だ。そのまま原稿にできるわけではないが、インタビュー原稿や取材記事を執筆する上での手間が劇的に減る。筆者はもうずっと昔から、書き起こし系の技術が出るたびに試行錯誤を繰り返してきた。 そんな中に、ちょっとびっくりするようなサービスが現れた。正確にいえば「使ってみたらびっくりするようなものだった」というのが正しいだろうか。 それはいわゆるジェネレーティブAIサービスである「Easy-Peasy.AI」だ。このうち、AIによる音声書き起こしサービス「AI Transcription」を日本語で使ってみた。 結果として、「非常に使えるが、面白い性質がある」こともわかってきた。現在のジェネレーテ
GoogleのCEOサンダー・ピチャイが、自然な文章で質問に回答するAIサービス『Bard』と、Google検索への組込みを発表しました。 ピチャイ氏によると、BardはGoogleが以前から研究してきたLaMDA (会話アプリケーションのための言語モデル)を元にした「実験的会話型AIサービス」。 Google検索にBardを組み込むことで、複雑なトピックについて文章で概要を答えたり、2つのものを比較したり、複雑な条件にあう答えを返すなど、従来の検索では難しかった答えが出せるようになります。 例のひとつでは、「ジェイムズ・ウェッブ宇宙望遠鏡(JWST)の新発見について、9歳児に話すならどんな内容にすべき?」という問いに対して、 「2023年、JWSTは「グリンピース」という愛称の銀河系を発見しました。小さく、丸く、豆のように緑色だったのでこの名前がつけられました」 「ジェイムズ・ウェッブ宇
IT系海外速報を書いたり、翻訳を請け負ったりしています。初めてのスマートフォンはHTC Desire。その後はNexus 5からずっとGoogleさんオリジナルモデルを使っています。 Google(というかその親会社のAlphabet)が1万2000人のレイオフを発表しました。これでいわゆるGAFA(FacebookはMetaになっちゃったので古い)でリストラを発表していないのはAppleだけに。Apple以外はコロナ禍の2019年~2022年の間、かなり雇用を拡大していた(Alphabetは57%増)ので、予想されていたものではあります。 スンダー・ピチャイCEOは大規模リストラの理由を「AIへの初期投資で生まれた大きなチャンスを完全につかむため」と公式ブログで説明しました。 ▲Google I/O 2022でAIについて語るスンダー・ピチャイCEO “初期投資”というように、Googl
前回の記事では、予期していなかった値下げに驚いたという内容でしたが、二度目となるとこちらも動じません。最近は円高傾向だし、為替レートに合わせてかなあ、と思って読んでいくと、たしかに値下げだけど、下げ幅がえぐい……。 筆者は、アンテナを移動して利用でき、使わないときは支払いを一時停止もできるRVプランを利用しているのですが、これが先月の13,700円から9,900円に引き下げるというもの。3,800円、27.7%もの大幅値下げです。下げ幅が大きすぎる。ちなみに先々月は15,100円でした。差額でTwitter Blueも余裕で払えます。 そして、最も安い、固定住所プランのレジデンシャルを見ようとStarlinkのページを確認したら、さらに驚きが待っていました。 「高速、低遅延のブロードバンドインターネットを日本の離島、農村どこからでも¥6,600/月」とあります。12,300円から11,10
星空のディスタンス(550km)を経てインターネットを接続するSpaceX「Starlink」を仮設置してわかったのは、現状(南向きベランダにスチールラックを置いてその上に半固定)だと、常時接続にはならないということ。 SpaceXの衛星インターネット「Starlink」は悪条件下で繋がるか、試してみた結果(CloseBox) 最適解は屋根の上に設置することなのが確定したので、取り付け工事をしてくれるところを探し始めました。ただ、現状これがなかなか難しいのです。 BS / CSアンテナや地上波アンテナの取り付け工事を行っている業者を取りまとめたようなサービスに複数連絡してみたのですが、前回の記事のように、「Starlinkは取り扱っておりません」とのお断りの返事。 KDDIがSpaceXと提携し、認定Starlinkインテグレーターとして設置サービスを提供することが発表されましたが、これは
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く