14歳の少年がAIチャットの女性キャラクターと会話した直後に自殺したのは、最後の会話が引き金となったためであり、運営側には未成年者保護や依存対策など安全措置を怠った責任があるとして、遺族がサービス運営元 Character .AI および協力関係にあるGoogleを訴えました。
筆者はUTAUによる波形接続の時代から「その人の声になりきる」技術を試してきましたが、このほど、その中でも画期的と思える技術に出会いました。『Seed-VC』(Seed Voice Conversion)というオープンソースソフトです。 ■AIボイチェンの進化どこが画期的なポイントかというと、高い音質を維持しながら、ゼロショット、つまりファインチューニングをせずに、1秒から30秒までの短い音源を参照するだけで、短時間でオリジナルに近いボイチェンができるところにあります。 以前紹介したDiff-SVCやRVCは、オリジナル音声に近いボイチェンが可能ですが、学習にはそれなりの長さのオーディオデータと高性能GPUによる処理が必要です。
仮想的なシステムであり、実際の普及は想定されていない。 言語学習や異文化コミュニケーションのツールとしての可能性がある。 結論ローマ字運動とJaphalbetは、どちらも日本語の表記をラテン文字化する試みという点で共通していますが、その目的、アプローチ、そして想定される使用範囲に大きな違いがあります。ローマ字運動が日本の近代化と識字率向上を主眼としていたのに対し、Japhalbetは国際的な日本語学習とコミュニケーションの促進を目指しています。 また、ローマ字運動が日本語の文法構造をほぼそのまま維持したのに対し、Japhalbetはより大胆な文法の簡略化を提案しています。これは、Japhalbetが非日本語話者にとっての理解のしやすさを重視しているためです。 結果として、ローマ字運動は日本社会に一定の影響を与え、特に技術分野での応用を見出しましたが、Japhalbetは現時点では理論的な提
ガジェット全般、サイエンス、宇宙、音楽、モータースポーツetc... 電気・ネットワーク技術者。実績媒体Engadget日本版, Autoblog日本版, Forbes JAPAN他 米国空軍テストパイロットスクールと国防高等研究計画局は(DARPA)、昨年2月にAIによる自律飛行を実現したX-62A可変飛行安定性試験機(VISTA)を用い、有人のF-16戦闘機との模擬空中戦に成功したと発表しました。 DARPAの空中戦革新(Air Combat Evolution:ACE)プログラムの一環として、人工知能アルゴリズムを搭載したX-62A VISTAは、2023年9月に行われた飛行試験で「大規模な機首対機交戦」による防御と攻撃の両方の機動を試し、有人パイロットが操るF-16に対し時速1200マイル(約1900km)で2000フィート(約610m)の距離にまで接近したと説明。X-62A VI
ガジェット全般、サイエンス、宇宙、音楽、モータースポーツetc... 電気・ネットワーク技術者。実績媒体Engadget日本版, Autoblog日本版, Forbes JAPAN他 アップルが、App Storeのアプリレビューガイドラインを更新し、これまで許可しいなかったレトロゲーム機のエミュレーターアプリの配信を認める文言を追加しました。 ガイドラインには「レトロゲーム機のエミュレーターアプリはゲームのダウンロードを提供してよい」と記されており、適宜希望のタイトルを追加でダウンロードする仕組みも提供できることになります。 ただし、エミュレーターは許可するものの、当然ながら海賊版ゲームの配信まで許可されるわけではありません。ガイドライン文書では、エミュレーターを提供する開発者は「配信するゲームタイトルについてガイドラインおよび適用されるすべての法律に準拠していることを確認」し「アプリ内
株式会社KADOKAWAは、SF小説「三体」作者、劉慈欣さんの短編小説「流浪地球」の無料試し読みをWebマガジン「カドブン」において4月7日まで実施中です。 流浪地球は、同社が1月に文庫版を発売した同名の短編集に収録の一編。舞台は太陽の膨張が目前に迫る地球。人類は岩石を燃料とした「地球エンジン」を構築し、星ごと太陽系外へ脱出する計画を立て、実行に移した先の時代が描かれています。カドブンの試し読みサイトでは本編を8分割して掲載。 本作は中国では2000年発表で、邦訳が初めて発表されたのは2008年。2019年には「流転の地球」として映画化しており、Netflixなどの配信サービスで視聴できます。 3月22日公開の映画「流転の地球 -太陽系脱出計画-」は「流転の地球」の前日譚にあたり、今回の試し読み企画も本作の日本公開記念して実施した企画です。 直近の関連トピックとしては21日にNetflix
人気連載『生成AIウィークリー』で取り上げている注目論文を見ると、そこに中国IT企業の名前が頻繁に登場します。 EC大手のアリババ(Alibaba)、ゲーム大手のテンセント(Tencent)、TikTokの運営元であるBytedanceなどが常に顔を出しており、画像・音声・アニメーションと、生成AIのあらゆる分野で中国に勢いがあることがわかります。 そんな中、テンセントがなかなか衝撃的な技術を発表しました。「PhotoMaker」という画像生成AIです。これでなければできない、というものではないのですが、「ファインチューニングの事前作成不要」「元画像が少なくても良い」のに、人物のアイデンティティを維持した画像を生成できるというメリットがあります。 これまでは既存の画像AIモデルに多数の写真を読み込ませて本人性を学習させたものから新たなAIモデルやその簡易版であるLoRAモデルを作ってきまし
ガジェット全般、サイエンス、宇宙、音楽、モータースポーツetc... 電気・ネットワーク技術者。実績媒体Engadget日本版, Autoblog日本版, Forbes JAPAN他 1月3日付けのNature Microbiologyに掲載された研究によると、科学者らは長らくわかっていなかったおしっこを黄色くする酵素を特定したとのことです。 メリーランド大学細胞生物学・分子遺伝学部のブラントリー・ホール助教授は「日常的な生物学的現象がこれほど長い間解明されていなかったのは驚くべきこと」だと述べています。 おしっこ、すなわち尿は、血液が腎臓で濾過されて余分な水分、電解質その他老廃物の混合物として排出された液体です。その色は、いまから125年以上も前にウロビリンと呼ばれる成分からのものであることが判明しています。 ところが、このウロビリンが酸化する前のウロビリノーゲンがどうやって生成されるの
ガジェット全般、サイエンス、宇宙、音楽、モータースポーツetc... 電気・ネットワーク技術者。実績媒体Engadget日本版, Autoblog日本版, Forbes JAPAN他 米アマゾンとトールキン財団は、J・R・R・トールキンのファンタジー小説『指輪物語』を巡って争われていた作家デミトリアス・ポリクロン氏との複数の法廷闘争で勝利しました。 ことの発端は2017年、ポリクロン氏がファンタジー小説『The Fellowship of the King』を米国著作権局に登録したことに始まります。ポリクロン氏はこの作品を『ロード・オブ・ザ・リング』の続きとして書いたとして、原稿をJ・R・R・トールキンの孫であり知的財産権を管理するトールキン財団のディレクターでもあるサイモン・トールキン氏に送り、レビューを求めたとのこと。 しかし、返答は2019年になってもありませんでした。ポリクロン氏は
需要のわからない記事を作る自由物書き。分解とかアホな工作とかもやるよー。USBを「ゆしば」と呼ぼう協会実質代表。 工作機械とか工具は、見てると欲しくなりますよね。溶接機なんかもそのひとつで、100Vでも使える安物なら1万円せずに手に入ったりもします。ただ、買っても使わない自信が120%あるので、買いませんけど。 とはいえ、もっと小規模な溶接であれば、話は別。具体的には薄い金属板の溶接……そう、電池のタブ付けです。リチウム電池やコイン電池の交換をしようと機器を分解したところ、ソケットではなくタブ付き電池で、交換に苦労することってありますよね。こんなときでも、タブ付けができるスポット溶接機があれば、新しい電池に交換できます。 以前はそれなりに高価な品を買うか、DIYキットに手を出すくらいしか選択肢がなかったのですが、AliExpressで探してみると、いつのまにやらイロイロ製品が出ていました。
今回はそれだけでは面白く無いので、元画像を絵柄そのまま高精細なフルHDにアップスケールしたい、もしくはそのまま使って絵を変えたい、構図やポーズをある程度固定したい、Photoshopのジェネレーティブ塗りつぶし的な機能は?…と言った、もう少しStable Diffusionっぽい使い方を順に説明する。 image-2-image / UpscalePromptから画像を得る方法を一般的にText-2-Imageと呼んでいる(txt2imgやt2iとも)。文字通りテキストから画像を…と言う意味だ。 Stable Diffusionでは、加えて画像から画像を得る方法があり、これをImage-2-Imageと呼んでいる(img2imgやi2iとも)。言葉よりも画像の方がより多くの情報を持っているので、それを使おうと言う意図だ。 これまで生成した画像の解像度は、832✕1,216や1,024✕1,
ガジェット全般、サイエンス、宇宙、音楽、モータースポーツetc... 電気・ネットワーク技術者。実績媒体Engadget日本版, Autoblog日本版, Forbes JAPAN他 デスクトップ版のFirefoxブラウザーに20年以上存在していたバグが先月、23歳のプログラミング初心者によって修正されました。 2002年、MacでMozilla browser(Firefoxの当時の名称)を使用していたアダム・プライス氏は、ツールチップの表示の問題に悩まされていました。このバグは、Mozillaツールバーのアイコンにマウスカーソルをポイントして表示されるツールチップ(説明書き)が、Commandキー(WindowsではAltキー)+Tabキーでウィンドウのフォーカスをほかのアプリに移したあとも表示され続けてしまうというもの。 この状態になってしまった場合、ツールチップを消すには再びFir
都市部を中心に品質が大きく低下していたドコモのネットワークですが、同社は4月に対応策を発表。7月28日には、つながりにくさ・遅さの象徴とも言えるスポットだった東京の渋谷、新宿、池袋、新橋での改善状況が明かされました。 以前、この連載でも取り上げたように、人流の戻りや地形の変化などがその原因。単純に言えば、増加したトラフィックを混雑エリアでさばききれなくなったということです。 ▲ドコモは、7月28日に4月に予告していた通信品質改善のチューニングが一部完了したと発表したただし、上記4エリアでも依然として通信品質が低下したままの場所は残っています。代表例として、基地局の撤去されてしまったJRの渋谷駅ホームが挙げられていますが、筆者が簡単に調べた限りでも、まだまだ完璧とは言いがたい状況。 上記4エリア以外でも通信品質の大幅な低下は報告されており、チューニングの継続が求められます。 ▲改善発表後も、
筆者も話題になった直後から試そうとしていたのですが、自分ではうまくいかず悶々としていたところ、Memeplexでできるようになったので、そのインプレッションをお届けします。 AnimateDiffの基本的な動作は、静止画を作成できるAI作画モデルを使って、一貫性のある短いアニメーションGIFを生成するというもの。Stable Diffusion 1.5、2.0といった標準的なものだけでなく、その上にカスタム学習(ファインチューニング)したモデルにも対応できるというのが特徴です。同様の技術としては「Tune-A-Video」があったのですが、一貫性が乏しかったために使いどころがなかなか難しいものでした。 筆者は現在、MemeplexとStable Diffusion WebUI上に、妻の写真を学習させたAIモデル(Checkpoint)を作成して使っていて「異世界とりちゃん」という名の下に日
使用したNegative Promptは、「1.無し」、「2.ほぼ最小限」、「3.筆者標準」、「4.embeddingsを使う」の4つパターン。 4番目だけ他と違い別途ファイルが必要となり、ダウンロードしたファイルを[Stable Diffusionのホームディレクトリ]/embeddingsへコピーする。Negative PromptでEasyNegativeなどをよく見かけるがそれだ。ここではng_deepnegative_v1_75tとbadhandv4が該当する。Promptで書く替わりに、特別に学習したModelで同じ効果を得られるようになっている。 無し (worst quality:2),illustration, 3d, painting, cartoons, sketch, illustration, 3d, sepia, (painting), cartoons, sk
百聞は一見に如かず。これってAI生成グラビア?AI画像生成に興味を持ったのは去年の年末頃だろうか。Twitterを眺めていると「どうやって撮った(作った)んだ?」と言う画像がたまに載っていたので調べると、Stable Diffusion Web UI (AUTOMATIC1111版)だった。 元々グラビアを撮っていたこともあり、あまり撮らなくなってもグラビア好きなのには違いなく、試したくなったのは言うまでもない。 AI生成画像は大きく分けて2種類あり、一つはイラスト系、もう一つはリアル系。筆者が興味を持ったのは後者。どこまで実写に迫れるのかがその興味の対象だ。百聞は一見に如かず。扉の写真はAI生成画像。現時点でこの程度の写りは容易にこなす。 とは言え、実際の撮影もそうなのだが、グラビア写真は数百枚撮ってカメラマンがある程度セレクトし納品したものが、納品先で更に絞られ、出版社などで更に絞り込
ガジェット全般、サイエンス、宇宙、音楽、モータースポーツetc... 電気・ネットワーク技術者。実績媒体Engadget日本版, Autoblog日本版, Forbes JAPAN他 ペンシルベニア州立大学の研究チームが、通常のガラスに比べ表面の損傷に対する耐性が10倍も高く、しかも製造に必要なエネルギーが大幅に少ない新しいガラス材料「LionGlass」を開発しました。 窓ガラスやコップなどに使われる一般的なガラスはソーダ石灰ガラスと呼ばれ、石英、ソーダ灰、石灰石といった主原料を溶解して作られます。しかし、ソーダ灰を構成する炭酸ナトリウムや石灰石の炭酸カルシウムは、いずれも溶解する際にCO2を空気中に放出します。またこの加熱プロセスには最高1500°Cにも達する炉が必要であり、プロセス全体が大量のエネルギーを消費し、またCO2を排出します。 今回の研究では、ガラスを製造する際に炭酸ナトリ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く