
広く使われている画像生成AIのStable Diffusionは「ControlNetを組み合わせてポーズ抽出やポーズ指定生成を実行する」「IP-Adapterを組み合わせて類似画像を生成する」といったように拡張機能を用いて多様な作業を実行できます。「OmniGen」はControlNetなどの拡張機能を使わず単一のモデルだけで多様な生成作業を実行可能にすることを目指して開発されたマルチモーダル画像生成AIで、単体で「画像生成」「ポーズ抽出」「ポーズ指定生成」「画像内の物体置換」「被写体指定生成」といった作業を実行可能です。 [2409.11340] OmniGen: Unified Image Generation https://arxiv.org/abs/2409.11340 GitHub - VectorSpaceLab/OmniGen: OmniGen: Unified Imag
NPUでもGPUでもない、アナログな演算がAIを動かす2024.11.01 20:0029,638 ヤマダユウス型 パソコンといえばCPU。その前提から考えたことはある? TDK株式会社といえば、世界有数の電子部品メーカー。CEATEC 2024でも大規模なブースを展開していましたが、小さいながらもただならぬ存在感を見せつけていたのがコレ。 スピンメモリスタ〜。一見するとSSDやメモリのようにも見えますが、実はGPUやNPUなどが行うAI処理を1/100の消費電力でこなせる、ものっそい素子なんです(そりゃイノベーション部門賞も受賞するわ)。 電気のちからで、デジタル計算をアナログでやっつけるこのスピンメモリスタは、スピントロニクス技術を活用したニューロモルフィック(神経模倣)素子。似た言葉のニューラルネットワークは神経細胞の模倣で、ニューロモルフィックはニューロン発火をの仕組みをハードウェ
AIには人類が知覚できない「何か」が見えているようです。 米コロンビア大学(Columbia University)による2022年の研究で、AIに物理法則を学習させ、それを表現するために必要な「変数」の数を考えさせたところ、現在の人類には理解できない要素が含まれることが示されました。 ありふれた振り子運動や回転運動でも、AIは人類とは異なる独自の変数を用いて物理法則を理解し、正確な運動予測まで成功させていたのです。 研究者たちは、AIは人類がまだ発見できていない未知の方程式と「変数」を用いて、物体の運動法則を理解している可能性があると述べています。 もし研究者たちの予測が正しければ、振り子運動や円運動などには誰も知らない「裏の方程式」が存在しているのかもしれません。 研究の詳細は2022年7月25日付で科学雑誌『Nature Computational Science』に掲載されています
機械学習エンジニアのマシュー・ル・コショワ氏が作成した「PabloNet」は、秒間100枚以上の画像を生成できる爆速画像生成パイプライン「StreamDiffusion」を使用して、リアルタイムでカメラで捉えたものからAIアートを作成するというシステムです。実際に動作している様子や仕組みについて、コショワ氏が解説しています。 PabloNet https://www.matthieulc.com/posts/pablonet/ 従来の拡散モデルはテキストや画像のプロンプトから画像を生成することには長けているものの、リアルタイムのやりとりでは性能が十分でないことがあります。メタバースやライブビデオストリーミングのような「連続的な入力」を伴うシナリオに対応するために考案された新しいアプローチがStreamDiffusionです。通常の生成AIは、一連のプロンプトが入力されたら読み込み時間を経て
OpenAIは文字起こしAIのWhisperを「人間レベルの堅牢性と正確性を持ったツール」と宣伝していますが、これには大きな欠点があると専門家たちが指摘しています。十数人のソフトウェアエンジニア、開発者、学術研究者にインタビューしたというAP通信によると、Whisperは文字起こしにおいて一部のテキストや文章全体を捏造するケースがある模様。この捏造はAIのハルシネーション(幻覚)によるもので、人種差別的なコメントや暴力的なレトリック、さらには想像上の医療処置を捏造するケースもあるそうです。 Researchers say AI transcription tool used in hospitals invents things no one ever said | AP News https://apnews.com/article/ai-artificial-intelligence-
Apple Intelligenceは競合AIに2年以上遅れている(アップル内部調査)2024.10.26 22:3015,087 satomi 23日のiPad mini発売にも間に合わなかったApple Intelligence。 26日には英語圏でいよいよ利用がスタートしますが、Apple公式サイトでPRされている4つの主なAI機能のうち、この日解禁になるのは通知サマリだけ。残り3つは12~3月に持ち越しとなります。競合のGoogle、OpenAI、Metaに水をあけられた感は否めません。 そう感じているのは外野のわれわれだけではないようです。 Bloombergが仕入れたAppleの内部調査においても「OpenAIのChatGPT のほうがAppleのSiriより25%精度が高く、30%多くの質問に回答する」ことがわかっているのだとか。これらのことから社内には「Appleの生成AI
Claude AIがブラウザ内でJavaScript実行可能に!コード不要のデータ分析ツールで業務効率化へ前進 Last Updated on 2024-10-26 15:21 by admin Anthropic社は2024年10月24日、AI チャットボット「Claude」に新機能「分析ツール(analysis tool)」を実装したことを発表した。 主な特徴は以下の通り: JavaScriptのコード実行環境が統合され、ブラウザ上で直接コードを実行できる CSVファイルやPDFなどのデータファイルを分析し、インタラクティブな可視化が可能 プログラミング知識がなくても、データ分析やグラフ作成をリアルタイムで実行可能 性能面での改善: Claude 3.5 Sonnetのプログラミング性能がSWE-Bench Verifiedテストで33.4%から49.0%に向上 TAU-benchでの
2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深い技術や研究にスポットライトを当てる生成AIクローズアップ。 今回は、人には聞こえないノイズを音楽に埋め込み、その音声をAIモデルが学習できないようにする防御フレームワークを提案した論文「HarmonyCloak: Making Music Unlearnable for Generative AI」に注目します。 ▲攻撃者がクリエイターがオンラインに投稿した音楽をスクレイピングして、音楽生成AIをトレーニングするモデルの図解 生成AIは膨大な音楽データベースから学習を行うため、著作権で保護された素材を意図せず侵害するリスクが高まっており
元OpenAI社員の告発「OpenAIは著作権法をやぶりまくっている」2024.10.28 14:3537,550 Lucas Ropek - Gizmodo US [原文] ( 岩田リョウコ ) 便利さと同時に、どんどん増す批判の声。 OpenAIの元研究員が、同社のビジネスモデルに反対する立場を表明し、ブログでOpenAIがアメリカの著作権法を遵守していないと述べました。このように、テック大手の情報収集ビジネスが法的に不安定(あるいは違法)な基盤の上に成り立っていると批判の声が多く挙がってきています。 告発者はどんな人?「私が信じていることをあなた方もを信じているなら、OpenAIを去るしかない」とSuchir Balaji氏はニューヨーク・タイムズ紙に語っています。2020年にOpenAIに入社しGPT-4の開発に携わった25歳のカリフォルニア大学バークレー校卒業生のBalaji氏は
11年以上に及ぶこの「極言暴論」の連載で、私が一貫して主張してきたことがある。最近はあえてあまり書かないようにしていたが、「オールドファン」なら当然ご存じだろう。世界に類を見ない労働集約型の人月商売を、日本のIT業界から撲滅することだ。百歩譲ったとしても、付加価値がまるでない人月商売が日本のIT業界の主役だというばかげた状態に、一刻も早くピリオドを打たねばならぬ。そんな「志」を掲げて執筆を始めたのがこの極言暴論で、その思いは今も持ち続けている。 ただねぇ、日本のIT業界を人月商売に堕落させた責任の多くは、仕事を依頼する客側にある。何せパッケージソフトウエアやクラウドサービスなどをあまり活用せず、古くさい自社のビジネスモデルや業務プロセスなどを反映した「自前」のシステムにこだわり続けてきたからだ。しかも自前のシステムのはずなのに、客のIT部門は自らつくれない。そんな「お客様の事情」を前提に、
パーソナライズされたAIチャットボットとのコミュニケーションを楽しむことができるCharacter.AIを使用していた14歳の少年が自殺してしまったとして、母親がCharacter.AIを訴えました。 Character.ai Faces Lawsuit After Teen’s Suicide - The New York Times https://www.nytimes.com/2024/10/23/technology/characterai-lawsuit-teen-suicide.html Character AI clamps down following teen's suicide, but users revolt | VentureBeat https://venturebeat.com/ai/character-ai-clamps-down-following-te
目次 目次 はじめに 我々のチームについて ZOZOMETRYについて ZOZOMETRYでのBtoB開発で取り入れたこと プールモデルによるマルチテナント管理 Cognito+DBによるユーザー情報の管理 RLSによる行単位でのデータアクセス制御 RLSの利用を見送った理由 理由1 : コネクションプールの管理 理由2 : O/RマッパーでのRLSの利用 DDDにおけるテナントのアクセス制御 MySQLを採用した理由 AWS Auroraとの互換性 PostgreSQL独自の機能の不使用 チームの経験と学習コスト 計測プロダクトとの整合性 PostgreSQLを採用したいケース Gitの運用フロー まとめ 最後に はじめに こんにちは。計測プラットフォーム開発本部バックエンドブロックの髙橋です。 先日、ZOZOMETRYという新規サービスをローンチしました。 corp.zozo.com
子供がこれ見たら本物だと思い込みそうなくらいにはリアルだなぁ
そこで、AI PCの真価と今後の進化を占うべく、日本HPの「HP Elitebook 1040 G11」と「HP Elitebook 630 G11」を例に、実際に使ってみた様子をレビューする。 なお、ギズモード・ジャパンで上記2機種を使ったレビュー動画がアップされているので、AI PCの実力について確認していただきたい。 エッジAIがもたらすビジネス上のメリットとは 通常AI機能を使うには、インターネット上のサーバーに接続する必要がある。これは一般的に「クラウドAI」と呼ばれる。 一方、端末内にAI機能を内蔵することで、クラウド上のサーバーにアクセスすることなく利用できるAI機能を「エッジAI」と呼ぶ。今回レビューする「HP Elitebook 1040 G11」と「HP Elitebook 630 G11」もエッジAIを活用できる。 ビジネスシーンにおいては、エッジAIは大きなメリット
Linux Foundationは10月24日、オンライン講座「Linux入門」の無料提供を始めた。Linuxシステム管理者とエンドユーザーが、Linux環境で日常業務を行うために使用するさまざまなツールと手法を一から学べるという。対象は、コンピュータの使用経験が豊富だが、Linuxは初心者であるユーザー。 約60時間のオンライン講座となっており、セルフペースで学習可能。Linuxの実用的な知識や、主要なLinuxディストリビューション、Linuxのシステム構成とグラフィカルインターフェ―ス、基本的なコマンドライン操作、Linuxの一般的なアプリケーションなどをナビゲートする方法を学べるという。講座を修了した人には、履歴書やプロフィールに追加できるデジタルバッジも送られる。 Linux Foundationは、Linuxについて「Webサーバ、クラウドコンピューティング、スマートフォン、家
Xに投稿した画像はAIイラストではない──成人PCソフトブランド「オーガスト」を展開する葉月(東京都中野区)は10月25日、そんな声明を公式Xアカウント(@august_soft)で発表した。同アカウントは24日、ハロウィーン記念イラストを投稿。これに対し、一部のユーザーから「生成AIによるイラストではないか」と複数の問い合わせがあったという。 オーガストの公式Xが投稿したのは、PCゲーム「あいりすミスティリア!」に登場するキャラクター・ユーのハロウィーンイラスト。リプライには「かわいい」「高解像度版まってます」など好意的な反応示すユーザーがいた一方、イラストがぼやけてるように見える点や、ライティングや塗りに違和感があることなどを理由に「生成AIで出力したイラストではないか」と指摘するユーザーもいた。 これに対して、オーガストは25日に「こちらのイラストにつきましては弊社イラストレーターに
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く