今回は、過去作った記事などのヘッダー画像+αから松尾氏に動画を作っていただくという、コラボ企画。元画像はSD 1.5、SDXL、SD3 Medium、そしてFLUX.1 [dev] が入り乱れての動画となる。
X / 旧Twitter のイーロン・マスク氏が、ブロック機能の仕様変更を告知しました。 従来、ユーザーが誰かのアカウントをブロックすると、ブロックされたアカウントからは、自分をブロックした相手の投稿は読めなくなっていました。 今後は誰かをブロックしても、相手は変わらず公開の投稿を読める状態のまま。リプライなどのエンゲージメントだけが封じられることになります。 Twitter を買収してXに改名したイーロン・マスク氏は当初からブロック機能自体に懐疑的で、意味がない機能だから廃止するつもりだと2023年の時点から公言したうえで、段階的に仕様を変更してきました。 たとえば今年の5月には「誰かにブロックされて投稿が見えなくなっても、(された)自分の投稿へのリプライについては見える」仕様に変更。 当時は変更について、従来からの「Xをグローバルな議論ための広場(タウンスクエア)」にする云々の方針とと
2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間の気になる生成AI技術・研究をピックアップして解説する連載「生成AIウィークリー」から、特に興味深い技術や研究にスポットライトを当てる生成AIクローズアップ。 今回は、「私はロボットではありません」でお馴染みのGoogleが開発する「CAPTCHA」(コンピュータと人間を区別するための完全に自動化された公開チューリングテスト)を突破するAIシステムを提案した論文「Breaking reCAPTCHAv2」に注目します。 ▲CAPTCHAを突破するAIシステム CAPTCHAは、ウェブサイトのセキュリティを向上させるために広く使用されている技術です。この研究は、そのシステムの効果を詳細に検証し、AI技術を用いてどの程度突破できるかを明らかにしま
2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間の気になる生成AI技術・研究をピックアップして解説する連載「生成AIウィークリー」から、特に興味深い技術や研究にスポットライトを当てる生成AIクローズアップ。 今回は、大規模言語モデル(LLM)は自身が出力する「幻覚」(ハルシネーション)からは避けられない現象を指摘した論文「LLMs Will Always Hallucinate, and We Need to Live With This」に注目します。幻覚とは、事実と異なる出力をLLMが実行してしまう現象を指します。 この研究では、LLMの幻覚が単なる偶発的なエラーではなく、これらのシステムに内在する避けられない特性であると主張しています。研究者らは、幻覚がLLMの根本的な数学的・論理的
非常に高性能な画像生成AI「ImageFX(Imagen 3)」の登場です。 FLUX.1がMidjourneyと並ぶ最高峰の画像生成AIとして注目を浴び始めてから2週間もたたないうちに、新しいAI画像サービスが、なんとGoogleから登場しました。それがImageFXです。 Googleは画像生成AIの新バージョンであるImagen 3をリリースしたばかりですが、この技術を使った「ImageFX」というサービスをGoogle AI Test Kitchenでスタートしています。これが生成する人物画像がとてもリアルだというので評判です。GeminiでもImagenを使った画像生成は可能なのですが、制限が厳しく、人物を含んだ画像の生成ができなくなっています。 ▲GeminiのImagenでは人物画像が生成できない ImageFXは、テキストプロンプトを入れると、4枚の画像が生成されるという仕
ディズニー・リゾート内レストランの食事が原因のアレルギー性ショック症状で女性が亡くなり、遺された夫がレストランおよびディズニーの監督責任を訴えていた裁判について。 米ディズニー社側は「夫は以前Disney+サービスに加入していたため、利用規約によりディズニー相手の訴訟は起こせない」との主張を取り下げました。 (ディズニー、リゾート内の死亡訴訟を『ディズニープラス規約』根拠に取り下げ求める。裁判外解決を主張 | テクノエッジ TechnoEdge) ■訴訟に至る経緯亡くなったのは、ニューヨーク在住の女医であるKanokporn Tangsuanさん。2023年秋に、夫のJeffrey Piccoloさんとその母親とともに、米フロリダ州ディズニー・リゾートの Disney Springs にあるレストラン Raglan Road Irish Pub and Restaurant を訪れました。
3カ月ほどベータテスターをしていた、DreamtonicsのAIボイスチェンジャー「Vocoflex」。その製品版が正式発売されたので、購入しました。 ベータ版でもすごく便利に使っていたのですが、さらに改良されているというので、製品版としてのファーストインプレッションをお届けします。 ■ Vocoflex とはDreamtonicsはその品質で定評のあるAIベースの歌声合成ソフト「Synthesizer V」の開発メーカー。 Vocoflexは、RVCなどのAIによるボイスチェンジャーをさらに使いやすく高性能に発展させたもので、VSTやAudioUnitsといったプラグインも揃っていてDAWを使うDTMユーザーとも親和性が高いものです。
iPhoneの機能「衛星経由の緊急SOS」が日本国内でも使えるようになりました。 携帯電話ネットワークやWi-Fiが圏外でも緊急通報サービスに救難メッセージを送れるほか、家族や友人に現在地を共有できるようになります。 「衛星経由の緊急SOS」が使えるのは、iOS 17.6以降にアップデートした iPhone 14 と iPhone 15の全モデル。 申し込みや手続きの必要はなく、本日から2年間、または対応 iPhoneを今後新たにアクティベーションした時点から2年間は無料で利用できます。 ■「衛星経由の緊急SOS」の仕組み・使い方「衛星経由の緊急SOS」は、携帯電話ネットワークの基地局ではなく、地球を周回する人工衛星と直接接続してメッセージを送る仕組み。 接続する人工衛星は高速に動いているため、またiPhoneの小さなアンテナで送信するためには、空が開けた場所で、画面の指示に従って端末を衛
AI作曲サービスのトップを競い合っている、大手レコード会社に訴訟され仲間であるSunoとUdioが相次いで機能強化を発表しました。 まず、Sunoに、ステム分離機能が追加されました。 ステム分離とは、楽器のパートごとにトラックを分ける機能。UVR5などの単独アプリや、Logic ProなどのDAWに組み込まれている例もあります。AI作曲サービスでもSonautoは早くから実装していました。 無料ソフトのUVR5では、ボーカル、ドラム、ベース、その他の4種類に分離でき、Logic ProのStem Splitterも同様。Sonautoも同じです。 ■Sunoのステム分離機能はボーカルとそれ以外Sunoのステム分離はそれに比べると単純で、ボーカルとその他を分けるだけ。つまり、ボーカルキャンセルと同じことなのですが、それなりに使い道はあります。 例えば、AIで作った曲のボーカルを自分や他の誰か
仮想的なシステムであり、実際の普及は想定されていない。 言語学習や異文化コミュニケーションのツールとしての可能性がある。 結論ローマ字運動とJaphalbetは、どちらも日本語の表記をラテン文字化する試みという点で共通していますが、その目的、アプローチ、そして想定される使用範囲に大きな違いがあります。ローマ字運動が日本の近代化と識字率向上を主眼としていたのに対し、Japhalbetは国際的な日本語学習とコミュニケーションの促進を目指しています。 また、ローマ字運動が日本語の文法構造をほぼそのまま維持したのに対し、Japhalbetはより大胆な文法の簡略化を提案しています。これは、Japhalbetが非日本語話者にとっての理解のしやすさを重視しているためです。 結果として、ローマ字運動は日本社会に一定の影響を与え、特に技術分野での応用を見出しましたが、Japhalbetは現時点では理論的な提
現役グラビアカメラマンでありエンジニアでもある西川和久氏による生成AIグラビア連載の第27回は、前回に続いて最新の画像生成AIモデル Stable Diffusion 3 Medium について。 『生成AIグラビアをグラビアカメラマンが作るとどうなる?連載』記事一覧』 前回に引き続きStable Diffusion 3 Mediumの話連載第26回にSD3 Medium(以降SD3 Medium)の話を書いたが、今回はその続きとなる。 前回の記事ではSD3 Mediumの特徴として Baseモデルなのに高画質。そして日本人含むアジア系もOK 商用利用不可。個人レベルでの商用利用は、クリエイターライセンス($20/月)を契約 結構な頻度で致命的な問題が発生する Promptで左右など、位置関係が指示でき再現可能。文字もOK(英語のみ) 生成環境は現状でComfyUI(系)のみ。基本Work
以前見学させていただいた「マイコン博物館」が6月22日に正式オープンしました。 1日の利用が大人1000円で、動態保存してあるマイコンを利用できるオプションが3000円。全て予約制で、水曜日が休館日。開館時刻は12時~18時。最終入館時刻は17時となっています。突然の訪問はできません。詳細はこちら。 筆者は正式オープン前に伺ったのでまだ整理されていない状態でしたが、展示のために集められたマシンたちは実に素晴らしいものでした。 マイコン博物館プレオープン訪問記の後編をまだ書いていなかったので、個人的な過去の体験を交えながらここに書いておきます。以下に登場する記述や写真はプレオープン時のもので、今は収まるべきところに、正しい説明とともに収蔵されているはずです。 1981年冬のマイコンフェアが青梅に再現されていたここを訪れた後、思い出した場所があります。それは五反田TOCのどこか。1981年冬の
このところUdioやSonautoの新機能搭載で押され気味だったAI作曲サービスの「Suno」が反撃に出ました。 バージョン3.5のEarly Access版(有料プランユーザーのみに提供)を利用すると、これまでの2分間制限が最長4分まで拡大。延長時間も従来の1分を2分に伸ばしています。これだけの長さがあれば大抵のポピュラー曲はエンディングまでいけます。 4分の曲をUdioで生成しようとすると、8回の命令が必要になります。さらに、生成に要する時間はUdioの方がはるかに長くかかるので、全体としての作業時間には大きな差が生じます。それがSuno 3.5ならば数秒でできてしまうのです。 また、Style of Musicのキーワードがサジェストされるようになっていて便利です。文字数制限は相変わらずきついですけど。 さらにうれしいのは、日本語歌詞の読み方が、従来は間違いが多かったのが、ほぼ問題な
ガジェット全般、サイエンス、宇宙、音楽、モータースポーツetc... 電気・ネットワーク技術者。実績媒体Engadget日本版, Autoblog日本版, Forbes JAPAN他 Twitterの共同創業者で、現在は決済サービスBlockを率いるジャック・ドーシー氏は、最近Blueskyの取締役会から降りた理由として「(Twitterが犯してきた)あらゆる過ちを繰り返しているから」だと語りました。 ドーシー氏はTwitterの歴史のごく初期に、営利企業としての都合や、広告主など外部の力で運営方針を左右されることのない、オープンソースのプロトコルとしてのTwitterを構想していました。 しかし、Twitterが成長していくにつれ、違法コンテンツなどのモデレーションやユーザーのアカウント凍結といった対応が必要となり、オープンで分散したネットワークという方向性に舵を切るのは難しくなります。
2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第45回目は、生成AI最新論文の概要5つを紹介します。 生成AI論文ピックアップ 高精度なニューラルネットワーク・アーキテクチャ「KAN」をMITなどの研究者らが開発 1手先のトークン予測ではなく、4手先のトークンを同時に予測するモデルをMetaなどが開発 医療分野に特化したマルチモーダル大規模言語モデル「Med-Gemini」をGoogleが開発 大規模言語モデルが答えに相当するベンチマークを事前に学習し、高い評価を出していた? AIカンニング問題を指摘した研究 一貫性の高い長編ビデオをテキストから生成するAIモデル「StoryDiffusion」 高精度なニューラ
著書に『宇宙世紀の政治経済学』(宝島社)、『ガンダムと日本人』(文春新書)、『教養としてのゲーム史』(ちくま新書)、『PS3はなぜ失敗したのか』(晋遊舎)、共著に『超クソゲー2』『超アーケード』『超ファミコン』『PCエンジン大全』(以上、太田出版)、『ゲーム制作 現場の新戦略 企画と運営のノウハウ』(MdN)など。 X(旧Twitter)は、ブロックの挙動を一部変更することを明らかにしました。 これまでブロックしたユーザーがブロックされた側に返信した場合、ブロックされた側は返信を見ることができませんでした。仕様の変更後は、ブロックされた側が返信を閲覧できるようになります。 仕様を変更する理由について、Xは次のように説明しています。 Xを「公共の広場」とする方針にブロック機能を合わせる継続的な取り組みの一環 これまでブロックされて見られなかった悪質な投稿を通報できるようになる アカウントの安
慶應義塾大学卒業後、新卒で出版社の宝島社に入社。独立後はケータイジャーナリスト/ライターとして幅広い媒体で執筆、コメントなどを行う。ケータイ業界が主な取材テーマ。 KDDIが povo 2.0の新たなトッピングを導入しました。1つ目が「データ使い放題(7日間)12回分」。もう1つが「300GB(90日間)」というトッピングです。 通常、この手のトッピングは期間限定としてイベントや大型連休などに合わせて提供されることが多い印象で、今回の2つのトッピングも一応は、期間が区切られるもののようです。 ただし、どちらも終了時期は未定となっており、かなり通常トッピングに近い位置づけと言えそうです。 povo2.0に、“楽天モバイル対抗”と呼べそうな2つのトッピングが登場した 2つのトッピングの金額を見ていくと、“楽天モバイル対抗”の色合いが非常に濃いことが分かります。 まず、データ使い放題ですが、こち
4月23日夜、米上院は79対18の賛成多数でTikTokを禁止する法案を可決しました。この法案はByteDanceに対してTikTokの売却を義務付け、さもなくば米国におけるサービス提供を禁止するものです。 正式名称「米国人を外国敵対勢力の管理アプリケーションから保護する法案」は、早ければ24日にもバイデン大統領が署名し、法律として成立する見通しです。 成立すれば、「外国の敵が制御するアプリケーション」と大統領が判断したサービスには、それを270日以内に米国企業に売却する義務が発生します。また大統領はその期限を360日まで延長する権限も有します。 もし、期限を過ぎても売却手続きが実行されない場合、そのアプリやサービスは米国内のアプリストアから削除され、米国のISPもそのサービスをブロックしなければなりません。 TikTokは長年、サービスのデータを中国政府に共有していることを否定してきまし
ガジェット全般、サイエンス、宇宙、音楽、モータースポーツetc... 電気・ネットワーク技術者。実績媒体Engadget日本版, Autoblog日本版, Forbes JAPAN他 米国空軍テストパイロットスクールと国防高等研究計画局は(DARPA)、昨年2月にAIによる自律飛行を実現したX-62A可変飛行安定性試験機(VISTA)を用い、有人のF-16戦闘機との模擬空中戦に成功したと発表しました。 DARPAの空中戦革新(Air Combat Evolution:ACE)プログラムの一環として、人工知能アルゴリズムを搭載したX-62A VISTAは、2023年9月に行われた飛行試験で「大規模な機首対機交戦」による防御と攻撃の両方の機動を試し、有人パイロットが操るF-16に対し時速1200マイル(約1900km)で2000フィート(約610m)の距離にまで接近したと説明。X-62A VI
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く