ブックマーク / www.itmedia.co.jp (226)

  • YouTube、クリエイターの権利を守る新生成AI検出ツールを発表

    Google傘下のYouTubeは9月5日(現地時間)、アーティストやクリエイターの歌声や顔を生成AIでコピーし、使用するのを防ぐための新たな2つのAI検出ツールを開発していると発表した。 こうしたツールは、AIの創造的可能性を活用しつつ、クリエイターを保護するのに役立つとしている。 1つ目は、YouTube上で自分の歌声を模倣したAI生成コンテンツを自動的に検出し、管理する「合成歌声識別技術」。既存の「Content ID」に組み込まれており、2025年にパイロットプログラムでテストを開始する予定だ。 YouTubeは昨年8月、米大手音楽レーベルのUNIVERSAL MUSIC GROUP(UMG)と提携し、「YouTube Music AI Incubator」を設立した。 2つ目は、クリエイターや俳優、ミュージシャン、アスリートなど、さまざまな業界の人々がYouTube上で自分の顔

    YouTube、クリエイターの権利を守る新生成AI検出ツールを発表
  • イーロン・マスク氏、ハリス副大統領のディープフェイクパロディ動画をXにポスト

    米Xのオーナーであるイーロン・マスク氏は7月26日(現地時間)、Xユーザーがポストしたカマラ・ハリス副大統領を揶揄するディープフェイク動画をパロディだという注釈なしにXに再ポストした。 この動画は、ハリス氏が25日に公開した選挙キャンペーン動画を編集したもので、ハリス氏の声のナレーションが改変されている。同氏の声で、「私は女性であり、有色人種でもある。だから、もしあなたが私を批判したら、私はあなたが性差別主義者であり人種差別主義者であると言う」などと語り、自らを「ディープステート(闇の政府)の操り人形」だとしている。 動画のオリジナル投稿者は「Mr Reagan(@MrReaganUSA)」というYouTuberで、この投稿者は動画に「パロディだ」と添えているが、マスク氏は「これはすごい(泣き笑い絵文字)」とのみコメントしている。 日時間の29日午前6時現在、オリジナルポストは約66万回

    イーロン・マスク氏、ハリス副大統領のディープフェイクパロディ動画をXにポスト
  • “ビールは冷やす”となぜうまい? 中国の研究者らが調査 アルコール度数と温度の関係に迫る

    このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 X: @shiropen2 酒は数千年前から人類が愛する嗜好品の一つだ。キリンホールディングスによると、最古の酒の一つとされうワインは約7000年前から、ビールは約5000年前から作られているという。これらのアルコール飲料の主成分はエタノールと水である。 さまざまな種類があるアルコール飲料だが、白ワインやビールは冷やして飲み、中国でつくられる白酒は温めて飲むのが一般的だ。これは長い歴史の中で経験則として人類の中で引き継がれているが「なぜビールは冷やすとおいしいのか?」のように、度数と温度の関係についての科学的な説明には曖昧な部分が多かった。 そこで研究チームでは度数と温度の関係に

    “ビールは冷やす”となぜうまい? 中国の研究者らが調査 アルコール度数と温度の関係に迫る
  • GW、暇なら読んどく? 企業が無料公開した研修資料まとめ 「AI活用」「グラブル裏側」「うんこのリスク」など

    2024年のゴールデンウイークがやってきた。暦の上では、3連休、平日3日、4連休と続いており、最大で10連休を取得し、休みを満喫している人も多いと思う。その中には、外出はせずに自宅でゆっくり過ごすという人もいるかと思うが、そんな人たちにおすすしたい、無料で読める研修資料を紹介したい。 昨今さまざまな企業で、自社の研修で使った資料を社外に公開するケースが相次いでいる。「事業や教育に役立ててほしい」という思いから公開されるそれらの資料たちは、新入社員向けの仕事の心構えを説くものや、各業務の基礎を解説した教材、今話題の生成AIの活用方法など多種多様である。 今回は、過去にITmedia NEWSやITmedia AI+で取り上げた記事の中から数点を紹介する。ゴールデンウイーク中に読むもよし、連休明けの仕事始めのモチベーションを上げるために読むもよし、“あとで読む”用にブックマークしてもよし。それ

    GW、暇なら読んどく? 企業が無料公開した研修資料まとめ 「AI活用」「グラブル裏側」「うんこのリスク」など
  • Google、サードパーティcookie廃止を3度目の延期 年内には実施せず

    Googleは4月23日(現地時間)、2024年中に完了する予定だったWebブラウザ「Chrome」でのサードパーティcookieの廃止を延期すると発表した。延期はこれで3度目になる。 延期の理由は「業界、規制当局、開発者からの異なるフィードバックを調整することに関連する課題が継続している」ため。 特に、「プライバシーサンドボックス」の取り組みに懸念を示している英政府競争規制当局の競争・市場庁(CMA)が「業界テストの結果を含むすべての証拠を検討するための十分な時間を確保することが重要」としている。 CMAは1月、Googleに対し、複数の競争関連の懸念が解消されるまで、サードパーティcookie廃止を一時停止するよう命じた(リンク先はPDF)。 CMAによる検討などに引き続き協力することで、プロセスを年内に完了し、合意に達すれば2025年初頭から廃止を進める想定という。 Google

    Google、サードパーティcookie廃止を3度目の延期 年内には実施せず
  • ブーム来る? 「和文バリアブルフォント」の世界

    そんな事もあり、4月10日は新しいフォントがいくつか発表された。今年の目玉はなんといっても「和文バリアブルフォント」であろう。 われわれが普段使用するフォントは、同じデザインでも細いもの、太いもの、横が詰まったものなどがそれぞれ個別のフォントとして提供され、1つのファミリーを形成している。 一方バリアブルフォントは、そうした文字の変形を1つのフォントで提供していこうという比較的最近のフォントフォーマットで、米Adobe/米Apple/米Google/米Microsoftが共同開発した。フォントパラメータとして、太さや字幅がバリアブルで変更できるため、従来はファミリーで提供しなければならなかったフォントデータが、1つのフォントで小さく提供できるというメリットがある。 もちろんデザインする側も、細いか太いかの2択ではなく「中間」も選べるし、縦長、横長も選べるので、表現の幅が広がるわけである。た

    ブーム来る? 「和文バリアブルフォント」の世界
  • 「歩くのが遅い人は脳が小さくIQが低い」──歩行速度と脳の構造に相関あり? 米国チームの実験結果

    このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。通常は新規性の高い科学論文を解説しているが、ここでは番外編として“ちょっと昔”に発表された個性的な科学論文を取り上げる。 X: @shiropen2 人は日常的に歩行という動作を行っているが、その速度は単なる身体能力の指標ではないことが、この研究で明らかになった。研究チームは、ニュージーランドで1972~1973年に生まれた1037人(45歳時点で生存していたのは997人、そのうち904人の歩行速度を測定)を対象に、45歳時点での歩行速度とさまざまな健康指標との関連を調べた。参加者は3歳から定期的にさまざまなテストを受けてきた縦断的調査の対象者である。 研究チームは、通常歩行や、二重課題歩行(アルファベットの文字を交互に声に出して読み上

    「歩くのが遅い人は脳が小さくIQが低い」──歩行速度と脳の構造に相関あり? 米国チームの実験結果
  • Microsoft、AI「Copilot」のAzure好調で予想を上回る増収増益

    Microsoftが1月30日(現地時間)に発表した第2四半期(2023年10月~12月期)の決算は、売上高は前年同期比17.6%増の620億2000万ドル、純利益は33.1%増の218億7000万ドル(1株当たり2ドル93セント)だった。「Copilot」などのAI統合を進めたクラウド部門が順調だった。 売上高、純利益ともにアナリスト予測(売上高は611億2000万ドル、1株当たりの純利益は2ドル78セント)を上回った。 サティア・ナデラCEOは発表文で「われわれは、AIについて語ることから、AIを大規模に適用することに移行した。技術スタックのあらゆる層にAIを導入することで新たな顧客を獲得し、あらゆる分野で新たなメリットと生産性の向上を促進している」と語った。 部門別では、Azureやサーバー製品を担うIntelligent Cloud部門全体の売上高は20%増の258億8000万ド

    Microsoft、AI「Copilot」のAzure好調で予想を上回る増収増益
  • Macintosh誕生40周年 コンピュータが未来だったあの時代

    初代Macintosh、のちにMacintosh 128Kと呼ばれることになるコンピュータが世界に発表されたのが、1984年1月24日。今年がちょうど40周年に当たるのだそうである。 初代機はほとんど日では使われなかったはずだ。メモリーが少なく、まだ日語が扱えなかった。日においては、1986年に発売されたMachintosh Plusのほうが初代という印象が強い。わかったわかったDynaMacとか面倒な事をいうな。そういうことを知ってて書いている。 80年代半ばからWindows 95が出る90年代半ばぐらいまで、当時のコンピュータはどれも製品寿命が長かった。今のように毎年新モデルが出るようなことはなく、1台のコンピュータを長く使った。 筆者が就職したのもちょうど1984年のことで、テレビ番組を制作するポストプロダクションにて、オンライン編集マンとしてのキャリアをスタートさせた。当時

    Macintosh誕生40周年 コンピュータが未来だったあの時代
  • 30秒以内に部屋の“隠しカメラ”をスマホで見つける技術 発見精度95%以上 中国などが開発

    このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: @shiropen2 中国の武漢大学やシンガポールの南洋理工大学などに所属する研究者らが発表した論文「LocCams: An Efficient and Robust Approach for Detecting and Localizing Hidden Wireless Cameras via Commodity Devices」は、スマートフォンを使用して、隠しワイヤレスカメラの検出と位置特定を行う手法を提案した研究報告である。 ユーザーはスマートフォンを検出器として、体の正面に両手で固定して持ち、約5秒間静止した後に右方向に回転する動作を4回実行する。こ

    30秒以内に部屋の“隠しカメラ”をスマホで見つける技術 発見精度95%以上 中国などが開発
  • AppleのMac、40周年 「誕生ですべてを変えた」とクックCEO

    Appleのティム・クックCEOは1月24日(現地時間)、スティーブ・ジョブズ氏が1984年にクパチーノのイベントで初代Macintoshを発表してから40年たったことを祝すポストを公式Xアカウントで投稿した。 クック氏の投稿は「Macは40年前に登場してすべてを変え、その後何度も変革を起こしてきた。今日のMacのラインアップは、パーソナルコンピュータの歴史上最高のものであり、これまでの数十年にわたる革新的なイノベーションに基づいて構築されている。Mac、誕生日おめでとう!」というものだ。 添えられた動画は、初代Macintosh、iMac、iBook、MacBookMac mini、鏡と呼ばれたiMac、チーズおろしと呼ばれたMac Proなどのハードウェアと、SafariやSwift、カレンダーなどのアプリ、M1プロセッサなどで形作ったAppleのロゴ(葉っぱの部分は昔の6色)だ

    AppleのMac、40周年 「誕生ですべてを変えた」とクックCEO
  • スマホカメラ全盛の中、ゲオが「5478円のコンデジ」を投入したワケ

    ゲオが、2023年10月26日に、「コンパクトデジタルカメラ(BM-DC01)」を発売した。 有効800万画素のカメラを搭載しており、最大16倍のデジタルズームや笑顔検出、連写機能、セルフタイマー、タイムラプス録画などの機能を備える。動画は4Kサイズまでの撮影に対応している。税込みで5478円という安さも特徴だ。 カメラに必要な機能は一通りそろっている印象だが、このスペックならスマートフォンのカメラでも十分に思われる。むしろカメラを持つ分、荷物が増えてしまう。なぜ、このタイミングでコンパクトデジタルカメラを発売しようと考えたのか。ゲオに聞いた。 ―― スマートフォンのカメラが全盛の中、このタイミングであえてコンパクトデジカメを投入した狙いを教えてください。 ゲオ 市場調査をしていると、お子さんの写真を撮りたいという方やお子さん向けのキッズカメラとしての用途、業務用としての用途の他、若い世代

    スマホカメラ全盛の中、ゲオが「5478円のコンデジ」を投入したワケ
  • 勉強中に特定の“音”を聞くと集中力が向上する可能性を発見 芝浦工業大学などの研究チーム

    芝浦工業大学は12月22日、学習などの際に集中力が落ちてくるタイミングで「川のせせらぎ」の音(River Sound)を流すと集中力を表す脳波が上昇することを確認したと発表した。情報工学科・菅谷 みどり教授らの研究チームが、三菱鉛筆(東京都品川区)、ストーリア(東京都中央区)と共同で実施した。 脳波を計測するヘッドバンドを装着した被験者に、PASATテストと呼ばれる情報処理能力の測定を実施した。前半2分間はそのままテストを行い、後半2分間は光(赤、青、緑のライト)や音(ホワイトノイズ、川のせせらぎの音、クラシック音楽)といった視聴覚刺激を与えた。 結果を比較したところ、川のせせらぎの音を流したテストで正答率が向上する傾向がみられた。またγ波についても、最も低かった赤いライトと比べると1%ほど高いという有意差があった。 研究チームは「学習時の集中力が切れるタイミングで、背景音として川のせせら

    勉強中に特定の“音”を聞くと集中力が向上する可能性を発見 芝浦工業大学などの研究チーム
  • 人だと正解率92%なのに、GPT-4だと15%になる新型テスト集「GAIA」 米Metaなどが開発

    このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: @shiropen2 米Metaや米HuggingFaceなどに所属する研究者らが発表した論文「GAIA: a benchmark for General AI Assistants」は、難しいタスクではなく、人間にとって簡単なタスクを達成する大規模言語モデル(LLM)を評価するためのベンチマークを提案している。この研究は、人間が日常で当たり前に実行してほしいタスクを正確にこなすLLM構築を目指すためのテスト集である。 現在のベンチマークは、人間にとってより困難なタスクを求めており、LLMには数学や法律などの複雑なタスクや、一貫性のあるを書くなどの複雑な課題が

    人だと正解率92%なのに、GPT-4だと15%になる新型テスト集「GAIA」 米Metaなどが開発
  • GoogleのAI「Bard」、YouTube動画の内容要約も可能に

    Googleは11月21日(現地時間)、生成AIチャット「Bard」が「YouTube動画を理解する能力の第一歩を踏み出した」と発表した。 同社は9月に、YouTubeからリアルタイム情報を取得できるようにしているが、今回のアップデートで、動画の概要や、長い動画のどの当たりで目的の情報が得られるかなどを答えられるようになったようだ。 Googleは例として、ケーキのレシピ動画を探している場合、そのレシピに必要な卵の数を尋ねられるようになるとしている。 「美味しいミルクティーの入れ方を紹介するYouTube動画から、手順を教えてください」と尋ねたところ、複数の画像入りの説明が表示された。最初の手順に「ティーポットに水と紅茶を入れ」とあるが、それがどのようなYouTubeからの情報かは不明だ。 画像をクリックするとYouTube動画ではなく、画像を掲載しているWebサイトに飛ぶ。 「ポトフの

    GoogleのAI「Bard」、YouTube動画の内容要約も可能に
  • OpenAIが次世代の「GPT-4 Turbo」やカスタムできる「GPTs」を発表/イーロン・マスクが対話型AI「Grok」

    OpenAIが次世代の「GPT-4 Turbo」やカスタムできる「GPTs」を発表/イーロン・マスクが対話型AI「Grok」:週末の「気になるニュース」一気読み!(1/3 ページ) うっかり見逃していたけれど、ちょっと気になる――そんなニュースを週末に“一気読み”する連載。今回は、11月5日週を中心に公開された主なニュースを一気にチェックしましょう!

    OpenAIが次世代の「GPT-4 Turbo」やカスタムできる「GPTs」を発表/イーロン・マスクが対話型AI「Grok」
  • 米Microsoft、生成AI開発のための初心者向け講座を公開 チャットbotや画像生成アプリ構築など

    各レッスンでは、まずトピックに関する短いビデオ紹介を提供。これを視聴することで、学ぶ内容の全体像を把握できる。続けて、全レッスンにはREADMEファイルに記載されている詳細なテキストガイドが含まれており、それによって主題に関する深い理解を深められるという。 プロジェクトベースのレッスンでは、コード例付きのJupyter Notebookにアクセスできる。このようなハンズオン形式の演習は、学んだ内容を実際に適用する際の助けとなる。そして、各レッスンの終わりには知識の確認を目的としたチャレンジや課題が設けられており、これを通じて習得した概念の理解度を確認可能だ。各レッスンの概要を下記の通り。 Lesson 00: Course Introduction - How to Take This Course(コース紹介 このコースの受講方法) Lesson 01: Introduction to

    米Microsoft、生成AI開発のための初心者向け講座を公開 チャットbotや画像生成アプリ構築など
  • Threads、ポストの修正機能と音声投稿機能を無料で提供開始

    米Metaは10月12日(現地時間)、テキストベースのSNS「Threads」に2つの新機能を追加したと発表した。投稿済みのポストを5分以内であれば編集できる機能と、録音した音声を投稿する機能だ。 ポストの編集機能は、競合する米X(旧Twitter)のXにもあるが、Xの編集機能は有料サービス「X Premium」(旧「Twitter Blue」)の加入者のみが使えるものだ。 それに対し、Threadsの編集機能は誰でも使える。編集済みポストの右上には編集済みマークが付き、これをタップすると「この投稿は編集済みです。」と表示される。なお、編集履歴は表示されない。 音声投稿は、稿執筆現在はモバイルアプリでのみ利用可能だ。新規スレッド画面に表示されるようになったマイクのアイコンをタップすると録音画面になるので、録音ボタンをタップしてメッセージを入力して投稿する。 音声投稿を聞くには音声の部分を

    Threads、ポストの修正機能と音声投稿機能を無料で提供開始
  • Windows 11、9月26日の大型アプデ「22H2」で「Microsoft Copilot」ビルトイン

    Windows 11、9月26日の大型アプデ「22H2」で「Microsoft Copilot」ビルトイン 米Microsoftは9月21日(現地時間)、ニューヨークで開催のスペシャルイベントで、「Windows 11」の次期大型アップデート「22H2」を26日にリリースすると発表した。このアップデートで、“everyday AI companion(日常のAIコンパニオン)”「Microsoft Copilot」(プレビュー版)をビルトインする。 Microsoftは5月のイベントではWindowsのCopilotを「Windows Copilot」と呼んでいたが、公式ブログによると、名称は「Microsoft Copilot」となるようだ(以下「Copilot」)。 Copilotは[Windows]+[C]または右クリックで起動でき、Windows 11のサイドバーとして表示される。

    Windows 11、9月26日の大型アプデ「22H2」で「Microsoft Copilot」ビルトイン
  • テキストプロンプトから音楽やサウンドを生成できる「Stable Audio」公開 商用利用も可

    英Stability AIは9月13日(現地時間)、音楽やサウンドの生成に使えるAIモデル「Stable Audio」を発表した。テキストプロンプトから高品質な音楽とサウンドエフェクトを生成できるという。 45秒までのトラックを生成してダウンロードできる無料版(月間20トラックまで)と、商用利用も可能な90秒のトラックを生成するサブスクリプションプラン(11.99米ドル、月間500トラックまで)、企業向け(要問い合わせ)を用意している。 Stable AudioのWebサイトにアクセスすると、「Trance, Ibiza, Beach, Sun, 4 AM, Progressive, Synthesizer, 909, Dramatic Chords, Choir, Euphoric, Nostalgic, Dynamic, Flowing」というテキストプロンプトで生成された音楽を視聴で

    テキストプロンプトから音楽やサウンドを生成できる「Stable Audio」公開 商用利用も可