タグ

ブックマーク / ascii.jp (582)

  • グーグルAI、1000ページのPDFを読んで質問に答えられるように 白書レベルなら余裕

    グーグルは8月21日、生成AI「Gemini」を使用するための「Google AI Studio」「Gemini API」でアップロード可能なPDFの最大容量を、これまでの300ページから1000ページまたは2GBまでに拡大したと発表した。 同社でAI Studioなどを担当するLogan Kilpatrick氏によると、テキスト理解と画像理解の両方を利用して、1ページにつき1画像として処理しているという。 We just increased the max PDF page upload size to 1,000 pages or 2GB (up from 300 pages) in Google AI Studio and the Gemini API. 🗒️ We use both text understanding and the native multi-modal cap

    グーグルAI、1000ページのPDFを読んで質問に答えられるように 白書レベルなら余裕
    jt_noSke
    jt_noSke 2024/08/23
  • 次期Windows 11ではAndroidのファイルをエクスプローラーからアクセス可能になる (1/2)

    今秋に登場予定のWindows 11 Ver.24H2では、Windowsのスマートフォン連携機能を介して、Androidスマートフォンのファイルにエクスプローラーからアクセスできるようになる予定だ。今回は、この機能を解説しよう。なお、Windows 11 Ver.24H2では、これとは別に、スタートメニュー横にスマートフォン連携の情報を表示可能になるようだ。 Windows 11 Ver.24H2では、スマートフォン連携関連の強化が予定されている。その1つにスタートメニューの横にスマートフォン連携の状態を表示するという機能がある エクスプローラーからスマホのファイルにアクセス USBケーブルで接続する必要もない この機能は、Windows Insider Programのプレビュー版Windows 11 Ver.24H2で利用できる。名前がないと解説しにくいため、ここでは、この機能を「エ

    次期Windows 11ではAndroidのファイルをエクスプローラーからアクセス可能になる (1/2)
    jt_noSke
    jt_noSke 2024/08/19
  • 「Stable Diffusion」の失敗に学び、画像生成AIの勢力図を塗り変える「FLUX.1」 (1/4)

    ドイツのスタートアップ「Black Forest Labs(BFL)」が、8月1日(現地時間)に画像生成AI「FLUX.1」を発表しました。Stability AIの最新モデル「Stable Diffusion 3(SD3)」を超える性能をアピールしており、開発者はStability AIの出身者たち。Stable Diffusionのビジネスモデル設計の失敗から学んだ新しい提案方法でのプランの提示、さらには、14日には、X(旧Twitter)のAI機能の「Grok」の画像生成機能として搭載されました。Stability AIにとってはかつてないほどに強力なライバルが出現した格好で、画像生成AIの勢力図が塗り変わろうとしています。 いきなり約45億円の資金を調達した大型AIスタートアップ Black Forest Labが、シード投資でいきなり3100万ドル(約45億円)相当の資金を調達し

    「Stable Diffusion」の失敗に学び、画像生成AIの勢力図を塗り変える「FLUX.1」 (1/4)
    jt_noSke
    jt_noSke 2024/08/19
  • 商業漫画にAIが使われるようになってきた (1/4)

    ウェブ漫画サイト「まんが王国」で配信中の、画像生成AIを使った漫画『児童福祉司 一貫田逸子 リメイク版』がSNS(X)を中心に話題になりました。発行元はビーグリー。オリジナル版の作者らに許諾を得た上、生成AIを利用してフルカラーに作成しなおしたものと考えられます。月間女性ランキング2位に入るほど好評のようです。 絶版漫画AIで「リメイク」 ビーグリーは「まんが王国」を運営しつつ、配信する新作タイトルとして、「名作リメイクプロジェクト」として、旧作タイトルの画像生成AIを使ったリメイク展開を始めています。現在のところ4作品が展開されており、『児童福祉司』もそのプロジェクトの一貫で展開されています。 男性向け漫画では松山えいじさんの恋愛コメディー漫画『エイケン』のAIリメイク版を手がけています。スマートフォンやウェブトゥーンの世界では、新しい読者へのアピール方法として、生成AIを使って過去作

    商業漫画にAIが使われるようになってきた (1/4)
    jt_noSke
    jt_noSke 2024/08/12
  • アップル、画像生成AI「マトリョーシカ」公開 開発者コミュニティーでの普及狙う

    さらにこの図が示すように、MDMは小さな画像から大きな画像まで並行して生成し、それぞれの情報を相互に活用しながら画質を高めていく。加えて、画像生成の全過程でテキストなどの情報を常に参照することで、与えられた指示に忠実な高品質な画像を効率よく作り出すことを可能にしている。 この手法により、MDMは多様で高品質な画像を、従来よりも効率的に生成することができるのだ。 1200万枚のデータセットを使った訓練も可能 GitHubで公開されたml-mdmは、このMDM技術を実装するためのPythonフレームワーク、喩えるなら「説明書付きの工具セット」だ。 そこには、MDMモデル体はもちろん、訓練・推論・可視化といったコード、さらには1200万組のテキストと画像のペアからなる大規模なデータセット「CC12M(Conceptual Captions 12M)」のダウンロードと訓練の手順まで含まれている。

    アップル、画像生成AI「マトリョーシカ」公開 開発者コミュニティーでの普及狙う
    jt_noSke
    jt_noSke 2024/08/10
  • OpenAI、最新AIモデル料金値下げ わずか1年半で9分の1に

    sponsored 2024年4月に新キャンパスへ移転した静岡デザイン専門学校は、最新設備を備えた実習室とMSIのノートPCで学生の実践力を養成 sponsored 部屋が狭い日家屋仕様になったピラーレスケース、自作初心者にもオススメ! ピラーレスだがコンパクト、価格もお手頃なCORSAIRのPCケース「3500X」が完成度高い! sponsored コスト、人材、セキュリティ…… データ活用の課題を包括的に解消するHPEの取り組み なぜHPEがソフトウェアを? 統合データ基盤「HPE Ezmeral」に注力する理由を率直に聞いた sponsored “データをためる”と“データを活用する”の2製品が解決する課題、得られるメリットを知る 「HPE Ezmeral」がシンプルに実現する大規模データ活用の姿とは sponsored スマホ設定で快適なハイエンドゲーミングルーター「ROG Ra

    OpenAI、最新AIモデル料金値下げ わずか1年半で9分の1に
    jt_noSke
    jt_noSke 2024/08/08
    へえー、あい(り)がたいと言えばありがたいけど採算取れるの?
  • 画像生成AI「Stable Diffusion」の代替に? 話題の「FLUX.1」を試した (1/7)

    Stable Diffusionの共同開発者たちによって設立されたベンチャー企業「Black Forest Labs(BFL)」が8月1日(現地時間)に発表した最新の画像生成AIモデル「FLUX.1」。画像生成アプリ「ComfyUI」が対応を発表しているので、ローカル環境で動くかどうかを試してみた。 画像生成AIは「Midjourney」「Stable Diffusion」「DALL-E」の三つ巴 現在、画像生成AIの分野は主に「Midjourney」、「Stable Diffusion」、「DALL-E 3」の3つがそれぞれ独自のアプローチでユーザーを集めている。 Midjourneyは直感的なインターフェースと美しい芸術的な出力で知られ、主にクリエイティブな専門家やアーティストに人気がある。 一方、Stable Diffusionはオープンソースの柔軟性と強力なカスタマイズ能力で、技術

    画像生成AI「Stable Diffusion」の代替に? 話題の「FLUX.1」を試した (1/7)
    jt_noSke
    jt_noSke 2024/08/07
  • OpenAIが重大な岐路に立たされている

    8月6日(現地時間)、OpenAIのGreg Brockman氏が、年末までの長期休暇を取得すると発表した。同日、共同創業者のJohn Schulman氏がAnthropicへの移籍を表明。さらにPeter Deng氏もOpenAIからの退社が報じられた。これに先立つ8月5日には、OpenAIの共同創業者イーロン・マスク氏がサム・アルトマンCEOらに対する訴訟を再開したことが明らかになった。OpenAIの内部で何が起きているのだろうか。 Greg Brockman氏には復帰の目も I’m taking a sabbatical through end of year. First time to relax since co-founding OpenAI 9 years ago. The mission is far from complete; we still have a safe

    OpenAIが重大な岐路に立たされている
    jt_noSke
    jt_noSke 2024/08/07
  • 「生成AIと発明(特許権)は相性が良い」知財の専門家、日本弁理士会が解説

    生成AIは「発明創作のスピードを上げ、質も高める」ツールになりうる 日弁理士会は、知的財産の専門家である弁理士により構成される組織。これまでも生成AIと著作権に関する説明会を開催してきた(昨年8月、今年3月)。 今回は、今年5月に政府の知的財産戦略部が「AI時代の知的財産権検討会 中間とりまとめ」を公表したことを受けて、著作権以外の知的財産権(特許権、意匠権、商標権)とAIとの関係を中心に説明した。 中氏はまず、今回の説明のポイントとして「生成AIは、発明創作のための有効なツールと言える」と位置づける。 たとえば、特定の性質を示す材料を生成するために、複数の材料から好ましいものを選択するような作業においては、人間よりも生成AIのほうが速く、大量に作業を進めることができる。同様に、複数の部材を組み合わせて構造物を構成する場合でも、各部材の好ましい配置や形状を創作するなどの手間のかかる作業

    「生成AIと発明(特許権)は相性が良い」知財の専門家、日本弁理士会が解説
    jt_noSke
    jt_noSke 2024/08/06
  • カスタムPCメーカーPuget Systems、CPU不安定性の問題についてレポート公開

    sponsored 2024年4月に新キャンパスへ移転した静岡デザイン専門学校は、最新設備を備えた実習室とMSIのノートPCで学生の実践力を養成 sponsored 部屋が狭い日家屋仕様になったピラーレスケース、自作初心者にもオススメ! ピラーレスだがコンパクト、価格もお手頃なCORSAIRのPCケース「3500X」が完成度高い! sponsored コスト、人材、セキュリティ…… データ活用の課題を包括的に解消するHPEの取り組み なぜHPEがソフトウェアを? 統合データ基盤「HPE Ezmeral」に注力する理由を率直に聞いた sponsored “データをためる”と“データを活用する”の2製品が解決する課題、得られるメリットを知る 「HPE Ezmeral」がシンプルに実現する大規模データ活用の姿とは sponsored スマホ設定で快適なハイエンドゲーミングルーター「ROG Ra

    カスタムPCメーカーPuget Systems、CPU不安定性の問題についてレポート公開
    jt_noSke
    jt_noSke 2024/08/06
  • AIバブル崩壊をめぐって (1/5)

    AIは経済成長を引き起こさない」という、マサチューセッツ工科大学(MIT)のダロン・アセモグル(Daron Acemoglu)教授の主張を朝日新聞が取り上げたことが大きな話題になりました。「AIバブル」状態の相場に冷や水を浴びせるような内容が注目されています。 「AIの普及で未来はバラ色」に疑問符 ダロン・アセモグル教授はトルコ出身のMIT経済学の研究家。有名な著書に『国家はなぜ衰退するのか』があります。おおまかに言えば、自由民主主義の政治制度がなければ、富の再分配やイノベーションが阻害されるため、いずれ経済は発展しなくなって停滞するという内容です。2023年の『技術革新と不平等の1000年史』では、「技術革新そのものが富の再分配をもたらすわけでなく、不平等も作る要因になっていく」と主張していました。 アセモグル教授が大きく注目を集めることになったのは、4月に発表した論文「The Si

    AIバブル崩壊をめぐって (1/5)
    jt_noSke
    jt_noSke 2024/08/05
  • 自分の作品に似たAIイラストがあったときの対応方法 文化庁が解説

    文化庁は7月31日、「AIと著作権に関するチェックリスト&ガイダンス」と題した資料を公開した。 同資料は生成AIに関するポイントのうち、著作権に関するものに限定し、AI開発者/AI提供者/AI利用者/業務外利用者(一般利用者)の立場ごとのチェックリストおよび、著作権の侵害があった際の対応方法について詳述されている。 その中に、「自身の作品に類似したAI生成物への対応」という項目がある(p.31)。つまり、自分の作品に似たAIイラスト等を見つけたときにどう対応するかというものだ。 著作権侵害は「類似性」と「依拠性」の2つの要素で判断 まず、人間の創作物と同様に、AI生成物でも著作権侵害にあたるかどうかは、「類似性」と「依拠性」の2つの要素から判断される。 類似性とは、AI生成物が既存の作品の「表現上の質的な特徴を直接感得することができる」状態を指す。 重要なのはアイデアの類似ではなく、具体

    自分の作品に似たAIイラストがあったときの対応方法 文化庁が解説
    jt_noSke
    jt_noSke 2024/08/05
  • ゼネコン現場社員が3年でここまで開発、戸田建設の内製化は「外部頼みでいいのか」から始まった (1/2)

    アマゾン ウェブ サービス ジャパンは、2024年6月、国内最大の年次イベントである「AWS Summit Japan」をハイブリッドで開催。150を超えるセッションが展開された。 記事では、戸田建設によるセッション「プログラムを書けないゼネコン社員が、3年でどこまでやれるのか ~戸田建設の技術的自立と現場力の向上~」をレポートする。登壇したのは、コーポレート部 ICT 統轄部 DX推進室 室長の佐藤康樹氏だ。 戸田建設が注力するのが内製化の推進による、現場力の強化だ。IT未経験の同社社員が、AWSの支援サービスや“三種の神器“と呼ぶサーバーレスの基サービスを活用して、自らシステム開発ができるようになった背景が語られた。 最前線の社員が開発した、現場の課題を解決するプラットフォーム 戸田建設が、DX推進課を新設して、内製化に注力し始めて約3年。その成果のひとつとして生まれたのが、業務

    ゼネコン現場社員が3年でここまで開発、戸田建設の内製化は「外部頼みでいいのか」から始まった (1/2)
    jt_noSke
    jt_noSke 2024/08/03
  • 「Stable Diffusion」開発者たちが新たな画像生成AI「FLUX.1」を発表 迷走するStability AIと対照的な展開に

    画像生成AIモデル「Stable Diffusion」の共同開発者たちによって設立されたベンチャー企業「Black Forest Labs(BFL)」は8月1日(現地時間)、高品質な画像生成能力と多様な出力が特徴の最新の画像生成AIモデル「FLUX.1」を発表した。 Stable Diffusionの共同開発者が設立 Black Forest Labs(BFL)は、オープンソースの画像生成AIモデル「Stable Diffusion」の共同開発者として知られるRobin Rombach氏、Patrick Esser氏、Andreas Blattmann氏によって2024年に設立された新興企業。Andreessen Horowitz(a16z)を筆頭とする投資家から3100万ドルの資金を調達したことで注目を集めている。 3つのモデルを展開 We are excited to announce

    「Stable Diffusion」開発者たちが新たな画像生成AI「FLUX.1」を発表 迷走するStability AIと対照的な展開に
    jt_noSke
    jt_noSke 2024/08/03
  • 画像生成AI「Midjourney」新バージョンでさらにリアルに もう実写にしか見えない

    sponsored 部屋が狭い日家屋仕様になったピラーレスケース、自作初心者にもオススメ! ピラーレスだがコンパクト、価格もお手頃なCORSAIRのPCケース「3500X」が完成度高い! sponsored コスト、人材、セキュリティ…… データ活用の課題を包括的に解消するHPEの取り組み なぜHPEがソフトウェアを? 統合データ基盤「HPE Ezmeral」に注力する理由を率直に聞いた sponsored JN-MD-IQ1301FHDRをレビュー モバイルでも映像の質にこだわりたいなら、QLEDの13.3型液晶はいかが? sponsored JN-i27QR-C65W-HSPをレビュー USB Type-C給電&KVM対応の27型WQHDディスプレーで約2.8万円は即ポチ損なしの最安級 sponsored MSIがセール開催中!この夏に自作PCパーツを買う人はツイている サマーセール

    画像生成AI「Midjourney」新バージョンでさらにリアルに もう実写にしか見えない
    jt_noSke
    jt_noSke 2024/08/01
  • NTTドコモ「dアカウント」一から作り直した方がいいのでは (1/3)

    sponsored 2024年4月に新キャンパスへ移転した静岡デザイン専門学校は、最新設備を備えた実習室とMSIのノートPCで学生の実践力を養成 sponsored 部屋が狭い日家屋仕様になったピラーレスケース、自作初心者にもオススメ! ピラーレスだがコンパクト、価格もお手頃なCORSAIRのPCケース「3500X」が完成度高い! sponsored コスト、人材、セキュリティ…… データ活用の課題を包括的に解消するHPEの取り組み なぜHPEがソフトウェアを? 統合データ基盤「HPE Ezmeral」に注力する理由を率直に聞いた sponsored スマホ設定で快適なハイエンドゲーミングルーター「ROG Rapture GT-BE98」 そろそろ替えどき?いまさら聞けない“Wi-Fi 7”の利点とASUSのWi-Fi 7ルーターを解説 sponsored JN-MD-IQ1301FHD

    NTTドコモ「dアカウント」一から作り直した方がいいのでは (1/3)
    jt_noSke
    jt_noSke 2024/08/01
  • マイクロソフトが重大なセキュリティ脆弱性を発見 VMwareの仮想化システムが標的に

    sponsored JN-MD-IQ1301FHDRをレビュー モバイルでも映像の質にこだわりたいなら、QLEDの13.3型液晶はいかが? sponsored JN-i27QR-C65W-HSPをレビュー USB Type-C給電&KVM対応の27型WQHDディスプレーで約2.8万円は即ポチ損なしの最安級 sponsored MSIがセール開催中!この夏に自作PCパーツを買う人はツイている サマーセールを活用すれば同じ予算でGeForce RTX 4070を4080にできないか考えてみた sponsored FRONTIERの「FRGBLSZ790/SG2」をチェック、自作erでも心くすぐられるケース内部 RTX 4070 Ti SUPERを垂直設置、デザインもゲーム性能も妥協なしのゲーミングPC sponsored ファーウェイ製スマートウォッチらしくバッテリー長持ちもうれしい スマート

    マイクロソフトが重大なセキュリティ脆弱性を発見 VMwareの仮想化システムが標的に
    jt_noSke
    jt_noSke 2024/07/30
    そうかそうか
  • AIは著作物の「フェアユース」と言えるのか 音楽業界vs.AIミュージック (1/4)

    ・米3大メジャーレコード会社、音楽生成AI「Suno」「Udio」を著作権侵害で提訴 アメリカレコード協会(RIAA)とユニバーサルミュージックグループ、ワーナーミュージック・グループ、ソニーミュージックグループの大手レコード会社が共同で、音楽生成AIスタートアップのSunoとUdioに対して著作権侵害を訴える裁判を起こしました。この2社のサービスは裁判へと発展するということは想定されていたところです。要するに、レコード会社が著作権管理している楽曲を無許可でAIに学習させて、商用展開を進めているということで訴えたわけですね。被告側はおそらく学習については、米著作権法で認められる「フェアユース」で押し切ることを狙い、レコード会社側は今回のケースはフェアユースに該当しないという主張の衝突になっていこうとしています。 AI音楽動画、YouTubeで200万再生 音楽生成AIの名前を有名にしたSu

    AIは著作物の「フェアユース」と言えるのか 音楽業界vs.AIミュージック (1/4)
    jt_noSke
    jt_noSke 2024/07/30
  • アップル新型「iPhone」カメラセンサーの“ソニー外し”は2026年か

    アップルが2026年に発売するiPhoneには、サムスン製の新しいカメラセンサーが採用される可能性が高いようだ。アップル関連の著名アナリスト、ミンチー・クオ氏が7月24日にXで報告した。 同氏によると、アップルは早ければ2026年にもサムスン製の1/2.6インチ4800万画素の超広角CMOSイメージセンサー(CIS)を採用するという。 これにより、ソニーが長年独占していたアップルのCISサプライヤーの地位が崩れることになる。 同氏はサムスンがすでにアップル向けのカメラ部品開発に特化したチームを社内に設立していると伝えている。 iPhone用イメージセンサーがソニーからサムスンに変更されるとのうわさはつい先日韓国メディアTHE ELECが報じていたが、その後、記事は削除されてしまっていた。 そのためガセだったのではないかとの見方も出てきていたが、クオ氏から予測が発表されたことでかなり真実性が

    アップル新型「iPhone」カメラセンサーの“ソニー外し”は2026年か
    jt_noSke
    jt_noSke 2024/07/27
  • 「ChatGPT」一強時代の終わり 狙われるAIの王座

    OpenAIはこれまで「ChatGPT」および「GPT-4」で大規模言語モデル(LLM)市場を席巻してきた。2022年11月のChatGPT発表、2023年3月のGPT-4リリース、そしてマイクロソフトからの巨額投資により、OpenAIの独走が決定的かに見えた。しかし、その独占的地位は揺らぎつつある。 次々に登場する高性能なLLM OpenAIがGPT-4からGPT-5へのメジャーアップデートに苦戦している中、ライバル勢が急速に台頭してきている。グーグルは「Gemini 1.5 Pro」、Anthropicは「Claude 3.5 Sonnet」、メタは「LlaMA 3.1 405B」と、GPT-4に匹敵する性能を持つモデルを次々と発表している。 特筆すべきは、オープンソースLLMの急速な進化だ。たとえばフランスのAIスタートアップMistralが7月24日(現地時間)に公開した「Mist

    「ChatGPT」一強時代の終わり 狙われるAIの王座
    jt_noSke
    jt_noSke 2024/07/26