ブックマーク / ascii.jp (147)

  • グーグルAI、1000ページのPDFを読んで質問に答えられるように 白書レベルなら余裕

    グーグルは8月21日、生成AI「Gemini」を使用するための「Google AI Studio」「Gemini API」でアップロード可能なPDFの最大容量を、これまでの300ページから1000ページまたは2GBまでに拡大したと発表した。 同社でAI Studioなどを担当するLogan Kilpatrick氏によると、テキスト理解と画像理解の両方を利用して、1ページにつき1画像として処理しているという。 We just increased the max PDF page upload size to 1,000 pages or 2GB (up from 300 pages) in Google AI Studio and the Gemini API. 🗒️ We use both text understanding and the native multi-modal cap

    グーグルAI、1000ページのPDFを読んで質問に答えられるように 白書レベルなら余裕
  • iPhoneのブラウザー、魔法みたいに広告が消せるように

    まあ、魔法つっても普通に新機能なんですけどね。 iOS 18の新しい「Safari」では、「ちょっとこの広告、記事読むのにおジャマね」と思ったら、その広告を非表示にできる機能が標準搭載されるんです。しかも、ただ非表示にするだけじゃないんです。なんと、消える瞬間、魔法にかかったように霧散するというエフェクトが付いていて、当に魔法みたいな機能なんですよ。 実は消せるのは広告だけじゃなくて、しつこく表示されるクッキーのポップアップだったり、なんなら記事中の図版や文字ブロックもきれいさっぱり消し去ることができるので、別に広告が気になるわけでもないのに色々消しているのがただ気持ちいい!みたいな機能でもあります。実装されたら、ぜひ遊んでみてください。 ※アップルの最新OSのパブリックベータ版の画面は一般に公開することが禁じられていますが、稿では特別に取材許可を得たうえで掲載しています。 新しい「S

    iPhoneのブラウザー、魔法みたいに広告が消せるように
  • OpenAIが重大な岐路に立たされている

    8月6日(現地時間)、OpenAIのGreg Brockman氏が、年末までの長期休暇を取得すると発表した。同日、共同創業者のJohn Schulman氏がAnthropicへの移籍を表明。さらにPeter Deng氏もOpenAIからの退社が報じられた。これに先立つ8月5日には、OpenAIの共同創業者イーロン・マスク氏がサム・アルトマンCEOらに対する訴訟を再開したことが明らかになった。OpenAIの内部で何が起きているのだろうか。 Greg Brockman氏には復帰の目も I’m taking a sabbatical through end of year. First time to relax since co-founding OpenAI 9 years ago. The mission is far from complete; we still have a safe

    OpenAIが重大な岐路に立たされている
  • なぜ『ガールズバンドクライ』は貧乏になった日本で怒り続ける女の子が主人公なのか?――平山理志Pに聞く (1/4)

    2024年の春アニメは大物作品が勢ぞろいする激戦区だった。そのなかにあって独自技術の3DCGかつ、重苦しい展開から逃げない『ガールズバンドクライ』がまさかの人気を獲得した理由は? 東映アニメーションの平山理志プロデューサーにたっぷり語っていただいた ©東映アニメーション 〈後編はこちら〉 暗い時代を生きる人々に寄り添うのは「地に足のついた」物語だ 人気作が並んだ2024年春番組で大きな話題となったオリジナル作品が『ガールズバンドクライ』だ。手がけたのは平山理志プロデューサー。2019年に東映アニメーションに入社した平山氏は、『ラブライブ!』シリーズを共に作ってきた監督・演出家の酒井和男氏にシリーズディレクターを、そして花田十輝氏に脚を依頼。新たなオリジナル作品を作り始めた。 コンセプトは「音楽もの×今の時代を反映した物語」。生きていくのが大変な時代にマッチする主人公と物語を数年かけて探っ

    なぜ『ガールズバンドクライ』は貧乏になった日本で怒り続ける女の子が主人公なのか?――平山理志Pに聞く (1/4)
  • ソニー「PSP」はゲーム、映画、音楽、ネット対戦と俺たちの夢が詰まった携帯ゲーム機だった

    高画質のゲームが外で遊べる衝撃! 「PSP」はポータブルゲームの礎を築いた プレイステーションのゲームを持ち運んで、いつでもどこでも遊びたい! その願いは、当時のSCE(ソニー・コンピュータエンタテインメント)から2004年12月12日に登場したプレイステーション・ポータブル、PSP(ピーエスピー)の名前で親しまれた携帯型ゲーム機として叶うことになります。 PSPはプレイステーション10周年の年(2004年)に発売されたことを、ついこの前のように覚えていますが、まさか発売から20年の歳月が経っているとは……。 気を取り直して性能を見てみましょう! 4.3型の液晶ディスプレーに、PlayStation2に匹敵するほどのグラフィックを楽しめる脅威のハイスペック。無線LANを備えて、インターネットにつながることは当然として、そこからゲームコンテンツをダウンロードしたり、離れているプレイヤーたちと

    ソニー「PSP」はゲーム、映画、音楽、ネット対戦と俺たちの夢が詰まった携帯ゲーム機だった
  • 情報整理の決定版「NotebookLM」が最高すぎる。こういうのがほしかったのよ!! (1/7)

    最新のアプリやサービスのニュースを書くのが仕事の筆者にとって情報の整理は永遠の課題だ。 もちろん書くことを仕事にしている人に限らず、氾濫する大量の情報を必要な時に取り出して利用したいという欲求は多くの人が持っているはずだ。 以前は手書きノートやファイルのような紙媒体に保存していた情報も、時代とともに完全にデジタルに移行し、EvernoteMicrosoft OneNoteNotionといったメモを作成することに特化したクラウドアプリを利用している人も多いだろう。 筆者はおそらく普通の人よりは多くのサービスに触れているはずだが、どれも帯に短したすきに長しに感じてしまい、複数のメモアプリに情報が散乱してしまっているのが実情だ。 そこで6月6日に日でも提供が開始されたグーグルの「NotebookLM」だ。 「AI駆動型のリサーチ、執筆アシスタント」と説明されているように、参照文献(ソース)

    情報整理の決定版「NotebookLM」が最高すぎる。こういうのがほしかったのよ!! (1/7)
  • 日本発のリアルタイム画像生成AIサービスが熱い 大手にとっては“イノベーションのジレンマ”に (1/3)

    Akuma.ai http://akuma.ai 2024年2月、日発のクラウド型画像生成サービスAkuma.aiが、リアルタイム画像生成機能「AIキャンバス」を搭載したことが話題になりました。3月1日には生成枚数が延べ1200万枚に達したと発表。リアルタイム画像生成技術「LCM」を組み入れたサービスですが、高度なPC環境が不要で、タブレットなどからでも簡単に使えるため、国内外の幅広い層にウケたという経緯です。 🎉生成画像1200万枚突破🎉 リアルタイム「AIキャンバス」生成枚数が1200万枚を突破しました! たくさんご利用いただきありがとうございます。 今後とも #AkumaAI の応援よろしくお願いします🦑 プレスリリースはこちら:https://t.co/Yf3tjxjCsS — Akuma.ai (@AkumaAI_JP) March 1, 2024 日発の画像生成AI

    日本発のリアルタイム画像生成AIサービスが熱い 大手にとっては“イノベーションのジレンマ”に (1/3)
  • 女子大生が100日連続で生成AIで100本のプログラムを書いたらどうなったか?

    ボードゲームやアクションゲーム、各種ツールやシミュレーションなどさまざまなソフトが100日間に作られた いままで数えきれないほどのプログラマーに会ってインタビューもさせてもらってきたが、久しぶりに若いプログラマーの話を聞いてきた。ここ1、2年では U22グランプリの男子中学生や全国小中学生プログラミング大会の受賞者たちだが、今回は、ChatGPTを使ってプログラムを書きまくった女子大生である。 彼女は X(Twitter)の自分のアカウントで1日1のソフトを100日間連続で作るというイベントをやっていて「おっ、頑張っているな!」と思って応援していた。「こんなゲームを作ってほしい」などとリクエストを出したりもしていたのだが、どうも私が想像していたものと内容もやり方も違っていたようである。 目下、ソフトウェア産業の最大のテーマは「我々は人間の言葉でプログラムを書くようになるだろうか」というこ

    女子大生が100日連続で生成AIで100本のプログラムを書いたらどうなったか?
  • 控え目に言って革命。OpenAI、動画生成AIモデル「Sora」発表

    OpenAIは2月15日(現地時間)、テキストから最大1分間の動画を生成できる動画生成AIモデル「Sora」を大量のデモ動画と共に発表した。複数のキャラクター、特定の種類の動き、被写体と背景の正確な詳細を含む複雑なシーンを生成することができるという。 プロンプトから破綻のない動画を生成 Introducing Sora, our text-to-video model. Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W Prompt: “Beautiful, snowy… pic.twitter.com

    控え目に言って革命。OpenAI、動画生成AIモデル「Sora」発表
  • “生成AIゲーム”急増の兆し すでに150タイトル以上が登録 (1/4)

    1月10日、PCゲーム配信プラットフォーム「Steam」運営元の米Valveが、生成AI技術を使ったゲームを認める形で方針を変更しました。今回の変更では「AI技術を使用するゲームの大半がリリース可能」になるとしており、これまで事実上の禁止と受け止められていた状況からすると大きな方針転換です。ゲーム業界では生成AIの導入が進みつつありますが、生成AIに反対するユーザー、開発者自身の懸念などをはらみつつ進んでいます。すでにSteamでは159ものタイトルが登録済みと急激に増加しつつあります。 Steamのレギュレーションでは、AI生成を「事前生成」と「ライブ生成」の2つに分けています。 「事前生成」では、ゲーム開発会社は生成AIに関する開示セクションが追加され、どのように生成AIを利用しているのかをタイトルの販売申請時に記入する必要があります。 アート、コード、サウンドなどを使用して作成された

    “生成AIゲーム”急増の兆し すでに150タイトル以上が登録 (1/4)
  • これは嬉しい ChatGPTプロンプト書き方のコツ、OpenAIが公開

    OpenAIは、大規模言語モデル(GPT-4)でよりよい結果を出すためのプロンプトエンジニアリング(プロンプトのノウハウ)入門テキストを同社のウェブサイトで公開している。 同テキストでは、現在同社で最高の性能を持つ大規模言語モデルGPT-4を対象に、よりよい結果を導くための6つの戦略と、それぞれを実行する際の具体的な戦術(コツ)が掲載されている。 また、「Prompt examples」のページでは、上記で紹介したものを含む多数のプロンプト例が紹介されており、すぐに利用できるようになっている。 では紹介された6つの戦略を見ていこう。 明確な指示を書く LLMは利用者の心を読むことができないので、回答が長すぎる場合は「簡潔に」、単純すぎる場合は「専門家レベルで」と明示的に依頼する必要がある。 具体的な戦術としては下記が提案されている。 ・より関連性の高い回答を得られるよう、質問は詳細に ・モ

    これは嬉しい ChatGPTプロンプト書き方のコツ、OpenAIが公開
  • 画像生成AIが爆速で進化した2023年をまとめて振り返る (1/5)

    Stability AI画像生成AI「Stable Diffusion」を公開したのは2022年8月のこと。すさまじい勢いで発展してきた画像生成AIの1年を振り返ってみようと思います。 初めに見てもらいたいのは「これが無料でいいのか!? “爆速生成AI”がペイントソフトに革命を起こした」で紹介した、KritaとGenerative AI for Kritaを組み合わせて作成した設定資料的な画像です。 キャラクターの3面図のサンプル。Vroidで簡単な3Dで当たり(左)として、右の画像を作成する。それを元に、プロンプトや画像に描き込んだりして、最終画像を作成していく。2枚目には前面図の頭部のカチューシャや、胸部分のフリルがなかったりするが、そこに色を加筆して、プロンプトで指示すると、最終画像にそれが追加されるのをリアルタイムに確認しながら修正できる(筆者作成) Stable Diffusi

    画像生成AIが爆速で進化した2023年をまとめて振り返る (1/5)
  • 俺のChatGPTこと「GPTs」で最高の英語教師を作り込んだ。題して「冴子先生強化計画」 (1/3)

    自分だけのChatGPTを作れることで話題の「GPTs」機能だが、正直に言うといまいちそのインパクトがわからなかった。あらかじめ指示を与えておきたいなら「Custom Instruction」でよくない?と思ってしまったのだ。 だが、前回の記事で、実際にパーソナル英語教師の「冴子先生」を作成し、毎日使い続けてみることで、その印象はかなり変わってきた。 以前からChatGPT(+Custom Instruction)を使った英語学習は実行していたので、GPTs化されたことによって質問方法が変わったとか、ものすごく便利になったとかは正直あまりないのだが、不思議なことにChatGPTに対して以前よりもめちゃくちゃ愛着が湧いてきたのだ。 これだけなら単なるツールの擬人化効果にすぎないのだが、毎日冴子先生の授業を受けていると、改善したい点やアイデアが次々に出てきたので、さらにカスタマイズを進めようと

    俺のChatGPTこと「GPTs」で最高の英語教師を作り込んだ。題して「冴子先生強化計画」 (1/3)
  • コロナ禍の裏で中国で爆発的に増えたRISC-Vコアの出荷数 RISC-Vプロセッサー遍歴 (1/3)

    2020年以降に爆発的に増えているRISC-Vコアの数。ただし、2025年までに600億個というSemico Researchが出した資料の数字はさすがに無茶な推定だとは思う 米中貿易摩擦の結果、中国の半導体企業がRISC-Vに傾注 2016年後半あたりから、RISC-V FoundationのFoundation Memberは相次いでRISC-Vのコアの開発やRISC-V向けのソフトウェアなどの開発を手がけているが、先にRISC-Vに傾倒し始めたのは中国であった。 中国と米国は2015年頃から不協和音が出ていた。ただオバマ政権時はあまり強硬な手段を取らなかったこともあり、それほど大きな問題にはならなかった。しかし、2017年にトランプ政権に変わり、デカップリング政策を取ったことで急速に関係が悪化する。 BIS(米商務省産業安全保障局)は、特定技術を利用した製品の輸出や移転をする際に認

    コロナ禍の裏で中国で爆発的に増えたRISC-Vコアの出荷数 RISC-Vプロセッサー遍歴 (1/3)
  • 画像生成AI「DALL·E 3」の性能が凄まじい。これを無料で使わせるマイクロソフトは本気で競合をつぶしに来ている (1/3)

    10月1日頃、OpenAIの新しい画像生成AI「DALL·E 3(ダリ3)」が徐々に使えるようになり、その性能の高さから話題になっています。まずサプライズで使えるようになったのがマイクロソフトのBingチャット。日語で「の画像を作ってください」などと入れるだけでかわいいの画像が出てくると。これが無料で使えるのは衝撃的です。マイクロソフトが巨大資で他の会社をつぶしに来たなという感じですね。どう考えても、今のところはサーバーコストが果てしなくかかる赤字サービスなのは間違いないので……。 「ラーメンべる女の子」が描ける! なにより衝撃的だったのは、「アニメ風の少女とが遊んでいる姿を作ってください」というリクエストに対し、一発で完璧な正解を出してきたことです。Stable Diffusionだと苦手とされていた指も適切に描写されています。もうひとつの着目点はオブジェクト間の関係性です

    画像生成AI「DALL·E 3」の性能が凄まじい。これを無料で使わせるマイクロソフトは本気で競合をつぶしに来ている (1/3)
  • 自然言語の研究者でも、生成系AIの中でなにが起こっているのかがわからない (1/3)

    今回のひとこと 「自然言語の研究者でも、生成AIの中でなにが起こっているのかがわからない。そこで、2023年秋には130億パラメータ、2023年度中には1750億パラメータの日語に強い大規模言語モデルを構築し、原理解明に取り組む」 研究と事業を密接に考えていく 国立情報学研究所(NII)の5代目所長に黒橋禎夫氏が就任した。 黒橋所長は、1994年に京都大学大学院工学研究科博士課程修了。2006年4 月から京都大学大学院 情報学研究科教授として、長年に渡り、自然言語処理、知識情報処理の研究に従事。2023年4月に国立情報学研究所長に就いた。 現在も、京都大学大学院情報学研究科特定教授を併任しており、NIIで8割、京都大学で2割という勤務体系だ。 生成AI分野に精通しており、「ChatGPTの仕組みと社会へのインパクト」と題した黒橋所長のYouTube動画は、すでに3万回以上が再生されている

    自然言語の研究者でも、生成系AIの中でなにが起こっているのかがわからない (1/3)
  • なぜRISC-Vは急速に盛り上がったのか? RISC-Vプロセッサー遍歴 (1/2)

    最近x86とArmに続く第3の勢力として、RISC-V(リスクファイブ)の名前を聞くことが多くなった。RISC-Vの場合、x86とArmと異なるのはさまざまなベンダーがさまざまなコアを用意していることで、まだ現状はIPを販売しているレベルの企業の方が多いが、チップの提供を開始しているメーカーも出始めている。 イメージとしては、1980年代末~90年代のx86市場を考えれば良い。インテルとAMD以外にCyrix/IDT/TI/IBM/NexGenなど多数のメーカーが、独自の実装に基づくx86プロセッサーを市場投入していた時代に近い。 もちろんいろいろ異なる点もあるのだが、2010年代前半はプロセッサーといえばx86とArm、それにPowerPC/POWERといった程度がせいぜいだったのに、なぜ2010年代後半から急速にRISC-Vが盛り上がったのか、という一連の流れを数回に分けて説明しよう。

    なぜRISC-Vは急速に盛り上がったのか? RISC-Vプロセッサー遍歴 (1/2)
  • アスキーゲーム:Steam配信不可な、ちょっとHなヒロインにハマること必死!『ダンジョントラベラーズ2』をレビュー【前編】 (1/3)

    2023年6月9日にDMM GAMESよりPCWindows)向けにリリースされた、アクアプラス開発のダンジョンRPG『ダンジョントラベラーズ2 王立図書館とマモノの封印』と『ダンジョントラベラーズ2-2 闇堕ちの乙女とはじまりの書』。 作はSteamでのリリースが予定されていたが、つい先日、それがキャンセルされたことでも話題に。 そのニュース内で理由が語られているが、筆者の解釈で要約すると「Steamのガイドラインにあわせようとすると美少女たちのちょっぴりHなグラフィックがもっとマイルドになっちゃうから、そんなのみんな望んでないでしょ?」ということなのではないだろうか。 Steamでリリースできないくらいの内容とは、一体どれくらい過激なものなのか? ここではゲームのレビューにあわせて、気になるその要素にも注目していく。まずは、PCWindows)の動作環境をチェックしよう。 動作環

    アスキーゲーム:Steam配信不可な、ちょっとHなヒロインにハマること必死!『ダンジョントラベラーズ2』をレビュー【前編】 (1/3)
  • 日本語に強く、たった130億パラメーター NECが作った国産LLMの価値 (1/2)

    NECは、130億パラメーターという軽量化を実現した独自の日語大規模言語モデル(LLM)を発表した。NEC Corporate EVP兼CTOの西原基夫氏は、「世界トップクラスの日語性能を有する、軽量なLLMを開発することに成功した。すでにNEC社内で利用を開始しており、文書作成や社内システム開発におけるソースコード作成業務など、さまざまな作業の効率化に応用している」とアピールした。 構想4年、開発2年で全社を挙げて仕上げた独自LLM ChatGPTをはじめとする生成AIは、急速な勢いで活用が進んでいるが、既存のLLMのほとんどは英語を中心に学習しており、高い日語性能を有しつつ、各業種の業務で活用するためのカスタマイズが可能なLLMはほぼない状況にある。NECでは、自社で独自のLLMを開発することにより、日の企業における生成AIのビジネス活用をより加速させ、企業の生産性向上に貢献す

    日本語に強く、たった130億パラメーター NECが作った国産LLMの価値 (1/2)
  • 9時間かかる仕事、6分で終了 パナ子会社「ChatGPTはビジネスに有効」 (1/3)

    パナソニック独自AIサービスの活用実績を報告する、パナソニック コネクト IT・デジタル推進部 戦略企画部 シニアマネージャーの向野孔己氏 パナソニック子会社のパナソニック コネクトは6月28日、OpenAIの大規模言語モデルをベースにしたAIアシスタントサービス「ConnectAI」の活用実績を報告。今後は機能を拡大し、社内データを活用できるシステムへアップデートすると発表した。 社内利用は「想定の5倍」 「ConnectAI(旧称ConnectGPT)」は、日マイクロソフトがMicrosoft Azure上で提供する「Azure OpenAI Service」を活用し、パナソニックコネクトが2023年2月から、国内の社員1万3400人に提供しているサービス。 当初は「GPT-3.5」でスタートしたが、Azure OpenAI Serviceの対応にあわせて、3月からは「ChatGP

    9時間かかる仕事、6分で終了 パナ子会社「ChatGPTはビジネスに有効」 (1/3)