ブックマーク / ascii.jp (25)

  • AI、ついにパソコンを使えるようになってしまう Anthropic「Claude 3.5 Sonnet」新機能

    AI企業のAnthropicは10月23日、大規模言語モデル「Claude 3.5 Sonnet」の刷新と、新モデル「Claude 3.5 Haiku」の導入を発表した。Claude 3.5 Sonnetには、AIモデルが人間のようにコンピューターを操作できるようになる新機能「コンピューター使用」が追加された。 アップデート版のClaude 3.5 Sonnetは、特にコーディング分野で大きく性能を伸ばし、業界ベンチマークで広範囲にわたる改善を示した。SWE-benchの検証済みタスクでは、前バージョンの33.4%から49.0%へと性能が向上し、他のすべての公開モデルを上回る結果となった。 新たに導入されるClaude 3.5 Haikuは、前世代の最大モデルであるClaude 3 Opusと同等の性能を持ちながら、コストと速度は前世代のHaikuと同等を維持している。特にコーディングタス

    AI、ついにパソコンを使えるようになってしまう Anthropic「Claude 3.5 Sonnet」新機能
    htamaaki
    htamaaki 2024/10/23
  • なんと1km届く! HaLow対応のWi-Fiモジュール「T-Halow」が予約受付中

    1km程度の長距離通信が可能な、LILYGOブランドのWi-Fiモジュール「T-Halow」がShigezoneにサンプル入荷。10月中旬頃の販売開始を予定しており、現在は4900円で予約を受け付けている。 日国内では2022年9月の電波法改正により利用可能になった、Wi-Fi HaLow(IEEE802.11ah)に対応した特殊なWi-Fiモジュール。Arduino IDEなどの開発環境が必要なため簡単に使用できるものではないが、一般的なWi-Fiより大幅に距離の長い1km程度の通信が可能という。 Wi-Fi HaLowは920MHz帯を利用するIoT向けのWi-Fi規格で、長距離の通信が可能な反面、Duty比10%制限、稼働時間が1時間あたり累計360秒までなどの制約があり、大容量通信には使用できない。あくまでセンサーの計測数値や連続しない広範囲監視映像の送受信などを想定した規格だ。

    なんと1km届く! HaLow対応のWi-Fiモジュール「T-Halow」が予約受付中
    htamaaki
    htamaaki 2024/10/06
  • iPhoneのブラウザー、魔法みたいに広告が消せるように

    まあ、魔法つっても普通に新機能なんですけどね。 iOS 18の新しい「Safari」では、「ちょっとこの広告、記事読むのにおジャマね」と思ったら、その広告を非表示にできる機能が標準搭載されるんです。しかも、ただ非表示にするだけじゃないんです。なんと、消える瞬間、魔法にかかったように霧散するというエフェクトが付いていて、当に魔法みたいな機能なんですよ。 実は消せるのは広告だけじゃなくて、しつこく表示されるクッキーのポップアップだったり、なんなら記事中の図版や文字ブロックもきれいさっぱり消し去ることができるので、別に広告が気になるわけでもないのに色々消しているのがただ気持ちいい!みたいな機能でもあります。実装されたら、ぜひ遊んでみてください。 ※アップルの最新OSのパブリックベータ版の画面は一般に公開することが禁じられていますが、稿では特別に取材許可を得たうえで掲載しています。 新しい「S

    iPhoneのブラウザー、魔法みたいに広告が消せるように
    htamaaki
    htamaaki 2024/08/10
  • なぜ『ガールズバンドクライ』は貧乏になった日本で怒り続ける女の子が主人公なのか?――平山理志Pに聞く (1/4)

    2024年の春アニメは大物作品が勢ぞろいする激戦区だった。そのなかにあって独自技術の3DCGかつ、重苦しい展開から逃げない『ガールズバンドクライ』がまさかの人気を獲得した理由は? 東映アニメーションの平山理志プロデューサーにたっぷり語っていただいた ©東映アニメーション 〈後編はこちら〉 暗い時代を生きる人々に寄り添うのは「地に足のついた」物語だ 人気作が並んだ2024年春番組で大きな話題となったオリジナル作品が『ガールズバンドクライ』だ。手がけたのは平山理志プロデューサー。2019年に東映アニメーションに入社した平山氏は、『ラブライブ!』シリーズを共に作ってきた監督・演出家の酒井和男氏にシリーズディレクターを、そして花田十輝氏に脚を依頼。新たなオリジナル作品を作り始めた。 コンセプトは「音楽もの×今の時代を反映した物語」。生きていくのが大変な時代にマッチする主人公と物語を数年かけて探っ

    なぜ『ガールズバンドクライ』は貧乏になった日本で怒り続ける女の子が主人公なのか?――平山理志Pに聞く (1/4)
    htamaaki
    htamaaki 2024/08/04
  • AI動画の品質が仕事に使えるレベルになってきた (1/4)

    Luma AIが6月12日に公開した動画生成AIサービス「Dream Machine」が、月に無料で30回まで試せることもあって、大きな話題となっています(「ついに来た! 無料で試せる動画生成AI『Luma Dream Machine』」参照)。ただ、技術情報は出ておらず、どういう関係や経緯で出しているかは一切不明です。 ※記事の配信先によっては動画や図版がうまく表示されないことがあります。その場合はASCII.jp掲載の記事をご覧ください 手軽に高品質な動画が生成できる「Luma AI」のサービス Luma AIはこの連載でも何回か紹介してきたように、大量の写真から3Dモデルを生成するサービスからスタートし、昨年12月には3Dモデル生成サービス「Genie」で参入しているAIスタートアップ企業です(連載第41回「3Dスキャンの進化がすごい」参照)。生成AIの3D化技術で先行していることか

    AI動画の品質が仕事に使えるレベルになってきた (1/4)
    htamaaki
    htamaaki 2024/07/01
  • 「1億台の常時接続」を実現せよ! Nintendo Switchのプッシュ通知システム全面刷新の裏側 (1/3)

    アマゾン ウェブ サービス ジャパンは、2024年6月20日と21日、国内最大の年次イベントである「AWS Summit Japan」をハイブリッドで開催。150を超えるセッションが展開された。 記事では、ニンテンドーシステムズによるセッション「Nintendo Switch向けプッシュ通知システムのリプレイス事例」をレポートする。登壇したのは、同社 システム開発部の林愛美氏と坂東聖博氏だ。 2017年のNintendo Switchの発売とあわせてリリースされた「プッシュ通知システム」。同社は、長期運用を見据えて、よりクラウドネイティブなシステムへのリプレイスを決定するが、大量のTCP接続を維持するための様々な課題が立ちふさがった。 セッションでは、AWS FargateやNetwork Load Balancer(NLB)といったAWSのマネージドサービスを用いた、“最大1億台”級

    「1億台の常時接続」を実現せよ! Nintendo Switchのプッシュ通知システム全面刷新の裏側 (1/3)
    htamaaki
    htamaaki 2024/06/27
  • 画像生成AIに照明革命 日本と世界で同時に“神ツール”登場 (1/3)

    この連載ではおなじみのキャラクター「明日来子さん」に右側からライトを当ててみた。左がIC-Lightを適用したもので、右がオリジナル。環境はWebUI Forge用の拡張機能を使用 5月8日に、「ControlNet」など画像生成AI関連の著名研究者であるイリヤスフィール(lllyasviel)さんが発表した「ICライト(Imposing Consistent Light、印象的な一貫的なライト)」が盛り上がりました。入力した画像をもとに、後から指定した照明効果を踏まえた画像を生成する技術です。 画像生成AIで照明効果がつけられる「ICライト(IC-Light)」 発表された学習済みモデルは、「ライトを指定すると、キャラクターのデータに合わせてテキストのプロンプトに合わせて独自に背景を生成するもの」「キャラクターとライトの影響を加味して、別の背景画像と合成するもの」の2種類があります。これ

    画像生成AIに照明革命 日本と世界で同時に“神ツール”登場 (1/3)
    htamaaki
    htamaaki 2024/05/27
  • しまむら、AIモデル「るな」起用 20歳の服飾専門学生(という設定)

    sponsored 今ならサマーキャンペーン(2024年9月9日まで)で最大2万7920円もお得になる! Zen 5版Ryzenで新機種が激増!! サイコムの9950X/9900X/9700X/9600X搭載BTO PCに刮目せよ sponsored 攻撃アクションの調整や新機能を追加して、より豪快かつポップなアクションが楽しめる! よりキュートで爽快に!『ロリポップチェーンソー RePOP』のファーストインプレションをお届け sponsored 猛暑の後にやってくる秋にはランニングを始めよう! 北海道マラソンにも協賛するファーウェイの人気スマートウォッチ「HUAWEI WATCH GT 4」で運動の秋に備える! sponsored Fractal Design「Pop XL Silet Black Solid」を採用 実は最近だとレア? 吸音材採用ケースで静音に特化したゲーミングPCのコ

    しまむら、AIモデル「るな」起用 20歳の服飾専門学生(という設定)
    htamaaki
    htamaaki 2024/05/21
  • Macで始める画像生成AI 「Stable Diffusion」ComfyUIの使い方 (1/5)

    突然だが、上記はこの連載の第2回の冒頭部分だ。連載をはじめた当初は右も左もわからない状態だったので「Stable DiffusionはMacでは使えない」と断言してしまった。思い出すたびに冷や汗が出る。 とはいえご存知の通りStable Diffusionを動かすのにNVIDIAビデオカード搭載のWindows機が向いているのは事実なので、これまではすべて新規購入したゲーミングPCで作業することになんの不満も感じていない。 だが、前回紹介したStable DiffusionのUI環境のインストールや更新がワンクリックで可能になる「Stability Matrix」を使えば、PythonやPipのバージョンといった難しいことを考えなくてもMac画像生成環境を作れるのではないかと考えた。 お詫びから7ヵ月、ずいぶん遅くなったがようやく伏線回収である。 Stability MatrixでM1

    Macで始める画像生成AI 「Stable Diffusion」ComfyUIの使い方 (1/5)
    htamaaki
    htamaaki 2024/03/27
  • 画像生成AIで同じキャラクターが簡単に作れるようになってきた (1/3)

    画像生成AIサービスの「Midjourney」に3月12日、新機能「Creative Reference」が追加。1枚の画像から特徴を引き継いだ画像を生成できるようになり、同じキャラクターに別のポーズをとらせるなど様々な画像を作れるようになりました。これまで画像生成AI「Stable Diffusion」などで同じキャラクターの画像を作るには「LoRA」という追加学習をするのが一般的でしたが、それが必要ないため、キャラクターの再現が劇的に簡単になってきました。 画像1枚で“似た顔” Midjourneyの新機能「Creative Reference」 使い方は、MidjourneyのDiscordに画像をアップロードして、「Creative reference」のタグ(cref)をつけてプロンプトを入力するだけ。CW 0〜100までのパラメーターがあり、0だと顔だけが共通になり、あとは数字

    画像生成AIで同じキャラクターが簡単に作れるようになってきた (1/3)
    htamaaki
    htamaaki 2024/03/25
  • ChatGPTのライバル「Claude 3」の使い方 良い点、悪い点まとめ (1/5)

    3月4日の公開以来、「Claudeやばくない?」「GPT-4を越えた」と、界隈で話題の「Claude 3」は、OpenAIの元メンバーによって設立されたAIベンチャー「Anthropic」が開発する最新の大規模言語モデル(LLM)だ。今回はChatGPTのライバルClaude 3の有料版を2週間ほどヘビーに使ってみて感じたことを、良い点と悪い点どちらも書いていきたいと思う。 Claude 3とは? 既報の通り、Claude 3はAnthropicが開発する大規模言語モデルの名称だ。 パラメーターのサイズなどが異なる3つのモデルがラインアップされている。 「Claude 3 Opus」は最も知能が高く、複雑なタスクでも最高のパフォーマンスを発揮する強力なモデル。APIやデータベースを介した複雑なアクションの計画や実行、インタラクティブコーディングなどの高度な活用が想定されている。 「Clau

    ChatGPTのライバル「Claude 3」の使い方 良い点、悪い点まとめ (1/5)
    htamaaki
    htamaaki 2024/03/23
  • 日本発のリアルタイム画像生成AIサービスが熱い 大手にとっては“イノベーションのジレンマ”に (1/3)

    Akuma.ai http://akuma.ai 2024年2月、日発のクラウド型画像生成サービスAkuma.aiが、リアルタイム画像生成機能「AIキャンバス」を搭載したことが話題になりました。3月1日には生成枚数が延べ1200万枚に達したと発表。リアルタイム画像生成技術「LCM」を組み入れたサービスですが、高度なPC環境が不要で、タブレットなどからでも簡単に使えるため、国内外の幅広い層にウケたという経緯です。 🎉生成画像1200万枚突破🎉 リアルタイム「AIキャンバス」生成枚数が1200万枚を突破しました! たくさんご利用いただきありがとうございます。 今後とも #AkumaAI の応援よろしくお願いします🦑 プレスリリースはこちら:https://t.co/Yf3tjxjCsS — Akuma.ai (@AkumaAI_JP) March 1, 2024 日発の画像生成AI

    日本発のリアルタイム画像生成AIサービスが熱い 大手にとっては“イノベーションのジレンマ”に (1/3)
    htamaaki
    htamaaki 2024/03/18
  • 「ExcelでChatGPTを再現するシート」が想像以上に素晴らしかった (1/4)

    先日サイトで「めちゃくちゃ重いけど動くぞ!Excelで『GPT-2』を再現したスプレッドシート」というニュースを執筆したのだが、実際に触ってみたところ想像以上に素晴らしかったのでレポートする。 「Spreadsheets-are-all-you-need」とは 記事で紹介した「Spreadsheets are all you need」とは、Excelの標準的なスプレッドシート機能を使ってGPT2(ChatGPTの先祖)のフォワードパス(入力から出力までのプロセス)をExcelの中で完全に実装したものだ。 と言ってももちろんExcel内で「ChatGPT」的な会話ができるわけではない。ChatGPTの心臓である大規模言語モデル(LLM)のごくごく基的な機能をシミュレートできるだけだ。 シートの説明文には「開発者でない人でも物のLLMが内部でどのように機能しているのかを、最小限の抽象

    「ExcelでChatGPTを再現するシート」が想像以上に素晴らしかった (1/4)
    htamaaki
    htamaaki 2024/03/09
  • 控え目に言って革命。OpenAI、動画生成AIモデル「Sora」発表

    OpenAIは2月15日(現地時間)、テキストから最大1分間の動画を生成できる動画生成AIモデル「Sora」を大量のデモ動画と共に発表した。複数のキャラクター、特定の種類の動き、被写体と背景の正確な詳細を含む複雑なシーンを生成することができるという。 プロンプトから破綻のない動画を生成 Introducing Sora, our text-to-video model. Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W Prompt: “Beautiful, snowy… pic.twitter.com

    控え目に言って革命。OpenAI、動画生成AIモデル「Sora」発表
    htamaaki
    htamaaki 2024/02/17
  • “世界生成AI”到来か 画像生成AIのゲームエンジン化が進む (1/5)

    Midjourneyの生成画像。12月のアップデートv6では、写真と変わらないような画像が生成されることが話題となっている。この画像のような世界を動き回れるようになるのだろうか(筆者作成) 画像生成AIサービス「Midjourney」のオフィスアワーがあったのが1月4日。アメリカ時間で1月3日ですかね。オフィスアワーというのは、MidjourneyがDiscord上で月に1回開いて、いろいろユーザー向けに今後どのようにサービスが展開されるのかを説明するミーティングです。その会合に参加していたNick St. Pierreさんの報告によると、Midjourneyのデイヴィッド・ホルツCEOが「2024年末までにホロデッキに到達できる」と話したと言うんですね。「2024 年末までには、リアルタイムのオープンワールドが実現できればと思っています」とも言い、画像生成AIが、単にイラストといった画

    “世界生成AI”到来か 画像生成AIのゲームエンジン化が進む (1/5)
    htamaaki
    htamaaki 2024/01/22
  • これは嬉しい ChatGPTプロンプト書き方のコツ、OpenAIが公開

    OpenAIは、大規模言語モデル(GPT-4)でよりよい結果を出すためのプロンプトエンジニアリング(プロンプトのノウハウ)入門テキストを同社のウェブサイトで公開している。 同テキストでは、現在同社で最高の性能を持つ大規模言語モデルGPT-4を対象に、よりよい結果を導くための6つの戦略と、それぞれを実行する際の具体的な戦術(コツ)が掲載されている。 また、「Prompt examples」のページでは、上記で紹介したものを含む多数のプロンプト例が紹介されており、すぐに利用できるようになっている。 では紹介された6つの戦略を見ていこう。 明確な指示を書く LLMは利用者の心を読むことができないので、回答が長すぎる場合は「簡潔に」、単純すぎる場合は「専門家レベルで」と明示的に依頼する必要がある。 具体的な戦術としては下記が提案されている。 ・より関連性の高い回答を得られるよう、質問は詳細に ・モ

    これは嬉しい ChatGPTプロンプト書き方のコツ、OpenAIが公開
    htamaaki
    htamaaki 2023/12/18
  • これが無料でいいのか!? “爆速生成AI”がペイントソフトに革命を起こした (1/5)

    Generative AI for Kritaのライブペインティング機能を実行している画面。左が筆者が描いた落書き。右が、その画像を線画(Scribble)としてAI生成した画像 11月13日掲載の記事「爆速化する画像生成AI」で紹介した新技術「Latent Consistency Models(LCM)」が大爆発しています。これは画像生成AIに2度目の革命を起こした「ControlNet」に次ぐ大インパクトではないかと感じています。「LCM-LoRA」(LoRAはStable Diffusion用の追加学習モデル)が11月下旬に登場したことで、リアルタイム生成のAI機能を組み入れたサービスやアプリの開発が一気に進みました。 なかでも、筆者にとってインパクトが大きかったのが、ペイントソフト「Krita」向けに開発された「Generative AI for Krita」。Kritaはスウェー

    これが無料でいいのか!? “爆速生成AI”がペイントソフトに革命を起こした (1/5)
    htamaaki
    htamaaki 2023/12/04
  • 伊藤園「おーいお茶」CMに生成したAIタレントを起用

    伊藤園が「お~いお茶 カテキン緑茶」のテレビCMにAIタレントを起用した。AIタレント事業を手がける企業AI modelが、自社のAIタレントが採用されたことを10月3日に公表した。 CMに登場するAIタレントの名称は明らかにされていない。CMはテレビのほか、伊藤園の公式YouTubeチャンネルでも公開されており、物の人間と見分けがつかないレベルの仕上がりだ。 AI modelによると、AIタレントが登場するテレビCMは日初になるという。 同社は発表に際して「AI技術で生成したAI model(AIモデル)を活用して、モデル撮影の創造性や表現の豊かさを広げて、そこから得られる新しい価値などを提供していくことで、広告やファッションなど様々な業界の発展に貢献していきます」と述べている。 「お~いお茶 カテキン緑茶」シリーズは伊藤園が9月4日より販売を開始した製品。同シリーズはテレビCM以外

    伊藤園「おーいお茶」CMに生成したAIタレントを起用
    htamaaki
    htamaaki 2023/10/15
    このレベルの広告ならもうこれでいいよって感じ
  • アニメの常識、画像生成AIが変える可能性「AnimateDiff」のすごい進化 (1/3)

    原画と原画の間にあたる画像を複数枚入れることで、自然な連続性のある動きを作る。アニメの基となる「中割」作業を画像生成AIが実現する可能性が出てきました。鍵になっているのは「AnimateDiff」という技術。8月に入って、様々なユーザーのアップデートによって機能拡張が進められています。それは完全な画像生成AIで作られるアニメの可能性を垣間見せるほどのものです。 16コマ/2秒の短い動画が生成できる AnimateDiffは7月10日に発表された、上海AIラボ、香港中文大学、スタンフォード大学の共同研究による技術画像生成AI「Stable Diffusion」の仕組みとデータセットを利用しつつ、数百万の動画を学習させた「モーションモジュール」と呼ばれるデータセットを別途に参照させることで、連続するキャラクターの動きを生成可能にするというのが基原理です。生成できる時間は、16コマ/2秒

    アニメの常識、画像生成AIが変える可能性「AnimateDiff」のすごい進化 (1/3)
    htamaaki
    htamaaki 2023/09/12
  • ChatGPTをめちゃくちゃ便利にする“プラグイン”の使い方「こんな情報を探して!」編 (1/3)

    プラグインの基を知ろう ChatGPTの有料サブスクライブプラン「ChatGPT Plus」には、ChatGPTの機能を拡張するためのツール「プラグイン(Plugin)」が多数用意されている。プラグインを導入することで最新情報にアクセスしたり、サードパーティーのサービスを利用できるようになる。プラグインの導入方法については前回の記事を参照してほしい。 注:記事はすべて筆者がChatGPT Plusでプロンプトを実行・検証している。 「結果はこちら(クリックで拡大表示)」のリンクをクリックすることで、すべてのプロンプトと生成されたChatGPTの回答を見ることができる。 なお、記事内で触れられていない質問や頓珍漢な回答も含まれているが、これはChatGPTとのリアルな対話記録であるため、その点をお楽しみいただければと思う。 知識ベース情報を取得できるプラグイン その1 前回はChatGP

    ChatGPTをめちゃくちゃ便利にする“プラグイン”の使い方「こんな情報を探して!」編 (1/3)
    htamaaki
    htamaaki 2023/09/09