並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 90件

新着順 人気順

開発者向けの検索結果1 - 40 件 / 90件

  • Cursorが市場を席巻している理由をちょっと考えてみる - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? はじめに どうも。鳩胸になりたい文鳥です。 Cusorが市場を席巻している ブッチギリでの世界最速ARR $100Mに加えて先日時価総額が1兆円を超えたそうです。間違いなく売れているし今後の成長を期待される企業であるのは間違いないでしょう。 Cursorはソフトウェアエンジニア向けにAI機能を搭載したソースコード編集ソフトを提供している会社です。 上記のブログに記載したがCursorは 12人の社員 Microsoft製のVisual Studio Codeをフォークして作ったラッパーアプリ AIのモデルは開発せず、ChatGPTやCl

      Cursorが市場を席巻している理由をちょっと考えてみる - Qiita
    • ChatGPT『GPT-4o』の画像生成が大幅アップデート!新機能を徹底解説|ChatGPT研究所

      日本時間2025年3月26日、OpenAIはChatGPTの基盤モデル「GPT-4o」に、ネイティブな画像生成機能を統合し、一般提供を開始しました。 今回のアップデートは単なる画像生成機能の追加ではなく、言語モデルの中核的な機能として画像生成を位置づける、非常に重要なアップデートです。特にテキストのレンダリング精度や複雑な指示への対応力が飛躍的に向上し、従来難しかった実用的な表現が可能となりました。 AIによるクリエイティブな画像生成が新たな段階に進んだことを実感できる、画期的な進化を遂げています。 最新の画像生成機能で生成 GPT-4oによるネイティブ画像生成機能の詳細今回のアップデートで最も大きな特徴は、画像生成能力がGPT-4oモデル自体にネイティブに組み込まれた点です。テキストと画像の連携がよりスムーズになり、以下の機能向上が実現しています。 特徴: 高精度なテキストレンダリング:

        ChatGPT『GPT-4o』の画像生成が大幅アップデート!新機能を徹底解説|ChatGPT研究所
      • macOS用エディタを引き継いで十年。CotEditor開発者を突き動かす“過激派”なMac哲学【フォーカス】 レバテックラボ(レバテックLAB)

        TOPフォーカスmacOS用エディタを引き継いで十年。CotEditor開発者を突き動かす“過激派”なMac哲学【フォーカス】 macOS用テキストエディタ「CotEditor」開発者 1024jp 趣味でmacOSアプリ開発者兼デザイナーとして活動している。「CotEditor」においては2014年からコア開発者を務める。本業はソフトウェアエンジニアではなく、工学系の企業研究員。オリジナルアプリに、SVGビューワ「Gapplin」や映像プレーヤー「Qli」など。技術コミュニティ「macOS native」も主催する。ピーナッツバターが好物で、来世は自らピーナッツバターになることを願っている。 X:@1024jp GitHub:https://github.com/1024jp CotEditor公式サイト 「CotEditor」という、macOS向けのプレーンテキストエディタがあります。

          macOS用エディタを引き継いで十年。CotEditor開発者を突き動かす“過激派”なMac哲学【フォーカス】 レバテックラボ(レバテックLAB)
        • LLM x Slack x Notion で論文インプットを効率化し、社内ナレッジ蓄積もできるようにした話

          はじめに 株式会社 neoAI の大坂洋豊です。東京大学に在学中で、松尾・岩澤研究室に所属しています。AI ソリューション事業部として、プロジェクトマネジメントを行いながら、研究開発組織 neoAI Research として先端技術の実践に取り組んでいます。 今回は、弊社の Slack 上で論文のインプットを効率化するために開発した LLM Bot についてご紹介します。開発したのは2023年で、当時は NotebookLM のようなサービスがまだ存在しなかったため、社内では論文の概要をスピーディーに把握できる点で重宝されていました。また、その要約結果を社内のデータベースに蓄積できるという機能もあるため、弊社のナレッジ基盤を支えている存在でもあります。 AI ソリューション事業部についてはこちらを参照ください。 背景と課題 論文を読む文化の重要性 AI ソリューション事業部では、常に最新の

            LLM x Slack x Notion で論文インプットを効率化し、社内ナレッジ蓄積もできるようにした話
          • 🚀 Figma MCP × Cursorで加速するUI実装とその先の工夫

            はじめに 近年、プロダクト開発の現場では「Design to Code」という概念が大きな注目を集めています。 これは、デザインツールで作成されたUIデザインを直接コードに変換する技術のことで、開発効率の大幅な向上が期待されています。 この流れの中で、Figma社は、Dev Mode(開発者向けの表示モード)やCode Connect(コードとデザインの同期機能)といった機能をリリースしてきました。 このような背景の中、つい最近では「Figma MCP」が話題となりました。 私たちのチームでは、このFigma MCPとAI搭載コードエディタ「Cursor」を組み合わせることで、実際のプロダクト開発に挑戦してみました! 本記事では、その導入過程で得られた知見、そして実際の運用における工夫について紹介します。 🤖 Figma MCPとは Figma MCPについては、こちらの記事が非常にわか

              🚀 Figma MCP × Cursorで加速するUI実装とその先の工夫
            • OSS活動してたらRuffの会社で働くことになった話

              TL;DR Pythonの型チェッカーを一人で作っていたらそれが仕事になりました。 私は(大学院生として物理学を専攻する傍ら)以前よりプログラミング言語やその周辺ツールのデザイン・実装に興味があり、趣味で開発したプロジェクトをOSSで公開するなどしていました。 ErgはPython APIと互換性を持つトランスパイル型の静的型付け言語で、pylyzerはこれの型検査器を流用したPython向け型チェッカーです。 ありがたいことに両方とも結構反響を受けて、公開から数年経っても未だにissueなど報告をいただいております。これはもう少し大きな話にできるのではないかと考え、Ergの開発の方で2023年度の未踏IT人材発掘・育成事業に応募し、運よく採択され、スーパークリエータにまで認定していただきました。 これだけでもかなりの僥倖ですが、それだけではなく、今年の3月からcontract softw

                OSS活動してたらRuffの会社で働くことになった話
              • 「Nintendo Switch 2」が NVIDIA の AI を活用した DLSS と 4K ゲーミングでレベルアップ

                4 月 2 日に発表された「Nintendo Switch 2」は、専用の RT コアと Tensor コアを備えた NVIDIA GPU 搭載のカスタム NVIDIA プロセッサにより、パフォーマンスを次のレベルに引き上げ、圧倒的な映像と AI 駆動の強化を実現します。 システムやチップのデザインから、カスタム GPU、API、世界クラスの開発ツールに至るまで、 NVIDIAは1000人年 ものエンジニアの労力を、長年に渡りあらゆる要素へ注ぎ込んだことにより、「Nintendo Switch 2」は大幅なアップグレードを実現します。 この新しいコンソールは、TVモードでは最大で 4K ゲーミングを、携帯モードでは 1080 P で最大 120 FPS を可能にします。「Nintendo Switch 2」はまた、鮮明な映像とスムーズなゲームプレイのために、HDR と AI アップスケーリ

                  「Nintendo Switch 2」が NVIDIA の AI を活用した DLSS と 4K ゲーミングでレベルアップ
                • LinuxがDockerからPodmanに向かうわけ|谷山 亮治

                  ― 10年のコンテナ実践から見えた次世代スタンダード 📆 コンテナ技術の始まり:私とlxc-toolsの出会い(2010年頃)私が初めてLinuxコンテナに触れたのは、2010年ごろのことです。Ubuntuに lxc-tools が登場し、Linuxカーネルの cgroups や namespaces 技術を活用して、プロセス単位で隔離された仮想サーバ(OSフルスタックコンテナ) を実行できることに衝撃を受けました。 当時、私が構築したのは「機能単位で分離したlxc仮想サーバ」による マイクロサービスアーキテクチャ でした。約15の機能別コンテナを連携させ、1つのシステムとして動作させる。Dockerが登場する以前に、マイクロサービス的設計思想を実装していたことになります。 実際、当時のバイトスタッフに異なるホストへの移植テストを依頼し、Ubuntu上では完全な移植性があることを確認しま

                    LinuxがDockerからPodmanに向かうわけ|谷山 亮治
                  • Llama 4 の概要|npaka

                    以下の記事が面白かったので、簡単にまとめました。 ・The Llama 4 herd: The beginning of a new era of natively multimodal AI innovation 1. Llama 4本日、「Llama 4 Scout」と「Llama 4 Maverick」がリリースしました。これらは、前例のないコンテキスト長のサポートを備えた初のオープンウェイトネイティブマルチモーダルモデルであり、MoEアーキテクチャを使用して構築されています。 また、新しいモデルの教師として機能する最も強力な「Llama 4 Behemoth」のプレビューも行います。 ・Llama 4 Maverick ・17Bのアクティブパラメータ ・128のエキスパート ・合計400Bのパラメータ ・100万トークンのコンテキスト長 ・Llama 4 Scout ・17Bのアク

                      Llama 4 の概要|npaka
                    • Googleの「Gemini」で「ウォーターマークを消せる」──SNSで物議 悪用を懸念する声多数【追記あり】

                      一方、米OpenAIのAIモデル「4o」や、米Anthropic「Claude 3.7 Sonnet」でも同様に検証したところ、どちらのモデルでもウォーターマークの削除はできなかった。このうちClaude 3.7 Sonnetからは「画像の著作権やコンテンツの所有権を尊重する必要がある」との指摘があった。 日本のXユーザーからは「有料の画像素材を改変して使えるとしたらマズい」「悪用されそう」など批判の声が相次いでいる。 Gemini 2.0 Flashの画像生成機能は3月12日(現地時間)にリリース。チャットの受け答えだけでなく、テキストによる指示で高度な画像編集ができるとして話題になっている。現在は開発者向けのバージョンで正式版ではないが、Google AI Studioなどを通して誰でも利用できる。 GoogleのAIを著作権侵害に使うのは「利用規約違反」 今回の件についてGoogle

                        Googleの「Gemini」で「ウォーターマークを消せる」──SNSで物議 悪用を懸念する声多数【追記あり】
                      • Google、思考するAI「Gemini 2.5」発表──推論能力とコーディング能力が大幅向上

                        米Google傘下のGoogle DeepMindは3月25日(現地時間)、同社の“最もインテリジェントなAIモデル”である「Gemini 2.5」を発表した。 最初のリリースとなる「Gemini 2.5 Pro Experimental」は、特に高度な推論能力とコーディング能力を発揮するとしている。ベンチマーク「LMArena」のリーダーボードでは第1位を獲得した。 Googleは、今後リリースするすべてのAIモデルに推論機能を組み込むとしている。 利用プランと提供時期 Gemini 2.5 Pro Experimentalは、「Google AI Studio」で既に開発者向けに公開されている。また、「Gemini Advanced」のユーザーは、デスクトップおよびモバイルアプリのモデル選択ドロップダウンから利用できる。 「Vertex AI」でも近日中に利用可能になる予定。スケーリン

                          Google、思考するAI「Gemini 2.5」発表──推論能力とコーディング能力が大幅向上
                        • 【2025年最新】プログラマー必見!バイブコーディング(Vibe coding)を加速するWindsurf代替ツール10選 - Qiita

                          ツール選択ガイド 大規模企業向け: Cursor、GitHub Copilot、Tabnineが特に適しています。セキュリティとスケーラビリティを重視する場合はTabnineがおすすめです スタートアップ/個人開発者向け: Codium、Trae、VS Code + AI拡張機能が費用対効果に優れています 特定環境に特化: Microsoft環境ならIntelliCode、AWS環境ならCode Whisperer、Python開発ならAIプラグイン付きPyCharmが最適です。 リモートチーム: Replitはブラウザベースで環境構築不要なため、分散チームに最適です バイブコーディング体験重視: Traeは特にバイブコーディングワークフローに最適化されています それでは、各ツールの詳細を見ていきましょう! 1. Cursor: 精密さを極めたAIコーディングの新星 まず最初に紹介するのは

                            【2025年最新】プログラマー必見!バイブコーディング(Vibe coding)を加速するWindsurf代替ツール10選 - Qiita
                          • ChatGPTの「GPT-4」、4月30日に退場へ

                            米OpenAIは4月10日(現地時間)、「ChatGPT」のリリースノートで、2023年3月リリースのLLM「GPT-4」のChatGPTでの提供を4月30日に廃止し、2024年5月リリースの「GPT-4o」に完全に置き換えると発表した。GPT-4は、OpenAIのAPIでは引き続き利用可能だ。 GPT-4oの「o」は「omni」を表しており、マルチモーダルであることが特徴だ。処理速度はGPT-4の高速版「GPT-4 turbo」よりも高速で、応答もより自然だ。 OpenAIはリリースノートで「最近のアップグレードにより、GPT-4oの指示の順守、問題解決、会話の流れがさらに改善され、GPT-4の自然な後継となった」としている。 サム・アルトマンCEOは4月3日に、「GPT-o3」「GPT-o4-mini」を向こう数週間中に、「GPT-5」を向こう数カ月中にリリースするとXで発表した。 関

                              ChatGPTの「GPT-4」、4月30日に退場へ
                            • MCPに駆けろ! AIが“外部サービスとつながる”新時代を誰でも簡単に体験する方法

                              MCPに駆けろ! AIが“外部サービスとつながる”新時代を誰でも簡単に体験する方法:Deep Insider編集長のネタ帳 「MCPってよく聞くけど、自分には関係ない?」──そんな人にこそ読んでほしい! Claude Desktopを使えば、“AIが外部サービスとつながる新時代”を誰でも簡単に体験できます。MCPとは何か? なぜ注目されているのか? 気になる課題や今後の進化まで、思いの丈を語りました。未来を切り開くのは、“今”試してみるその一歩かもしれません。 連載目次 皆さん、こんにちは! もしくは、はじめまして! @ITのDeep Insider編集長、一色(いっしき)です。連載『Deep Insider編集長のネタ帳』の第2回をお届けします。 今回は、「皆さんに早い段階でぜひ知っておいてほしい」と思っていたテーマです。それは、「今、話題の“MCP”が、私たちの仕事や働き方全体に大きな

                                MCPに駆けろ! AIが“外部サービスとつながる”新時代を誰でも簡単に体験する方法
                              • あなたのiPhoneが着実に便利に--「Apple Intelligence」で筆者が驚いた機能2選(石川温)

                                アップルはiPhone向けOSの最新バージョンである「iOS 18.4」をリリースした。 iPhone 16シリーズ、さらにはiPhone 15 Proシリーズにおいて、アップルのAI機能「Apple Intelligence」の日本語版が利用可能だ。 昨今話題のChatGPT「ジブリ風イラスト」のような派手さは全くないが、実際に使ってみると、地味ながらも使い勝手が大幅に向上しているのが実感できる。 筆者は開発者向けバージョンから使っているが、実際に「Apple Intelligenceが便利だ」と感じたのが写真アプリだ。 仕事柄、記者会見など取材現場だけでなく、家族での旅行、さらには海外出張時の風景や食事など、様々な場所でiPhoneを使って撮影することが多い。実際、写真アプリには35万枚の画像が保存されている。 これまでは、過去に取材で撮影した写真を探し出すときは、まずはスケジュールア

                                  あなたのiPhoneが着実に便利に--「Apple Intelligence」で筆者が驚いた機能2選(石川温)
                                • DevSecOps文化を育てる:少しずつ、でも着実にチームと前進するために / 開発者向けブログ・イベント | GMO Developers

                                  はじめに:文化は、導入するものではなく、育てていくもの この記事は、複数のチームが関わる中規模〜大規模な開発組織で、DevSecOpsを推進しようとしている方々に向けて書いています。 横断チームのマネージャーとして、組織をまたいで文化を育てるという難易度の高いテーマに向き合ってきました。 DevSecOpsという言葉に初めて出会ったとき、定義や概念には納得感がありました。 でも、いざ現場に落とし込もうとすると、「で、うちのチームでは何から始めるべきなのか?」が見えてこない。 本や記事では「継続的な価値提供」「セキュリティのシフトレフト」などの美しいフレーズが並んでいます。 しかし、それをどう実現するか──現場と一緒に、泥臭く、迷いながら、どこまで進めるのか? その答えは、自分たちで見つけるしかありませんでした。 この記事は、私たちがその中で見えてきたもの、失敗したこと、気づいたことを丁寧に

                                  • OpenAI、ChatGPTにGPT-4oベースの画像生成機能 セレブの画像も生成可能

                                    米OpenAIは3月25日(現地時間)、マルチモーダルモデル「GPT-4o」を活用した新たな画像生成機能を「ChatGPT」にネイティブ統合したと発表した。従来の「DALL・E」シリーズと比較して大幅に性能が向上しており、よりリアルな画像の生成、画像を入力とした編集・変換、プロンプト内のテキストを正確に画像へ反映する能力などが特徴という。 同日から、Plus、Pro、Team、無料プラン向けに展開され、EnterpriseおよびEduでも近日中に利用できるようになる予定だ。無料プランでの利用回数の制限などについてはまだ公表されていない。また、「Sora」でも使える。開発者向けのAPI経由の提供は、今後数週間以内に展開する。なお、従来の画像生成モデルDALL・Eは、ChatGPT内の専用GPTなどを通じて引き続き利用できる。 この新たな画像生成機能(発表文には名称は記載されていない)は、GP

                                      OpenAI、ChatGPTにGPT-4oベースの画像生成機能 セレブの画像も生成可能
                                    • 文章を書くことに集中できるmacOSネイティブでオープンソースのエディタアプリ「freewrite」がリリース。

                                      macOSネイティブでシンプルに文章を書くことに専念できるオープンソースのMac用エディタ「freewrite」がリリースされています。詳細は以下から。 米カリフォルニア州で個人開発者向けのコミュニティBuildspaceを運営しているFarza Majeedさんは現地時間2025年04月10日、macOSネイティブで文章を書くことに特化したMac用エディタ「freewrite」を新たにリリースしたと発表しています。 one simple, clean place to write continuously for a set time without distraction — think through a new idea, write your next script, reflect on an event, whatever. hi, this is freewrite. –

                                      • Meta、ネイティブマルチモーダルAI「Llama 4」発表 最小モデルは「H100」1枚で利用可能

                                        また、100以上の言語でそれぞれ10億以上のトークンを含む、「Llama 3」の10倍以上の多言語トークンで事前学習されており、オープンソースのファインチューニングの取り組みを強化したという。 3つのモデルの違い Scoutは、16のエキスパートを持つ170億のアクティブパラメータモデルで、コンテキストウィンドウは1000万トークン(先代の「Llama 3」は12万8000トークン)。ドキュメントの要約や大規模なコードベースでの推論で威力を発揮する。米NVIDIAのGPU「H100」1つで利用可能としている。すべての旧世代Llamaモデルより強力という。広範なベンチマークで米Googleの「Gemma 3」と「Gemini 2.0 Flash Lite」、仏Mistral AIの「Mistral 3.1」よりも優れた結果を示した。 Maverickは、128のエキスパートを持つ170億のア

                                          Meta、ネイティブマルチモーダルAI「Llama 4」発表 最小モデルは「H100」1枚で利用可能
                                        • 技術評論社の編集者を招いて「本を出すきっかけ」の作り方を聞いてみた

                                          こんにちは、Dev Contentチームのmochikoです。LINEヤフー株式会社で開発者向けのドキュメントを書くテクニカルライターとして働く傍ら、個人としても技術書を書いて出しています。 先日、IT系の出版社である技術評論社の編集者の方をLINEヤフーにお招きして、「本を出すきっかけ」の作り方を聞くイベントを開催しました。参加者も多く、非常に実りあるイベントとなりましたので、このブログでは開催までの経緯や当日の様子を紹介します。 編集者とエンジニアをつなぐイベントをやろう!オンラインでもオフラインでもやろう!2月20日(木) オンラインセッションを開催2月21日(金) オフィスでオフライン交流会を開催参加したエンジニアの感想開催を経てどれくらいの本が生まれそうか 編集者とエンジニアをつなぐ 1on1などで社内の若手エンジニアと話すと、私自身が技術書を書いていることから「実は自分も本を書

                                            技術評論社の編集者を招いて「本を出すきっかけ」の作り方を聞いてみた
                                          • 「+メッセージ」があるのに「RCS」を新規導入、なぜ?--KDDIの思惑を高橋社長に聞いた(石川温)

                                            ついにiPhoneとAndroid間を無料で電話番号だけで動画や写真を送れるようになる。 といっても「すでにLINEがあるじゃん」とお思いの人も多いだろう。確かにLINEアプリを使えば、相手がiPhoneだろうがAndroidだろうが、無料で動画や写真を送り合える。ただ、相手のLINE IDをあらかじめ知っておく必要がある。 また、NTTドコモ、KDDI、ソフトバンクが提供する「+メッセージ」や、楽天モバイルの「Rakuten Link」といったメッセージアプリもある。とはいえ、これらもあらかじめ相手がアプリをインストールしていないと利用できないという制約がある。 ●電話番号だけで写真を送受信できる「RCS」とは 今回新しく始まる、iPhoneとAndroid間を無料、かつ電話番号だけで動画や写真を送受信できるサービスは「RCS」というものだ。 RCSはもともと世界のキャリアが導入を進めて

                                              「+メッセージ」があるのに「RCS」を新規導入、なぜ?--KDDIの思惑を高橋社長に聞いた(石川温)
                                            • iPhone 16とPixel 9で「文字起こし」の精度を比較 オンライン会議と騒がしいファミレスで試した結果

                                              iPhoneで録音した音声を文字に起こしてくれる、いわゆる文字起こしの機能。録音したものをいったん保存した後、「Speechy」というアプリにデータを移行し、音声をテキストに変換する作業を行う方法はあるが、1つのアプリで完結できないゆえに面倒だ。 文字起こしの機能では、Google Pixelが先行しているが、iPhoneもようやく追随した。Appleが開発者向けに配信しているβ版の「iOS 18.4」では、「ボイスメモ」という標準搭載アプリで、録音から文字起こしまでを完結できるようになった。それも日本語でだ。 正式なアップデートは、Apple独自開発の生成AIサービス「Apple Intelligence」が日本語対応を果たす4月だが、それを待たずにβ版のiOS 18.4を手元のiPhone 16にインストールし、Pixel 9と文字起こしの精度を比較する。

                                                iPhone 16とPixel 9で「文字起こし」の精度を比較 オンライン会議と騒がしいファミレスで試した結果
                                              • 「これが上場企業のクリエイティブ?」疑問から始まった、自走できるデザイナー組織づくりの旅 / 開発者向けブログ・イベント | GMO Developers

                                                GMOインターネットグループが今年4月から開始する、年間を通してデザイン・クリエイティブの発信を強化する施策「Creator Synergy Project」の取り組みとして、本ブログでもデザイナー・クリエイターへのインタビュー連載をスタートします! 記念すべき初回は、GMOインターネットでクリエイティブ組織を牽引する丸山清人さんへのインタビューとなります。 丸山さんは、イベントのアートワークからセキュリティ、ドメイン、レンタルサーバーなどの自社サービスまで多様なプロジェクトに関わりながら、“提案できるデザイナー集団”の育成に力を注いでいます。 現場とチームの両輪を動かす、その思考と実践に迫ります。

                                                  「これが上場企業のクリエイティブ?」疑問から始まった、自走できるデザイナー組織づくりの旅 / 開発者向けブログ・イベント | GMO Developers
                                                • 「Devin」がアップデート、月20ドルから利用可能に “自律型”と話題のAI開発エージェント

                                                  米Cognitionは4月3日(現地時間)、AIエージェント「Devin」をアップデートし「Devin 2.0」としてリリースした。これまでは月額500ドルからのプランしか提供していなかったが、新たに20ドルから利用できるプランを用意した。エージェントの作業効率も向上したとうたう。 新プラン「Core」は実質的な従量課金プラン。基本料金は無料で、エージェントを動かすクレジット「ACU」を月20ドル分購入すれば利用できる。ACUがなくなった場合は、1ACU当たり2.25ドルで追加購入する必要がある。ただし、既存プランで提供していたAPIは利用できない。 Cognitionによれば、アップデートによってエージェントのACU当たりの作業効率はほぼ2倍になったという。エージェントがテキストエディタ「Visual Studio Code」上で作業している最中に、コーディングの様子を確認したり、割り込

                                                    「Devin」がアップデート、月20ドルから利用可能に “自律型”と話題のAI開発エージェント
                                                  • 動画内の人物を好きなキャラに変更できる動画AI「VACE」、3DビデオゲームをAIにプレイさせる「PORTAL」など生成AI技術5つを解説(生成AIウィークリー) | テクノエッジ TechnoEdge

                                                    2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 Googleが大規模言語モデル(LLM)の最新バージョン「Gemma 3」を発表しました。1B、4B、12B、27Bのパラメータ数を持つバリエーションが公開され、マルチモーダル対応、128kのロングコンテキスト、140言語以上の多言語対応、数学やコーディングタスクの性能向上などの特徴があります。 またGoogleは、「Gemini 2.0 Flash」において、テキストの指示から直接画像を生成する機能を開発者向けに公開しました。画像に対しての細かな変更もテキストででき、出力結果の一貫性の高さがSNS上でも一部話題になっていました。 さらにGoogleの「Deep Research」が無料ユーザーでも使えるようになりました。この機能には「2.0 Fl

                                                      動画内の人物を好きなキャラに変更できる動画AI「VACE」、3DビデオゲームをAIにプレイさせる「PORTAL」など生成AI技術5つを解説(生成AIウィークリー) | テクノエッジ TechnoEdge
                                                    • GPT-4o、ついにネイティブ画像生成機能を公開 – OpenAIの最新アップデートがユーザーを驚かせる - イノベトピア

                                                      GPT-4o、ついにネイティブ画像生成機能を公開 – OpenAIの最新アップデートがユーザーを驚かせる Last Updated on 2025-03-27 20:14 by admin OpenAIは2025年3月25日、ChatGPTにGPT-4oのネイティブ画像生成機能を追加したと発表した。この新機能はPlus、Pro、Team、Free利用者向けに提供が開始され、近くEnterprise、Eduユーザー、およびAPI経由でも利用可能になる予定である。 主な特徴と機能 GPT-4oの画像生成機能は以下の特徴を持っている テキストを画像内に正確にレンダリングする能力 自然な会話を通じて画像を洗練させる機能 最大10〜20の異なるオブジェクトを含む複雑なプロンプトに対応 以前の画像やテキストを基に構築し、視覚的一貫性を確保 様々な芸術スタイルをサポート(フォトリアリズムからスタイライズ

                                                        GPT-4o、ついにネイティブ画像生成機能を公開 – OpenAIの最新アップデートがユーザーを驚かせる - イノベトピア
                                                      • GoogleのAIモデル「Gemini 2.0 Flash」の画像生成機能で画像からウォーターマーク(透かし)を削除できると話題に

                                                        2025年2月に一般公開されたGoogleのAIモデルである「Gemini 2.0 Flash」には、3月12日に画像生成機能が開発者向けに試験導入されました。この機能を使い、フォトストックサービスが配信する画像からウォーターマーク(透かし)を削除できることが明らかになっており、問題視されています。 People are using Google's new AI model to remove watermarks from images | TechCrunch https://techcrunch.com/2025/03/16/people-are-using-googles-new-ai-model-to-remove-watermarks-from-images/ Gemini 2.0 Flashの画像生成機能は、ネイティブに画像コンテンツを生成・編集することができます。具体的に

                                                          GoogleのAIモデル「Gemini 2.0 Flash」の画像生成機能で画像からウォーターマーク(透かし)を削除できると話題に
                                                        • 賢い生成AIの大幅値上げは避けられない、「月額課金」はもう限界だ

                                                          生成AI(人工知能)により高い利用料金を支払うほど、より賢いAIが利用できる――。推論時に投入する計算量を増やすほどAIが賢くなる「テスト・タイム・スケーリング」によって、2025年はこんなトレンドが生じそうだ。これに伴いユーザーは、複雑な料金制度に困惑することになるだろう。 高い利用料金を支払うほど賢いAIが利用できるようになるとの方針は、米OpenAI(オープンAI)のSam Altman(サム・アルトマン)CEO(最高経営責任者)が2025年2月12日(米国時間)に明らかにした。 GPT-5の賢さは、料金プランによって異なる アルトマンCEOはこの日、オープンAIによる大規模言語モデル(LLM)のリリース計画を明らかにした。同社は現在、一般的な用途に使うLLMである「GPTシリーズ」と、同社がCoT(Chain-of-Thought、思考の連鎖)モデルやReasoning(論理的推論

                                                            賢い生成AIの大幅値上げは避けられない、「月額課金」はもう限界だ
                                                          • Ruffに搭載される新しい型チェッカーRed-knotについて

                                                            Python開発者向けツールRuff/uvの開発チーム(Astral inc.)がPython向けの型チェッカーを新規開発しているので紹介いたします。この型チェッカーはコードネーム"Red-knot"と呼ばれており、まだリリース前ですが将来的にはRuffに組み込まれる予定であるようです。以下ではこのプロジェクトの概略を説明したいと思います。 特徴 既存の型チェッカー(e.g. mypy, pyright)の不満点である遅さを改善すべく、徹底的にパフォーマンスに気を配った設計となっています。pyrightもそこまで遅くはないのですが、さらに高速であることを目指すようです。 Red-knotはRuffと同様Rustを用いて実装されています。Ruffが使っている諸々のデータ構造を共有しているため、フォーマット、lint、静的解析が一気通貫で行えるようになります。JavaScriptツールチェイン

                                                              Ruffに搭載される新しい型チェッカーRed-knotについて
                                                            • 【80人定員に150人超が応募!】セキュリティ診断AIエージェント「Takumi」最速体験会の熱気をレポート - #FlattSecurityMagazine

                                                              こんにちは、GMO Flatt Securityの小島です。 2025年4月7日(月)、GMO Flatt Securityは、セキュリティ診断AIエージェント『Takumi』のリリースを記念し、品川区大崎のファインディ株式会社様のイベントスペースにて、『セキュリティ診断AIエージェント「Takumi」世界最速体験会』を開催いたしました。 この記事はそのイベントレポートとして、ご参加いただいた方のXの投稿とイベントの写真を交えながらイベントを振り返っていきたいと思います。 セキュリティ診断AIエージェント「Takumi」について セキュリティ診断AIエージェント「Takumi」は、Slackでいつでもセキュリティ診断を頼めるAIです。ソースコードや仕様を理解し、自律的に診断します。 例えば、以下のようなセキュリティ業務を自律的にこなすことができます。 Dependabotのトリアージ CV

                                                                【80人定員に150人超が応募!】セキュリティ診断AIエージェント「Takumi」最速体験会の熱気をレポート - #FlattSecurityMagazine
                                                              • 「国連オープンソース原則」をOSIが公式支持 IT業界に与える影響は?

                                                                国連オープンソースユナイテッドコミュニティー(United Nations Open Source United community)とオープンソースイニシアチブ(OSI:Open Source Initiative)は、2025年3月11日(米国時間)、OSIが「国連オープンソース原則」を公式に支持する初の組織となったことを発表した。国連オープンソース原則は、国連内部だけでなく、世界全体においてオープンソースの活用と協力を推進するための指針となっている。 国連オープンソースユナイテッドコミュニティーは、国連機関全体でオープンソーステクノロジーを推進することを目的として活動している。同コミュニティーは、国連のデジタル変革を支援するため、コラボレーションとスケーラブルなソリューションの推進に取り組んでいる。一方、OSIは、個人、企業、公的機関から国際的に認知されている非営利団体で、ソフトウェ

                                                                  「国連オープンソース原則」をOSIが公式支持 IT業界に与える影響は?
                                                                • Windows PC版の「Google Play Games」が“PCネイティブ”ゲームをサポート 2025年内に

                                                                  米国で3月17日から21日まで(米国太平洋時間)開催される「Game Developers Conference(GDC) 2025」に合わせて、GoogleがAndroid OSやアプリストア「Google Play」「Google Play Games」について幾つかの発表を行った。この記事では、Google Play Gamesの変更点を中心に紹介する。 変更点1:WindowsネイティブのPCゲームを提供可能に 現状、Google Play GamesではAndroid OS向けに開発されたゲームを配信している。同プラットフォームで配信されるゲームは、仮想マシン(VM上)で動くAndroid OS上で稼働する。 モバイルゲームの開発者にとって、この仕組みはプレーヤーの裾野を広げる一助となるが、「PC(Windows)にはPCに最適化したゲームを配信したい」というニーズは満たせない。

                                                                    Windows PC版の「Google Play Games」が“PCネイティブ”ゲームをサポート 2025年内に
                                                                  • Windows 11 でまもなく新規インストール時に ReFS ファイルシステムの選択肢が登場。ただしインストールはまだ不可

                                                                    Windows 11 でまもなく新規インストール時に ReFS ファイルシステムの選択肢が登場。ただしインストールはまだ不可 2025 3/30 Windows 11 でまもなく新規インストール時に ReFS ファイルシステムの選択肢が登場。ただしインストールはまだ不可 Windows 11で使われているファイルシステムであるNTFS 3.1はWindows XPから投入されており、既に20年以上が経過していますが、Microsoftでは近い将来このNTFSを新しいファイルシステムであるReFSに段階的に置き換えていくためか、Windows 11 Insider PreviewのBuild 27823にて新規インストール時に限りReFS形式でのフォーマットを行いインストールを行うオプションが用意されていることが明らかになりました。 Build 27823 adds a menu for f

                                                                      Windows 11 でまもなく新規インストール時に ReFS ファイルシステムの選択肢が登場。ただしインストールはまだ不可
                                                                    • Cloudflareを活用したMCPサーバーデプロイ完全マニュアル - Qiita

                                                                      Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? はじめに AIアシスタントと連携できるModel Context Protocol(MCP)サーバーを自分で構築してみませんか?この記事では、個人開発者向けにCloudflareを使ったMCPサーバーの構築方法をステップバイステップで解説します。難しそうに聞こえるかもしれませんが、実は無料プランでも十分に始められるんです! 私自身、趣味プロジェクトでMCPサーバーを構築した経験から、つまずきやすいポイントや実用的なヒントを交えながら説明していきます。この記事を読めば、あなたも自分だけのAI連携システムを手に入れることができますよ。 MC

                                                                        Cloudflareを活用したMCPサーバーデプロイ完全マニュアル - Qiita
                                                                      • Google、「Gemini Code Assist」の無料提供を個人開発者に向けて開始 月最大18万回のコード補完の他は何が役立つのか?

                                                                        Google、「Gemini Code Assist」の無料提供を個人開発者に向けて開始 月最大18万回のコード補完の他は何が役立つのか?:GitHub向けのコードレビュー機能も Googleが開発したAIコーディングアシスタント「Gemini Code Assist」の個人開発者向け無料提供が開始した。Visual Studio CodeやJetBrains IDEでのコード補完、生成、デバッグ支援に加え、GitHub向けのコードレビュー機能も利用できる。 個人向けのGemini Code Assistは世界中で利用可能で、Gemini 2.0を搭載している。このツールはパブリックドメインの全てのプログラミング言語をサポートしており、特にコーディングに最適化されている。Gemini 2.0モデルは、実際のコーディングユースケースを大量に分析、検証することで開発者向けにファインチューニング

                                                                          Google、「Gemini Code Assist」の無料提供を個人開発者に向けて開始 月最大18万回のコード補完の他は何が役立つのか?
                                                                        • OpenAI、オープンなAIモデル公開へ 推論機能あり、「今後数カ月以内」とアルトマンCEO

                                                                          リリース予定のモデルは推論能力を備えているという。同社のITエンジニアであるスティーブン・ハイデルさんは、自身のX(@stevenheidel)で「ユーザーが持つハードウェアで実行できるモデル」と説明している。 リリースに先立ち、同社のフレームワークに従い、同モデルのリスクなどを事前に評価するという。加えて、米国サンフランシスコなどで開発者向けのイベントを開催。同モデルに関するフィードバック調査や、プロトタイプの検証をするとしている。 アルトマンCEOは、オープンウェイトモデルについて「長い間考えてきたものの(これまでは)他のことを優先してきた。しかし今こそ実行に移す時だと感じた」と説明。「開発者が何を構築し、大企業や政府が自身のモデルを運用するのを好む際、どのように使うのか楽しみだ」(アルトマンCEO) 関連記事 DeepSeekで注目された「蒸留」って何だ? 識者が解説 中国のAI企業

                                                                            OpenAI、オープンなAIモデル公開へ 推論機能あり、「今後数カ月以内」とアルトマンCEO
                                                                          • VSCode公式マーケットプレースに悪意のある拡張機能が混入 審査プロセスに課題

                                                                            ReversingLabsは2025年3月19日(現地時間)、「Visual Studio Code」(VSCode)向けに2つの悪意ある拡張機能が配布されていることを発見したと発表した。開発段階のランサムウェアを配布する拡張機能とされ、Visual Studio Code Marketplaceに公開されていたことが確認されている。 これらはそれぞれ数回ダウンロードされた後、報告を受けて削除されている。拡張機能はPowerShellスクリプトを通じてリモートC2(Command and Control)サーバから別のスクリプトをダウンロードして実行し、「testShiba」フォルダ内のファイルを暗号化する。 安全審査をすり抜けて長期間公開、ランサムウェア機能はおそらく「鋭意開発中」 発見された悪意のある拡張機能は「ahban.shiba」と「ahban.cychelloworld」という

                                                                              VSCode公式マーケットプレースに悪意のある拡張機能が混入 審査プロセスに課題
                                                                            • Claude Code + MCPの関係図解:2025年3月版

                                                                              はじめに 皆さん、AIエージェントを使ったコーディングしていますか? 私もここ半年ほどいくつかのツールを使って生成AIと共にコードを書くことを試してきましたが、2025年3月時点ではCline + OpenRouter(主にClaude 3.7 Sonnet API)の組み合わせが一番信頼が高く快適にコードを書けると感じています。しかしClaude 3.7 Sonnet APIは料金が比較的高く、思う存分使いこなせないという課題を抱え始めるようになってきました。 このAPI利用に加えて個人でClaude Proもサブスクリプション契約しており、これだけですでに月額$20(約3,000円)を支払っています。 そこで、より効率的な料金プランを模索していたところ、興味深い解決策に出会いました。 より効率的な選択肢:ClaudeのLLMを月額固定料金で使用する方法 一方2025年3月頃から、「Cl

                                                                                Claude Code + MCPの関係図解:2025年3月版
                                                                              • GMOインターネットグループのロボット人材派遣型サービス始動─ヒューマノイド×AIで切り拓く、未来への一歩 / 開発者向けブログ・イベント | GMO Developers

                                                                                GMOインターネットグループのロボット人材派遣型サービス始動─ヒューマノイド×AIで切り拓く、未来への一歩 2025年4月3日──この日は、GMOインターネットグループがヒューマノイドG1を活用したロボット人材派遣型サービスを正式にスタートした、いわば私たちにとって“ロボット派遣の初日”になります。 GMO AI&ロボティクス商事株式会社がこれまで構想してきたビジネスモデルを、いよいよ社会実装フェーズへと移行させるときが来たのです。 はじめに:ロボット人材派遣の“はじまりの日” 2025年4月3日、GMO AI&ロボティクス商事は、最新型ヒューマノイドロボットを活用した「ロボット人材派遣型サービス」の提供を正式に開始しました。従来の「ロボットレンタル型」ではなく、GMOインターネットグループがロボットの動作を事前にプログラミングし、現場に派遣するという点が本サービスの最大の特長です。ヒュー

                                                                                  GMOインターネットグループのロボット人材派遣型サービス始動─ヒューマノイド×AIで切り拓く、未来への一歩 / 開発者向けブログ・イベント | GMO Developers
                                                                                • OpenAIの新LLM「o3」は「o1」と何が違う? なぜ「o2」は存在しない?

                                                                                  関連キーワード 人工知能 AI(人工知能)チャットbot「ChatGPT」の開発元であるOpenAIは、2024年12月に大規模言語モデル(LLM)「OpenAI o1」シリーズの一般提供を開始した。これは同社にとって初の推論特化モデルであり、推論能力を強化している点が特徴だった。 同じタイミングでOpenAIが主催したイベント「12 Days of OpenAI」では、OpenAIのサム・アルトマンCEOがOpenAI o1の後継となる「OpenAI o3」シリーズのプレビュー版を発表。2025年1月には「o3-mini」の一般提供を開始した。 OpenAI o3は、OpenAI o1や、従来の「GPT-4o」と何が違うのか。OpenAI o3の特徴やバージョンごとの違い、利用方法までを詳しく解説する。 「OpenAI o3」は「o1」と何が違う? なぜ「o2」は存在しない? 併せて読み

                                                                                    OpenAIの新LLM「o3」は「o1」と何が違う? なぜ「o2」は存在しない?