misshikiのブックマーク / 2025年3月24日

イーロン・マスクの隠し玉「Grok3」、遂に登場。OpenAIやDeepSeekを超える実力 | AMP[アンプ] - ビジネスインスピレーションメディア

AIインフラ投資はやはり必須か、Grok3が物語る現実中国DeepSeekが「600万ドル」という低コストでR1モデルを開発したとされる報道は、AI業界に大きな衝撃を与えた。これまで必須とされてきた大規模なAI開発インフラが本当に必要なのかという疑念を増大させたためだ。しかし、イーロン・マスク氏率いるxAIがこのほど発表した最新の「Grok3」モデルが物語るのは、現時点ではやはり大規模なAIインフラは、優位性を確立するために必要であるということだ。 Grok3は、非推論モデルでありながら、推論モデルであるDeepSeek R1に迫る性能を発揮、さらにGrok3をベースとする推論モデルGrok3（Think）は、OpenAIのo3をも上回るパフォーマンスを示す。まず、このGrok3がどのような環境で開発されたのかを詳しく見ていきたい。同モデルが開発されたのは、xAIが米メンフィスに建

misshiki 2025/03/24

“Grok3は、X（旧Twitter）のプレミアム+サブスクリプション（月額40ドル）と、単独サービス「SuperGrok」（月額30ドル）を通じて提供される。”

人工知能

リンク

OpenAIが新しい音声モデルをリリース。文字起こし・音声合成・リアルタイム処理の全機能まとめ｜ChatGPT研究所

2025年3月21日、OpenAIはライブストリーミングにて音声モデルに関する開発者向け大規模アップデートを発表しました。今回の発表では、リアルタイム音声処理や高精度の文字起こし・自然な音声合成など、多岐にわたる改良がなされています。以下、主要なポイントをまとめます。 OpenAI① Audio / Speech機能アップデートの概要まず、音声関連のAPIが一斉に強化・拡充されました。具体的には以下がポイントとなります：新モデル: gpt-4o-transcribe（高精度な文字起こし）、gpt-4o-mini-tts（リアルタイム音声合成）ストリーミング対応: 音声の入出力をリアルタイムでやり取りマルチモーダル処理: テキスト＋音声の両方を同時に扱える設計 OpenAI多言語対応も引き続き強化されており、ファイルサイズなどの制約はあるものの、実用性は格段に向上している印象です。

misshiki 2025/03/24

“2025年3月21日、OpenAIはライブストリーミングにて音声モデルに関する開発者向け大規模アップデートを発表しました。”

リンク

一休における C#,PythonからRustへの移行の現状と見えてきた課題

はじめまして、一休でプロダクト開発・技術広報を行っている山本（@kymmt90）といいます。今回は「一休.comレストラン」のバックエンドのRust移行の取り組みについて、バックエンドを中心に、背景や現在の移行状況をお伝えします。なぜRustを選定したのか？サービス概要「一休.comレストラン」は、上質なレストランを対象に店舗や食事コースの検索、詳細情報の閲覧、Web予約機能を提供するサービスです。2006年にローンチされ、従来はPython・C#・VBScriptといった技術スタックを用いたシステム構成となっていました。選定背景5年以上Pythonを中心にサービスを開発／運用してきましたが、コロナ禍や開発チームの再編成を経て、既存のコードベースのままだと事業の要求に沿った開発や運用が難しくなってきたという課題がありました。そこで、サービスのUI自体の刷新を含めリライトしていくとい

misshiki 2025/03/24

“「一休.comレストラン」のバックエンドのRust移行の取り組みについて、バックエンドを中心に、背景や現在の移行状況をお伝え”

Rust

リンク

AIに欠かせない機械学習の手法を物理学に融合させる新しい概念「学習物理学」とはどういうものか？ - 大学ジャーナルオンライン

人工知能（AI）、特に生成AIの登場からまだ２年余り、しかしその進化のスピードは速く、それがもたらす様々な社会課題――著作権問題、プライバシー保護などの倫理面での問題、教育の在り方等々—についての議論の、はるか頭上を飛び越えていく。しかもこの勢いは、情報端末の普及で、世界のすべての人々を巻きこもうとしています。その流れは、生みの親でもある物理学にも及んでいます。「学習物理学」という新たな概念を提唱し、同名の国のプロジェクトのグループ代表も務める京都大学理学部の橋本幸士先生の話を聞いてみましょう。「学習物理学」、始めてます　AIが人間の職業を奪うという報道がよくなされていて、不安や恐れを感じている人は少なくないと思います。もちろん物理学研究者の世界にもAIの波が押し寄せています。しかしほとんどの物理学者は非常に楽観的です。というのは、物理学者はAIと一緒に物理学を発展させようとしているから

misshiki 2025/03/24

“物理学研究者の世界にもAIの波が押し寄せています。しかしほとんどの物理学者は非常に楽観的です。というのは、物理学者はAIと一緒に物理学を発展させようとしているからです。”

人工知能

リンク

Taiji Suzuki on X: "直接学習することが難しい問題でも，Chain-of-thoughtを使えばTransformerで簡単に学習できるようになることを示した論文がICLR2025にオーラル発表として採択されました． Kim&Suzuki: Transformers Provably Solve Parity Efficiently with Chain of Thought. ICLR2025. https://t.co/T0LAlEZGYU"

misshiki 2025/03/24

“直接学習することが難しい問題でも，Chain-of-thoughtを使えばTransformerで簡単に学習できるようになることを示した論文がICLR2025にオーラル発表として採択”

リンク

AI初心者がDeepSeekの論文を読んで感動した話（解説付き）

はじめにこんにちは！最近AIに興味を持ち始めたばかりの超初心者です。「DeepSeek-R1」についての解説記事を読んでみたのですが、専門用語や数学的な説明が多く、最初はなかなか理解できませんでした。それならいっそ論文を直接読んでみよう！と思い立ち、DeepSeek-R1 の論文に挑戦することにしました。実際に読んでみると、思っていたほど難しくなく、専門用語や数学的な要素も少なかったので、初心者の私でも意外と読みやすいことに驚きました。最初は DeepSeek-R1 がなぜ話題になっているのか知りたくて読み始めたのですが、読み進めるうちに AI の基本的な仕組みや、これまでの技術の進化についても学ぶことができ、AI の世界の面白さと未来の可能性を強く感じるようになりました。その楽しさやワクワク感をもっと多くの人に伝えたいと思い、この記事を書くことにしました。この記事では、

misshiki 2025/03/24

“自由な探索と継続的な学習が、新たな可能性を切り開く。それはAIに限らない真実かもしれません。今回DeepSeek R1の論文を読んで、最も感動したことでした。”

リンク

LLM x Slack x Notion で論文インプットを効率化し、社内ナレッジ蓄積もできるようにした話

はじめに株式会社 neoAI の大坂洋豊です。東京大学に在学中で、松尾・岩澤研究室に所属しています。AI ソリューション事業部として、プロジェクトマネジメントを行いながら、研究開発組織 neoAI Research として先端技術の実践に取り組んでいます。今回は、弊社の Slack 上で論文のインプットを効率化するために開発した LLM Bot についてご紹介します。開発したのは2023年で、当時は NotebookLM のようなサービスがまだ存在しなかったため、社内では論文の概要をスピーディーに把握できる点で重宝されていました。また、その要約結果を社内のデータベースに蓄積できるという機能もあるため、弊社のナレッジ基盤を支えている存在でもあります。 AI ソリューション事業部についてはこちらを参照ください。背景と課題論文を読む文化の重要性 AI ソリューション事業部では、常に最新の

misshiki 2025/03/24

“「論文の URL を Slack に投稿するだけで、タイトル、要約、さらには関連する Q&A を自動生成し、会社全体でシェアできる仕組み」”

リンク

GitHub - microsoft/playwright-mcp: Playwright MCP server

You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

misshiki 2025/03/24

“Playwrightを使用してブラウザ自動化機能を提供するモデルコンテキストプロトコル (MCP) サーバー。”

リンク

Model Context Protocol (MCP) サーバを使ってみた・作ってみた

Model Context Protocol（MCP）は、AI（LLM）の能力を拡張するためのプロトコルです。このブログ記事では、以下について書きます。 MCPの概要 MCPを使ってみた MCPを作ってみた MCPとは何か？ Model Context Protocolは、AI（GPTやClaudeなどのLLM）が外部システムやAPIと通信するための標準化されたプロトコルでAnthropic社が定めたものです。MCPを使用することで、AIアシスタントは以下のようなことが可能になります：インターネット上の情報にアクセスするデータベースを検索するファイルシステムを操作する外部APIを呼び出す GitやGitHubなどの開発ツールを操作する MCPの公式サイトの紹介文には以下のような概念図があります。 modelcontextprotocol.io introductionより引用また

misshiki 2025/03/24

“Model Context Protocol（MCP）について、概要に加えて、使い方と作り方を簡単に紹介しました。実際に作ってみて、MCPが少しだけ理解できたような気がします。”

リンク

Mastraの基本機能と何ができるか

はじめに TypeScriptでAIエージェントの開発ができると噂のMastraを試してみたくなり、主要機能をざっと調べてみました。この記事では、エージェントやワークフロー、RAGなどMastraの基本機能を一通り紹介し、「どんなことができるのか」をざっくり掴めるようまとめてみました。より高度な機能や環境構築、デプロイ方法など詳しい設定方法を知りたい方は、公式ドキュメントを参照してみてください。 Mastraとは Mastraは、AIエージェント、ワークフロー、RAGなどの機能を統合的に提供するTypeScriptフレームワークです。VercelのAI SDKをベースにしており、OpenAI、Anthropic、Google Geminiなど様々なAIプロバイダーとシームレスに連携できます。オープンソースであるため、カスタマイズ性が高く、コミュニティによる継続的な改善が期待できます。 M

misshiki 2025/03/24

“エージェントやワークフロー、RAGなどMastraの基本機能を一通り紹介し、「どんなことができるのか」をざっくり掴めるようまとめ”

リンク

Devinはどこまでできる？自律型AIエージェントDevinを2ヶ月試した結果を公開！ - Findy Tech Blog

こんにちは。ファインディでソフトウェアエンジニアをしている栁沢（@nipe0324a）です。ファインディでは、25年1月末から転職開発チームにDevinがジョインし、現在2ヶ月ほど一緒に働いています。 Devinのアウトプットとして、プルリクエストのマージ数は「2ヶ月で197件」、「1日あたり平均5.2件」とバリバリ開発をしてもらっています。過去2ヶ月のDevinのマージ済みプルリク数の推移 Devinの2ヶ月の費用としても約30万（$2,000 = 1,000 ACUs）ほどで、比較的簡易なタスクかつ一部サポートは必要でしたが十分なアウトプットを得ることができました。今回の記事では、Devinに効果的にアウトプットを出してもらうために試して上手くいったところ上手くいかなかったところ具体的なTips などをご紹介できればと思います。ちなみに、ファインディ内でのDevinの利用

misshiki 2025/03/24

“「ジュニアからミドルレベルのタスクを概ね任せられそう」という感触を得ています。難易度が易しい〜普通ぐらいのタスクにおいて、要件把握・設計から動作確認までできるポテンシャルを感じています。”

リンク

AIエージェント「Devin」はジュニアエンジニアの域を超えていた【開発者と読み解くAIの世界】

misshiki 2025/03/24

“リポジトリの膨大なコードを読み込み理解する能力、その内容を説明しドキュメントを作る能力は完全にジュニアエンジニアの域を超えていますし、開発知識が豊富なのでタスク遂行力は低くありません”

リンク

【Cursor】Proプランをコスパ良く使おうぜまとめ - Qiita

TL;DR Cursor Proプラン最高！でも気を抜くとめっちゃ請求されるよ！誰に向けた記事か最近Cursorに課金して、Proプランを使い始めました。これを機に、AIコードエディターの「Cursor」のProプランを選択した後の料金体系やモデル選択について解説します。 Cursorに関する紹介記事や「ここがすごい！」の記事は多数ありますが、コスト面の記事はあまりありませんでした。私と同じような「潤沢に資金を回せる立場ではない方」の役に立てればと思い、コストに特化した情報備忘録として共有します。読んで欲しい人 Cursor Proプランの契約を検討している方 Proプランを使い始めたばかりで使い方を最適化したい方高速リクエストと低速リクエストの違いを理解したい方どのAIモデルを選べばいいか迷っている方月間の高速リクエスト制限に達しそうで心配な方読まなくてもいい人すで

misshiki 2025/03/24

“デフォルトでは月500回の上限を超えると追加課金が発生する可能性がある。追加課金を防ぐために「Enable usage-based billing」をオフにするか、支出上限を設定。急ぎでないタスクには低速リクエストを活用して節約する”

リンク

【Cursor / Cline】ほにゃららRulesの功罪：独自のカスタム設定に関する心理的バイアスについて

モチベーション（100%人間） CursorやClineなどで.rulesを作成することが増えましたが明確に何を作成すべきで何をすべきでないかはユーザー側の判断に委ねられていることが多いと感じています。そこに対してそもそもの「作成することによる心理的バイアス」の有無や「サービス側のPromptの考慮」の有無などについて明確に述べてみようかなと思いました。以下AIと作った記事です。はじめに AIサービスが普及するにつれて、Custom Instructions（カスタム指示）やRulesといった「AIの挙動をカスタマイズする機能」が多くのプラットフォームで提供されるようになりました。一見すると便利に思えるこれらの機能ですが、その実際の効果と、私たちがそれを評価する際の心理的バイアスについては、十分な議論がなされていません。本記事では、PKM（Policy-Knowledge-Me

misshiki 2025/03/24

“自己診断チェックリストあなたのカスタム設定が実際に効果があるのか、それとも心理的バイアスに影響されているだけなのかを判断するための質問集：”

リンク

Cursorを使った文章執筆は、AIファーストな環境整備から始まる - 本しゃぶり

なぜCursorを使うと執筆が捗るのか？それはAIファーストな環境では、自律的に情報を探索してくれるからだ。執筆のパラダイムシフトは既に始まっている。文章執筆でAIエディタを活用するには最近、CursorなどのAIエディタによる文章執筆が注目を集めているが、「実際にどう使えば執筆が捗るのか」というイメージが湧かない人も多いだろう。いくら便利だと言われても、具体的な活用法が見えなければ結局は普通のエディタとの違いが分からない。ではどうしたら執筆に活用できるのか。俺自身はこの2年間、AIを文章執筆に活かす方法を模索してきた。そしてようやく3つの要素が揃ったことで執筆環境が一変したと確信した。 EvernoteからObsidianに移行し、すべての情報をMarkdown形式で一元管理音声入力でアイデアを一気に吐き出し、AIに修正・整理させる手法 Cursorの登場により、Markdo

misshiki 2025/03/24

取り組みとしては面白けど、AIが文書の次を書き出すとそっち気が取られて雑念がうまれそうなのがね。AIで文章を生成しても何度も書き直すだろうから、自分ならたたき台を書いてもらうぐらいの使い方になると思う。

人工知能

リンク

Cursorが市場を席巻している理由をちょっと考えてみる - Qiita

Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? はじめにどうも。鳩胸になりたい文鳥です。 Cusorが市場を席巻しているブッチギリでの世界最速ARR $100Mに加えて先日時価総額が1兆円を超えたそうです。間違いなく売れているし今後の成長を期待される企業であるのは間違いないでしょう。 Cursorはソフトウェアエンジニア向けにAI機能を搭載したソースコード編集ソフトを提供している会社です。上記のブログに記載したがCursorは 12人の社員 Microsoft製のVisual Studio Codeをフォークして作ったラッパーアプリ AIのモデルは開発せず、ChatGPTやCl

misshiki 2025/03/24

“マイクロソフトがCopilotにGeminiを取り込んだりClaudeを取り込むとなった場合競合の製品を組み込むことになるため、経営判断が必要になります。 ....一方、Cursorには政治が絡みません。”

リンク

AI時代を生きるエンジニアに必要なマインドセット

こんにちは、しば田です。 AIの登場でエンジニアに求められるマインドセットにも変化が生まれてきています。 AIにどっぷり触れている人は行動の変化に引っ張られるカタチでマインドセットも形成されてきているとは思うのですが、まとまって言語化されているものは現状なさそうなので、自分の思考整理を兼ねて言語化してみようと思います。「システムエンジニア」に必要なマインドセットと銘打ちましたが、 AIを用いて開発する全人類が対象読者になります。これまでの開発経験も別に問わない内容です。では、早速本題にいきます。 1. AIへの期待値を正しく持つ AIに限った話ではないですが、正しい期待値を持たないとその期待が裏切られた時に多大なストレスがかかります。これまでAIをトライしてみたけどすぐに使わなくなった人が自分の周りにもいましたが、大体は期待値の調整ができていない人だったと思います。自分が観測している

misshiki 2025/03/24

“AIには得意分野と不得意分野がはっきりと存在します。得意不得意のも極めができずにAIに不得意分野をやらせ続けていると、なかなか思ったようにいかないのでストレスを溜めることになります。”

リンク

中島聡が大胆予測、「コードが書けるAI」で「SIerの中抜き」が意外な進化を遂げる理由…ムダすぎて草？ - まぐまぐニュース！

日本の大手SIer（System Integrator）いわゆるITゼネコンの開発工程は、「上流」の設計と「下流」のコーディングに分離されている。このスタイルは「もうさァッ無理だよ自分でコード書かないんだからさァッ」的な悲劇をしばしば起こしてきた。では、そんな現場に「コードが書けるAI」を投入したら何が起こるだろうか？著名エンジニアの中島聡氏が興味深い予測をしている。（メルマガ『週刊 Life is beautiful』より） ※本記事のタイトル・見出しはMAG2NEWS編集部によるものですプロフィール：中島聡（なかじま・さとし）ブロガー／起業家／ソフトウェア・エンジニア、工学修士（早稲田大学）／MBA（ワシントン大学）。NTT通信研究所／マイクロソフト日本法人／マイクロソフト本社勤務後、ソフトウェアベンチャーUIEvolution Inc.を米国シアトルで起業。現在は neu.P

misshiki 2025/03/24

“コードは完成度・保守性の高いものを何度も使う時代から、必要に応じてその場で生成し、実行後は破棄してしまう「使い捨てソフトウェア」へと大きなパラダイム・シフトを起こそうとしている”

リンク

生成AIの検索エンジンは60%以上も間違った情報を引用。有料版は無料版より自信を持って間違えやすい（生成AIクローズアップ） | テクノエッジ TechnoEdge

2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless（シームレス）を運営し、執筆しています。 1週間の気になる生成AI 技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI 技術や研究にスポットライトを当てる生成AIクローズアップ。今回は、生成AIモデルが検索で引用する情報が誤ったものが多いことを指摘した米コロンビア大学のTow Center for Digital Journalismによる2025年3月発表の研究を取り上げます。現在、アメリカ人の約4分の1がAI検索ツールを従来の検索エンジンの代わりに使用しているとされています。研究チームは、ニュースコンテンツを正確に検索し引用する能力を評価するため、リアルタイム検索機能を持つ8つの生成型検索ツール（ChatGPT、Perplexity、Per

misshiki 2025/03/24

“調査の結果、これらのチャットボットは全体として60％以上のクエリに対して不正確な回答を提供することがわかりました。Perplexityはクエリの37％に誤った回答をした一方、Grok 3は94％という高いエラー率を示しました”

人工知能

リンク

パナソニックHDと統計数理研、材料から結晶構造を予測する機械学習モデルを開発

パナソニックホールディングスと統計数理研究所は、材料の組成からその結晶構造を高速で高精度に予測するMLアルゴリズム「ShotgunCSP」を開発した。結晶構造予測のベンチマークにおいて世界最高性能を達成したという。パナソニックホールディングス（パナソニック）は2025年3月4日、統計数理研究所と共同で、材料の組成からその結晶構造を高速で高精度に予測するML（機械学習）アルゴリズム「ShotgunCSP」を開発したと発表した。結晶構造予測は、以前から物質科学の基本問題として研究されてきた。しかし、大規模な結晶系や複雑な分子系では、広大な相空間を網羅的に探索する必要があるため計算資源が膨大になり、未解決の問題となっていた。今回、MLアルゴリズムを導入することで、安定した結晶構造が持つ対称性（空間群やワイコフ配置）のパターンを高精度で予測できることを発見。これを用いて探索空間を大幅に絞

misshiki 2025/03/24

“（パナソニック）は2025年3月4日、統計数理研究所と共同で、材料の組成からその結晶構造を高速で高精度に予測するML（機械学習）アルゴリズム「ShotgunCSP」を開発したと発表”

人工知能

リンク

BPMNとは | 一般社団法人BPMコンソーシアム

（注：必ず「BPMとは」「BPMの導入支援サービス」の動画を合わせて観てください。（青字をクリック）） YouTubeを見ることができない場合は「ここ」をクリックしてください。 BPMN（Business Process Model and Notation）マルチベンダーで構成されているOMG（Object Management group)によって維持されている国際標準（ISO19510）の業務フロー（プロセスモデリング表記）です。過去、業務フローは様々な描き方がありました。IT系の企業やコンサルティング会社が基準を定めたものなどが存在しますが、国際的に基準が明確なものはありませんでした。BPMNは単に標準化された業務フローということではなく、BPMにおいて（「BPMとは」も参照してください。）業務改革・改善に無くてはならないものです。このページではその意味を説明します。 ※BPMN

misshiki 2025/03/24

“BPMN（Business Process Model and Notation）マルチベンダーで構成されているOMG（Object Management group)によって維持されている国際標準（ISO19510）の業務フロー（プロセスモデリング表記）”

DX

リンク

DX時代の「業務フロー」完全ガイド～1000枚の経験から導いた成功の法則～｜すぅ | PM & PdM

この記事をご覧になっているということは、業務フロー作成について関心がある、または「そもそも業務フローってどう作ればいいの？」と悩んでいる方が多いのではないでしょうか。私自身、これまで10年以上で1,000枚以上の業務フローを作ってきました。DX推進や業務改善、新規事業の立ち上げなどに携わり、たくさんの成功例と同時に、失敗例も目の当たりにしてきました。その中で痛感したのは、業務フローは単なる「手順書」ではないということ。適当に作った業務フローでは、いざプロジェクトが動き出したときに想定外の問題が発生し、最悪の場合、事業の撤退にまで追い込まれることもあります。一方、しっかりと設計された業務フローは、現場に安心感をもたらし、プロジェクトをスムーズに進める土台となります。この記事では、私が実際の現場で培った経験をもとに、実践で使える業務フロー作成のコツをお伝えします。専門用語は最小限にしつつ

misshiki 2025/03/24

“私のおすすめは、BPMNを参考にしつつ、使う記号は8個程度に絞ることです。以下に例を挙げてみます。”

DX

リンク

VTuberの二次創作は「ナマモノ」になる？ AI生成は許される？令和の同人文化を法的に解説

第7回 VTuberの二次創作は「ナマモノ」になる？ AI生成は許される？令和の同人文化を法的に解説芸術活動を支援する「骨董通り法律事務所」に所属する寺内康介弁護士の協力のもと、連載中の「ポップカルチャー×法律 Q&A」シリーズ。第7回は「二次創作と著作権」を取り上げる。近年、AIの普及もあり二次創作のハードルが下がり、ガイドラインを明確に制定する企業も増えている。任天堂や集英社といった大手企業だけでなく、カラーが「『エヴァンゲリオン』シリーズのファン創作物の公開に関するガイドライン」を制定したのは2020年末のことだ。「エヴァ」二次創作ガイドライン公開　動画配信や有料ファン会員サービスに言及映画『シン・エヴァンゲリオン劇場版』の公開を2021年1月23日（土）に控えるアニメ制作スタジオ・カラーは、「エヴァンゲリオン… しかし、ガイドライン違反で損害賠償を求めるケースは、一般的に

misshiki 2025/03/24

“固有名詞自体は著作権法で保護されないため、たとえば「ルフィ」という名前のキャラクターを別の作品で登場させたり、実在の企業名やブランド名を作品内に登場させたりしても、著作権侵害にはなりません。”

法律と倫理

リンク

個人開発動画編集ソフト「Beutl」の紹介

はじめにこんにちは。yutotuyです。今回は、わたしが個人開発している動画編集ソフト、Beutlを紹介していきます。また、次回以降の記事からはBeutlの開発中に発生した課題と解決策を載せていきます。背景私が動画編集ソフトの開発を始めたのは、中学生の頃にさかのぼります。当時、趣味で動画編集をしていた私は、使っていたAviUtlというソフトのスクリプト言語を通じてプログラミングに興味を持ちました。コロナ禍で自宅にいる時間が増えたこともあって、「もっと性能が良く、安定した動画編集ソフトがあったらいいな」という単純な思いから、プログラミングの勉強と並行して「BEditor」（Beutlの前身）の開発を開始しました。実は、開発する前はAviUtlの利用を便利にするソフトの開発を行っていましたが、AviUtl本体のパフォーマンスや安定性に根本的な課題を感じ、ゼロから新しいソフトを作るこ

misshiki 2025/03/24

“UIフレームワーク: Avalonia C#でクロスプラットフォームUIを実現するためのフレームワークです。”

C#

リンク

AIエージェントが変えるサイバー攻撃　アカウント侵害に要する時間は半分に　Gartner予測

Gartnerは2025年3月18日（米国時間）、AIエージェントが2027年までに、サイバー攻撃者がアカウントの侵害に要する時間を50％短縮するとの予測を明らかにした。 Gartnerのバイスプレジデントアナリストのジェレミー・ドイネ氏は「アカウントの乗っ取り（ATO：Account TakeOver）は、依然として根強い攻撃ベクトルとなっている。脆弱（ぜいじゃく）な認証情報（パスワードなど）が、さまざまな手段（データ侵害、フィッシング、ソーシャルエンジニアリング、マルウェアなど）で収集されているためだ。攻撃者は、収集された認証情報が再利用されていることを期待し、収集したデータとbotを用いて、ログイン試行を自動実行している」と指摘する。 AIエージェントがサイバー攻撃の多くのステップを自動化 AIエージェントは、ディープフェイク音声に基づくソーシャルエンジニアリングから、ユーザー認証情

misshiki 2025/03/24

“artnerは2025年3月18日（米国時間）、AIエージェントが2027年までに、サイバー攻撃者がアカウントの侵害に要する時間を50％短縮するとの予測を明らかに”

リンク

AIで生成した偽の判例を使用した弁護士に1万5000ドルの罰金

とある裁判の抗弁に際しAIで資料を生成したせいで、この世に存在しない判例を引用したことになった弁護士について、計1万5000ドル(約224万円)の罰金支払いが勧告されたことがわかりました。 sanctions rr.pdf (PDFファイル)https://assets.law360news.com/2301000/2301530/sanctions%20rr.pdf Texas Atty Dinged For AI-Generated Fake Citations In Briefs - Law360 Pulse https://www.law360.com/pulse/articles/2301530/texas-atty-dinged-for-ai-generated-fake-citations-in-briefs Lawyer faces $15,000 fine for usi

misshiki 2025/03/24

“とある裁判の抗弁に際しAIで資料を生成したせいで、この世に存在しない判例を引用したことになった弁護士について、計1万5000ドル(約224万円)の罰金支払いが勧告された”

リンク

元ファーウェイ「天才少年」、中国初のエンボディドAI向け汎用基盤モデルを発表ロボット学習を革新 | 36Kr Japan | 最大級の中国テック・スタートアップ専門メディア

人型ロボットに代表されるエンボディドAIの開発を手掛ける「智元機器人（Agibot）」はこのほど、中国初となるエンボディドAI向け汎用基盤モデル「智元啓元大模型（Genie Operator-1）」（以下GO-1）を発表した。GO-1は、人間や各種ロボットのデータを活用し、エンボディドAIに画期的な学習能力を付与する。エンボディドAIはさまざまな環境や物体に対応する汎化能力を獲得し、新たなタスクに順応してスキルを習得できるようになる。智元機器人の担当者によると、GO-1には視覚言語モデル（VLM）と混合専門家モデル（MoE）で構成されるアーキテクチャ「Vision-Language-Latent-Action（ViLLA）」を採用した。 VLMは、インターネット上の膨大な画像やテキストデータを学習し、一般的な場面や言語を理解する能力を獲得する。MoEに含まれるLatent Planner

misshiki 2025/03/24

“GO-1は、人間や各種ロボットのデータを活用し、エンボディドAIに画期的な学習能力を付与する。エンボディドAIはさまざまな環境や物体に対応する汎化能力を獲得し、新たなタスクに順応してスキルを習得できるように”

リンク

グーグル「NotebookLM」にみんな大好き「マインドマップ」機能が追加！

グーグルは3月19日、AIノートアプリ「NotebookLM」にインタラクティブなマインドマップ機能を導入したと公表した。 🛳️Rolling out interactive Mindmaps in NotebookLM! I'm so inspired by the Exploratorium here in SF - What if every notebook generated your own personal set of interactive understanding toys that help you learn through play? What if instead of text or images, Notebook could even… pic.twitter.com/fFJCGrv0kc — Simon (@tokumin) March 19, 20

misshiki 2025/03/24

“グーグルは3月19日、AIノートアプリ「NotebookLM」にインタラクティブなマインドマップ機能を導入したと公表した。”

リンク

DeepSeek・Baidu・Alibabaなどの中国企業がAIモデルをオープンソースにしているのは「アメリカの規制を回避するため」

中国のAI企業・DeepSeekは2025年1月に、OpenAIのモデルに匹敵する推論モデル「DeepSeek R1」をオープンウェイトで公開し、欧米のAI研究者を驚かせました。その後も中国のAI企業が相次いでオープンなAIモデルを市場に投入していますが、これにはアメリカの規制をかいくぐる狙いがあると、経済紙のFinancial Timesが指摘しています。 Why China is suddenly flooding the market with powerful AI models https://www.ft.com/content/13df6250-dffb-40fc-bb79-309764fa3905 これまでのところ、OpenAI・Google DeepMind・AnthropicといったアメリカのAI企業のほとんどはAIを独占的なリソースとして扱っており、最も高度なモデルへ

misshiki 2025/03/24

“「AIをオープンソース化することで、中国はアメリカの制裁を出し抜けるだけでなく、開発を分散化し、世界中の人材を活用してモデルを改良できます。...NVIDIAの高性能チップに対する規制すらさほど障害にはならなく”

人工知能

リンク

Claude 3.7 Sonnetで作ったPower Apps 開発補助ツールでグローバルに反響がきた話 - Qiita

はじめに Claude 3.7 Sonnet。本当に凄まじいですね。 Anthropic社が2025年2月25日に発表されてから、かなり使いまくっています。 Claude 3.5 Sonnetでも凄まじすぎると感じていましたが、「ハイブリッド推論モデル」と称される史上初の仕組みを備え、高度なレスポンスを提供してくださります。 AI関連に課金しすぎている反省もあり、Claudeのサブスクリプションを解約したばかりでしたが、「Limited time offer: Switch to Claude Pro annual plan and save 25% 」という2/27の急なDMから課金を余儀なくされました・・・。月額20$で凄まじい知性が使えるのであれば良しとするか・・・と一旦考えています。さてインターネットにありふれているClaude 3.7 Sonnetの紹介は、GPTのDeep R

misshiki 2025/03/24

“Power Appsの開発補助ツールの作成にチャレンジしてみました。”

リンク

Claudeの利用制限を解除する方法 - 使用回数制限の対処法とコツ｜遊花：遊びながら学ぶ生成AI【フォロバ100】

また使用制限？困ったなぁClaudeを使っていると遭遇する使用制限。無料版では1日の使用回数制限が毎朝リセットされ、Pro版では5時間ごとに利用規制が解除されます。急いでいるときやちょうど大事な作業の途中でこの制限に引っかかってしまうと、とても困りますよね。このような制限は、Claudeの高度な処理能力を多くのユーザーで共有するために設けられています。完全に制限をなくすことはできませんが、効率的な使い方を知っているだけで、制限を気にせず作業を進められるようになります。今回は、私の実践経験から得た具体的なコツをご紹介します。 1. 新しい話題は新しいチャットでClaudeには興味深い特徴があります。メッセージを送信するたびに、その会話の最初から全ての内容を読み直しているのです。つまり、会話が長くなればなるほど、1回のメッセージ送信に必要な処理量が増えていきます。これは逆に言えば、新しいチ

misshiki 2025/03/24

“会話が長くなればなるほど、1回のメッセージ送信に必要な処理量が増えていきます。これは逆に言えば、新しいチャットを始めることで処理量をリセットできる”

リンク

OpenAI、自然で感情豊かに文章読をみ上る音声合成モデル　書き起こしも強化

misshiki 2025/03/24

“音声認識の新モデルとなる「gpt-4o-transcribe」と「gpt-4o-mini-transcribe」と音声合成の新モデル「gpt-4o-mini-ttsをAPIで提供開始したほか、音声合成デモ用のWebアプリ「openai.fm」を公開”

リンク

OpenAI、次世代音声モデルをAPIに導入～「親身なカスタマー担当のように話して」も可能／書き起こしの精度は以前の「Whisper」モデルを凌駕

misshiki 2025/03/24

“米OpenAIは3月20日（現地時間）、次世代音声モデルをAPIに導入したと発表した。「OpenAI.fm」などで試すことができる。”

リンク

ChatGPTの予測能力を爆上げするプロンプトが判明、「物語プロンプト」とはいったい何か？【生成AI事件簿】ロシアによるウクライナ戦争の帰趨についても驚きの回答が | JBpress (ジェイビープレス)

ChatGPTに「○○は将来どうなりますか？」と直接的に尋ねても、大抵は「確かなことは言えません」といった控えめな返答しか得られない。その背景には、未来の出来事を予測しないようChatGPTの頭脳であるLLM（大規模言語モデル）に調整が施されている可能性も指摘されている。ところが、プロンプトにある工夫を加えると、雄弁に未来を語り出すという。どういう工夫なのだろうか。（小林啓倫：経営コンサルタント）生成AIの予測力を上げるには質問すれば何でも答えてくれる、便利な生成AI。いっそ未来のことも聞けないかというわけで、さまざまな形で生成AIを未来予測に活用する取り組みが行われてきたことは、この連載でも何度か取り上げた。たとえば、専門家が編み出した「未来予測手法」に従うよう指示した生成AIは、予測精度が上がるという研究結果が出ている（参照記事）。しかし、もっと簡単にChatGPTの予測精度

misshiki 2025/03/24

“「未来の物語」戦略とは、LLMに未来の出来事を直接的に予測させるのではなく、未来を舞台にしたフィクションの物語を作成させることで、間接的にその出来事を予測させようとする手法”

リンク

ChatGPT利用と孤独感の関係性──OpenAIとMITが共同研究結果を発表

米OpenAIと米MITメディアラボは3月21日（現地時間）、AIチャットbot（特にChatGPT）の利用が、人々の社会的および感情的な幸福にどのような影響を与えるかについての研究結果を発表した。チャットbotの利用時間の長さと孤独感の増加との間に相関関係があることなどが明らかになったとしている。研究方法 OpenAIのチームは、人間の介入なしに約4000万件のChatGPTと人間とのやり取りについて、自動分析を実施した。この分析では、感情的な手がかりを検出し、感情的利用のパターンを理解することを試みた。この分析と並行して、感情的利用のパターンをより深く理解することを目的に、4000人以上のユーザーを対象としたアンケート調査を実施した。オンプラットフォームデータ分析では、特にChatGPTの高度な音声モードのヘビーユーザー約6000人を3カ月にわたって追跡し、利用状況の時間的変化を

misshiki 2025/03/24

“チャットbotの利用時間の長さと孤独感の増加との間に相関関係があることなどが明らかに”

リンク

【解説】Geminiの画像生成がすごい　無料で使えるうちに試してみて (1/8)

sponsored 手軽なのに安心なサイバーセキュリティ対策「QTクイックセキュリティアセスメントサービスpowered by KDSec」自社のセキュリティ対策の弱点を2週間で可視化　中小企業向け問診型のセキュリティ診断 sponsored 気軽に着けられるサイズと価格、最長14日間の動作や充実の睡眠モニタリングなどが特長人気スマートバンドがさらに魅力的に進化！ファーウェイ「HUAWEI Band 10」レビュー sponsored Wi-Fi 7対応の「Archer BE450」「Archer BE220」、便利なスマートリモコン「Tapo H110」 Wi-Fi 7ルーターで一番売れてたTP-Link！　Amazon限定版は納得の高コスパ、メッシュ化もスマートホームも快適だ sponsored ストリーマー・はつめが爆速光回線「ビッグローブ光10ギガタイプ」で配信もゲームもスト

misshiki 2025/03/24

“グーグルは3月12日、最新の大規模言語モデル（LLM）「Gemini 2.0 Flash Experimental」の画像生成・編集機能を「Google AI Studio」で開発者向けに試験的に無料公開した。”

リンク

生成AI「Stable Audio Open」機能強化、オフラインのスマホで8秒未満で音楽生成　Armの技術をどう活用？

Stability AIは2025年3月3日（英国時間）、Armとの提携により、Stability AIの音楽生成AI（人工知能）「Stable Audio Open」を強化したと発表した。Arm CPUを搭載したモバイルデバイスでインターネット接続なしに音楽生成が可能になったという。 Stable Audio Openは、最大47秒のオーディオサンプルやサウンドエフェクトを、テキストから生成できるAIモデル。モデルウェイトがHugging Faceで公開されており、ユーザーは独自のデータを活用してモデルをファインチューニングすることもできる。 Stability AIによると、Armの「KleidiAI」ライブラリとStable Audio Openの連携により、インターネット接続を必要とせず、デバイスで直接、サウンドエフェクトやオーディオサンプルの生成が可能になったという。「ArmのC

misshiki 2025/03/24

“Stability AIは2025年3月3日、Armとの提携により、Stability AIの音楽生成AI（人工知能）「Stable Audio Open」を強化したと発表した。Arm CPUを搭載したモバイルデバイスでインターネット接続なしに音楽生成が可能になった”

リンク

AI向け学習データ提供、同意不要に　相手先公表など条件 - 日本経済新聞

政府の個人情報保護委員会は企業内のデータを第三者に提供する際、AI（人工知能）向けの学習データであれば本人同意を原則不要にする法改正に乗り出す。学習のための良質なデータは2026年にも枯渇するとの指摘がある。企業に眠るデータの活用を後押しし、AIの国内開発を促す。個情委は個人情報保護法の見直しを検討している。早ければ今国会に改正案を提出する考えだ。改正案にはAI学習データの流通促進策を盛り込む

misshiki 2025/03/24

“政府の個人情報保護委員会は企業内のデータを第三者に提供する際、AI（人工知能）向けの学習データであれば本人同意を原則不要にする法改正に乗り出す。”

リンク

ソフトのサイバー弱点、AIエージェントが診断　GMOフラットセキュリティ - 日本経済新聞

GMOインターネットグループ子会社は人工知能（AI）を使ってソフトウエアのセキュリティー上の脆弱性を診断するサービスを開発した。細かく指示しなくても自律的に作業する「AIエージェント」の一種で、4月からアプリ開発企業などに提供を始める。サービス名は「Takumi（タクミ）」。2024年に買収した子会社のGMOフラットセキュリティ（東京・渋谷）が開発した。「このソースコードの脆弱性を探して」とい

misshiki 2025/03/24

“（AI）を使ってソフトウエアのセキュリティー上の脆弱性を診断するサービスを開発した。細かく指示しなくても自律的に作業する「AIエージェント」の一種で、4月からアプリ開発企業などに提供を始める。”

人工知能

リンク

AIを使い一般的なデスクトップPCでも動作するAI天気予報システム「Aardvark Weather」、従来より数千倍少ない計算能力ではるかに高速

従来のAIと物理シミュレーションを組み合わせた天気予報システムに比べ、数十倍のスピードおよび数千分の1の計算能力で天気予報を行える新たなシステム「Aardvark Weather」がケンブリッジ大学のチームによって開発されました。 Fully AI driven weather prediction system could start revolution in forecasting | University of Cambridge https://www.cam.ac.uk/research/news/fully-ai-driven-weather-prediction-system-could-start-revolution-in-forecasting Project Aardvark: reimagining AI weather prediction | The Alan

misshiki 2025/03/24

“Aardvark Weatherのモデルは人工衛星や気象観測所などのセンサーからのデータを取り込むことでいきなり世界と地域の予報を出力することができ、天気予報パイプライン全体を単一のシンプルな機械学習モデルに置き換え”

人工知能

リンク

Google、AI採用の早期山火事抑制システム「FireSat」の衛星第1号打ち上げ

米Googleは3月17日（現地時間）、早期の山火事発見と軽減を目的とした衛星システム「FireSat」の最初の衛星が打ち上げられたと発表した。このプロジェクトは、Google Researchと米衛星製造会社Muon Spacが、米非営利団体Earth Fire Allianceの創設パートナーとして協力して進めている。最初の衛星打ち上げコストの一部は、Google.orgが創設したイニシアチブ「AI Collaboratives: Wildfires」が賄った。打ち上げは、米SpaceXのロケットFalcon 9で行われた。このイニシアチブは、AIを活用して山火事の壊滅的な影響を防ぐという目標に取り組んでいる。 Google ResearchのClimate AI部門のプロダクトディレクター、ジュリエット・ローテンバーグ氏は、自身がカリフォルニアの山火事で避難した経験から、より良い

misshiki 2025/03/24

“FireSatはAIを利用して、世界中のあらゆる場所の画像を過去の画像と比較し、近くのインフラや地域の気象などの要素を考慮して火災の有無を判断する。”

リンク

無料で使えて超高品質、画像生成AIの最新事情 (1/5)

Illustrious XL v1.0の派生モデルillustrious_pencil-XL-v3.2.0で生成した画像。解像度は1824x1248（筆者作成） 2月11日に、韓国ONOMA AIが開発した画像生成AI「illustrious XL（イラストリアス）」のv1.0がリリースされて話題になっています。2024年9月にv0.1が公開された際、v1.0やv2.0を開発していると示唆があったのですが、意図的に公開されていませんでした。3月18日にはクラウドでの「v2.0」も公開を開始しています。最大の特徴は高解像度化です。ベースとなる基盤モデル「Stable Diffusion XL（SDXL）」では1024x1024の画像で学習していますが、v1.0では追加学習用の学習データを1536x1536へと大幅に引き上げています。その分、学習にかかる計算量は大幅に増大していますが、より大き