Koe Recast is the world's most powerful AI voice changing app
このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: @shiropen2 米Microsoftや米ペンシルベニア州立大学などに所属する研究者らが発表した論文「AutoGen: Enabling Next-Gen LLM Applications via Multi-Agent Conversation」は、複数のエージェントの会話を使用してさまざまな大規模言語モデル(LLM)ベースのアプリケーションを作成するためのフレームワークを提案する研究報告である。このフレームワークでは、各エージェントを容易にカスタマイズでき、多様なアプリケーションへの対応が可能となる。プロジェクトページはこちら。
About ようこそプロジェクトに貢献するにはGeneral コード補完コメントからコードを生成コードからコメントの自動生成GitHub CopilotとのクイックQ&A正規表現プログラミング言語間の翻訳タイプヒンティング構造化データからのオブジェクト生成コードからドキュメントへClient Side Tips Copilot スニペットハンドリングGitHub Copilot ショートカット定義に移動便利なファイルのピン留めDesign Patterns AI が理解可能な命名規則一貫性のあるコーディングスタイルハイレベルアーキテクチャを先に小さなコードチャンクで作業するコンテキストレス・アーキテクチャ微細な OSS 依存関係の排除Collaboration AIフレンドリーなドキュメンテーションプロンプトとコード生成プロセスのコーチングTesting ユニットテストの作成テストコード生
Microsoftが2021年に発表したコード補完AIツール「GitHub Copilot」は、2022年に月額10ドル(約1500円)または年額100ドル(約1万5000円)で利用可能な有料サービスとして提供が開始されました。ところが、経済紙のウォール・ストリート・ジャーナルが発表したレポートによると、MicrosoftはGitHub Copilotのユーザー1人あたり月額20ドル(約3000円)近くの損失を出しているとのことです。 Big Tech Struggles to Turn AI Hype Into Profits - WSJ https://www.wsj.com/tech/ai/ais-costly-buildup-could-make-early-products-a-hard-sell-bdd29b9f Report: GitHub Copilot Loses an
注:最後のアプリの売り上げに関する部分と、アプリ開発時のChatGPTとの会話の完全なやり取りのオマケ部分のみ有料となります。 Whisperを使って誰でも手軽にサクッと高精度文字起こしができるWindows用アプリ「MyWhisper(マイウィスパー)」をChatGPTに作ってもらってboothで販売したという話です。 https://umiyuki.booth.pm/items/4663311 Whisperでお手軽に音声ファイルを文字起こしできるWindowsアプリ、MyWhisper(マイウィスパー)を開発してboothにて公開しました!CPU処理するのでGPU無くても動作します。有料のプロ版は全てのモデルが使えます。無料版はLargeモデル(最高品質)以外のモデルが使用できます https://t.co/FrdtcQzZ5r pic.twitter.com/ELKEkfGMau
米Adobeは9月28日、β版として提供していた「Adobe Photoshop Web」の正式版をリリースした。インストール不要でブラウザからPhotoshopの機能にアクセスでき、同社の生成AI「Firefly」などの機能も利用可能。無料版はないものの、Photoshopを含む全てのCreative Cloudプランで使えるとしている。 Web版はインストールなしに、ブラウザ上でPhotoshopの機能が利用できるもので、ファイルの作成や編集だけでなく、デスクトップ版に移動しての作業もスムーズに行うことができる。デスクトップ版と機能は同一ではないものの、β版のリリース以降、よく使われる機能の大半をWeb版に搭載したとしている。 また、データの共有先がPhotoshopユーザーではない場合でも、共有時に生成したリンクからWeb版Photoshopを立ち上げることができ、ファイルの表示とコ
LINEから36億(3.6B)パラメータの大規模言語モデル(LLM)が公開されたので早速遊んでみた。正確には遊んだのは昨日のデイリーAIニュースなのだが、面白かったのでこちらにも転載する。 細かいやり方は大先生のページを参照のこと。 例によってこんな関数を書いた def line(prompt): # 推論の実行 input_ids = tokenizer.encode(prompt, add_special_tokens=False, return_tensors="pt") tokens = model.generate( input_ids.to(device=model.device), min_length=50, max_length=300, temperature=1.0, do_sample=True, pad_token_id=tokenizer.pad_token_i
毎日AIニュースを追いかけていると、当然、波がある。 「今週は落ち着いてるな」とか「今日はやばいな」とか。 今日は、久々に「やばいな」という日だった。 まず、一日のうちにSOTA(State Of The Art)超えしたという大規模言語モデルを三つくらい見た。明らかにおかしい。 さらに、AttentionとMLPを使わない大規模言語モデルの実装も見た。世界を三次元的に解釈して合理的な質問と答えを行う大規模言語モデルもあれば、4ビット量子化した60モデルは8ビット量子化した30Bモデルよりも高性能という主張がなされたり、Googleは論理回路の設計を強化学習で行なっているという。どれもこれもにわかには信じ難いが、今目の前で起きていることだ。 「シンギュラリティ」の定義には、「AIがAIを設計し、改良し続ける」という部分があるが、今のAIは人間も考えているが、実はAIがAIを設計している部分
単方向通信であるということと、HTTP/1.1上で動作しているのが大きな特徴です。 また、HTTP上で動作することから、通信の互換性が高く、セキュリティモデルも使いまわせるので安心です。 どんな用途と相性がいいの? 双方向通信がしたいわけでなければ、相性の幅がとても広いです。 今回の ChatGPT のような、GPT がトークンを生成するごとに送るケースはもちろん、通知の未読件数バッジの更新、ニュース速報の表示など、サーバからイベントを送りたい時ならなんでも使えます。 HTTP/1.1で動くカラクリ SSEはHTTPのレスポンスヘッダにContent-Type: text/event-streamを指定した上で動作します。 SSEが動く流れ クライアントがサーバーに HTTP/1.1 リクエストを送信し、イベントストリームに接続します。 サーバーは、Keep-Alive 接続を使用して、T
はじめに こんにちは、CTO/DevRelブロックの堀江(@Horie1024)です。ZOZOではGitHub Copilotを全社へ導入しました。本投稿では、GitHub Copilotの導入に際して検討した課題とその課題の解決策としてどのようなアプローチを取ったのかを紹介します。 目次 はじめに 目次 GitHub Copilotとは何か? GitHub Copilot導入の背景と目的 導入する上での課題 セキュリティ上の懸念 ライセンス侵害のリスク GitHub Copilot for Businessの利用 導入による費用対効果 試験導入による費用対効果の見積もり 試験導入の実施 対象者の選出 アンケートの設計 試験導入の実施 アンケート結果の集計 アンケート結果の考察 費用対効果の見積もり 全社導入の判断 導入決定後のGitHub Copilot利用環境の整備 社内LT会 おまけ
Copilot をオープンベータ直後から長く使っていて、また補助的に ChatGPT も使いながらコードを書いていて、なんとなくコツがわかるようになってきた。 自分は生成モデルのことは表面的な理解しかしてない。雑にバックプロパゲーションの実装の写経したり、Transformer の解説とかは読んだが、にわかの域を出ていない。 あくまで利用者として生成モデルから吸い出したプラクティスになる。 基本的に TypeScript と Rust での経験が元になっているが、他の言語にも適用できる話ではあると思う。自分は TypeScript はかなり得意だが、 Rust はあんまり書けるわけではなく、Rust の学習で ChatGPT を頼ろうとして失敗しているというステージ。 Copilot / ChatGPT とどう付き合うか まず、前提として ChatGPT も Copilot も、コード生成
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く