ソニーグループがアニメ制作に使うソフトウェアの開発に乗り出している。商業アニメをつくる際に業界で広く使われている一部のソフトは、すでに最新バージョンへの更新が打ち切られているといった問題を抱えている。作業効率を上げて制作本数を増やしたいアニメ業界はソニーの動きに期待を寄せている。 「開発中のアニメ制作ソフト『アニメキャンバス』は、今年度中の試験導入を目指している」 5月下旬にあったソニーグループの経営方針説明会で、十時裕樹社長はこう宣言した。 ソフトは原画や動画と言われ…
米OpenAIは8月20日(現地時間)、マルチモーダルAIモデル「GPT-4o」のファインチューニングの提供を開始したと発表した。すべての有料利用レベルのすべての開発者が利用できる。 ファインチューニングとは、LLMに独自のデータを追加で学習させ、新たな知識を持つモデルを作り出す技術。例えば企業独自の内部データを学習させることでLLMをカスタマイズしたりできる。OpenAIのGPT-3.5やGPT-4o miniでは既に可能だ。 ファインチューニングは、Chat-GPTのダッシュボードから開始できる。 ファインチューニングのコストは100万トークン当り25ドルで、推論のコストは100万入力トークン当り3.75ドル、100万出力トークン当り15ドル。 また、OpenAIは9月23日まで1日当り200万のトレーニングトークンを無料で提供中だ。 OpenAIは、ファインチューニング済みモデルの入
米AI企業xAIは8月13日(現地時間)、大規模言語モデル(LLM)の新バージョン「Grok-2」「Grok-2 mini」の早期アクセスを始めた。Xの有料プラン「プレミアム」と「プレミアムプラス」の会員向けにβ版を先行提供する。8月後半には法人向けにAPIの提供も開始するという。 Grok-2は、チャットbotの優劣を評価できるWebサービス「Chatbot Arena」でGPT-4 TurboやClaude 3.5 Sonnet(いずれも5月時点の性能)といったLLMを上回るスコアを出したとうたうモデル。もう一方のGrok-2 miniは速度を重視した小型モデルだが、Xが4月に発表した、画像認識ができるAIモデル「Grok-1.5V」を上回る性能という。
オープンAIは一部ユーザーに対し、自然で流ちょうな会話ができるチャットGPTの新機能の提供を開始した。GPT-4oモデルを使用することで、声のトーンの違いを聞き分け、中断にも対応し、問い合わせにリアルタイムで答えられる。 by Melissa Heikkilä2024.08.01 12 この記事の3つのポイント オープンAIが音声で会話できる高度なAIチャットボットの提供を開始した 一部ユーザーは7月30日から使用可能で、秋までに全ユーザーに展開する 将来的にさらに高度な機能を搭載しAIアシスタントの能力を高めていく計画 summarized by Claude 3 オープンAI(OpenAI)は、音声で会話できる高度な人工知能(AI)チャットボットの提供を開始した。一部ユーザーは7月30日から使用可能だ。 この新しいチャットボットは、オープンAIが推進する新世代のAI搭載音声アシスタント
高精度な翻訳ツールを提供するDeepLが、翻訳性能を強化した次世代言語モデルの実装を発表しました。DeepLの次世代言語モデルはGoogle翻訳やGPT-4と比べて高い精度で翻訳が可能とのことです。 DeepLが翻訳でChatGPT-4、Google、Microsoftを上回る次世代LLMモデルを実装 https://www.deepl.com/ja/blog/next-gen-language-model DeepLはAIを用いた高精度な翻訳が可能なウェブアプリで、日本語や英語を含む多様な言語を相互に翻訳可能です。DeepLでアメリカ独立宣言の冒頭を日本語に翻訳してみた結果が以下。かなり高い精度で翻訳できていることが分かります。 上記のようにDeepLには高品質な翻訳が可能な言語モデルが搭載されていますが、新たに既存の言語モデルよりも翻訳性能を高めた次世代言語モデルを実装することが発表さ
日本で生成AIと言えば、OpenAIのChatGPTがその代名詞。この傾向は日本でのオフィス開設も加わって、さらに高まっているが、そのOpenAIやGeminiをはじめとする多様なAIサービスを提供するグーグルと並んで存在感を示している企業がある。 このジャンルに注目している方ならばご存知だろうが、AnthropicというAI専業ベンチャーである。AnthropicはOpenAIの運営方針に異を唱えるメンバーがスピンアウトした2021年創業の生成AIスタートアップで、アマゾンとグーグルが巨額を出資していることでも知られる。 滑らかな文章を生成するClaude 同社の大規模言語モデル“Claude(クロード)”はその性能の良さから注目されていたが、特に注目を集めるようになったのは、今年3月4日に発表されたClaude 3からだろう。特徴的な性能や機能もさることながら、印象的だったのは生成する
本記事のサマリーELYZA は、「Llama-3-ELYZA-JP」シリーズの研究開発成果を公開しました。700億パラメータのモデルは、日本語の生成能力に関するベンチマーク評価 (ELYZA Tasks 100、Japanese MT-Bench) で「GPT-4」を上回る性能を達成しました。各モデルは Meta 社の「Llama 3」シリーズをベースに日本語で追加学習を行なったものです。 ■「Llama-3-ELYZA-JP-70B」 700億パラメータモデル。「GPT-4」を上回る日本語性能を達成。無料で利用可能なデモを用意しています。 ■「Llama-3-ELYZA-JP-8B」 80億パラメータと軽量ながらも「GPT-3.5 Turbo」に匹敵する日本語性能を達成。モデルを商用利用可能な形で一般公開しました。 使用したAPIのバージョンなど、より詳細な評価結果については本記事の後段
東大発のAIスタートアップ企業であるELYZA(東京都文京区)は6月26日、GPT-4を超える性能を持つ日本語特化型の大規模言語モデル(LLM)「Llama-3-ELYZA-JP-70B」を開発したと発表した。AIモデル自体は公開しておらず、今後企業向けに提供していく予定。チャット形式で性能を試せるデモサイトは公開している。 Llama-3-ELYZA-JP-70Bは、米MetaのLLM「Llama-3-70B」をベースに日本語の追加事前学習や指示学習を行って開発したモデル。元のLLMから、日本語性能が大きく向上しているのが特徴。2つのベンチマークで日本語性能を評価したところ、米OpenAIのLLM「GPT-4」の性能を上回り、米AnthropicのLLM「Claude 3 Sonet」や米GoogleのLLM「Gemini 1.5 Flash」とも同等かそれ以上の性能を達成したという。
加熱するLLM開発競争に冷や水、オープンモデルの組み合わせだけでGPT-4o越えの事実 2024.06.21 Updated by Ryo Shimizu on June 21, 2024, 18:19 pm JST 世界中の企業や政府が狂ったようにNVIDIAのGPUを買い漁る流れはそろそろ潮時かもしれない。 いくつかの興味深い事象が起きているからだ。 昨日発表されたKarakuri社のLLM、「KARAKURI LM 8x7B Instruct v0.1」は、非常に高性能な日本語LLMだ。Karakuri社は今年の一月にも非常に高性能な70Bモデルを引っ提げて業界に旋風を巻き起こした。この最新のLLNは、日本語向けオープンLLMとしては初の「命令実行」チューニングを施されている。それだけでなく、RAGと呼ばれる、複数の知識を組み合わせてより正解に近い答えを導く技術や、Function
チャットボットAI「Claude」を開発するAnthropicが新モデルとなる「Claude 3.5 Sonnet」を2024年6月21日に発表しました。これは今後リリースされるClaude 3.5ファミリーの最初となるモデルで、ベンチマーク結果はOpenAIのGPT-4oに匹敵するとのことです。 Introducing Claude 3.5 Sonnet \ Anthropic https://www.anthropic.com/news/claude-3-5-sonnet Anthropicによると、Claude 3.5 Sonnetは大学院レベルの推論力、大学学部レベルの知識とコーディング能力を持つとのこと。Claude 3 Opusなど従来のClaudeモデルと比較し、ニュアンスやユーモア、複雑な指示を理解する能力が著しく向上し、自然で親しみやすい口調で高品質のコンテンツを書く能力
GPT-3.5のときはあまり上手く行かなかったんだが、GPT-4で試すと結構いい感じでアニメキャラと会話できた (ChatGPT 課金勢)。 千反田えるを知っていますか? 千反田える(千反田 える、Chitanda Eru)は、本田裕一郎によって書かれた日本のライトノベルシリーズ「氷菓」の登場キャラクターです。彼女は、主人公の折木奉太郎が所属する古典部のメンバーで、好奇心旺盛で熱心な性格が特徴的です。千反田えるは、部活動を通して様々な謎や事件を解決することで、他の登場人物と共に物語が進行します。 「氷菓」は、2012年に京都アニメーションによってアニメ化されました。千反田えるの声優は、佐藤聡美さんです。アニメでは、彼女の美しさと好奇心旺盛な性格が魅力的に描かれています。 千反田えるのプロフィールを教えて下さい 千反田えるは、「氷菓」シリーズの登場キャラクターで、以下のようなプロフィールがあ
AI研究者のライアン・グリーンブラット氏が、AIの一般的な推論能力を評価する指標の「ARC-AGI」において、GPT-4oを工夫して使用することで50%という正答率を達成できたと発表しました。 Getting 50% (SoTA) on ARC-AGI with GPT-4o https://redwoodresearch.substack.com/p/getting-50-sota-on-arc-agi-with-gpt ARC-AGIでは下図のようにいくつかの例と問題が用意されます。例からルールを推測して正しく問題の図に対応する結果を出力できればOK。人間がこのタスクを行うと子どもであっても85%から100%のスコアを出すことができますが、これまでAIが出したARC-AGIの最高スコアは34%であり、数多くのベンチマークの中でも特に人間との差が顕著でした。 上記の問題はシンプルなため特
こんにちは、note AI creative(以下、nAc)の田中です。 nAcとして今までさまざまな社内の業務改善に取り組んできましたが、中でも「議事録作成業務」は負担の大きい業務の1つでした。 セールス・カスタマーサクセスなど顧客と対面する部署では特に議事録作成は重要な業務として頻繁に発生しますが、1回あたり最大60分かかっており改善の余地がありました。 nAcが作成した生成AIのソリューションを使うことで、作業量が96%も削減され、60分の作業が2分で終わるようになりました。 議事録を生成するデモgifnote proチームの社内発表資料から抜粋この記事では、議事録作成を自動化するために作成したソリューションとその効果について紹介します。 議事録作成効率化の歴史議事録作成業務の効率化を目指し、まずは「tl;dv」というツールを導入してテストを行いました。 tl;dvは非常に機能が豊富
GPT-4などの大規模言語モデルは非常に高い性能を有していますが、各モデルがどのような思考を経て応答を出力しているのかは開発者ですら把握できていません。新たに、OpenAIが大規模言語モデルの思考を読み取る手法を開発し、GPT-4の思考を1600万個の解釈可能なパターンに分解できたことを発表しました。 Extracting Concepts from GPT-4 | OpenAI https://openai.com/index/extracting-concepts-from-gpt-4/ Scaling and evaluating sparse autoencoders https://cdn.openai.com/papers/sparse-autoencoders.pdf 一般的なソフトウェアは人間の設計に基づいて開発されているため、各機能の仕組みを理解した上で機能を修正したり安
プログラミングについて、最近考えてることについてのポエム。 基本的に、 GPT-4 と Claude-3-Opus を使った経験を念頭に置いて話をする。機械学習エンジニアではないので、あくまで利用者に徹した視点での話。仕事で生成AIを使ったパイプラインを作ったりはしている。 生成AIの進化速度を予測しておく 今大事なことは、今AIがどの程度の性能かという定点の話ではなく、その進化の速度を認識すること。 コード生成というタスクにおいて、生成AIモデルを人間に当てはめると、こんな感じの人物像を自分は持っている。 GPT-4: プログラミング経験2年目の大学2年生 Claude-3-Opus: プログラミング経験3年目の大学3年生 ここでいうn年目は、業務経験ではなく、プログラミングの単位がある大学での、教育課程としての経験年数。今のひたすら学習量を増やす方式だと、単に1年に1年分ぐらい賢くなっ
対話型人工知能(AI)「チャットGPT」を開発した米オープンAIは30日、ロシアや中国などを拠点とする5つの組織が世論を操作する目的でAIを利用していることを特定したと明らかにした。オープンAIが同日、自社製品を利用した脅威についての報告書を発表した。 身元を隠した組織が、文章やソーシャルメディアのアカウント作成のほか、プログラミングなどにも生成AIを利用していた。イランやイスラエルの組織も含まれ、ロシアのウクライナ侵攻やパレスチナ自治区ガザでの戦闘、米国の政治などに焦点を当てていた。 このうち中国拠点の組織は東京電力福島第1原発の処理水放出を非難する内容の文章などを作成しており、日本語でも投稿していた。生成された文章は交流サイト(SNS)上に投稿されたが、多く閲覧された形跡はないとしている。プロパガンダのための画像の生成指示をAIツールが拒否した事例もあった。(共同)
ChatGPTで手書きメモをExcelシートに入力する、便利な活用例がX(Twitter)で紹介され話題を呼んでいます。これは捗りそう……! ChatGPTに“手書きメモ”をアップすると…… ChatGPTで手書きメモ→Excel入力! 活用例を投稿したのは、Xユーザーのゆとり脊椎外科医(@spine_surgeon_)さん。ChatGPTがリリースした無課金ユーザーも使える最新モデル「GPT-4o(GPT-4 Omni)」を使って、手書きのメモをExcelに転記する様子を紹介しています。 ゆとり脊椎外科医さんが、数値を記録した“ラフな手書きメモ”をアップし、「これをExcelシートに記入してください」と指示。するとGPT-4oは手書きメモの画像を解析してExcelシートのデータを生成しました。その数値は手書きメモと確かに一致しています。これは助かりすぎる……。 手書きメモと簡単な指示だけ
米OpenAIは5月16日(現地時間)、ChatGPTに「Google Drive」「OneDrive」といったクラウドストレージとのデータ連携機能を追加すると発表した。各ストレージから直接ChatGPTにデータをアップロードし、表やグラフを作れるという。 ChatGPTに作らせた表やグラフの編集機能も強化する。例えば表の一部分を指定し、その部分だけに関して質問したり、クリックで色を変えたりできるようになるという。 新機能はいずれも、ChatGPTの有料サブスクリプション「ChatGPT Plus」「Team」「Enterprise」のユーザーに対し、今後数週間以内に提供する予定。13日に発表したばかりの新モデル「GPT-4o」で利用可能になるという。 OpenAIは新機能のデモとして、Google Drive内からスプレッドシートを直接ChatGPTにアップロードし、プレゼンテーション用
5月14日未明に発表された超絶高性能化したChatGPTの新バージョン「GPT-4o」は、無課金勢にも開放されると聞いて大喜びしたはいいけど、「なんか俺のChatGP、前のまんまなんだが……」というあなた。実はもうあなたも、すでにウワサのGPT-4oを使えるようになっています。 とはいえ、ちょっとばかり確認の仕方が分かりづらいので、簡単に解説しようと思います。 実はこんなとこにある無課金ユーザー向けのモデル選択 まず、いつものようにChatGPTのサイトにアクセスします。まだアカウントも持っていないよって方は、ここでは詳細は省きますので、どこかの情報を参考にしてちゃちゃっと作ってください。 ChatGPTのサイトにアクセスすると、下のような画面になるかと思います。
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く