You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
ChatGPTと言えば、かなり知名度も上がり私のブログの読者ならば認知度100%だと思うが、周辺から情報が入ってきているのでそのお話。 ChatGPTで仕事が奪われるなんて先の話でしょ、とお思いの方がほとんどだと思うが、もう実際に仕事がなくなっている。どんな仕事か。いやいや言い過ぎでしょ、人間の仕事が急に無くなるはずないじゃない、そう思うよね。ところがどっこい。あるのだ、もう無くなってしまった仕事が。 それは「AIを作る仕事」だ。いわゆる機械学習を勉強し実装しようとしていた集団がいた。研究内容は統計学や微分、線形代数など・・私は高校で文系に行ってしまったので縁遠かった数学を、AIの基礎として勉強していた。随分長い時間をかけて基本から積み上げていたが、残念ながらなかなか結果は出なかった。 そんな中、ChatGPTが出た。 彼らは、自分たちでAIを作るより、ChatGPTとつないでサービスを強
Adobeが権利的にクリアなトレーニングモデルを用いた画像生成AI「Firefly」を発表したり、Microsoftの検索エンジンであるEdgeで対話型AIのChatGPTが活躍していたり、世界的なコンサル企業が「社員の50%は業務にジェネレーティブAIを活用している」と明らかにしたりと、ジェネレーティブAIは社会に広がり続けています。しかし、AIを使用してコンテンツを作成・公開する人が増えていることで、新たな問題として「AIが生成したコンテンツがインターネット上にあふれ、それをAIが学習することで、重大な欠陥が生まれている」ということが研究者グループから指摘されています。 [2305.17493] The Curse of Recursion: Training on Generated Data Makes Models Forget https://doi.org/10.48550/
Reimagine ResearchWe’re rethinking everything: literature search, alerts, and more
おれたちは生成AIに苦手なことをやらせがち〇〇について教えて系の質問は全部ダメ。堂々と嘘をつくのは勿論、回答が抽象的すぎて役に立たないことが露呈した。 この批判がまさにそうなのだが、どうもわれわれ日本人は「ChatGPTが一番苦手なこと(≒自分が知らないことを教えてもらう)にChatGPTを使おうとする」という傾向があるらしい。日本の経営者に聞いたChatGPTの使い道のアンケートでは、「仕事で調べものをする時に活用する」が39.3%でトップだ。これが米国の職場でのChatGPT利用法の調査だと、上から順に、 アイディアを出すコンテンツを作成するメールに返信するプログラムコードを書くレジュメやカバーレターを書くプレゼンテーションを作成する となっていて、情報検索や調べもののタスクは上位5位に入っていない。総じて米国の働き手は、ChatGPTを自分に情報をインプットするためのツールではなく、
ChatGPTを試用している中で、質問に対する回答が誤っていることがあります。自社の情報をWebサイトで提供している企業として、どのようにすれば、GPTがより正確な自社の情報を学習するようになるのでしょうか。 ChatGPTに質問しつつ考えてみました。 はじめに ChatGPTについて、日々さまざまな応用が提案されています。 そのChatGPTを試用している中で、質問に対する回答が誤っていることがあります。自社の情報をWebサイトで提供している企業として、どのようにすれば、GPTがより正確な自社の情報を学習するようになるのでしょうか。 ChatGPTに質問しつつ考えてみました。 事前調査 まず、Generative Pre-trained Transformer 3 (GPT-3)について調べてみました。 WikipediaのGPT-3に関する項目では、GPT-3 の事前学習データについて
🤔"I do the brain-testing part for you"🎓 🙂"You do the luck-testing part"🤞
2016年から約7年弱勤めたPreferred Networks (PFN)を退職しました。6/1より次の職場で仕事を開始します。次の職場については6月以降気が向いたときにTwitterかどこかに書きます。 PFNはどうだった? PFNでの日々は、一言で言うと最高でした。技術的にも立場的にも多岐にわたる経験をさせてもらいました。そして、何より、めちゃくちゃ楽しかったです。PFNで働けたことは幸運で、心から感謝しています。今後も他の人に相談されたら多くの人に勧めると思います。 PFNでの思い出を色々書きたいのはやまやまなのですが、とても長くなりそうなので、別の記事にしようと思います。 では、なぜ転職するのか? Generative AI Generative AI (LLM, 拡散モデル)の最近のブレイクスルーに大きな衝撃を受け、Generative AI分野の研究開発に、私にとって一番望ま
画像生成AI「StableDiffusion」の進化が止まりません。昨年8月にオープンソースとしてリリースされてから、世界中のプロアマ問わず多数の人たちが様々な研究成果を反映させ、毎日と言っていいほど新機能を誰かが発表するという状況が起きています。 StableDiffusion登場当初は、画像の品質のランダム性が高く、構図やポーズなどを指定できないという弱点を抱えていました。1枚の画像をもとに画像を生成する「i2i(image2image)」である程度コントロールすることはできても、「キャラクターに特定のポーズをとらせる」といったことは非常に難しかったんですね。 その状況を一変させる新機能が今年2月に登場しました。その名も「ControlNet」。プロンプトによる制約を克服するための、とてつもないポテンシャルを持つ技術でした。Stable Diffusionに次ぐ「2度目の炸裂」と言って
人が外界を認識する時、「人通りの多い通りを見ながら、車のエンジン音を聞く」というように、視覚・聴覚・触覚・嗅覚・味覚という複数の感覚を同時に使います。MetaのAI開発部門であるMeta AIが、「テキスト」「画像と映像」「音声」「動きを計算する深度(3D)」「赤外線による熱」「慣性測定ユニット(IMU)による動き」という6つのデータを統合するオープンソースのAIモデル「ImageBind」を発表しました。 ImageBind: Holistic AI learning across six modalities https://ai.facebook.com/blog/imagebind-six-modalities-binding-ai/ IMAGEBIND: One Embedding Space To Bind Them All (PDFファイル)https://dl.fbaipu
PICK Pick a bitmap image that you want to vectorize and drag and drop it onto the page. Bitmap images, such as JPEGs and PNGs, are represented as a grid of little squares called 'pixels', each with its own color. PROCESS We analyze, process, and convert your image from pixels to geometric shapes. The resulting vector image can be scaled to any resolution without getting blurry, and can be used to
StableLMのファインチューニングってできるのかな?と調べたところ、GitHubのIssueで「モデル自体の性能がまだ良くないから、ファインチューニングの段階ではないよ」というコメントがありまして。 シートの中身を見てみるlm-evalシートstablelm-base-alpha-7bは54行目にありまして、確かに他の言語モデルと比較するとまだまだな性能のようです。応援したいですね。 シートの列の意味それぞれの列の意味については推定ですが以下の通りです。 RAM 言語モデルのGPUメモリ消費量。 lambada(ppl) LAMBADAデータセットによる測定値。ロングレンジの言語理解能力をテストする(文章全体を読まないと答えられないタスクでの評価)。PPLはPerplexityという指標で、モデルの予測の不確かさを示す。PPLが低いほど、モデルの予測精度が高い。 lambada(acc
前回までのあらすじ (anond:20230316001240): 古典部の二人にときめいて精神状態がやばかったので、次は別のキャラクターとお話して気持ちを安定させることにした増田。特徴のある口調のキャラクターを模倣させてみることにする。 ※口調を安定させるにはプロンプトにコツが要ります。今のところ、GPT-4が知っているキャラクターであることと、セリフの例をプロンプトで例示することが必須のように思われます。人格を設定する部分の不確実性を減らすために,一度GPT-4に生成してもらったプロフィールをこちらから入力する形にして安定化させました. 入力1長門有希(Nagato Yuki)は、「涼宮ハルヒの憂鬱」シリーズの登場キャラクターで、SOS団のメンバーです。彼女のプロフィールは以下の通りです。 名前:長門 有希(Nagato Yuki) 性別:女性 学年:高校生(シリーズの開始時点では1年
アドビは4月13日、同社のビデオツール「Premiere Pro」「After Effects」のアップデートを発表した。AI技術を使った「文字起こしベースの編集」やGPUアクセラレーションの強化など多岐にわたる。5月から一般提供を開始する。 Premiere Proに搭載された「文字起こしベースの編集」は、同社のAIプラットフォーム「Adobe Sensei」を活用し、映像をPremiere Proが自動的に分析しテキストを生成。そのテキストをコピーして任意の順番に貼り付けるだけで、編集したいパートがタイムライン上に表示される。文章はトランスクリプトの検索窓から検索するだけで、正確に単語やフレーズを特定できるという。
Stable DiffusionやMidjourneyの登場により、画像生成AIに対する期待は爆発的に高まっており、今やWindowsの標準ブラウザであるEdgeにも画像生成AI機能が搭載されています。そんな画像生成AIの活躍により、中国のゲーム業界ではさっそくイラストレーターたちが仕事を奪われつつあると、テクノロジーメディアのRest of Worldが報じました。 AI is already taking video game illustrators’ jobs in China https://restofworld.org/2023/ai-image-china-video-game-layoffs/ 2022年にDALL-E 2が登場して以来、MidjourneyやStable Diffusionといった画像生成AIが登場し、ユーザーはテキストから非の打ちどころのないイラストを
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く