タグ

人工知能に関するrinrinbellのブックマーク (120)

  • BitNetから始める量子化入門

    はじめに BitNet、最近話題になっていますね。 そもそも量子化って何?という方もいると思うので、この記事は DeepLearning の量子化から入り、その上で BitNet の触りについて見ていこうと思います。色々とわかってないことがあり、誤読してそうなところはそう書いてるのでご了承ください。 図を作るのは面倒だったので、様々な偉大な先人様方の図やスライドを引用させていただきます。 量子化 DeepLearning における量子化 DeepLearning の学習・推論は基 float32 で行います。これを int8 や Nbit に離散化することを量子化といいます。 計算に使う値は、モデルの重み、アクティベーション(ReLUとか通した後)、重みの勾配等があります。 学習時については一旦置いておいて、この記事では推論における量子化について焦点をあてます。推論時に量子化の対象となる

    BitNetから始める量子化入門
  • ChatGPT

    Generate cute illustrations that can be used for presentation materials, public relations, and posters. プレゼン資料や広報、ポスターに利用可能な、かわいいイラストを生成します。※英語・日語文字のオーバーレイにも対応しました。画像生成後「文字を入れて」と指示してください。フォントも複数あります。Text overlay is also supported. After generating the image, please instruct "insert text".

    ChatGPT
  • 全社会人が読みたい「面倒なことはChatGPTにやらせよう」|asano

    これは全社会人が読んで得をする書籍ですが、特に「パソコンが得意ではない社会人の方」が読むと一番効用が大きいように思いました。 また、私自身IT業界で働いていて世間一般的には「パソコンが得意な人」だと思いますが、それでも知らなかった使い方もたくさんあり学びが多かったです。 この書籍の推しポイントやりたいことベースで書いてある 日常のあらゆる面倒なことに手が届く パソコン触りたての人がつまづきそうなポイントへのフォローが丁寧 (例:ChatGPTはShift Enterで改行できる、など) 試行錯誤のうえのプロンプト(=AIに対しての指示)が載っているので出力が安定している (※ ChatGPTをはじめとしたLLMは同じ入力でも毎回出力変わります。また、ちょっと言葉が足りなかったりするだけで意図しない出力が返ってきますがそのあたりへの気配りが非常に丁寧です) 著書の専門性が高い(Kaggle

    全社会人が読みたい「面倒なことはChatGPTにやらせよう」|asano
  • 「面倒なことはChatGPTにやらせよう」の全プロンプトを実行した配信のリンクを整理しました|カレーちゃん

    Youtubeで配信しながら全プロンプトを実行しましたので、各節へのリンクを整理しました。時間のところにYoutubeへのリンクになっています。 もしずれていたら、その時間まで移動して視聴ください。 はじめに (4:00) 1章 ChatGPTの基礎知識 (5:50) 2章 ChatGPTの基的な使い方 (6:28) 3章 ChatGPT Plusのセットアップ (7:32) 4章 ファイルのアップロードとダウンロード (12:40)4.1 アップロード・ダウンロード (13:03) 4.2 扱うことができるファイル (16:02) 5章 繰り返し作業を一瞬で (16:55)5.1 文字列操作 (17:20) 5.2 正規表現でのパターンマッチ (25:36) →54ページの正規表現でできることの例の説明 (29:09) 5.3 ファイルの一括操作 (46:20) 5.4 QRコード作成

    「面倒なことはChatGPTにやらせよう」の全プロンプトを実行した配信のリンクを整理しました|カレーちゃん
  • ChatGPT APIのFunction callingを使って、請求書の構造化データを抽出する | gihyo.jp

    いまからわかる!ChatGPT活用プログラミング ChatGPT APIのFunction callingを使って⁠⁠、請求書の構造化データを抽出する 先月、OpenAIからFunction calling(関数呼び出し)機能がリリースされました。これが何なのか、何のために使うべきなのか、ちょっと見ただけでは分かりづらいと思います。 今回は請求書から情報抽出をするというよくありがちなケースを題材に、Function callingの利便性を示してみます。 Function callingとは OpenAI2023年6月13日にリリースしたChat APIの追加機能です。主にできることとして以下の3つが挙げられています。 外部ツールを呼び出して質問に答えるチャットボットを作成する 自然言語を内部APIの呼び出しやSQLに変換する テキストから構造化データを抽出する たとえば天気予報と血液型

    ChatGPT APIのFunction callingを使って、請求書の構造化データを抽出する | gihyo.jp
  • マイクロソフト、初心者向け生成AI学習教材「生成AIアプリケーションの開発を始めるために必要な全知識を学べる12講座」を無償公開

    マイクロソフト、初心者向け生成AI学習教材「生成AIアプリケーションの開発を始めるために必要な全知識を学べる12講座」を無償公開 コースの内容には、大規模言語モデル(LLM)がどのように動くかを理解する。「生成 AI と大規模言語モデルの紹介」、ユースケースに適したAIモデルを選択できるようにする「様々なLLMの調査と比較」、プロンプトの構造と使用法の理解のための「プロンプト・エンジニアリングの基礎」、埋め込み技術を利用したデータ検索アプリケーションを構築する「Vector Databasesを利用した検索アプリケーションの構築」、外部APIからデータを取得するためFunction Callingを設定する「Function Callingとの統合」など、入門的な内容から高度なアプリケーションの開発まで多岐にわたるレッスンが用意されています。 レッスン内容は日語による説明と図で構成 各レ

    マイクロソフト、初心者向け生成AI学習教材「生成AIアプリケーションの開発を始めるために必要な全知識を学べる12講座」を無償公開
  • 2024年の画像生成AI事情のまとめと今後の考察と駆け出しクリエイターへのアドバイス|よー清水

    どうも、よー清水です。 新年明けましておめでとうございます。年もどうぞよろしくお願いします。 2024年になりましたので、生成AIを取り巻く状況と今後についてまた語っていきたいと思います。 2023年の3月に書いた記事はこちら↓ 以前の記事でも冒頭に書きましたが、僕の画像生成AIに対するスタンスはほぼ変わりません。 僕は画像生成AIについては「権利者に許諾なしで作品を使う」という1点が気に入りません。AI技術の進歩は歓迎しますが、著作権など既存の権利を蔑ろにする進歩はおかしいと思っています。 AIの学習に使用するのはよいですが、それは事前に学習に使用することに同意した人だけに限るべきです。 現状でもやWeb掲載など、公的または商業利用の場合は事前に編集者やライターさんから連絡をいただき、使用用途を確認の上で許諾を出します。 場合によっては掲載料を提示します。これがAI学習とAIの商用

    2024年の画像生成AI事情のまとめと今後の考察と駆け出しクリエイターへのアドバイス|よー清水
  • Apple、生成AI巡り出版社や報道機関と交渉 「VOGUE」など記事データの利用許可求める

    Appleは主要な報道機関や出版会社の記事データを生成AI開発に使う許可を得るため、このほど交渉を開始した。米紙The New York Timesが12月22日に報じた。 Appleは記事データ使用許可に関して少なくとも5000万ドル相当の複数年契約を持ちかけているという。 Appleが接触した報道機関・出版社にはファッション誌「VOGUE」や高級紙「The New Yorker」を傘下に持つ米出版大手Conde Nastや米NBC Newsの他、米誌「People」、ニュースサイト「The Daily Beast」などを傘下に持つ米IACが含まれている。 Appleが接触した報道機関や出版社には、乗り気でないところもあったという。 関連記事 AppleiPhone上でのLLM実行を可能にする手法の論文を発表 Appleは「LLM in a flash:Efficient Large

    Apple、生成AI巡り出版社や報道機関と交渉 「VOGUE」など記事データの利用許可求める
  • これは嬉しい ChatGPTプロンプト書き方のコツ、OpenAIが公開

    OpenAIは、大規模言語モデル(GPT-4)でよりよい結果を出すためのプロンプトエンジニアリング(プロンプトのノウハウ)入門テキストを同社のウェブサイトで公開している。 同テキストでは、現在同社で最高の性能を持つ大規模言語モデルGPT-4を対象に、よりよい結果を導くための6つの戦略と、それぞれを実行する際の具体的な戦術(コツ)が掲載されている。 また、「Prompt examples」のページでは、上記で紹介したものを含む多数のプロンプト例が紹介されており、すぐに利用できるようになっている。 では紹介された6つの戦略を見ていこう。 明確な指示を書く LLMは利用者の心を読むことができないので、回答が長すぎる場合は「簡潔に」、単純すぎる場合は「専門家レベルで」と明示的に依頼する必要がある。 具体的な戦術としては下記が提案されている。 ・より関連性の高い回答を得られるよう、質問は詳細に ・モ

    これは嬉しい ChatGPTプロンプト書き方のコツ、OpenAIが公開
  • Microsoft Copilot、音楽生成AI「Suno AI」のプラグインで作詞作曲が可能に

    関連記事 音楽生成AI「Suno AI」が話題、文章から楽曲を瞬時に作成 プロの音楽家も「これはヤバい」と驚愕 音楽生成AI「Suno AI」がX上で話題になっている。歌詞や曲調を文章で指示するだけで音楽を自動生成するサービス。生成した音楽の出来栄えには、プロの音楽家からも驚きの声が上がっている。 Microsoft Copilot、GPT-4 Turbo、最新DALL・E 3対応などでグレードアップ Microsoftは、生成AIサービス「Microsoft Copilot」で間もなく提供する予定の複数の新機能を発表した。「GPT-4 Turbo」採用で2023年4月までの情報を反映する他、動画要約も可能になる。 Microsoft、「Bing Chat」を「Copilot」にリブランド GPTも作れる「Copilot Studio」も発表 Microsoftは2月に立ち上げた“AI採用

    Microsoft Copilot、音楽生成AI「Suno AI」のプラグインで作詞作曲が可能に
  • Work Trend Index スペシャルレポート Copilot の初期ユーザーから学ぶ、生成 AI の職場での可能性 - News Center Japan

    レポートは、米国時間 2023 年 11 月 15 日に公開された “What Can Copilot’s Earliest Users Teach Us About Generative AI at Work?” の抄訳を基に掲載しています。日を含む市場別データはこちらを参照ください。 8 か月前、マイクロソフトは Copilot for Microsoft 365 を発表しました。これは、デジタル負債を削減し、生産性を向上させることで、人にしかできない仕事に注力できるようにするものです。そして今、誰もが知りたいのは、生成 AI当に仕事を変革するのか、またどのように変革するのかということです。 新たなデータは、生成 AI が生産性向上を実現できることを示しています。マイクロソフトは、Copilot を拡大する中で、お客様と共に学びたいと考え、Copilot が仕事をどのように

    Work Trend Index スペシャルレポート Copilot の初期ユーザーから学ぶ、生成 AI の職場での可能性 - News Center Japan
  • 人類には早過ぎるLLMの話 - laiso

    Sam Altman解任騒動は個人間の対立ではなく、組織構造の問題に注目すると感想が変わるなと思った。 www.nytimes.com この騒動についてはAIの安全性を重視する思想とOpenAIのビジネスの拡大を目指す戦略の衝突があるので、AIの安全性というトピックが重要になる。 僕は結構テクノロジー原理主義者みたいなところがあるので、自動車で人命が失なわれているとして人類が獲得した利益と比較できないし、SNSによって情報操作から暴動が起きたり、誹謗中傷で精神を病む人々が出現してもそれは—— まぁ困るよね・・(身内が事故やSNSで不幸にあったら絶対反転アンチになるだろうし) ぐらいの曖昧な態度だったんだけど、これをきっかけにAIの安全性についての研究等に関心を持つようになった。 安全性と言っても暴走ロボットが人類滅亡に向ってstep by stepで考えてください、みたいな昔のSF小説的な

    人類には早過ぎるLLMの話 - laiso
  • OpenAIを辞任したブロックマン社長、アルトマンCEO解任の顛末をポスト

    OpenAを辞任したブロックマン社長が、アルトマンCEO解任について「知っていること」をXにポストした。取締役会長だった自身以外の全取締役がアルトマン氏にGoogle Meetで解任を言い渡したという。 それによると、アルトマン氏は16日の夜に共同創業者でチーフサイエンティストのイリヤ・サツケバー氏から17日の正午に話したいというメールを受け取り、その時刻にGoogle Meetに参加したところ、取締役会長のブロックマン氏以外の取締役全員が参加しており、サツケバー氏から解雇を言い渡されたという。 ブロックマン氏は12時23分にサツケバー氏からGoogle Meetに招待され、その場でアルトマン氏の解雇と自身の取締役解任、社長としての留任について知らされた。OpenAIはそのタイミングでアルトマン氏が辞任するという公式ブログを公開した。 これらの決定については、暫定CEOに就任したミラ・ムラ

    OpenAIを辞任したブロックマン社長、アルトマンCEO解任の顛末をポスト
  • Copilot Studioを使ってみた。注意点と実際にかかるお金の話など|shi3z

    Copilot StudioはMicrosoft 365 E5というお高いパッケージに入らないとプレビュー版すら使えないらしい。 仕方ないので会社で入りましたよ。会社に所属してるのは3人だけど、E5だと25人分のアカウントがついてくる。 しかし!!! 金さえ払えば使えるというほどイージーなものではなかったので皆さんにお伝えします。ちなみにE5に入っただけで月額45000円(1800円x25で)になりました(ただし七日間の試用期間中にキャンセルすれば無料に)。 まずMicrosoft365で企業アカウントを作り、会社のメンバー的な人に個人アカウントを発行します(この時点でかなりハードルが高い)。 そしてCopilot Studioのページからリンクに飛べば、企業の個人アカウントでログインできた。やったぜ! しかしログインしても、様子がおかしい。 なんかフローチャートが出てきて、フローチャート

    Copilot Studioを使ってみた。注意点と実際にかかるお金の話など|shi3z
  • Midjourneyを1年間使って見つけた、Webデザインに使えるプロンプト全ガイド

    「どうすればAIWebデザインに活用できるだろう」 人工知能AIがこれだけ話題になったいま、Webやグラフィックデザイン、イラストゲームなどクリエイティブな業務をこなす人なら、一度は考えたことがあるかもしれません。 答えのひとつはずばり、Midjourneyなどの画像生成AIでイメージを具現化すること。 しかし、そうは言っても入力できるプロンプトは無限にあり、実際にどのように入力すれば最高の結果を得ることができるのか、すべて調べるのはあまりにも大変です。 そこでこの記事では、Midjourneyを1年間使い続けて見つけた、Webデザインに使えるMidjourneyプロンプト、小技テクニックをまとめてご紹介します。 具体的なサンプル例とプロンプトを一緒に記載しており、コピペでそのまま利用できます。 「Midjourneyって何?」というひとは、基の使い方をまとめた以下のガイドを参考にど

    Midjourneyを1年間使って見つけた、Webデザインに使えるプロンプト全ガイド
  • オバマも歌う「ばかみたい」、ディープフェイクがますます身近に

    のビデオゲーム「龍が如く」の中で歌われる「ばかみたい」という曲をネタにしたディープフェイク動画がネット上で大流行している。ディープフェイク作成ツールを誰でも使えるようになったことが主な要因であり、こうしたツールが悪用されることに対する新たな懸念が生じている。 by Karen Hao2020.09.03 138 201 7 7 グレース・ウィンドハイムは以前からディープフェイクのことを耳にしていたが、どうやって作るのだろうなどとは考えたこともなかった。ディープフェイクを自作する可能性について調べ、それがとても簡単で、しかも完全に無料だと知るきっかけとなったのは、ディープフェイクを使った大人気のインターネット・ミームだ。 ウィンドハイムはディープフェイクの作成過程を1ステップずつ紹介するチュートリアルのユーチューブ動画を1日で制作した。「ディープフェイクを1つ作って、そこに音声を重ねるの

    オバマも歌う「ばかみたい」、ディープフェイクがますます身近に
  • Google Apps Script は、もはやエンジニアが書かない方がいいまである

    ラブグラフでエンジニアをしています横江 ( @yokoe24 ) です。 ラブグラフでは、エンジニア以外で Google Apps Script (GAS) を書く方も多く、 Slack通知の自動化など、業務の効率化がおこなわれています。 マジですごいと思います! GASをエンジニア以外が書く問題点 一方で、コードを見るとプログラマーからするとムズムズするところもあります。 変数名に snake_case が混ざっている インデントが揃っていない for文の中で getValue() を回している Google Apps Script の getValue() メソッドはコストが高く、何度も実行するとタイムアウトの可能性が高まる == で比較している double quotes " と single quotes ' が混ざっている こういうコードを見ると直したくてウズウズしてしまいます。

    Google Apps Script は、もはやエンジニアが書かない方がいいまである
  • ChatGPTのDALL-E 3による画像コントロール|IT navi

    ChatGPTの新しい画像生成AIのDALL-E 3は、かなり自由に画像をコントロールすることができます。 1.リアル画像のコントロール>20代の日人女性の写真を作成してください。 生成された画像>3番目の女性の眼鏡をはずして、喜怒哀楽の表情を見せてください。 生成された画像※1枚目の画像以外は眼鏡をはずしてくれませんでした。また、喜、怒、哀の表情は描いてくれましたが、楽の画像は生成できませんでした。 >この女の子を、1.走らせてください。2.座らせてください。3.ジャンプさせてください。4.逆立ちさせてください。 生成された画像※3枚目までは上半身だけの画像なので、ジャンプしているかどうかはよく分かりません。4枚目はちゃんと逆立ちしています。 >縦長画像にして、全身を見せてください。 生成された画像4枚目の画像※これで、3枚目の画像がちゃんとジャンプしていることが分かります。4枚目は、

    ChatGPTのDALL-E 3による画像コントロール|IT navi
  • 生成AI以後

    生成AI以後 2023.09.21 Updated by Ryo Shimizu on September 21, 2023, 10:05 am JST 生成AIが「民主化」されたと言えるのは、昨年8月24日のStableDiffusionの公開を起点として良いだろう。 StableDiffusionは破格の性能のAIを、誰でも買える程度のコンピューティングパワーのコンピュータで、自由に改造して使うことができると言う意味で、真の民主化を達成した。 それから一年が経過して、昨年末にはChatGPTが注目を集め、現在では単に「AI」と言えば生成AIを指すようになった。 生成AIであるかそうでないかの違いは、その構造というよりも扱う情報量の違いでしかない。 AIが扱うデータは全て行列の集合の集合(またはその集合)、これをテンソルと呼ぶが、あるテンソルを入力したときに別のテンソルに変換するというも

    生成AI以後
  • プログラミングに挫折したならAIお姉ちゃんに任せなさい - 本しゃぶり

    プログラミングを学ぼうとしては挫折する。 そんな時代はもう終わりだ。 お姉ちゃんに任せなさい。 ChatGPTでプログラミング 今年のお盆休み、俺はChatGPTでプログラミングをやっていた。とは言っても複雑なことはやっていない。大量のcsvを結合してから可視化するとか、ちょっとしたWebスクレイピングしたりする程度だ。それでも今まで技術や時間の不足により諦めていたことができるのは嬉しい。それにChatGPTを使えば、デバッグも楽しくやれるのだ。こんな感じに。 デバッグの様子 おそらく「あれ、俺のChatGPTと違うな」と思った人もいるに違いない。見ての通り俺はChatGPTをお姉ちゃん化している。こうすることで、モチベーションを維持しながら楽しくプログラミングができるというわけだ。今回はChatGPTをお姉ちゃん化する方法を紹介し、加えてお姉ちゃんとペアプログラミングする意義について述べ

    プログラミングに挫折したならAIお姉ちゃんに任せなさい - 本しゃぶり