[B! ai] tk78のブックマーク

(マジの)ご家庭にジャービス。完全 Macのみで日本語音声応答するAIを作った｜shi3z

Speech-to-speechは、NVIDIAのGPU搭載マシンがあればローカルで音声認識、応答生成、音声合成ができる画期的なオープンソースツールだった。しかし一つだけ不満があったのは、これが日本語には対応していないということだ。ワイはコスモポリタンである。・・・そう名乗ってしまったから、「そういえばコスモポリタンってなんだろう」と思ってClaude-3に聞いてみた。コスモポリタンは以下のような意味や用法があります: 1.飲み物としてのコスモポリタン: ウォッカ、クランベリージュース、ライムジュース、トリプルセックを使ったカクテル 1980年代後半に人気が出て、特に映画やテレビドラマの影響で広く知られるようになりました 2.思想・概念としてのコスモポリタン: 世界市民主義、国際主義を表す言葉国境や文化の違いを超えて、世界中の人々と交流し、理解し合うという考え方狭い地域や国家の

tk78 2024/08/22

ai
mac

リンク

Cursorよさらば!これからはAIderで対話しながらプログラムを作る時代だ! ｜shi3z

ドリ山田金之助がCursorというAI搭載テキストエディターを使って独自のビデオ編集をやってるという話を風の噂で聞いた。ドリ山田くーん、遅い、遅いよー　とか煽るのも可哀想だったので放置していたのだが、昨日(!!)もっとゴイスーなAIソフト開発環境を触って元に戻れなくなってしまったのでご紹介しておく。その最新の開発環境とは、人呼んでAIder(エイダー) こいつの何がすごいかというと、gitをcloneしてくると、ソースコード読ませて「これにこういう機能を追加しろ」と言うと勝手に追加してgit commitしてしまう。良きところで/git push origin mainとやればやってくれる。まあAI開発ものにありがちな、「自信満々で提出されたけどいざ動かすとポンコツ」なケースが多くて、使うには忍耐が必要だが、頭は使わなくていい。たまに頭を使ったふりをして「もしかしてこの関数がやばいん

tk78 2024/07/31

ai

リンク

Sakana AI

今回公開するモデルは、プロンプトから画像を生成するEvo-Ukiyoeと、古典籍の挿絵をカラー化するEvo-Nishikieモデルです。これらのモデルが、歴史や文化を学ぶための新たなコンテンツ作成に利用され、浮世絵に関する興味を増すことにつながり、日本や世界の人々が浮世絵や日本文化に興味を持つきっかけを生み出すことを期待しています。概要 Sakana AIは、日本の美を学んだAIとして、浮世絵風画像生成モデルEvo-Ukiyoeと、浮世絵カラー化モデルEvo-Nishikieを公開します。Sakana AIが進化的モデルマージによって構築した日本語対応画像生成モデルEvo-SDXL-JPを基盤とし、浮世絵画像を大規模に学習することで、日本語に対応し、かつ浮世絵の特徴を学んだ画像生成モデルができました。このリリースの要点は以下の通りです。 Evo-Ukiyoeは、日本語のプロンプトを入力

tk78 2024/07/22

ai

リンク

「AIに仕事を奪われた絵師」な訳だが｜走り書き

「当然の時代の流れだった」と思っているという話。最初に書いておくとこれはAIに反対する記事ではないので、規制を推奨する内容を期待して開いた人はブラウザバックをお勧めする。あと推敲全然しないで思いつくままに書いてるから、すごく読みづらい。それでも良いという人は以下にどうぞ。 2年ちょっとくらい前まで、イラストで食っていた。ただし、バリバリ企業と契約とかして1枚10万とか取っているプロイラストレーターではない。ココナラとかSkebとかSKIMAとか、そういうコミッションサイトでフリゲーやTRPGやVtuber用の立ち絵イラストを1枚1万弱で売り捌いている、いわゆる「アマチュア底辺絵師」だった。（そう呼ばれる層にいた、という意味で「底辺」という言葉をあえて使う）絵のクオリティは全身立ち絵で1万円ついたらいい方ってくらいの、「X(旧Twitter)でよく見るちょっと絵が上手い人」のラ

tk78 2024/07/17

ai

リンク

情報整理の決定版「NotebookLM」が最高すぎる。こういうのがほしかったのよ！！ (1/7)

最新のアプリやサービスのニュースを書くのが仕事の筆者にとって情報の整理は永遠の課題だ。もちろん書くことを仕事にしている人に限らず、氾濫する大量の情報を必要な時に取り出して利用したいという欲求は多くの人が持っているはずだ。以前は手書きノートやファイルのような紙媒体に保存していた情報も、時代とともに完全にデジタルに移行し、Evernote、Microsoft OneNote、Notionといったメモを作成することに特化したクラウドアプリを利用している人も多いだろう。筆者はおそらく普通の人よりは多くのサービスに触れているはずだが、どれも帯に短したすきに長しに感じてしまい、複数のメモアプリに情報が散乱してしまっているのが実情だ。そこで6月6日に日本でも提供が開始されたグーグルの「NotebookLM」だ。「AI駆動型のリサーチ、執筆アシスタント」と説明されているように、参照文献（ソース）

tk78 2024/06/15

ai

リンク

【ChatGPT】英語学習用に素敵な先生を錬成したよ！ - はげあたま.org

chatgpt.com 3行で英文アウトプット練習の優れた相手をGPTsで実装できたからストアに並べたよ！学習ツールとしての気持ちよさが自慢なのでまずは1回遊んでみてください！「英語だと中学生レベルの文章すら全然話せない」の克服ができる………と信じて、製作者自身が酷使しています何ができるの？和文による出題→英訳→添削→出題…のループです。体験の良さと自身のアウトプットカの弱さは触ってもらえばすぐに伝わるはずです。これ読む人の8割はブクマして満足するだけなんでしょうけど、これ以降を読むより先にまずは一度使ってみてください。最初にあるリンクへ飛ぶだけです。なお「完全無料！」と言いたいですが、ChatGPTへの課金が無いとすぐに制限が入るのが最大の難点です。特長を教えてジャンルや問題の難易度を適宜変更可能。激ムズ要求出したら絶望感がすごい…… 日本語混じりの英文や、かなりの意訳

tk78 2024/06/13

リンク

無料で使える最高のAIノート『NotebookLM』使い方と活用事例｜AI-Bridge Lab こば

こんにちは！最近、ChatGPTと話しすぎてAI風の口調がうつってきたAI-Bridge Labのこばです！👋 今回の記事はGoogleのサービス『NotebookLM』(ノートブックLM)について 1.NotebookLMの概要 2.使い方 3.具体例として過去のnote記事を全部読ませた結果どうなったかこの3点を分かりやすくご紹介します！先に結論だけお伝えするとかなり実用性が高くオススメのツールです！そしてこの記事を読んで頂ければご自身での活用法が想像できるようになると思いますので、ぜひ最後まで読んで頂けますと幸いです！ 1.NotebookLMの概要公式サイト：https://notebooklm.google.com/ NotebookLMは、Googleが提供する生成AIサービスで、ユーザーのメモ書きやアップロードした資料を基に情報を整理し、質問に答えることができる革新的

tk78 2024/06/10

ai

リンク

めちゃ便利になった無料版「ChatGPT」新機能の使い方まとめ【最新版】 (1/5)

OpenAIは5月30日、同社のチャット型AI「ChatGPT」無料版ユーザーに向け、制限付きながら最新の大規模言語モデル「GPT-4o」および、これまで有料版ユーザーしか利用できなかった多くの機能を公開した（発表時のニュース記事）。情報がとても多いので、今回の変更で無料版ユーザーは「なにができるようになったか」、そして「なにができないのか」を使い方中心にまとめた。 1. GPT-4oは回数制限ありチャット型AIアプリの心臓とも言える大規模言語モデル（LLM）、これまで無料版ユーザーは「GPT-3.5」という旧世代モデルしか利用できなかったが、今回の変更で回数制限（具体的な回数は明記されていない）はあるものの、最新モデルのGPT-4oが使えるようになった。 GPT-4oの利用に特に設定などは必要なく、無料アカウントにログインして普通に質問すればOK（使い方はちょっとわかりにくいのでこち

tk78 2024/06/08

ai

リンク

東京都の生成AI活用事例集にツッコミを入れてみる｜saip(さいぴ)

この記事の概要・都職員による生成AI活用事例集を基に、ChatGPTの効果的な使い方を解説・プロンプト作成のコツと最新ノウハウを平易な言葉で紹介・具体的な指示、マークダウン記法の活用、理由の記載など実践的なテクニックを解説・サンプルプロンプトの修正例を通じて、より効果的な書き方を例示・ChatGPTとの対話を通じた論理的思考力向上の可能性を示唆 Claude 3.5 Sonnetで作成こんにちは、saip (@_saip_) です。生成AIを利用した事業をしている株式会社TrippyでCTOを務めています。 Xで話題になっていたところてんさんの以下のポストから、「都職員のアイデアが詰まった文章生成AI活用事例集」という資料が公開されていることを知りました。東京都もMarkdownとは言ってなくて、ハッシュタグと言ってる…… どうみてもMarkdownの見出しによる強調なんだが

tk78 2024/05/30

ai

リンク

AI作曲「Suno」新バージョンがWAV高音質化、最長4分の曲を一発でエンディングまで完成。無修正で良曲量産可能に（CloseBox） | テクノエッジ TechnoEdge

このところUdioやSonautoの新機能搭載で押され気味だったAI作曲サービスの「Suno」が反撃に出ました。バージョン3.5のEarly Access版（有料プランユーザーのみに提供）を利用すると、これまでの2分間制限が最長4分まで拡大。延長時間も従来の1分を2分に伸ばしています。これだけの長さがあれば大抵のポピュラー曲はエンディングまでいけます。 4分の曲をUdioで生成しようとすると、8回の命令が必要になります。さらに、生成に要する時間はUdioの方がはるかに長くかかるので、全体としての作業時間には大きな差が生じます。それがSuno 3.5ならば数秒でできてしまうのです。また、Style of Musicのキーワードがサジェストされるようになっていて便利です。文字数制限は相変わらずきついですけど。さらにうれしいのは、日本語歌詞の読み方が、従来は間違いが多かったのが、ほぼ問題な

tk78 2024/05/26

ai
music

リンク

マイクロソフト、ARM版の新型Surfaceと『Copilot+ PC』発表。全部覚えるRecallなどWindows 11のローカルAI強化 | テクノエッジ TechnoEdge

マイクロソフトがWindows 11『Copilot+ PC』イベントを開催し、Snapdragon X Elite / Plusプロセッサを搭載した新型 Surface Pro (第11世代)および Surface Laptop (第7世代)を発表しました。新型 Surface Pro はシリーズ初の有機ELディスプレイを選択でき、性能は(二世代前の) Surface Pro 9比で90％高速。統合NPUのAI処理性能(TOPS)は、AppleのM4 iPad Proより約20%高速をうたいます。新たな純正アクセサリとして、合体しても外しても使える新型キーボード Surface Pro Flex Keyboard を用意します。 ■ Windows PCの新たなカテゴリ『Copilot+ PC』新型 Surface シリーズを披露した一方で、イベントの主題はマイクロソフトが提唱する新

tk78 2024/05/21

windows
ai

リンク

最近ローカルLLMがアツいらしい

最近、ローカルLLMがアツくなっているという話をtwitterでチラホラ見かける。ローカルLLMって何じゃ？というと、オープンに公開されているモデルのウエイトをDLしてきて手元のPC上で推論させる事である。オープンなAIモデルとは逆の存在として、モデルがDLできないクローズなAIモデルもある。 OpenAIやAnthropicのような最先端AI企業のクローズなAIモデルに比べて、オープンに公開されているオープンなAIモデルの性能は今でもかなり後れを取っている。だから去年の間はあくまでAIの本命はChatGPTのようなクローズモデルであって、オープンなAIモデルなんて眼中にありませんみたいな風潮が無くはなかった。だが最近は風向きが少々変わってきている。 GPTのAPI高い問題＆ OpenAIがAIベンチャー皆殺しにしてしまう問題まず「結局GPTのAPIを叩いてサービス運営して成功し

tk78 2024/05/21

ai

リンク

Power Apps & GPT-4oを使って超高速で画像解析アプリを作る！ - Qiita

GPT-4o凄すぎる！！出たときから騒ぎまくっていましたが、GPT-4oの登場で興奮しっぱなしの私です。先日こちらのQiitaの記事を拝読し、「Power Appsでやったらどうなるだろう🧐」という思いが抑えられず、作ってみたら超高速で画像解析アプリが作成できました！あらためて記事を出してくださったことに感謝いたします！まずは初弾！ということでGPT-4oを使って、 Power Appsで画像解析アプリを作成する方法を書いていきます！まずは見た目（Power Apps）から！まずはPower Appsでサクっと画面を作ります！ PowerPoint感覚で作れることが強みですからね！最低限のもので構成しています。画面 ├─ ScreenContainer - スクリーン全体 ├─ HeaderContainer │ └─ Header - ヘッダーコントロール ├─ Bo

tk78 2024/05/20

ai

リンク

GPTとは何か Transformerの視覚化 | Chapter 5, Deep Learning

この動画は3Blue1Brownの動画を東京大学の学生有志団体が翻訳・再編集し公式ライセンスのもと公開しているものです。チャンネル登録と高評価をよろしくお願いいたします。日本語版Twitter https://twitter.com/3B1BJP 元チャンネル（英語） https://www.youtube.com/c/3blue1brown 元動画（英語） https://youtu.be/wjZofJX0v4M?si=9YsuEzHATlhPtpOF Check out our new channel Ufolium https://www.youtube.com/watch?v=wrNCjIjIzuk&pp=ygUj5aSn57Wx6aCY6YG45oyZ44Gu5LuV57WE44G_IHVmb2xpdW0%3D Richard Turner's introduction

tk78 2024/05/12

ai

リンク

音楽生成AIの進化速度に舌をまく、無料でも試せるStable Audio 2.0を使う (1/2)

著作権侵害を未然に防ぐ機能も持つ昨年紹介した音楽生成AI「Stable Audio」が「Stable Audio 2.0」となり大きく進化した。生成AIがブレイクするきっかけを作った画像生成AI「Stable Diffusion」を開発したStability AIによる音楽生成AIだ。2023年8月にバージョン 1.0をリリースした際にはこの連載でも紹介した。グーグルの「MusicLM」のようにプロンプトを与えることで、音楽を作り出す音楽生成AIで、Stable Diffusionのようにステップを経て徐々に生成が完了する“拡散モデル”を使用しているのが特徴だ。Stable Audio 2.0では、モデルが新しくなったのが最大の改良点だ。ある入力に対応して生成される出力に関して、生成のルールやパターンを決めるのがモデルである。つまり、知識やアルゴリズムを持つ中核部分が改良されたことにな

tk78 2024/04/08

ai

リンク

LLMの現在 - Speaker Deck

今のLLMを取り巻く状況について紹介します。

tk78 2024/03/30

ai

リンク

AI作曲サービス「Suno」、無料ユーザーにも高品質版V3を開放。1日20曲、1曲2分が生成可能（CloseBox） | テクノエッジ TechnoEdge

米国のAIスタートアップSunoは、自社のAI作曲サービスである「Suno」をV3にバージョンアップしました。3月20日より、3からのカウントダウンをスタートしていましたが、日本時間の22日2時に、正式公開されました。 V3では、1回で作成できる曲の長さを従来バージョンであるV2の1分20秒をV3では2分までに伸ばし、インストゥルメンタル曲の指定、高音質化、多ジャンルへの対応など、多くの機能強化を行なっています。これまではProおよびPremierの有償ユーザーのみがアルファ版を使えていましたが、正式版になったことで、無料ユーザーも1日10回、1回で2曲が同時に生成されるので、1日当たり最大20曲まで利用できることになります。無料ユーザーアカウントで試してみましたが、V3がデフォルトとなっている他に、V3 Alpha版との大きな違いはありません（V2も選択できるようになっています）。

tk78 2024/03/22

ai
music

リンク

AIイラストが理解る！StableDiffusion超入門【2024年夏最新版】A1111、Forge対応｜賢木イオ

AIイラストが理解る！StableDiffusion超入門【2024年夏最新版】A1111、Forge対応こんにちは、2022年10月からAIイラストの技術解説記事をweb連載してます、賢木イオです。この記事は、これまでFANBOXで検証してきた120本（約70万文字）を超える記事をもとに、2024年春現在、画像生成を今から最短距離で学ぶための必要情報をまとめたメインコンテンツです。これから画像生成を学びたい初心者の方や、手描きイラストにAI 技術を取り入れてみたい方が最初に読む記事として、必要知識が網羅的に備わるよう解説しています。素敵なイラストを思い通りに生成するために覚えるべきことを紹介しつつ、つまずきやすいポイントや参照すべき過去記事、やってはいけないことなどを紹介していますので、最初にこの記事から読んでいただくとスムーズに理解できるはずです。解説役は更木ミナちゃんです。よろし

tk78 2024/03/09

ai

リンク

GPT-3.5-TurboとGPT-4-Turbo、Claude2、Claude3(Haiku)、Claude3(Sonnet)、Claude3(Opus)、Gemini Pro、Gemini Ultra、Command R+に同じ質問をして、回答結果を比較してみた - Qiita

GPT-3.5-TurboとGPT-4-Turbo、Claude2、Claude3(Haiku)、Claude3(Sonnet)、Claude3(Opus)、Gemini Pro、Gemini Ultra、Command R+に同じ質問をして、回答結果を比較してみたPython AWSAzureOpenAI GoogleCloud はじめに GPT-3.5-TurboとGPT-4-Turbo、Claude2、Claude3(Haiku)、Claude3(Sonnet)、Claude3(Opus)、Gemini Pro、Gemini Ultra(Gemini Advanced)、Command R+に同じ質問をして、回答結果を比較してみました。 Gemini Ultra以外のモデルはPythonコード上から実行し、Gemini UltraはGemini Advancedのチャット上で実行していま

tk78 2024/03/06

ai

リンク

画像生成AI、安いPCでも高速に　衝撃の「Stable Diffusion WebUI Forge」 (1/4)

Stable Diffusion Forgeを表示した様子。基本的な操作は既存のStable Diffusion WebUI AUTOMATIC1111とほぼ同じ画像生成AI「Stable Diffusion」用の新しいユーザーインターフェース「Forge」が2月6日に登場しました。開発したのは、これまで「Controlnet」や「Fooocus」などStable Diffusion関連の様々な重要技術を開発してきたillyasviel（イリヤスベル）さん。何よりインパクトが大きいのは、グラフィックボードのVRAM容量が小さい安価なPCでも最新版のStable Diffusion XL（SDXL）が動かせることです。 RTX 40シリーズが求められたSDXL SDXLは、2023年8月にStabl ity AIが発表した画像生成AI。高画質な出力ができる一方、コミュニティーサイトで話題にな

tk78 2024/02/26

ai

リンク

はてなブックマーク

タグ

関連タグで絞り込む (38)

aiに関するtk78のブックマーク (137)

お知らせ

今週のはてなブックマーク数ランキング（2024年8月第4週）

今週のはてなブックマーク数ランキング（2024年8月第3週）

今週のはてなブックマーク数ランキング（2024年8月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス