[B! AI][機械学習] tyosuke2011のブックマーク

tyosuke2011 id:tyosuke2011

AIと機械学習に関するtyosuke2011のブックマーク (97)

ReazonSpeech - Reazon Human Interaction Lab
ReazonSpeech¶ ReazonSpeechは、世界最大のオープン日本語音声コーパスを構築するプロジェクトです。日本語音声技術の推進を目的として、35,000時間の日本語音声コーパスを公開しています。音声認識モデル・コーパス作成ライブラリをオープンソースライセンスで配布しています。
tyosuke2011 2024/06/19
機械学習

学習

api

時間

AI
リンク
GPT-4oを使って2Dの図面から3DのCADモデルを作る
はじめに株式会社ファースト・オートメーションCTOの田中(しろくま)です！先日、 OpenAIからGPT-4oがリリースされました。いろいろGPT-4oに関して調べていると、スピードが速くなっていたり、音声も直接扱えてマルチモーダル化が進んでいたりするようなのですが、画像に関して GPT-4-turboに比べ、認識やOCRの精度が向上しているようです。製造業という観点からすると、これは設計図面などに活かせるようになるのでは？と思いました。機械部品などの設計図面は以下のように、特定の方向から部品を2次元上に落とし込んだ形で書かれるのですが、部品本体を描いている図以外に、寸法や名称といった文字も含まれた画像になっています。このような図と文字の複合データにおいて、GPT-4oの進化は有効なのではないかと考えました。 ※画像元URL: http://cad.wp.xdoma
tyosuke2011 2024/05/20
機械学習

AI

3d
リンク
LLMの現在 - Speaker Deck
今のLLMを取り巻く状況について紹介します。
tyosuke2011 2024/03/30
AI

機械学習

人工知能

資料
リンク
NVIDIA、PC上で動くカスタムAI「Chat with RTX」を無償公開
tyosuke2011 2024/02/15
pc

AI

あとで読む

人工知能

機械学習
リンク
AIアニメを作った話｜852話
2/6になんかt2vでいきなりAIanimeがうまく行ったのでそこから9日まで徹夜しながら色々模索してました。
tyosuke2011 2024/02/11
これ相当難しい上にたいしたの出来ないよ時間の無駄

AI

機械学習
リンク
大学間コンソーシアム | 東京大学数理・情報教育研究センター
数理・データサイエンス・AI 教育強化拠点コンソーシアム MIセンターは、2022年度政府予算に盛り込まれた「数理・データサイエンス・AI 教育の全国展開の推進」事業の東京大学における実施主体です。同事業で選定された29大学（拠点校11大学、特定分野校18大学）のコンソーシアムの幹事校として、大学、産業界、研究機関等と幅広くネットワークを形成し、地域や分野における先進的教育モデルの拠点として、数理・データサイエンス・AIの実践的教育の全国普及に努めます。同時に、この分野を牽引できる国際競争力のある人材および産学で活躍できるトップクラスのエキスパート人材の育成を目指します。 [コンソーシアムホームページ] 数理・データサイエンス・AIの活用事例動画本動画集は数理・データサイエンス・AIリテラシーレベル教材の導入となるような活用事例を収集したものです。数理・データサイエンス・AIリテラシーレ
tyosuke2011 2023/12/19
AI

機械学習
リンク
画像生成AIが爆速で進化した2023年をまとめて振り返る (1/5)
Stability AIが画像生成AI「Stable Diffusion」を公開したのは2022年8月のこと。すさまじい勢いで発展してきた画像生成AIの1年を振り返ってみようと思います。初めに見てもらいたいのは「これが無料でいいのか!? “爆速生成AI”がペイントソフトに革命を起こした」で紹介した、KritaとGenerative AI for Kritaを組み合わせて作成した設定資料的な画像です。キャラクターの3面図のサンプル。Vroidで簡単な3Dで当たり（左）として、右の画像を作成する。それを元に、プロンプトや画像に描き込んだりして、最終画像を作成していく。2枚目には前面図の頭部のカチューシャや、胸部分のフリルがなかったりするが、そこに色を加筆して、プロンプトで指示すると、最終画像にそれが追加されるのをリアルタイムに確認しながら修正できる（筆者作成） Stable Diffusi
tyosuke2011 2023/12/11
AI

画像

機械学習

人工知能
リンク
GPTsでNotion APIを叩くようにしてみたらやばかった
OpenAI の DevDay で発表された、GPTs は、特定のタスクに特化したカスタムモデルを作成できる ChatGPT Plus で利用できる新しい機能です。作った GPTs は、自分だけで使うのはもちろん、友達にシェアしたり。ウェブ上で公開することもできます。この GPTs の機能である Actions を使うと、OpenAPI Schema を元に、外部 API を ChatGPT エージェントが実行するようになります。この機能を使って Notion などの様々なサービスと GPTs を繋げてみたので、そのデモと GPTs のつくりかたを解説します。デモ Notion は、API と呼ばれる開発者が Notion のデータを操作し、外部アプリケーションやサービスと連携するための機能が公開されています。そこで、Notion API の OpenAPI スキーマを書いて検索、デ
tyosuke2011 2023/11/15
あとで読む

api

AI

機械学習
リンク
ChatGPT で自分の仕事がどう楽しくなるのかを考えるネタ集 -2023年10月バージョン-
企業・組織に属している方向けの ChatGPT の社会・ビジネスへの影響を考えるお話です。人とComputerの在り方が大きく変わったこれらも交えて。それらが周囲にあふれ出すその日のために、今はしっかりと Prompt の仕方を学んでおきたいものです。そのためのサンプルも幾つか継続して提示しています - とある人の、変わってしまった日常の一部 - なぜ?何が? ChatGPT で変わるのか? - Plugin の可能性 - Code Interpreter の可能性 - Copilot の可能性
tyosuke2011 2023/10/20
機械学習

AI
リンク
【ChatGPTのおすすめプラグイン一覧】猛者達が選んだ最強プラグインの使い方69選 | WEEL
現在、600を超えるChatGPTプラグインが存在します。多すぎないか？全部試す時間なんてないよ……皆さんそう思っているのではないでしょうか。そこで今回は、ChatGPTプラグインを片っ端から試した猛者達をリサーチし、彼らが本当にオススメしているChatGPTプラグイン69選と実際に弊社が使ってみた記事、更には各プラグインの評価までをご紹介します。 ※この記事では多くのプラグインを紹介しているため、「Ctrl+F」もしくは「Command+F」で、知りたいプラグインを検索することがおすすめです。なお弊社では、生成AIツール開発についての無料相談を承っています。こちらからお気軽にご相談ください。 →無料相談で話を聞いてみる ChatGPTプラグインとは？ ChatGPTプラグインとは、ChatGPTにさまざまな機能を追加できるツールです。プラグインを使うと、ChatGPTで以下のよう
tyosuke2011 2023/10/16
AI

機械学習

!!

twitter
リンク
GPT-4Vができることをまとめてみた - 電通総研テックブログ
こんにちは。ISID 金融ソリューション事業部の若本です。先日、GPT-4から発展し、画像も扱うことができるGPT-4 with vision（GPT-4V）が発表されました。GPT-4Vは大規模マルチモーダルモデル（LMMs: Large multimodal models）と呼ばれるAIモデルの一種であり、GPT-4の入力として「画像」を拡張したものになります。今日は Microsoft Researchの論文[1]を中心に、Open AIの発表したSystem Card[2]も踏まえ、GPT-4Vでできることや苦手とすること、そして実用上の制限について解説します。 GPT-4Vの特徴 ① 画像とテキストを入力にできる GPT-4Vでは、GPT-4のテキスト入力に加えて画像も入力することが可能になりました。画像は複数枚入力することが可能であり、かつ、画像とテキストを任意に交互に組
tyosuke2011 2023/10/13
AI

機械学習

画像
リンク
もう初回コードレビューはAIに任せる時代になった - CodeRabbit -
どんな人向けの記事？レビューによって心理的なダメージを受けやすい方非エンジニアだが、エンジニアチームがどんな機能を作っているか知りたい方業務が溜まっていて、レビューに割く時間を捻出するのに苦労している方コピペできるコードも公開します初回レビューをAIに任せると、いろんなロールの人の役に立つレビューは得意ですか？優秀なエンジニアしかいないチームであれば、PRは1トピックに絞って小さく明確なコミットによって作成され、適切な要約とともに提供されることでしょう。しかし、実際にはいろいろな制約から、PRが想定よりずっと大きくなってしまったり、関連トピックと異なるコードが混じってしまうこともあります。実際のところ、大きなPRを適切にレビューするのは難しいことです。また、自分が詳しくない領域のレビューを行わなければいけない機会もあります。今回の記事は、レビューを作成してくれるAI C
tyosuke2011 2023/10/04
AI

エンジニア

機械学習
リンク
【文系でもわかる】ChatGPTのキモ「Transformer」「Attention」のしくみ
第1回は、さまざまなタスクをこなす万能型ジェネレーティブAIツール「ChatGPT」の性能の鍵を握る「トークン長（GPTが文脈を意識できる過去の単語数）」やGPTの歴史的経緯について解説しました。第2回はGPTを支える自然言語処理の分野で使用される深層学習モデル「Transf ormer」とその根幹となる「Attention機構（そのタスクにおいてどの単語の重要度が高く、注目すべきか決める仕組み）」についてです。Transf ormerとAttention機構の仕組みを定性的に把握し、それを踏まえてGPTの能力と可能性について考察したいと思います。テクノロジー領域に明るくない人でもわかる記事を目指します。
tyosuke2011 2023/09/27
考察

あとで読む

AI

機械学習

学習
リンク
えっ、まだChatGPT使ってんの？ Bingは無料でGPT-4使えますよ！ - Qiita
はじめにこんなタイトルをしていますが、私はChatGPTを悪く言う意図は全くありません。ChatGPTは非常に優れた製品ですし、実際に、世界はChatGPTによって大きく変わりました。LLMを大きく普及させた先駆者として、とても偉大な存在です。今回は、利用料金に焦点を当てた話になります。 Chat GPT Plusを使いたいけど（もしくは、使っているけど）、ちょっと金額が高いな･･･と感じている方に向けた記事になりますので、ご理解いただけると嬉しいです。 ChatGPT、ちょっと高い･･･！ GPT-4、精度が高くていいですよね！僕もプログラムを書くときや、採用するプロダクトを決めるときなんかによく使っています！でも、ChatGPTのGPT-4を使うには、月額3,000円(※)を払う必要がります。会社が払ってくれるのなら全く問題ないのですが、個人で使うとなると、正直ちょっと高いっ
tyosuke2011 2023/09/15
Microsoft

プログラム

AI

機械学習
リンク
Magenta
An open source research project exploring the role of machine learning as a tool in the creative process. Magenta Studio has been upgraded to more seamlessly integrate with Ableton Live. It is a collection of music creativity tools built on Magenta’s open source models, using cutting-edge machine learning techniques for music generation. Read the blog post.
tyosuke2011 2023/09/07
creative

機械学習

AI

音楽

google
リンク
LINEの3.6B言語モデルで遊んだら爆笑した｜shi3z
LINEから36億(3.6B)パラメータの大規模言語モデル(LLM)が公開されたので早速遊んでみた。正確には遊んだのは昨日のデイリーAIニュースなのだが、面白かったのでこちらにも転載する。細かいやり方は大先生のページを参照のこと。例によってこんな関数を書いた def line(prompt): # 推論の実行 input_ids = tokenizer.encode(prompt, add_special_tokens=False, return_tensors="pt") tokens = model.generate( input_ids.to(device=model.device), min_length=50, max_length=300, temperature=1.0, do_sample=True, pad_token_id=tokenizer.pad_token_i
tyosuke2011 2023/08/16
まさかLineがCHATGPT並のサービス作るのか

LINE

日本

AI

あとで読む

機械学習
リンク
作って遊ぼう！LLMを搭載した君だけのV&Lモデル！
はじめに TuringのBrain Research teamで頑張ってる井ノ上です。(Twitter: いのいち) Turingは完全自動運転の開発を目指しており、その実現のためには賢い頭が必要だと考えています。その方法の一つとして、近年の大規模言語モデル（LLM）に見られるような文脈理解力をうまく取り入れられないかと考えており、LLMとVisionの情報をかけ合わせたモデルに注目して研究を行っています。自動運転とVision and languageモデルについては、ぜひこちらの記事を読んでみてください。今回の記事は2023年7月に開催されたABCI LLMハッカソンで取り組んだときに開発していたGIT-LLMというモデルの開発について解説する記事となっています。途中のコードの解説部分などは少し退屈に感じるかもしれませんので、その場合はぜひ結果のパートだけでも見てみてください。いろい
tyosuke2011 2023/08/10
本読まないと

git

機械学習

AI

あとで読む
リンク
https://thispersondoesnotexist.com/
tyosuke2011 2023/08/08
webサービス

AI

機械学習

webservice

人工知能

マーケティング
リンク
DALL·E: Creating images from text
We’ve trained a neural network called DALL·E that creates images from text captions for a wide range of concepts expressible in natural language. DALL·E is a 12-billion parameter version of GPT-3 trained to generate images from text descriptions, using a dataset of text–image pairs. We’ve found that it has a diverse set of capabilities, including creating anthropomorphized versions of animals and
tyosuke2011 2023/08/08
AI

機械学習

deep learning

画像処理
リンク
Meta、テキストから音楽を生成するAIツール「AudioCraft」を発表
Meta Platformsは米国時間8月1日、テキストから「質の高いリアルな」音楽を生成できる生成人工知能（AI）ツール「AudioCraft」を発表した。 AudioCraftは、Metaの3つの生成AIモデル、「MusicGen」「AudioGen」「EnCodec」で構成されている。MusicGenとAudioGenは、いずれもテキストからサウンドを生成するもので、MusicGenは音楽を、AudioGenは特定の音や効果音を生成する。「HuggingFace」で公開されているMusicGenにアクセスすれば、デモを再生できる。プロンプトには、聴きたいと思うあらゆる時代のあらゆる種類の音楽を記述できる。Metaは、「バックグラウンドでドラムとシンセサイザーが強く響く、80年代風の迫力あるポップソング」などの例を公開している。 Today we’re sharing details
tyosuke2011 2023/08/05
AI

音楽

ツール

機械学習

あとで読む
リンク
1 2 3 4 5 次のページ