「TRANSFORMERS」を検索 - はてなブックマーク

1 - 40 件 / 1407件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

TRANSFORMERSの検索結果1 - 40 件 / 1407件

画像生成AI「Stable Diffusion」を低スペックPCでも無料かつ待ち時間なしで使う方法まとめ
- 779 users
- gigazine.net
- テクノロジー
- 2022/08/24
2022年8月23日に無料公開された画像生成AI「Stable Diffusion」は、「ボールで遊ぶ猫」「森の中を走る犬」といった指示を与えると指示通りの画像を出力してくれます。Stable Diffusionはデモページで画像生成を試せる他、NVIDIA製GPUを搭載したマシンを用いてローカル環境で実行することも可能です。しかし、デモページは待ち時間が長く、NVIDIA製GPUは所持していない人も多いはず。Googleが提供しているPython実行環境「Colaboratory」を利用すれば、NVIDIA製GPUを所持していなくともStable Diffusionを待ち時間なしで実行する環境を無料で整えられるので、実際に環境を構築する手順や画像を生成する手順を詳しくまとめてみました。 Stable Diffusion with 🧨 Diffusers https://huggingf
- AI
- あとで読む
- 画像
- Stable Diffusion
- StableDiffusion
- PC
- イラスト
- まとめ
- google
- コマンド
ChatGPTを業務に組み込むためのハンズオン.pdf
- 588 users
- www.digital.go.jp
- テクノロジー
- 2023/08/25
ChatGPTを業務に組み込むためのハンズオン 2023/06/26 一般公開用デジタル庁 Fact&Data Unit 大杉直也 ↑マイナンバー交付数のダッシュボードを作っているところです「Microsoft でテストされたアイデアのうち、改善を示すメトリクスを実際に改善できたのは3分の1にすぎない」 (Microsoft社元Vice President) 「もしあなたが実験主導のチームにいるなら、70%の仕事が捨てられることに慣れてください。それに応じてプロセスを構築しましょう」(Slack社 Director) A/Bテスト実践ガイド p14より一方で「アイデアの価値を見積もることは難しい。このケースでは、年間１億ドルの価値ある単純な変更が何か月も遅れていた。」(同著 p5より) こともあります午前中のアイデアソンで出たアイデアはちゃんと検証するまで価値があるかは不明です
- ChatGPT
- あとで読む
- AI
- api
- GPT
- pdf
- 文章
- 機械学習
- プロンプト
- OpenAI
東京オリンピックの競技中に映り込んだ「実物大ガンダム」の説明に海外メディアが苦戦
- 556 users
- gigazine.net
- アニメとゲーム
- 2021/08/06
2021年7月から開催されている「東京2020オリンピック」は、新型コロナウイルスの影響で無観客開催となりましたが、競技の様子は世界中に配信されています。そんな中、競技の背景に映り込んだ「ガンダム」の説明にイギリスの公共放送であるBBCなどが苦戦していると、海外メディアが報じています。 Tokyo 2020 Olympics Commentator tries his best to say 'Gundam' https://kotaku.com/olympics-commentator-tries-his-best-to-say-gundam-1847366388 The BBC's Twitter Account Thought Gundam Was A Transformer https://kotaku.com/the-bbc-still-doesnt-know-what-gund
30分で完全理解するTransformerの世界
- 550 users
- zenn.dev/zenkigen_tech
- テクノロジー
- 2023/02/14
はじめに初めまして。ZENKIGENデータサイエンスチームのはまなすです。正式な所属はDeNAデータ本部AI技術開発部なのですが[1]、業務委託という形で今年度から深層学習系の開発等に携わっています。深層学習界隈では、2017年に衝撃的なタイトル（Attention Is All You Need）の論文が発表されてから早5年半、元出自の機械翻訳タスクを大きく越えて、Transformer関連の技術が様々な領域で用いられる汎用アーキテクチャとして目覚ましく発展し続けています。今回はそんなTransformerが現時点までにどのように活用されてきたか、また、どのように工夫されてきたかをざっくりと俯瞰し、流れをおさらいする目的の記事になります。本記事の大枠は、2021年時点でのサーベイ論文である A Survey of Transformers に倣いつつ、適宜、2023年2月上旬現在ま
- 機械学習
- あとで読む
- Transformer
- AI
- 学習
- 自然言語処理
- 勉強
- algorithm
- ChatGPT
- deeplearning
ChatGPTなどの大規模言語モデルはどんな理論で成立したのか？重要論文24個まとめ
- 550 users
- gigazine.net
- テクノロジー
- 2023/06/04
2022年11月にChatGPTが公開され、たった1週間で100万ユーザーを超えたのをきっかけに、GoogleのBardやMicrosoftのBing AI Chatなど、大規模言語モデルを利用したチャットAIが続々とリリースされています。チャットAIを研究しているセバスティアン・ラシュカさんが、チャットAIが実用化されるまでの研究の軌跡を重要な論文24個に絞って要約しています。 Understanding Large Language Models - by Sebastian Raschka https://magazine.sebastianraschka.com/p/understanding-large-language-models ◆目次・主要なアーキテクチャとタスク・スケーリングと効率性の向上・言語モデルを意図した方向へ誘導する・人間のフィードバックによる強化学習(
- AI
- あとで読む
- ChatGPT
- LLM
- 論文
- 人工知能
- 機械学習
- GPT
- まとめ
- 文章生成AI
GPTの仕組みをちゃんと勉強したい本 - きしだのHatena
- 506 users
- nowokay.hatenablog.com
- テクノロジー
- 2023/04/25
やっぱGPTを仕組みから勉強したい、という本をいくつか見つけたのでまとめておきます。まず理論的な概要。機械学習からニューラルネットワーク、CNNでの画像処理、トランスフォーマーでの自然言語処理、音声認識・合成、そしてそれらを組み合わせたマルチモーダルと章が進むので、理論的な概観を得るのにいいと思います。最初は数式が多いのだけど、Σをfor文だと思いつつ、定義が説明文中に埋まってるPerlよりたちが悪い記号主体言語だと思えば読めるけどめんどくさいので飛ばしても問題ないと思います。深層学習からマルチモーダル情報処理へ (AI/データサイエンスライブラリ“基礎から応用へ” 3) 作者:中山英樹,二反田篤史,田村晃裕,井上中順,牛久祥孝サイエンス社Amazon で、もういきなり作る。トークナイザーから全部つくっていきます。TensorFlowでBERTをつくってGPT2をつくる
- GPT
- あとで読む
- ChatGPT
- AI
- 本
- 学習
- 人工知能
- 文章生成AI
- ライブラリ
- Transformer
Google Colab ではじめる Stable Diffusion v1.4｜npaka
- 438 users
- note.com/npaka
- テクノロジー
- 2022/08/23
2. ライセンスの確認以下のモデルカードにアクセスして、ライセンスを確認し、「Access Repository」を押し、「Hugging Face」にログインして（アカウントがない場合は作成）、同意します。 4. Colabでの実行Colabでの実行手順は、次のとおりです。 (1) メニュー「編集→ノートブックの設定」で、「ハードウェアアクセラレータ」に「GPU」を選択。 (2) 「Stable Diffusion」のインストール。 # パッケージのインストール !pip install diffusers==0.3.0 transformers scipy ftfy(3) トークン変数の準備。以下の「<HugginFace Hubのトークン>」の部分に、先程取得したHuggingFace Hubのトークンをコピー&ペーストします。 # トークン変数の準備 YOUR_TOKEN="<H
- AI
- あとで読む
- StableDiffusion
- google
- 画像
- Stable Diffusion
- 画像生成
- 機械学習
- Colab
- deep learning
日本語言語モデル「Japanese StableLM Alpha」をリリースしました — Stability AI Japan
- 437 users
- ja.stability.ai
- テクノロジー
- 2023/08/10
Stability AI Japan は70億パラメータの日本語向け汎用言語モデル「Japanese StableLM Base Alpha 7B」及び、指示応答言語モデル「Japanese StableLM Instruct Alpha 7B」を一般公開しました（略して「JSLM」)。これらのモデルはベンチマークスイート「lm-evaluation-harness」による複数の日本語タスクを用いた性能評価において、一般公開されている日本語向けモデルで最高の性能を発揮しています。汎用言語モデル「Japanese StableLM Base Alpha 7B」「Japanese StableLM Base Alpha 7B」はウェブを中心とした大規模なデータを用いてテキスト生成を学習したモデルです。学習データは主に日本語と英語で、それに加えソースコードが約2%含まれています。学習データに
- AI
- あとで読む
- LLM
- 日本語
- 学習
- 機械学習
- ChatGPT
- NLP
- japan
- japanese
画像認識の大革命。AI界で話題爆発中の「Vision Transformer」を解説！ - Qiita
- 436 users
- qiita.com/omiita
- テクノロジー
- 2020/10/12
0. 忙しい方へ完全に畳み込みとさようならしてSoTA達成したよ Vision Transformerの重要なことは次の3つだよ画像パッチを単語のように扱うよアーキテクチャはTransformerのエンコーダー部分だよ巨大なデータセットJFT-300Mで事前学習するよ SoTAを上回る性能を約$\frac{1}{15}$の計算コストで得られたよ事前学習データセットとモデルをさらに大きくすることでまだまだ性能向上する余地があるよ 1. Vision Transformerの解説 Vision Transformer(=ViT)の重要な部分は次の3つです。入力画像アーキテクチャ事前学習とファインチューニングそれぞれについて見ていきましょう。 1.1 入力画像まず入力画像についてです。ViTはTransformerをベースとしたモデル(というより一部を丸々使っている)ですが、
- 機械学習
- AI
- あとで読む
- 画像
- 画像処理
- 画像認識
- Transformer
- 学習
- qiita
- Deep Learning
GPTのモデル構造を可視化した｜shi3z
- 401 users
- note.com/shi3zblog
- テクノロジー
- 2023/06/10
GPTのモデル構造を目で見てみたい! そんな気持ち、わかるでしょ? 技研フリマをやりながら、どうにかこうにか出力したよご覧あれやり方メモ from transformers import AutoTokenizer, AutoModelForCausalLM from torchviz import make_dot tokenizer = AutoTokenizer.from_pretrained("gpt2") from transformers import pipeline, set_seed generator = pipeline('text-generation', model='gpt2') m= generator.model x= m.generate() y= m.forward(x) image = make_dot(y.logits, params=dict(
- AI
- あとで読む
- GPT
- 人工知能
- ChatGPT
- ソフトウェア
- モデル
- 技術
- IT
- 文章生成AI
ChatGPTのコア技術「GPT」をざっくり理解する - Qiita
- 389 users
- qiita.com/ksonoda
- テクノロジー
- 2023/06/01
※本記事はOracleの下記Meetup「Oracle Big Data Jam Session」で実施予定の内容です。 ※セミナー実施済の動画に関しては以下をご参照ください。本記事の対象者これから機械学習を利用した開発をしていきたい方機械学習のトレンド技術を知りたい方なるべく初歩的な内容から学習したい方はじめに Transformerの登場以降、著しい技術革新が続くここ数年、特にOpenAI社のChatGPTのサービス開始以降、おびただしい数の技術ブログや記事がインターネット上に存在する中、本記事に目を留めていただいてありがとうございます。この勉強会では、専門用語や難解な公式を極力排除し、初学者の方々を対象に、「そもそも自然言語の機械学習ってどういうもの？」、「言語モデルって要するに何？」というところからGPTをざっくり理解することを目的としています。従って、本記事に記載のあ
- ChatGPT
- あとで読む
- アルゴリズム
- GPT
- AI
- 技術
- 機械学習
- 言語
- 学習
- 統計
画像生成AI「Stable Diffusion」をGoogle Colabで動かしたメモ - ただいま村
- 379 users
- ima.hatenablog.jp
- テクノロジー
- 2022/08/25
AIが画像を自動生成してくれる「Stable Diffusion」がすごい。これを使ったサービス「DreamStudio」は1枚6秒ほどで画像を生成してくれて早いが、無料枠を超えて使うには課金が必要になる。 Google Colabという、Pythonの実行環境を提供してくれるサービス上でStable Diffusionを動かせるそうだ。お金はかからない。1枚の画像生成にかかるのは30秒ほど。その方法は以下で解説されている。 Google Colab ではじめる Stable Diffusion v1.4｜npaka｜note 自分でもやってみて、今は無事にStable Diffusionを使えるようになっている。しかしGoogle Colabを使うのも初めてだったので上の記事だけだと詰まるところもあった。ここではそれを解説したいと思う。ライセンスの確認 Hugging Faceのトー
Stable Diffusion の仕組みを理解する - ABEJA Tech Blog
- 338 users
- tech-blog.abeja.asia
- テクノロジー
- 2022/12/19
この記事は、ABEJAアドベントカレンダー2022 の 19 日目の記事です。こんにちは！株式会社 ABEJA で ABEJA Platform 開発を行っている坂井です。世間では Diffusion Model 使った AI による画像生成が流行っているみたいですね。自分は元々 Computer Vision 系の機械学習エンジニアだったんですが、この１年くらいは AI モデル開発ではなくもっぱらバックエンド開発メインでやっていて完全に乗り遅れた感あるので、この機会に有名な Diffusion Model の１つである Stable Diffusion v1 について調べてみました！*1 では早速本題に入りたいと思います！ Stable Diffusion v1 とは？ Denoising Diffusion Probabilistic Model（DDPM）学習時の動作 for
ITスキルロードマップ roadmap.sh がすごい。AI and Data Scientist について対応する本をまとめた - Qiita
- 333 users
- qiita.com/aokikenichi
- テクノロジー
- 2024/04/09
ITスキルロードマップ roadmap.sh がすごい。AI and Data Scientist について対応する本をまとめた機械学習データ分析キャリアデータサイエンスデータサイエンティスト Developer Roadmapsというサイトがすごいです。ITエンジニアの分野別にスキルアップのロードマップが示されています。言語、基盤、アプリ、かなり網羅されています。その中のAI and Data Scientist Roadmapについての推薦図書まとめです。雑感これだけ学んでいれば「こいつ知ってるな」感がありますね。ただ気になる点としてはビジネス、ドメイン知識や分析目的定義などのスキルについて言及がないのは残念。いきなり数学から入るコースになってますが、一旦は飛ばしてコード写経してから戻ってきても良いと思います。ここで挫折すると勿体無いので。計量経済学重視の観点はいいですね
- 学習
- あとで読む
- 本
- AI
- IT
- 機械学習
- エンジニア
- スキル
- Qiita
- data
【Day 3】東大松尾研のLLM講座資料が公開されたから、詳しく読んでいくよ【備忘録】 - Qiita
- 322 users
- qiita.com/mohki7
- テクノロジー
- 2024/02/17
Transformer 深層学習モデル以前の言語モデルの課題言語モデルでやりたいことは、「今まで生成した単語列を元に、次の単語を予測する」ことで、その単語は今まで生成した単語列を条件とし、次にある単語がくる条件付き確率を求め、その確率が最大のものを選ぶということだった。（LLM資料p.8参照）ただ、これだと単語列が長くなったときや、類義語の処理に課題が生じてしまっていた。ニューラル言語モデルしかし、計算したい条件付き確率をNNで推定することにより、対処できた。 Encoder-Decoder型のRNN（Recurrent Neural Network)が最も基本的なモデルにはなるが、これでは長文に対応できなかった。（勾配消失＆単語間の長距離依存性の把握が困難） RNNが勾配消失するのは、活性化関数のtanhが1未満の値を取るため、BPTT時に掛け算されるとだんだん値が小さくなってし
- LLM
- あとで読む
- AI
- 学習
- ChatGPT
- 資料
無料でGPT4越え!?ついに来たXwin-LM｜shi3z
- 318 users
- note.com/shi3zblog
- 暮らし
- 2023/09/22
今日のウィークリーAIニュースではnpaka大先生と一週間のニュースを振り返った。今週もいろいろあったが、なんといってもダークフォース、GPT-4越えと言われるXwin-LMである。中国製。大先生もまだ試してないというので番組内で一緒に試してみた。もちろんドスパラ製Memeplexマシン(A6000x2)を使用。 >>> from transformers import AutoTokenizer, AutoModelForCausalLM >>> model = AutoModelForCausalLM.from_pretrained("Xwin-LM/Xwin-LM-7B-V0.1") Downloading (…)lve/main/config.json: 100%|██████████████████| 626/626 [00:00<00:00, 56.2kB/s] [2023
- LLM
- あとで読む
- AI
- ChatGPT
- GPT
- 文章生成AI
- 人工知能
- 機械学習
- 無料
【AI動画生成】Sora 要素技術解説
- 308 users
- zenn.dev/mattyamonaca
- テクノロジー
- 2024/02/17
もう全部OpenAIでいいんじゃないかなはじめに月間技術革新です。ということで、昨日OpenAIから発表された新しい動画生成AI「Sora」が非常に話題となっていますね。圧倒的な一貫性の保持と1分間に及ぶ長時間動画が生成可能という事で、現状の動画生成技術を圧倒的に凌駕する性能を持っているようです。在野エンジニアの小手先テクニックなど一笑に付すような圧倒的性能を Soraの凄さは色んなエンジニアやインフルエンサーがたくさん語っているのでそちらを見てもらうとして、この記事ではSoraを構成する各技術について簡単に解説していければと思います。 Soraの技術構成論文が公開されているわけではないですが、OpenAIが要素技術の解説ページを公開してくれているため、そのページを参考にしていきます。原文を見たい方はこちらからどうぞ全体構成 Soraは以下の技術要素で構成されているとのこと
- AI
- あとで読む
- 動画
- 技術
- OpenAI
- StableDiffusion
- 学習
- GPT
- 論文
36億パラメータの日本語言語モデルを公開しました
- 305 users
- engineering.linecorp.com
- テクノロジー
- 2023/08/14
LINE株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。 LINEヤフー Tech Blog こんにちは。 LINEのNLP Foundation Devチームの清野舜と高瀬翔とoverlastです。 LINEでは2020年11月から日本語に特化した大規模言語モデル「HyperCLOVA」の構築と応用に関わる研究開発に取り組んできましたが、この「HyperCLOVA」と並行するかたちで複数の大規模言語モデルの研究開発プロジェクトが進行しています。今回はそれらの研究開発プロジェクトのうち、我々を含むMassive LM開発ユニットから、日本語言語モデル「japanese-large-lm（ジャパニーズラージエルエム）」をOSSとして公開できる状況になりましたので、本ブログを通じてお伝えすることにしました。この記事
- LLM
- あとで読む
- AI
- LINE
- 機械学習
- 開発
- ChatGPT
- 自然言語処理
- nlp
- 日本語
2023 年に読んでよかった本
- 302 users
- azukiazusa.dev
- テクノロジー
- 2023/12/30
2023 年に読んでよかった本 2023.12.30 年末なので 2023 年のまとめっぽい記事を書きたくなりました。今年は 1 年間でおおよそ 300 冊の本をよんだようです（そのうち 3 割ほどはラノベなのですが...）。その中でも特に印象に残った本を紹介します。年末なので 2023 年のまとめっぽい記事を書きたくなりました。今年は 1 年間でおおよそ 300 冊の本をよんだようです（そのうち 3 割ほどはラノベなのですが...）。その中でも特に印象に残った本を紹介します。忘れる読書この本では「本は忘れるために読んでいます」と語られています。というわけでこの本の内容もあまり覚えておりません(?)。本を読むときには一字一句正確に覚えるような読み方をしていると、「覚えなきゃ」という気持ちが芽生えてしまい、本を読むことが苦痛になってしまうことがあります。そうではなくて、パラパラとペ
- 本
- あとで読む
- book
- エンジニア
- 読書
- 書籍
- Rust
- ランキング
- AI
- IT
機械学習の全体像をまとめてみた
- 265 users
- zenn.dev/yoshikawat64m
- テクノロジー
- 2022/05/13
教師あり学習概要入力値から何かしらの予測をしたい場合を考えます. 予測する対象の正解データが事前に得られる場合、入力値から正解データを出力するモデルを学習する手法を教師あり学習と言います. 主なタスク何を入力して、何を出力するかでタスクが分類されます. 代表的なものに以下が挙げられます時系列予測: 現在以前の時系列データ ⇒ 未来の時系列データ画像分類: 画像 ⇒ ラベル物体検出: 画像 ⇒ 物の位置と種類セグメンテーション: 画像をピクセル単位で分割文章分類: 文章 ⇒ ラベル機械翻訳: ある言語の文章 ⇒ 別の言語の文章時系列予測現在以前のデータから将来のデータを予測します. 実用例株価予測災害予測自動車の事故防止システム主要なアルゴリズム自己回帰モデル（AR・MA・ARMA・ARIMA）時系列間の関係を数学的に定量化、モデル化する. 周期性のあるデ
【図解】誰でもわかるTransformer入門！凄さ・仕組みをわかりやすく解説 - すえつぐのNLP&LLM
- 240 users
- nlpillustration.tech
- テクノロジー
- 2023/02/03
始めにこんにちは！自然言語処理（NLP）・自然言語生成（NLG）の解説記事を書いている、すえつぐです！突然ですが、BERT、GPT-3、PaLMを使ったことはありますか？Transformerはこれらの最先端のモデルに使用されている、現代のNLPモデルには欠かせないモデルです。おそらくBERTやGPT-3でTransformerを知った、このページに来たという人も多いのではないでしょうか。機械学習、特にNLPの勉強をしている方々は、Transformerの概要は知っておいた方が良いと思います。ただ多くのサイトは、いきなり細かい仕組みの解説をする中級者以上向けの記事が多いですよね。そこで、このページでは、Transformerの入門〜中級までの解説をしていきます！まず入門として、「Transformerの使い道」「Transformerの何が凄いのか？」を先に解説します。その上で「T
- 機械学習
- あとで読む
- 自然言語処理
- NLP
- Transformer
- BERT
- AI
- 勉強
- 入門
- プログラミング
「機械学習で時系列予測はできるのか」論議がTransformerと共に帰ってきた - 渋谷駅前で働くデータサイエンティストのブログ
- 238 users
- tjo.hatenablog.com
- テクノロジー
- 2023/10/21
先日、こちらのポストをお見かけしました。 AI技術開発部の高橋が社内勉強会の資料「時系列予測にTransformerを使うのは有効か？」を公開しました。論文Are Transformers Effective for Time Series Forecastingの紹介を中心に、時系列予測について解説しています。ぜひご覧ください。https://t.co/LplxTT8b1d pic.twitter.com/nUXb4bGiQ3— GO Inc. AI Tech (@goinc_ai_tech) 2023年9月28日なるほど、NN全盛というかNN一択の時代にあっては時系列予測もNNでやるのが当たり前になったのだなという感想でした。大昔「沖本本」で古典的な計量時系列分析を一通り学んだ身としては隔世の感がありますが、これもまたNN時代の趨勢なのでしょう。なお、元論文2点は上記リンクから辿
- 機械学習
- あとで読む
- AI
- 時系列分析
- 時系列
- 論文
- 学習
- データ
- 統計
- 勉強
ChatGPTを探す旅に出させていただきます | DevelopersIO
- 236 users
- dev.classmethod.jp
- テクノロジー
- 2023/04/09
文書の数が多い場合、単語の種類(ボキャブラリ)も多くなり単語の次元が大幅に増えていきます。一方、一つの文書に含まれる単語の数には限りがあるため、これは全体として疎行列になります。また、単語が各次元として扱われますが、文書ごとの出現順序など、単語間での関連性を示す情報は抜け落ちたものとなります。それに対して低次元(通常数百次元程度)の密な行列で単語の意味を定義する方法があります。これは、「分散表現」や「埋め込み表現」と言われるものになっております。この表現を獲得するため手法は様々なものがありますが、ここではWord2Vecを紹介します。元論文 : Efficient Estimation of Word Representations in Vector Space 具体的な実装についての解説 : word2vec Parameter Learning Explained Wor
日本語画像言語モデル「Japanese InstructBLIP Alpha」をリリースしました — Stability AI Japan
- 234 users
- ja.stability.ai
- テクノロジー
- 2023/08/17
Stability AIは日本語向け画像言語モデル「Japanese InstructBLIP Alpha」を一般公開しました。入力した画像に対して文字で説明を生成できる画像キャプション機能に加え、画像についての質問を文字で入力することで回答することもできます。 Japanese InstructBLIP Alpha「Japanese InstructBLIP Alpha」は、先日公開された日本語向け指示応答言語モデル「Japanese StableLM Instruct Alpha 7B」を拡張した、画像を元にしたテキストが生成されるモデルです。「Japanese InstructBLIP Alpha」は、高いパフォーマンスが報告されている画像言語モデルInstructBLIPのモデル構造を用いております。少ない日本語データセットで高性能なモデルを構築するために、モデルの一部を大規模な
- AI
- LLM
- あとで読む
- 画像
- 機械学習
- 日本語
- 人工知能
- 生成AI
- 日本
- イラスト
読まないと後悔する技術書30選 - Qiita
- 225 users
- qiita.com/Sicut_study
- テクノロジー
- 2024/06/17
はじめに現代の人に名著以外の本を読むような時間はないこんにちは、Watanabe Jin (@Sicut_study)ですみなさんは何か新しい技術を学ぶときにどんなコンテンツを利用するでしょうか？最近ではUdemyなどの動画講座を利用する人が多いと思いますが、本を読んで学ぶという人もまだまだ多いのではないかと思います今回は私がこれまで5年間読んできた150冊以上の中から厳選した30冊の本を紹介します。広く多くの人に役立つものから、特定の技術の書籍までどれを読んでもあなたの大切な一冊になるのでぜひ読んでみてください現代人には時間がないなぜ働いていると本が読めなくなるのかという本が話題になりました現代人は本を読む時間がなくなっています。仕事に追われてしまい、プライベートで本を読む暇などなくなっているのです。しかし、エンジニアは「技術職」なのでプライベートの時間でも学習をして
- エンジニア
- あとで読む
- 学習
- 本
- 書籍
- 技術
- プログラミング
- 開発
- book
- 勉強
GPTとは何か Transformerの視覚化 | Chapter 5, Deep Learning
- 209 users
- www.youtube.com
- テクノロジー
- 2024/05/11
この動画は3Blue1Brownの動画を東京大学の学生有志団体が翻訳・再編集し公式ライセンスのもと公開しているものです。チャンネル登録と高評価をよろしくお願いいたします。日本語版Twitter https://twitter.com/3B1BJP 元チャンネル（英語） https://www.youtube.com/c/3blue1brown 元動画（英語） https://youtu.be/wjZofJX0v4M?si=9YsuEzHATlhPtpOF Check out our new channel Ufolium https://www.youtube.com/watch?v=wrNCjIjIzuk&pp=ygUj5aSn57Wx6aCY6YG45oyZ44Gu5LuV57WE44G_IHVmb2xpdW0%3D Richard Turner's introduction
- AI
- あとで読む
- GPT
- Transformer
- LLM
- visualization
- アルゴリズム
- YouTube
- 機械学習
PythonとType Hintsで書くバックエンド | メルカリエンジニアリング
- 209 users
- engineering.mercari.com
- テクノロジー
- 2020/11/05
こんにちは、AIチーム所属の@shidoです。CRE (Customer Reliability Engineering) 領域でMLを扱っています。みなさんはPythonで本番コードを書くことについてどうお考えでしょうか。「研究/分析以外には使いたくない」「遅い」「動的型付け言語を本番用に使いたくない」といった声が聞こえてきそうです。しかしながら機械学習サービス(または機械学習サービスのためのサービスなど)を作りたい場合、「学習に利用したPython用のライブラリを使用したい」「Pythonでやっていた分析と同じことを本番環境内でもやりたい」など、Pythonでバックエンドを実装したくなることがあると思います。この記事ではtype hintsを付けながらPythonを書くことで、GoやJavaのようなサーバーサイドでよく使われる言語と可読性や保守性、場合によっては型安全性も同じレベ
- python
- あとで読む
- 型
- *Python
- programming
- class
- IDE
- コード
- プログラミング
- ライブラリ
Anond AI開発日記 - Hatena Developer Blog
- 199 users
- developer.hatenastaff.com
- テクノロジー
- 2023/04/02
こんにちは。Anond AIを研究している id:cockscomb です。私たちはこの度、このAI時代を制するプロダクト、Anond AIを開発しました。本エントリではその詳細について説明します。 Anond AIとは Anond AIはいわゆるGenerative AIで、人類が匿名で日記を書くことをアシストしてくれるものです。私たちは日記に芸術性を感じる文化を持っていて、「日記文学」という言葉もあります。Generative AIによって、名前を隠して楽しく日記を書くことをサポートし、匿名日記文化のさらなる発展に寄与できないか、と考えました。 Anond AIは、rinna/japanese-gpt2-mediumをはてな匿名ダイアリーのデータを用いてファインチューニングし、ドメイン適応させたものです。 Anond AIの開発 Anond AIは実験的なプロダクトのため、Hatel
- AI
- はてな
- あとで読む
- 人工知能
- 文章
- 機械学習
- 開発
- anond
- 言語
- tech
Google Colabで英語の論文を無料で翻訳する方法 - Qiita
- 198 users
- qiita.com/sakasegawa
- テクノロジー
- 2023/02/10
こんにちは！逆瀬川 ( https://twitter.com/gyakuse ) です。今日は英語論文をサクッと翻訳する方法を共有します。素晴らしい事前学習済みモデルの恩恵で素人でも1時間程度で実装できてしまいます。なお、実装めちゃ汚いのですが、そのあたりはご容赦ください。論文以外の文字埋め込みのないpdfを翻訳したい場合はこちらを参考にしてください: 論文全体の自動要約についてはこちら: 概要翻訳モデル、レイアウト検知ライブラリとpdfを操作するライブラリを用いて外国語で書かれたpdfファイルを翻訳します。翻訳にはフリーのニューラル機械翻訳モデルFuguMTを使用します。この手法の嬉しさ DeepLおよびDeepL APIではpdf翻訳がサポートされていますが、行の切り替わりで別の文章と認識されることが多く、途中までの文章で翻訳されるため精度が落ちてしまいますこの手法で
- 翻訳
- あとで読む
- pdf
- google
- 論文
- AI
- 英語
- レイアウト
- 機械学習
AIの進歩とつらみについて - Qiita
- 195 users
- qiita.com/sakasegawa
- テクノロジー
- 2023/03/14
こんにちは！逆瀬川 ( https://twitter.com/gyakuse ) です。今日はAIの進歩にともなうヒトの役割にかんするポエムを書いていきます！なにについて書いてある文章か AI※の進歩ってすごいよね AIがなんでもできるようになったら、ヒトは何を思うか ※AIって気軽に使う世界になったのもすごい. なお、MicrosoftはすでにAGI as a serviceについて考えている: https://thegenerality.com/agi/ さいきん思うこと言語モデルや生成モデルの進歩は凄まじくて、どんどん知的な活動がAIに置き換えられて行きそうな空気を感じます。じっさい、イラストを描くことやプログラミングを実装することなどは、かなりできるようになってきています。今回は、こうした人間しか出来ないと思われていたことが、どんどんAIができてくることによって、何が起き
- AI
- あとで読む
- 社会
- 人工知能
- qiita
- 言語
- 技術
150万MAUのNuxt.js製サービスを機能開発を止めずに1ヶ月&1人でNext.jsに置き換えた話
- 192 users
- zenn.dev/ubie_dev
- テクノロジー
- 2021/07/26
Nuxt.js で開発されていたAI受診相談ユビーのフロントエンドを Next.js で作り直しました。まだまだ仮説検証を繰り返すフェーズのスタートアップのため、機能開発を止めて一気に置き換えることはできず、機能ごとに少しずつ置き換えてリリースをしました。結果、5人のプロダクト開発チームによる機能開発と並走して、全体の移行を1人で1ヶ月の短期間で終わらせることができたので、その意思決定や過程、工夫を紹介します。移行前の課題まず前提として、移行前の Nuxt.js による実装は 2018 年に立ち上がったもので、当時 toC の Web サービスを持っていなかった Ubie がほぼ 1 人の小さいチームで PoC 的に作り始めたものでした。また、当時の Next.js は今ほど多機能ではないプレーンなフレームワークでした。これらを踏まえて、当時の状況で MVP を最速で作るための技
- Next.js
- あとで読む
- react
- Nuxt.js
- 開発
- 設計
- js
- アーキテクチャ
- Vue
- next
2022年の深層学習ハイライト - Qiita
- 189 users
- qiita.com/shionhonda
- テクノロジー
- 2023/02/12
はじめに 2023年になって日が経ってしまいましたが、今年も深層学習の個人的ハイライトをまとめたいと思います。今回は研究論文5本と応用事例4つを紹介します。他におもしろいトピックがあれば、ぜひコメントなどで教えて下さい。 AIの研究動向に関心のある方には、ステート・オブ・AIガイドの素晴らしい年間レビューもおすすめします。また、私が過去に書いた記事（2021年、2020年、2019年）もよろしければご覧ください。 * 本記事は、私のブログにて英語で書いた記事を翻訳し、適宜加筆修正したものです。元記事の方も拡散いただけると励みになります。 ** 記事中の画像は、ことわりのない限り対象論文からの引用です。研究論文 Block-NeRF: Scalable Large Scene Neural View Synthesis 著者: Matthew Tancik, Vincent Casser,
Niantic、『ポケモンGO』以降ヒット作を生み出せず、複数作品の開発中止とレイオフを実施したとの報道 - AUTOMATON
- 187 users
- automaton-media.com
- アニメとゲーム
- 2022/06/30
ホームニュース Niantic、『ポケモンGO』以降ヒット作を生み出せず、複数作品の開発中止とレイオフを実施したとの報道海外メディアBloombergは、Nianticが複数タイトルの開発中止と、85～90人のスタッフをレイオフしたと報じた。Nianticの広報担当は、複数プロジェクトの開発中止とスタッフのうち8%を削減したことを認めている。あわせて、レイオフした人々の進路についてもサポートしていることを強調した。 Nianticはアメリカの企業。もともとGoogle社内のスタートアップNiantic Labsとして立ち上げられたが、のちに独立。その後Googleや任天堂やポケモン、フジテレビなどから資金調達。日本にも開発スタジオとしてTokyo Studioが存在しており、日本も重要な拠点となっている。これまでには『Field Trip』に『Ingress』、『Pokémon GO
- Niantic
- ゲーム
- ポケモン
- game
- pokemon
- あとで読む
- AR
- ポケモンGO
- business
【2024年】ITエンジニア本大賞まとめ
- 187 users
- zenn.dev/yottabyte
- テクノロジー
- 2024/01/30
アジャイルプラクティスガイドブックチームで成果を出すための開発技術の実践知チーム・組織にプラクティスを導入し、根付かせるために！ 116の手法を一冊にまとめた“実践”の手引きチームでのアジャイル開発には、開発技術やツールなどの「技術プラクティス」の活用が重要です。プラクティスはそれぞれの目的や役割を意識することで効果を発揮します。しかし、目まぐるしく状況が変化する開発では、当初の目的を忘れて、プラクティスに取り組むこと自体が目的化してしまうチームも少なくありません。本書は、チーム・組織でアジャイル開発に取り組んできた著者が、プラクティスの効果的な選択・活用のしかたについて、自らの実践経験に基づいてまとめたガイドブックです。架空の開発現場を舞台にしたマンガとともに、チーム開発の様々なシーンで役立てられるプラクティスを、幅広くかつわかりやすく解説しています。開発現場に備えておけば、
- エンジニア
- あとで読む
- 本
- ソフトウェア
- プログラミング
- book
- 技術
- 開発
- IT
歴代チャットボットと最近のLLMのまとめ - Qiita
- 186 users
- qiita.com/Ted-HM
- テクノロジー
- 2023/06/02
LLMs The History of Chatbots ELIZA (1966) 初期の人工知能プログラムのひとつ。ルールベースの簡単なパターンマッチングで返答していた。心理療法士の会話を模したELIZA(DOCTOR)が有名。 PARRY (1972) PARRYは偏執病的統合失調症患者をシミュレートしようとしたもの。 ELIZA(DOCTOR)と通信し話題となった。 Jabberwacky (1982, 1988, 1997) ユーモラスな人間同士の自然な会話をシミュレートすることを目的としていた。ユーザーとの会話の大規模なデータベースを構築し、言語と文脈を学習することができた。プロジェクト自体は1982年から開始されていたが、当初は学習機能は有していなかった。ローブナー賞を2005年(George)、2006年(Joan)に受賞している。ローブナー賞(Loebner P
- AI
- 機械学習
- あとで読む
- 人工知能
- BERT
- 学習
- techfeed
- Qiita
- 勉強
- まとめ
Metaの「Llama 2」をベースとした商用利用可能な日本語LLM「ELYZA-japanese-Llama-2-7b」を公開しました｜ELYZA, Inc.
- 181 users
- note.com/elyza
- テクノロジー
- 2023/08/29
Metaの「Llama 2」をベースとした商用利用可能な日本語LLM「ELYZA-japanese-Llama-2-7b」を公開しました本記事のサマリーELYZAが「Llama 2」ベースの商用利用可能な日本語LLM「ELYZA-japanese-Llama-2-7b」を一般公開性能は「GPT-3.5 (text-davinci-003)」に匹敵、日本語の公開モデルのなかでは最高水準 Chat形式のデモや評価用データセットも合わせて公開既に社内では、130億、700億パラメータのモデルの開発も進行中はじめにこんにちは。ELYZAの研究開発チームの佐々木、中村、平川、堀江です。この度ELYZAは、Metaの「Llama 2」をベースに、日本語による追加事前学習を行なった日本語言語モデル「ELYZA-japanese-Llama-2-7b」と、そこにELYZA独自の事後学習を施した「
- LLM
- AI
- あとで読む
- 機械学習
- 開発
- 自然言語処理
- 日本語
- 人工知能
- 学習
- 勉強
ローカルで動く大規模言語モデル(Rinna-3.6B)を使ってあなただけのAIパートナーを作ろう - Qiita
- 179 users
- qiita.com/takaaki_inada
- テクノロジー
- 2023/06/18
はじめにはじめまして。株式会社ずんだもんのアルバイトエンジニアのinadaです。今日は誰でも作れるずんだもんと題してローカルPCにずんだもんAIを作ります。この記事はそのチュートリアル記事です。 (誰でもと書いてますが、RTX 3060(12G)搭載以上のPC推奨です。CPUマシンでも出来る部分はありますが非推奨です。RTX 3060(12G)のグラボは5万ぐらいで買えるので持ってなければ買っちゃいましょう。) 対象読者/記事の範囲ローカルPCで動かせる大規模言語モデルを、学習用のデータの用意から、学習、動かすところまで一通りどんなものか、お試ししてみたい人。自分だけの世界にただ一人だけのうちの子、またはパートナー(うちの嫁)を作り育てたい。そんな沼にはまりたい、興味がある人。 AIの仕組みや用語は当記事では解説しません。AIの用語(モデル, loss, epoch, checkp
- AI
- あとで読む
- LLM
- qiita
- 学習
- Python
- 人工知能
- ChatGPT
- 言語
- techfeed
年末恒例企画「ゲーム業界著名人コメント集」。177人が振り返る2023年と，2024年に向けた思いを語る
- 178 users
- www.4gamer.net
- アニメとゲーム
- 2023/12/28
年末恒例企画「ゲーム業界著名人コメント集」。177人が振り返る2023年と，2024年に向けた思いを語る編集部：Chihiro 編集部：Igarashi 123456789→ 4Gamerの年末恒例企画，「ゲーム業界著名人の年末コメント集企画」が今年もやって来ました。今回は177人の方にご参加いただきました。 ※記事掲載時点では176名でしたが，2024年1月9日14：30頃に1名追加しました 2023年は，この数年間，人々の暮らしや行動，企業での働き方などに大きな影響を与えた「新型コロナウイルス感染症」が5類感染症に位置づけられた。これに伴い，「東京ゲームショウ2023」が久しぶりに制限なしで開催されたり，声を出してスポーツを観戦できるようになったり，日本各地で大規模な音楽フェスティバルが実施されたりと，コロナ禍以前の日常が戻ってきたことを実感できた1年だったと思う。ゲーム業界に目を
tRPCを導入したら爆速でWebサービスをリリースできた話
- 170 users
- zenn.dev/praha
- テクノロジー
- 2022/12/09
この記事は「個人開発Advent Calendar 2022」 8日目の記事です。はじめに先日リリースされた、SplarateというWebサービスの開発をお手伝いしています。そこで導入したtRPCが驚くほど便利だったので、実際の体験を交えてその使いやすさを紹介します。 tRPCとは？ tRPC allows you to easily build & consume fully typesafe APIs without schemas or code generation. https://trpc.io/docs/ tRPCは、スキーマやコード生成なしで型安全なAPIを簡単に構築し、呼び出すことのできるライブラリです。 tRPC is for full-stack TypeScript developers. と謳われているように、TypeScriptに特化して作られており、Ty
- typescript
- あとで読む
- API
- web
- development
中島聡さん、NVIDIAのGPUが用済みになるって本当ですか？AI開発の行列乗算をなくす｢MatMul-free LM｣で気がかりなこと - まぐまぐニュース！
- 162 users
- www.mag2.com
- テクノロジー
- 2024/06/23
エヌビディアの強みであるGPUの優位性を揺るがすかもしれないAI関連の注目論文とは？人気急上昇中のメルマガ『週刊 Life is beautiful』より読者Q&Aをご紹介。著者の中島さんは「Windows95の父」として知られる日本人エンジニア。メルマガでは毎号、読者からの質問に丁寧に回答しています。 ※本記事のタイトル・見出しはMAG2NEWS編集部によるものですプロフィール：中島聡（なかじま・さとし）ブロガー／起業家／ソフトウェア・エンジニア、工学修士（早稲田大学）／MBA（ワシントン大学）。NTT通信研究所／マイクロソフト日本法人／マイクロソフト本社勤務後、ソフトウェアベンチャーUIEvolution Inc.を米国シアトルで起業。現在は neu.Pen LLCでiPhone/iPadアプリの開発。 1ビットの高速推論AIチップ　米国より先に中国が開発する可能性も読者からの質
- ai
- あとで読む
- GPU
- LLM
- 半導体
- NVIDIA