[B! 学習] shion214のブックマーク

shion214 id:shion214

学習に関するshion214のブックマーク (331)

何度見ても勉強になる。新規事業始める時に見るべき「ソニーの開発18ヵ条」→各項目に対するコメントが賛否両論で興味深い
ただのまるちゃん @raccomaru マーケ歴6年 |マーケ全体設計、オーガニック、アドアフィ、予算運用 | 好きな分野は動画媒体 | 女性のインサイトについて物申してます
shion214 2024/09/17
勉強

動画

開発

サイト

学習
リンク
Google AI Studioでモデルをチューニングしてみる - Qiita
はじめに企業での生成AI活用では、GPT-4などのLLMをそのまま利用するのみではなく、企業内の様々なナレッジや特定ドメインの追加情報を活用したいという要望がほとんどです。その場合の方法として、RAG(Retrieval-Augmented Generation) とファインチューニングという選択肢があると思いますが、ファインチューニングに関しては機械学習やプロンプトエンジニアリングに関する専門知識が無いと太刀打ちできない、ということでまずはRAGに取り組んでいる事例が多いと思います。一方、RAGの精度に関しては課題も多く、Vector検索のみではなくハイブリッド検索を試す、ナレッジグラフを使う、クエリ拡張を行う、など様々な手法で精度向上に取り組んでいることかと思います。ファインチューニングに関しても、今やる必要は無いと思っていたところ、各社機械学習の専門家でなくてもノーコードでモデ
shion214 2024/09/13
ai

google

csv

api

学習
リンク
技術ブログや登壇資料を秒で作るコツ伝授します
アイレットさんの社内アウトプット勉強会にお邪魔したときの資料です
shion214 2024/09/07
資料

勉強

ブログ

技術

学習
リンク
画像生成AI「FLUX.1」が相当ヤバい　LoRAで画風の再現も簡単に (1/5)
画像生成AI「Stable Diffusion」開発者たちが突然発表した新モデル「FLUX.1」、これが楽しすぎてはまりこんでいます。私の本業はゲーム会社。出展を予定している東京ゲームショウまで1ヵ月で、やらないといけないことが山積みなのに、FLUX.1が面白すぎて魅力に抗えません。わずか30分の学習で画風が安定 FLUX.1が決定的に変えてきそうなのはLoRAです。LoRAは学習済みのウェイトモデルを利用することで、少ない枚数であっても学習ができるということで、画像生成AIの分野では広く普及している手法です。FLUX.1は、Stable Diffusionで使われてきたLoRAの方法論を動かすことができることがわかっています。そのため、FLUX.1のリリース後、ユーザーコミュニティーでさっそくLoRAの環境の整備が始まり、何ができるのかを試すフェーズに入っています。これまでの「Sta
shion214 2024/09/04
画像

人工知能

ai

学習

あとで読む
リンク
2024年度新卒エンジニア研修を実施しました! - Pepabo Tech Portal
はじめに新卒エンジニア研修を担当しました ugo です！今年も新卒エンジニア研修を実施し、全カリキュラムが無事終了しました。この記事では、各研修の講師を担当したメンバーが、新卒エンジニア研修のカリキュラムの内容と研修資料をまとめました。ぜひご覧ください。 2024年度新卒エンジニア研修概要新卒エンジニア研修のコンセプトは「サービスを作るための技術要素や観点について、現時点で良いやり方を一通り学ぶ」と設定しました。サービスを運用していくために必要なオブザーバービリティといった領域も今年から研修に盛り込みました。研修に参加した新卒エンジニアは3名です。オフィス内はフリーアドレスとなっていますが、研修のためオフィスに固定席を設け、1ヶ月に1回程度の頻度でオフィスの別に席に移動する形態で実施しました。講師も新卒エンジニアの近くに座ることで、相談をしやすい環境づくりを行いました。
shion214 2024/09/04
エンジニア

技術

学習

ai

ruby
リンク
Perplexity AIとは？機能概要や使い方、料金体系を徹底解説！ | AI総合研究所
この記事のポイント Perplexity AIは、自然言語処理（NLP）と機械学習を使用した、日本語対応のAI搭載検索エンジンです。日本語を含む多言語に対応しているため、質問と回答を日本語で受け取ることができます。OpenAIのGPTモデルと検索エンジンを利用しており、信頼できる情報源からの引用を提供します。テキストベースの出力だけでなく、画像生成も可能です。新機能であるPerplexity AI Pagesについても紹介しています。 Microsoft AIパートナー、LinkX Japan代表。東京工業大学大学院で技術経営修士取得、研究領域：自然言語処理、金融工学。NHK放送技術研究所でAI、ブロックチェーン研究に従事。学会発表、国際ジャーナル投稿、経営情報学会全国研究発表大会にて優秀賞受賞。シンガポールでのIT、Web3事業の創業と経営を経て、LinkX Japan株式会社を創業。
shion214 2024/08/27
ai

検索

自然

日本語

学習

search

language

Perplexity
リンク
LLMによるLLMの評価「LLM-as-a-Judge」入門〜基礎から運用まで徹底解説
前回の記事でLLMアプリケーションの評価について基礎から運用まで丁寧に解説いたしました。この記事では、評価方法の一部であるLLM-as-a-Judgeについて詳しく解説したいと思います。 LLMアプリケーションの評価といえば、LLM-as-a-Judgeだというように結びつける方もいらっしゃいますが、必ずしもそうではありません。というのも、LLMアプリケーションの評価には、LLM以外で評価するLLM-as-a-Judge以外にもいろんな方法や観点があるからです。評価方法や指標について多くの論点が、LLMアプリケーションに限らず、機械学習アプリケーション全般に共通しています。この10年ぐらいで、機械学習アプリケーションの評価についてはかなりの議論がなされてきており、ある程度成熟してきました。一方、LLMでLLMの出力を評価するLLM-as-a-Judgeについては、GPT-3.5や
shion214 2024/08/08
学習

LLM

あとで読む

AI

*あとで読む
リンク
GPT-4を超える日本語性能のLLM、PFN子会社がフルスクラッチで開発　無料トライアルを開始
β版では、PLaMo-100Bをベースに指示学習やモデルマージを行い、文章生成能力を高めた。無料トライアルは個人・法人を問わずに提供し、商用利用も可能。同社は今後、トライアルの検証結果から改善や追加学習などを実施し、商用版の「PLaMo 1.0 Prime」を今秋に発売する。関連記事 PFNが生成AI新会社「Preferred Elements」設立へ　130億パラメータの和製LLMもオープンソースで公開 AIベンチャーのPreferred Networks（PFN）は、生成AI事業に関する新子会社「Preferred Elements」を11月1日に設立すると発表した。併せて、研究・商用利用が可能な、130億パラメータの事前学習済み大規模言語モデル（LLM）「PLaMo-13B」も公開した。「いつものやつ持ってきて」──PFNの荷物運びロボット、あいまいな指示にも対応可能に　LLMの
shion214 2024/08/08
無料

日本語

開発

技術

学習

llm
リンク
“新卒エンジニア向け”生成AI研修の教材、KDDI子会社が無償公開中　計2時間の体験型学習向け
KDDIグループでアジャイル開発事業を行うKDDIアジャイル開発センター（東京都港区、以下KAG）は7月23日、同社の新卒エンジニア向けに実施した生成AI研修の教材を無償公開した。体験型学習として、プロンプトエンジニアリングやRAG、API利用などの項目の研修メニューを紹介。計2時間程度の研修として想定した内容だという。全研修メニューは「プロンプトエンジニアリング」（20分）、「いろいろな生成AIアプリを試す」（20分）、「API利用」（20分）、「RAG」（30分）、「AIエージェント」（30分）の5項目。エンジニアとデザイナー共通の体験型新卒研修として実施した。KAGでは事前に講義も実施し、実際の研修では受講者にペアを組ませ、相互フォローさせる形で行ったという。プロンプトエンジニアリングでは「ChatGPT」を使用。いろいろな生成AIを試す際には、「Claude.ai」や「Perp
shion214 2024/08/01
エンジニア

AI

api

開発

学習
リンク
Gemini 1.5 のロングコンテキストを活かして AI を育てるアプローチ〜 RAG の限界を軽やかに突破するために
Gemini 1.5 のロングコンテキストを活かして AI を育てるアプローチ〜 RAG の限界を軽やかに突破するためにはじめにこの記事では、Gemini 1.5 のロングコンテキストを活かして LLM を用いた AI システムを段階的に育てるアプローチを説明します。後半では、RAG システムの導入ハードルを下げるためにこのアプローチを適用するイメージをサンプルコードとあわせて紹介します。ここではまず、前提知識となるグラウンディングや RAG の仕組みを説明します。グラウンディングと RAG の違いについて LLM の業務活用に向けて勉強していると、かならず耳にするのが「グラウンディング」や「RAG」というキーワードです。グラウンディングは、LLM の基盤モデル自身が保有していない（学習していない）追加の参考情報をプロンプトに埋め込む事で、参考情報に基づいた回答を生成させるテクニ
shion214 2024/07/28
AI

検索

データ

*まとめ

学習
リンク
「Llama 3.1」の日本語追加学習モデル、サイバーエージェントが公開　SNSでは「爆速すぎる」の声
サイバーエージェントは7月26日、米Metaの最新AIモデル「Llama 3.1 70B」を使った新たな大規模言語モデル（LLM）を公開した。Llama 3.1 70Bをベースに、日本語データを追加学習させたもので、Hugging Face上で公開している。ライセンスはMetaの「Llama 3.1 Community License」に基づいており、商用利用可能だが、利用規約などに同意が必要となる。「Llama 3.1」シリーズはMetaが24日（現地時間）に公開した最新LLM。15兆トークンを超えるデータでトレーニングしたとしており、複数のベンチマークで米OpenAIのLLM「GPT-4o」や米AnthropicのLLM「Claude 3.5 Sonnet」より優れているという。
shion214 2024/07/27
日本語

学習

gpt

データ

sns
リンク
fastTextで文章分類(python) - My Note
文章を分類したくなったので、fastTextを用いて分類することにしました。 [ポイント] ・pythonでfastTextを利用・テキスト分類データ今回は元々収集していたtweetデータを用いて分類していきます。今回私は、3つのカテゴリに分割しました。ラベル1:人が呟いたものラベル2:人が呟いたけれど何かのアプリケーション、botを介している？ラベル3:企業が宣伝でtweet 以下のようなcsvファイルを作成します。今回私が学習に利用するデータは全部で200件です。ファイル名はtrain_data.csvとします。形式は以下のような感じです。ラベル(__label__*),tweetの文章　　　　 *には数字が入ります。 __label__1,江戸時代の五街道における宿場で東海道五十三次の中間点となる27番目の宿場は袋井宿ですが中山道六十九次の中間点となる35番目の宿場は
shion214 2024/07/26
csv

学習

文章

データ
リンク
浮世絵生成AI「Evo-Ukiyoe」と浮世絵カラー化AI「Evo-Nishikie」が登場
日本のAI企業であるSakana AIが、日本を代表する美術のひとつである浮世絵を生成するAIモデル「Evo-Ukiyoe」と、浮世絵を彩色するAIモデル「Evo-Nishikie」を発表しました。日本の美を学んだAI：浮世絵風画像生成モデルEvo-Ukiyoeと浮世絵カラー化モデルEvo-Nishikieを公開 https://sakana.ai/evo-ukiyoe/ 浮世絵は世界的にも知名度が高く、モネやゴッホなど数々の巨匠に影響を与えたことでも知られています。しかし、既存の画像生成モデルは浮世絵を重点に置いた学習が行われていないため、多くの人が画像生成AIに浮世絵を出力させようとしたにもかかわらず、浮世絵らしい画像を生成することができませんでした。今回Sakana AIが開発したEvo-UkiyoeとEvo-Nishikieは、同社が開発した日本語対応画像生成モデル「Evo-S
shion214 2024/07/25
AI

アート

開発

学習

画像
リンク
生成AIの誤りを生成AIが見抜く、OpenAIの「CriticGPT」　その実力とは
OpenAIは2024年6月27日（米国時間）、同社の生成AI（人工知能）「ChatGPT」における応答の誤りを発見する「CriticGPT」を発表した。CriticGPTは、「GPT-4」をベースとするモデルで、ChatGPTが出力するコードの誤りを発見できるという。 OpenAIは「ChatGPTが生成したコードの人によるレビューにおいて、CriticGPTを使えば、使用しない場合よりも60％の確率でパフォーマンスが向上すると判明した。OpenAIはCriticGPTのようなモデルを私たちのRLHF（Reinforcement Learning from Human Feedback：人間のフィードバックによる強化学習）パイプラインに統合する作業を開始した。これは、AIの学習にAIのサポートを提供することを意味する」と述べている。生成AIの誤りを生成AIが見抜く意義とは関連記事 R
shion214 2024/07/21
AI

programming

ChatGPT

学習

gpt
リンク
無料で使えるデータ分析ツール「KNIME」プログラミング不要で機械学習による予測も可能 | Ledge.ai
サインインした状態で「いいね」を押すと、マイページの「いいね履歴」に一覧として保存されていくので、再度読みたくなった時や、あとでじっくり読みたいときに便利です。
shion214 2024/07/20
便利

ツール

無料

学習

AI

データ分析
リンク
Cloudflare、すべての生成AIによるクローラーをワンクリックでブロックする機能を無料で提供開始
Cloudflare、すべての生成AIによるクローラーをワンクリックでブロックする機能を無料で提供開始 Cloudflareは、すべての生成AIによるクローラーをワンクリックでブロックする機能を無料で提供すると発表しました。生成AIは人間が作成したテキストや画像、動画などを大量に読み込んで学習を行う必要があります。生成AIを開発している組織は、より多くの学習データを取得しようとしており、そのためにインターネット上の多数のWebサイトをクロールするBotを稼働させているのです。しかしWebサイトの運営元として自分たちのコンテンツがこうした生成AIの学習に使われることを望まないところもあるでしょう。 Cloudflareの新機能はこうしたWebサイトが簡単に生成AIのBotによるクローラーをブロックしてくれる機能を提供してくれます。下記がCloudflareのダッシュボード画面で、すでに
shion214 2024/07/12
AI

web

無料

学習

サイト
リンク
新人のためのインターネット&ネットワーク超入門2024
shion214 2024/07/09
インターネット

あとで読む

ネットワーク

internet

学習
リンク
オープンソースデータベース標準教科書ダウンロード
新バージョン（Ver.3.0.0）公開！ SQLを使ったデータベースの操作、作成、管理について、実習形式で基礎から学習できる教科書ですオープンソースデータベース標準教科書は、データベース初心者を対象にSQLを使ったデータベースの基本的な操作から一歩進んだ使い方までを実習形式で解説している学習テキストです。 PostgreSQLの基本操作から体系的に解説をしているので、教育機関はもとより企業でのPostgreSQLの研修用テキストとして多く利用されているほか、「OSS-DB 技術者認定試験 Silver」の学習にも役立てることができます。（注：出題範囲の全てを網羅しているわけではありません。OSS-DBの受験対策は、LPI-Japan OSS-DB認定教材をご利用ください。）今回のVer3.0.0へのバージョンアップでは基準となるデータベースをPostgreSQL 13にアップデートし、
shion214 2024/07/04
データベース

学習

技術

ダウンロード

linux
リンク
生成AIグラビアをグラビアカメラマンが作るとどうなる？第27回：SD3 Mediumリリース！Part2(西川和久) | テクノエッジ TechnoEdge
現役グラビアカメラマンでありエンジニアでもある西川和久氏による生成AIグラビア連載の第27回は、前回に続いて最新の画像生成AIモデル Stable Diffusion 3 Medium について。『生成AIグラビアをグラビアカメラマンが作るとどうなる？連載』記事一覧』前回に引き続きStable Diffusion 3 Mediumの話連載第26回にSD3 Medium(以降SD3 Medium)の話を書いたが、今回はその続きとなる。前回の記事ではSD3 Mediumの特徴として Baseモデルなのに高画質。そして日本人含むアジア系もOK 商用利用不可。個人レベルでの商用利用は、クリエイターライセンス($20/月)を契約結構な頻度で致命的な問題が発生する Promptで左右など、位置関係が指示でき再現可能。文字もOK(英語のみ) 生成環境は現状でComfyUI(系)のみ。基本Work
shion214 2024/07/03
学習

ソフトウェア

AI

画像

あとで読む
リンク
バクラクのAI-OCRが扱う問題の複雑さ - LayerX エンジニアブログ
こんにちは。 LayerXのバクラク事業部機械学習チームのテックリードを務めております機械学習エンジニアの島越（@nt_4o54）です。最近、カジュアル面談や学会などで「AI-OCRってもうほぼ完成で、運用フェーズですよね」「やることあるんですか？」など頻繁に聞かれることがあります。「いやいや課題が山のようにあるんです」という話をいつもしているので、今回は我々が作っているAI-OCRがどれだけ複雑で難しい問題を扱っているか、という部分についてお話しさせていただければなと思います。少し、経理ドメインの話が多く恐縮ですが、お付き合いいただけると嬉しいです。 AI-OCRについて AI-OCRが扱う問題の複雑さドメインへの深い理解が必要同じ書類であってもコンテキストによって抽出したい値が異なるまとめ最後に AI-OCRについてまず、そもそも弊社のバクラクで提供しているAI-OC
shion214 2024/07/02
AI

学習

*あとで読む

あとで読む
リンク
1 2 3 4 5 6 7 8 9 10 次のページ