タグ

AIとqiitaに関するyuki_2021のブックマーク (28)

  • 話題のbrowser-use使ってみた - Qiita

    はじめに 開発業務で「情報収集」や「タスク自動化」をするときにスクレイピングやクローリングを用いる場合があると思います。一時期私もスクレイピング関連のを読んでBeautifulSoup, Seleniumなどを使って自動化をしましたが、CSSセレクタを指定していくのが大変だったり、DOM構造が変わると動かなくなったりと、色々苦労した覚えがあります。 そんな時、browser-useという面白そうなライブラリを見つけたので、この記事では、browser-useを使ってみた内容を自分用のメモとして残そうと思います。 browser-useとは? browser-useはAIを使ってブラウザ操作を自動化してくれるツールです。 このツールは、Pythonを使ってブラウザで実行する操作をテキストで渡してあげると、AIがそのテキストに基づき操作を行ってくれます。そのためスクレイピング/提携業務の自動

  • browser-use やばいです - Qiita

    はじめに 語彙力なくてすみません、 browser-use は、「AI エージェントがウェブブラウザを操作できるようにする」ためのライブラリです。 プロンプトで与えられた指示どおりに動き、ほかの技術と比較しても精度が抜群に高いです。 早速試してみます。 実践 複数のECサイトから特定の商品価格を取得することを目標とする。 Python は 3.11 以上が必要です。

  • 論文の探し方 / 読み方 - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 記事は K3 Advent Calendar 2024 23日目の記事です 記事では、趣味がSurveyで毎日論文漬けの僕から、論文の探し方・読み方のTipsを伝授します! もちろん、研究分野によっても論文の書き方や特徴は変わってきます!基的に普遍的なことを書くつもりですが、僕の専門であるコンピュータサイエンス・機械学習・コンピュータビジョン・自然言語処理の分野に依存した部分もたたあると思います!あくまで参考程度に、もし指導教員の話とコンフリクトしたら、そちら優先してマージしてください! この記事を読んでる人の中には、来年度から研

    論文の探し方 / 読み方 - Qiita
  • 生成AIで会社の要件定義プロセスを100倍高速化した話 - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 要約 要件定義で生成AIを活用するポイントを整理 要件定義に特化したAIシステムのアーキテクチャを紹介 一般的なソフトウェア開発プロセスに適用できるので範囲が広い 最終的な成果物 ↓パワーポイントで作った資料をgifでエクスポートしたもの このパワーポイントの資料、 まったく人の手で修正をしていません 。完全自動の生成AIで作成された資料です。もちろん完璧なものにはならないので修正が必要なところも出てくるのですが、修正可能なpptx形式で出力されるのでパワーポイントでサクッと修正ができます。そして 1からこの資料を作るのに15分もかかっ

    生成AIで会社の要件定義プロセスを100倍高速化した話 - Qiita
  • OCRはもう不要?視覚的特徴とテキストを高精度に捉える!次世代マルチモーダルAIモデル『MPLUG-DOCOWL2』登場! - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 株式会社ulusageの技術ブログ生成AIです!今回は、PDF解析とドキュメントインテリジェンスの最先端技術 「MPLUG-DOCOWL2」 について、解説していきます。このモデルは、高解像度のマルチページドキュメントを効率的かつ正確に解析する技術として注目されています。特に、従来のOCR(光学文字認識)ベースの解析手法が抱える課題を解決し、従来のOCR技術を必要とせず、新しい水準の性能と効率を実現しました。 この記事では、技術的な背景、MPLUG-DOCOWL2の構造と革新性、他の技術との比較、そして具体的なデモンストレーションを交え

    OCRはもう不要?視覚的特徴とテキストを高精度に捉える!次世代マルチモーダルAIモデル『MPLUG-DOCOWL2』登場! - Qiita
  • Geminiを使ったらKaggle初挑戦、参加期間10日間でも5位入賞できたので手法をすべて書く - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 一言で言うと? この記事を一言で言うと、kaggleのあらゆる情報をマークダウン形式にしてまとめて(約50万トークン)、Geminiのプロンプトに入れたらいい感じだった!という内容です。 はじめに こんにちは!yukky_maruです。先日、KaggleのLLM 20 Questionsのwinner callが無事終わって賞金もいただき、一段落ついたので、今回自分が使った方法をシェアしたいと思います。 なお、この金メダルは半分くらいはGeminiのおかげです! Gemini を活用しまくりました。ChatGPTやClaudeではない理

    Geminiを使ったらKaggle初挑戦、参加期間10日間でも5位入賞できたので手法をすべて書く - Qiita
  • 「よーしパパ、Ollama で Llama-3-ELYZA-JP-8B 動かしちゃうぞー」 - Qiita

    はじめに こんにちは、KDDIアジャイル開発センターのはしもと(仮名)です。 エンドレス水出しコーヒーの時期になりましたね。 今回は、Ollama を使って日語に特化した大規模言語モデル Llama-3-ELYZA-JP-8B を動かす方法をご紹介します。 このモデルは、日語の処理能力が高く、比較的軽量なので、ローカル環境での実行に適しています。さあその性能は如何ほどに!!!!????はやくAIは俺から仕事を奪え。 Llama-3-ELYZA-JP-8Bとは Llama-3-ELYZA-JP-8Bは、ELYZA社が開発した日語に特化した大規模言語モデルです。Meta社の「Llama 3」シリーズをベースに、日語での追加学習を行っています。80億パラメータという比較的小さなモデルサイズながら、「GPT-3.5 Turbo」や「Claude 3 Haiku」、「Gemini 1.0 P

    「よーしパパ、Ollama で Llama-3-ELYZA-JP-8B 動かしちゃうぞー」 - Qiita
  • OpenAIのライバル:Cohereが最高にイケている件 - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? はじめに Cohere(コーヒア)とは、生成AI関連のスタートアップ企業であり、オラクル、エヌビディア(NVIDIA)、セールスフォース・ベンチャーズ(Salesforce Ventures)、センチネルワン(SentinelOne)などが支援しています。 これまでにCommand-R+などのモデルを公開しています。 今回はCohereのイケている部分について紹介させていただきます。 UIがイケている こちらCohereのダッシュボードです。実際に使ってみるとわかるのですが、全ての画面がわかりやすいです。この画面だけでもやりたいことがす

    OpenAIのライバル:Cohereが最高にイケている件 - Qiita
  • GPT-4よりすごいらしいClaude 3が気になったあなたへ - Qiita

    Claude 3、気になりますよね 今まで触ったことないけど、興味を持った方へ、入門するところまでのご案内です。 とりあえずチャットがしたい claude.aiにアクセスして、アカウントを作成します。 メールアドレスを入力する方法と、Googleのアカウントと紐付ける方法があります。 私はGoogleアカウントとの紐づけを行いました。 ログインができたら、もう、チャットができます。ChatGPTのような感じです。 日語も自然に回答してくれます。 左下にClaude 3 Sonnetとあります。これはClaude 3のモデルの名称で、SonnetはClaude 3のシリーズの中で真ん中のモデルです。 Haiku - ハイク Sonnet - ソネット Opus - オーパス 名前からモデルの特徴を想像してもらいました。概ね特徴を捉えているのではないでしょうか。 Claude 3の特徴として

    GPT-4よりすごいらしいClaude 3が気になったあなたへ - Qiita
  • ChatGPTを社内に配ってもあまり使われない本当の理由 - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? はじめに 2023年はChatGPT元年とも言われ、いわゆるテック業界だけでなく、あらゆる業界でChatGPTが話題となりました。 この空前のChatGPTブームの中で、企業内でもChatGPTを利用しようという取り組みが進み、連日ニュースでも取り上げられていました。 皆さんも「〇〇会社、ChatGPTを従業員約1万人に展開。全従業員の業務効率化を目指す。」といった内容のニュースをよく見かけたのではないでしょうか? 先行企業に遅れを取らないよう「うちも早くやらないと!」と、同じようにChatGPTを社内に配る取り組みを進める企業が相次ぎ

    ChatGPTを社内に配ってもあまり使われない本当の理由 - Qiita
  • GPTが人知れず既存の名刺管理アプリを抹殺していた話 - Qiita

    名刺管理アプリ作ってほしいといわれた それは2/22のお話。 ことの発端は別の部署からかかってきた一の電話でした。 新規事業の部署でいろいろな取引先様と付き合いがあるものの、紙の名刺が非常に多く管理に困っているとのことのことです。 私は小売業に勤務しているしがない一社員で、現在Eコマースの戦略立案に関する部署に所属しています。 電話先の方は、以前一緒の部署で勤務したことがある方です。現在新規事業のプロジェクト推進をしており、冒頭のような課題感を持っているため既存の名刺管理アプリ導入を考えたのですが、あまりのお値段の高さに卒倒して私に藁をもすがる思いで連絡されたようです。 これまでのアプリは名刺の識別専門のAI()を使っていた 話を聞いてみたところ、 名刺の写真を撮る 会社名、部署名、名前、…など項目別にスプレッドシートへ記載される スプレッドシートに次の打ち合わせ日を記載しておくと通知さ

    GPTが人知れず既存の名刺管理アプリを抹殺していた話 - Qiita
  • ローカルで気軽にRAGを使って会話することが簡単すぎてビビった。 - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 今日は、ローカルにてRAG(Retrieval-Augmented Generation)を使って、あるPFDについて質問するチャットを作ろうと思う。 OpenAIを使うので、無料ではないので注意されたい。 今回のソースは LangChain 完全入門 というを参考にしていて、とても勉強になるので購入をお勧めする。 行いたいこと ローカルでPDFを読み込ませて、内容を質問したり、要約させること。 大きな流れ 環境準備 チャットアプリの土台の作成 プロンプトを定義 アップロードされたPDFファイルを分割 内容をベクトル化し保存 入力され

    ローカルで気軽にRAGを使って会話することが簡単すぎてビビった。 - Qiita
  • 机から離れて論文を大量に読む方法(NGK2024S) - Qiita

    これは何? NGK2024Sの発表資料です。 自己紹介 名前: 中西克典 X(Twitter): @n_kats_ 機械学習名古屋研究会主催 NGK発表は2回目 機械学習名古屋研究会 論文読み会 毎月第3木曜(19:00~)オンラインで 次回(2月15日第71回)・・・https://machine-learning.connpass.com/event/308186/ 編 イントロ(研究会の表の目的) 論文を読む習慣付け 知識のアップデート 発展的・実践的な知見の獲得 イントロ(研究会の裏の目的) この世の真理と呼べるものを全て知りたい。 という話を2年前のNGKでした。 おさらい(2年前の話) 読み上げソフトを使うと機械学習の論文が30分で再生できる。 ある分野の概要を把握する目安の論文50には約3日あればよい。 2年前の課題 読み上げられてる文章を目で追いかけないといけない。つら

    机から離れて論文を大量に読む方法(NGK2024S) - Qiita
  • LLMのプロンプト技術まとめ - Qiita

    現在,34個掲載(一部執筆途中) Xのアカウント@fuyu_quantでも技術系の投稿をしているのでよかったらフォローしてください! はじめに 今回はすぐに使えそうなプロンプトの工夫やフレームワークについて有名なものをまとめました.LMの出力の精度向上に役立てられればと思います. 論文があるものについてはarXivに最初に投稿された順番で掲載しています. 論文で精度向上が確認されているのは英語での検証がほとんどであるため,日語で改善されるかは分かりません. 全てのLLM(GPT-4,Llama2,...)で精度が改善するとは限りません. ※記事に誤り等ありましたらご指摘いただけますと幸いです. 以下の記事では敵対的プロンプト技術をまとめています! 目次 Zero-shot prompting Few-shot prompting 2021年〜 Generated Knowledge Pr

    LLMのプロンプト技術まとめ - Qiita
  • 【2023年】AI・データサイエンス・統計の無料おすすめ学習教材25選 - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? こんにちは。スキルアップAI編集部です。 近年ネット上には数多くの無料教材が公開されており、AIやデータサイエンス、統計を無料で学べる機会が増えています。そのため、AIやデータサイエンス、統計について無料教材で学ぼうと思っても、どれを選べばいいのかわからない方は多いのではないでしょうか? この記事では、AI・データサイエンス・統計の無料学習教材25選を紹介していきます。各教材の特徴について紹介していくので、ぜひ参考にして、自身に適した教材を選んでください。 【入門編】AI・データサイエンスの無料学習教材 まずは、入門編のAI・データサイ

    【2023年】AI・データサイエンス・統計の無料おすすめ学習教材25選 - Qiita
  • 凄すぎると話題の「Open Interpreter」の始め方・使い方まとめ - Qiita

    以下の記事を見て、早速「Open interpreter」を試してみたので、使い方や始め方をまとめておきます Open Interpreterとは Open Interpreterは、GPT-3.5、GPT-4、Code Llamaなどの大規模言語モデル(LLMs)を活用して開発されたオープンソースのツールです。 このツールは、OpenAIが提供するChatGPTの「Advanced Data Analysis(旧Code Interpreter)」のオープンソース版とも言える存在で、PythonJavascript、Shellなどのプログラミング言語のコードを自然言語による対話を通じてローカル環境で実行することができます。 このツールの最大の特徴は、ChatGPTの「Advanced Data Analysis」と違いローカル環境で動くため、ファイル容量やネット接続への制約がなく、Ch

    凄すぎると話題の「Open Interpreter」の始め方・使い方まとめ - Qiita
  • AIがハルシネーション(Hallucination)を起こす最大の理由【AGIの未来】 - Qiita

    ハルシネーション(Hallucination)とは? もっともらしいウソ(=事実とは異なる内容や、文脈と無関係な内容)の出力が生成されることである。人間が現実の知覚ではなく脳内の想像で「幻覚」を見る現象と同様に、まるでAIが「幻覚」を見て出力しているみたいなので、このように呼ばれる。 なぜハルシネーションを起こすのか? AIに掛け算をさせてみよう 5x5=は正解できたが、438890x819471=は不正解である。なぜならAIは掛け算を理解しておらず、人間が九九を暗記しているにすぎないのである。 ではどうすれば、438890x819471=を正解できるのであろうか?それは、簡単だ。RNNのように時系列の次元をTransformerに追加することで正解に導くことができる。 これは一体何を意味するのだろうか。GPT-4はまさにマルチモーダル(画像)を扱えるが、GPT-5で動画。 つまり、時系列

    AIがハルシネーション(Hallucination)を起こす最大の理由【AGIの未来】 - Qiita
  • ローカルで動く大規模言語モデル(Rinna-3.6B)を使ってあなただけのAIパートナーを作ろう - Qiita

    はじめに はじめまして。株式会社ずんだもんのアルバイトエンジニアのinadaです。 今日は誰でも作れるずんだもんと題してローカルPCにずんだもんAIを作ります。この記事はそのチュートリアル記事です。 (誰でもと書いてますが、RTX 3060(12G)搭載以上のPC推奨です。CPUマシンでも出来る部分はありますが非推奨です。RTX 3060(12G)のグラボは5万ぐらいで買えるので持ってなければ買っちゃいましょう。) 対象読者/記事の範囲 ローカルPCで動かせる大規模言語モデルを、学習用のデータの用意から、学習、動かすところまで一通りどんなものか、お試ししてみたい人。 自分だけの世界にただ一人だけのうちの子、またはパートナー(うちの嫁)を作り育てたい。そんな沼にはまりたい、興味がある人。 AIの仕組みや用語は当記事では解説しません。AIの用語(モデル, loss, epoch, checkp

    ローカルで動く大規模言語モデル(Rinna-3.6B)を使ってあなただけのAIパートナーを作ろう - Qiita
  • Jupyter AIが出た!試した!!すごい!!! - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article?

    Jupyter AIが出た!試した!!すごい!!! - Qiita
  • 【性能比較】日本語対応したBard(バード)とGPT-4の出力を比較してみた - Qiita

    import os import boto3 from datetime import datetime, timedelta, timezone import requests BUCKET_NAME = os.environ['BUCKET_NAME'] SLACK_WEBHOOK_URL = os.environ['SLACK_WEBHOOK_URL'] s3 = boto3.client('s3') def lambda_handler(event, context): # 前日の0:00と23:59を取得 today = datetime.now(timezone.utc).date() start_time = datetime(today.year, today.month, today.day, tzinfo=timezone.utc) - timedelta(days=1

    【性能比較】日本語対応したBard(バード)とGPT-4の出力を比較してみた - Qiita