tlo_olyのブックマーク - はてなブックマーク

Wanna Code Like a Google Engineer? Let’s Dive into Advanced Python Together!

tlo_oly 2023/09/28

Python

リンク

ChatGPTとStreamlitを使ってarXiv論文を要約するWebアプリを開発しよう！｜あゆ＠ChatGPT×AI×自動化

アプリの目的と概要この記事では、StreamlitとChatGPTを使って、論文要約アプリを作成する方法を紹介します。このアプリでは、キーワードと指定された期間を入力するとその期間のarXiv論文を検索できます。検索結果の一覧から選択した論文に対して、ChatGPTを使ってabstractの要約を生成します。これで、日本語で簡単に論文の内容を理解できるようになります。追加機能として、全文要約や論文の内容に質問できるような機能もできたらなと思っていますが今回は未実装です。アプリの開発には、StreamlitとChatGPT APIを使います。特にChatGPT APIでは6月に新しく追加されたFunctionを使ってみました。ユーザーインターフェースをStreamlitで作成し、arXiv APIで論文の検索を行います。 2. 開発準備今回は、前半の機能面を作る部分ではGoogle Colab

tlo_oly 2023/09/28

リンク

いちデータエンジニアが出会った、アナリティクスエンジニアというキャリア

2023/07/25に、TECH TRACK vol.2で発表した山邉の資料です。

tlo_oly 2023/09/22

リンク

データオーケストレーションツールDagsterの紹介

データオーケストレーションとはデータオーケストレーションという言葉をご存知でしょうか？日本ではまだ耳慣れない言葉ですが、data orchestrationでgoogle検索すると実に3000万件以上ヒットし、世界的には十分に市民権を得ている言葉です。Databricksではデータオーケストレーションを以下のように説明しています。データオーケストレーションとはデータオーケストレーションとは、複数のストレージからサイロ化したデータを取り出し、組み合わせて整理し、分析に利用できるようにするための自動化されたプロセスです。このプロセスでは、レガシーシステム、クラウドベースのツール、データレイクといったあらゆるデータセンターが接続されます。データは標準形式に変換されるため、理解しやすく、容易に意思決定に利用できます。オーケストレーションとは、コンピュータシステム、アプリケーション、および

tlo_oly 2023/09/22

リンク

M1 MacでPySparkローカル環境構築 | DevelopersIO

はじめにデータアナリティクス事業本部ビッグデータチームのyosh-kです。今回は、M1 MacでPySpark環境を構築し簡単なCSV読み込みとDataFrameのShowコマンドで出力結果を確認するところまでをまとめていきたいと思います。 macOS Monterey バージョン12.4 M1チップ Python 3.10.4 zsh Apache Sparkとは前提としてApache SparkとPysparkの関係性について簡単に理解します。 Apache Sparkとは複数台のノードで分散処理を行い、ビッグデータを分析するためのフレームワークです。 PySparkとは SparkはScalaで実装されていますが、それをPythonで実行できるようにSparkはPython用のAPIを提供しています。このAPIのことをPySparkといいます。 Pyspark環境構築 Jav

tlo_oly 2023/09/18

PySpark

リンク

Icons | Font Awesome

The internet's icon library + toolkit. Used by millions of designers, devs, & content creators. Open-source. Always free. Always awesome.

tlo_oly 2023/09/15

tool

リンク

文章生成AI利活用に関するガイドライン.pdf

文章生成AI 利活用ガイドライン Version 2.0 令和6年（2024年）4月東京都デジタルサービス局 2 はじめにこのガイドラインは、東京都で初めてとなる文章生成AI の利活用ガイドラインです。 ChatGPTをはじめとする文章生成AIは、都職員の業務のあり方を大きく変革する可能性を秘めている一方、様々なリスクも指摘されています。このため、業務での活用にあたり期待する効果を得るためには、その特性をよく理解し、正しく利用することが重要です。東京都では、デジタルサービス局に検討プロジェクトチームを設置して、文章生成AIの利活用について議論を重ね、令和5年８月、検討の成果をガイドライン（Version 1.0）としてまとめ、文章生成AIの全庁利用を開始しました。その後、10月に利用状況についてアンケートを行ったところ、活用事例やプロンプト例を求める声が多かった

tlo_oly 2023/08/31

リンク

Metaの「Llama 2」をベースとした商用利用可能な日本語LLM「ELYZA-japanese-Llama-2-7b」を公開しました｜ELYZA, Inc.

Metaの「Llama 2」をベースとした商用利用可能な日本語LLM「ELYZA-japanese-Llama-2-7b」を公開しました本記事のサマリーELYZAが「Llama 2」ベースの商用利用可能な日本語LLM「ELYZA-japanese-Llama-2-7b」を一般公開性能は「GPT-3.5 (text-davinci-003)」に匹敵、日本語の公開モデルのなかでは最高水準 Chat形式のデモや評価用データセットも合わせて公開既に社内では、130億、700億パラメータのモデルの開発も進行中はじめにこんにちは。ELYZAの研究開発チームの佐々木、中村、平川、堀江です。この度ELYZAは、Metaの「Llama 2」をベースに、日本語による追加事前学習を行なった日本語言語モデル「ELYZA-japanese-Llama-2-7b」と、そこにELYZA独自の事後学習を施した「

tlo_oly 2023/08/31

ChatGPT
LLM

リンク

Chatbase | The complete platform for chat-based AI Agents

AI Agents for magical customer experiencesChatbase is the complete platform for building & deploying AI Agents for your business to handle customer support & drive more revenue.

tlo_oly 2023/08/22

ChatGPT
tool

リンク

CodeCut – Stay sharp, learn in a snap

tlo_oly 2023/08/09

リンク

【Streamlitよりいいかも？】機械学習系のデモアプリ作成に最適！Gradio解説 - 学習する天然ニューラルネット

はじめに Streamlit vs Gradio Gradioの設計思想 Interface 入出力に応じたUI Interface String Shortcut 入力データのサンプルのセットドキュメンテーションテーマの変更タイムアウトへの対処中級者への第一歩、デモを作る際に知っておきたい処理 Gradioが担当する前処理についてプログレスバーもろもろの出力結果を保存するには？認証認可（というか認可）その他、解説しないが需要の有りそうなものまとめ追記 : 動画になりました。はじめに機械学習系のデモアプリを作成することがしばしばありStreamlitを使用していたが、パラメーターなどをいじるたびに処理が最初から走るなどといった挙動に悩まされていた。同僚がGradioというのを使っていたのでサーベイがてらメモしていたらブログが出来上がってしまった。本ブログでは、G

tlo_oly 2023/07/29

Gradio

リンク

外部データをRetrievalしてLLM活用する上での課題と対策案 - ABEJA Tech Blog

はじめに ABEJAでデータサイエンティストをしている服部です。今回はLLMで外部データを使うケースについてのお話をしたいと思います。はじめに LLMと外部データの利用 RetrievalとLLM 0. (事前準備)参照したいテキストデータをDBに格納 1. ユーザの入力文とのテキスト類似度を計算して、関連テキストを抽出する(Retrieval) 2. 関連テキストをLLMのプロンプトに入れ込み、ユーザの入力文に回答する。 Retrieval時の課題 LangChainでの用意 Case1: それぞれの文章がRetrievalしにくい形で保存されている対策案: ページ構造を意識した形で各文章を格納する他の対策案聞き方を明確にする類似度を測るクエリ文章を置き換える不要そうな文章をデータから削除するデータ自体をLLMで整形し直す Case2: 未知の単語を含む仮説: ニャオハ

tlo_oly 2023/07/29

LangChain

リンク

全自動でデータ分析してくれるAIエージェントを作った

2023/05/18 LLM Meetup Tokyo #2でのLT資料です。動画は以下のURLからご覧いただけます！ https://twitter.com/Penguins_Lab/status/1639827880879472640

tlo_oly 2023/07/26

ChatGPT

リンク

Five Python Decorators That Can Reduce Your Code By Half

tlo_oly 2023/07/23

Python

リンク

Create Your Own Stunning Website in Minutes for Free

tlo_oly 2023/07/22

リンク

GPT-4の精度は悪化している？　3月に解けた数学の問題解けず　GPT-3.5にも敗北──米国チームが検証

「GPT-4の精度は時間とともに変わっている」──そんな研究成果を米スタンフォード大学と米カリフォルニア大学バークレー校の研究チームが発表した。3月と6月時点のGPT-4の精度を比較したところ、一部タスクでは精度が大きく悪化していたという。ただし、この論文は査読前のもので第三者によるレビューは受けていない。 GPT-4は、米OpenAIが提供する大規模言語モデル（LLM）。3月の発表後、チャットAI「ChatGPT」にも搭載され、性能の高さが大きな話題を集めた。LLMは、データのフィードバックや設計変更などをすると性能が変化する。しかし、OpenAIはLLMの更新について発表しておらず、公開以後の性能変化も明らかにしていない。そこで研究チームは、3月と6月時点でのGPT-4、前モデルであるGPT-3.5に精度の違いがあるのか検証した。実験ではChatGPTに対して「数学の問題の回答」「機

tlo_oly 2023/07/22

ChatGPT
LLM

リンク

1万種類を超える大規模言語モデル(LLM)をまとめてダウンロード数や類似性などを分かりやすく視覚化したデータライブラリが公開される

2022年後半から「ChatGPT」や「Bard」など数え切れないほどの大規模言語モデル(LLM)およびAIサービスが登場し、世界中のユーザーが生成AIを積極的に使い始めるようになりました。こうした大規模言語モデルの多くは機械学習モデルとデータセットのリポジトリであるHugging Faceに寄託されていますが、スタンフォード大学の研究者らがHugging Faceのデータをまとめて視覚化したものを新たに公開しました。 [2307.09793] On the Origin of LLMs: An Evolutionary Tree and Graph for 15,821 Large Language Models https://doi.org/10.48550/arXiv.2307.09793 Constellation https://constellation.sites.stan

tlo_oly 2023/07/22

ChatGPT
LLM

リンク

prefect) sqlite3.OperationalError: table worker_pool already exists Error when I build docker container using prefecthq/prefect image

tlo_oly 2023/07/20

“AttributeError: 'State' object has no attribute 'services'”

prefect

リンク

Clipdrop - Sketch to image

No style Photographic Fantasy Art Origami Isometric Digital Art Comic Book Anime Cinematic Analog Film Neon Punk Pixel Art Low Poly 3D Model Line Art

tlo_oly 2023/07/16

リンク

多要素認証のバイパスが可能な攻撃「Pass-The-Cookie」について

NECサイバーセキュリティ戦略統括部セキュリティ技術センターの桐下です。今回のブログでは、Pass-The-Cookieという攻撃手法について紹介します。Pass-The-Cookieは、多要素認証をバイパスすることが可能な強力な攻撃です。Office365(Microsoft365)を対象にデモを交えながら攻撃手法を紹介します。 Pass-The-Cookieとは、WebアプリケーションのセッションCookieを攻撃者が何らかの手段で入手し、セッションCookieを悪用して認証をバイパスする攻撃手法です。有効なセッションCookieをブラウザに投入するだけでWebアプリケーションにログインすることが可能です。セッションCookieは、ログイン成功状態を保持しています。そのため、セッションCookieを入手し、ブラウザに投入することでID/Password認証及び多要素認証要求をバイパ

tlo_oly 2023/07/14

リンク

はてなブックマーク

タグ

tlo_olyのブックマーク (1,349)

お知らせ

今週のはてなブックマーク数ランキング（2025年4月第3週）

今週のはてなブックマーク数ランキング（2025年4月第2週）

今週のはてなブックマーク数ランキング（2025年4月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス