tomonori13のブックマーク (2,117)

  • 東大・松尾研、2024年度「大規模言語モデル講座」の講義スライド資料を無料公開/LLMの活用法からモデル構造、応用まで幅広く学べる

    東大・松尾研、2024年度「大規模言語モデル講座」の講義スライド資料を無料公開/LLMの活用法からモデル構造、応用まで幅広く学べる
  • 【無料】グーグル神AIツール5選 「Google AI Studio」はこれがやばい (1/7)

    Google AI Studio」は、グーグルが提供する生成AI開発プラットフォームだが、実は隠れた「無料の神ツール集」とも言える存在である。 ただし重要な点として、このサービスは「実験的な技術」を含んでおり、完全に保証されたプロダクションレベルのサービスではない。Googleの利用規約にも「実験的技術が含まれており、不正確または不快なコンテンツを提供することがある」と明記されている。つまり、無料で高機能な反面、「お試し・実験環境」的な位置づけなのだ。 最大の魅力は、有料級の機能が完全無料で使い放題になることだ。リアルタイム音声対話、テキストから動画生成、1000ページ級PDF一括解析など、他社なら月額数千円~数万円クラスの機能が、Googleアカウントひとつで全て0円。まさに「こんなのタダでいいの?」レベルの神仕様である。「AIお金をかけたくないけど、格的に活用したい」という人に

    【無料】グーグル神AIツール5選 「Google AI Studio」はこれがやばい (1/7)
  • Amazon S3 へデータ転送速度が早いと噂の s5cmd を使って aws s3 cp と比べてみた | DevelopersIO

    はじめに S3 バケットへのファイル転送において一般的な aws s3 cp コマンドと、高速転送可能な s5cmd の転送速度を検証しました。先日、海外リージョンの S3 バケットへ小さなファイルを大量アップロード時に利用したところ、転送時間が想像よりもずっと早かったです。そんな私の中でホットな s5cmd が当に早いのか気になりました。 条件を整えて aws s3 cp と s5cmd cp でファイル転送した転送時間と転送速度を計測してみました。 ところで s5cmd ってなに s5cmd は、S3 と S3 互換オブジェクトストレージ、ローカルファイルシステム上のファイル操作できるコマンドラインツールです。マルチコアをフル活用した並列処理により非常に高速に転送できること強みです。 Mac なら homebrew で簡単にインストールできます。 検証結果早見 実行環境に依りますが、

    Amazon S3 へデータ転送速度が早いと噂の s5cmd を使って aws s3 cp と比べてみた | DevelopersIO
  • データアナリストのためのLLM時代のSQL作成術|Mercari Analytics Blog

    メルカリのデータアナリストの@__hiza__です。メルカリではデータアナリストとして日々SQLを使ったデータ分析をしつつ、業務外ではPythonを使ったアプリケーション開発を行っており、どちらの作業にもLLMを活用しています。 この記事ではデータアナリストに向けて、LLMにSQLを作成させて効率的にデータ分析を行うテクニック と、その背景にある応用可能な考え方を説明します。 関連記事メルカリでは、LLMをデータ分析の現場に活かすさまざまな取り組みが生まれています。 例えば、対話形式で誰でも手軽にデータ分析ができる社内ツール「Socrates」があります。これはデータアナリストに限らず、より多くのメンバーがデータを活用できるようになる強力なツールです。 一方で、私たちデータアナリストが日々向き合う、より複雑で専門的な分析を効率化する取り組みも行っています。 先日、私と同じデータアナリストの

    データアナリストのためのLLM時代のSQL作成術|Mercari Analytics Blog
  • 私的年間新作映画ベスト10×10年分(2015年-24年)、全解説 - 名馬であれば馬のうち

    (迷えるように見えてたいして迷っていない若者に助言をくれる謎のおじいさん) 人は年始にをつきますが、わたしは年間ベストリストを作ります。 ここ十年、年毎の変わり目に、映画、マンガ、ゲームのリストをこねこねしてきました。大学時代は推理小説研究会の一員としてミステリ小説の年末ベスト投票にかかわり、最近ではSF小説の年間ベストとオールタイムベストの投票に参加しました。あと、去年はVRコンテンツのベストリストにもコメントを寄せました。ちまたではピート・ベスト、ジョージ・ベストとならぶ三大ベスト人間としてもっぱらの評判です。 年末ベストリスト作りとは、なにか。他人のことばを借りましょう。それは自分がつまらない人間であると確認する作業です。 個別として非凡な作品たちのならんだリストが、集合として耐えがたい凡庸さを放つのはなぜでしょう? 一貫した人格のようにふるまっていたはずの自分が、まるで分裂してい

    私的年間新作映画ベスト10×10年分(2015年-24年)、全解説 - 名馬であれば馬のうち
  • 【ついにきたか】OpenAI Codex - OpenAIが生み出した天才コーディングエージェント

    概要 OpenAIは2025年5月16日、新たなAI搭載のコーディング支援エージェント 「Codex」 を発表しました。これは従来のコード補完モデル(旧Codex API)とは異なり、 クラウド上で動作する自律型のソフトウェア開発エージェント です。Codexは並列に複数のタスクをこなすことができ、コードの新機能実装、コードベースに関する質問への回答、バグ修正、プルリクエストの提案など、様々な作業を代理で実行してくれます。各タスクはクラウド上の独立したサンドボックス環境で実行され、ユーザーのリポジトリがあらかじめ読み込まれた状態で処理が行われます。 Codexの頭脳となっているのは 「codex-1」 と呼ばれる最新モデルで、OpenAIの高度な大規模言語モデル「o3」系列をソフトウェア開発向けに最適化したものです。このモデルは実際のコーディングタスクを用いた強化学習(実環境で試行錯誤させ

    【ついにきたか】OpenAI Codex - OpenAIが生み出した天才コーディングエージェント
  • Cursor入門のツボ - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? VScodeは使ってる。コードもAIに書かせてる。Cursorは使ってない。ツボだけ知りたい。 この記事の対象 ・ふだんVScodeを使っている人で、 ・すでにChatGPTやClaudeなどでAIコーディングをしている人で、 ・コードのコピペ作業が大変と感じている人で、 ・しかしながらCursorみたいな新しいツールを覚えるのもイヤだという人 この記事はそういう人(一週間前の自分)向けの記事です。 一連の導入にあたって、つまずきポイントやツボのところにざっと触れていますので、上記のリテラシーのある方ならすんなりとCursorに移行でき

    Cursor入門のツボ - Qiita
  • はじめてのBillGレビューのこと - The Joel on Software Translation Project

    Joel Spolsky / 青木靖 訳 2006年6月16日 金曜 かつてExcelは名もないまったく無様なプログラミング言語を持っていた。私たちはそれを「Excelマクロ」と呼んでいた。はなはだ機能不全なプログラミング言語で、変数もなく(値はワークシートのセルに入れる必要があった)、サブルーチンもなく、つまるところ、ほとんど保守不能なものだった。「Goto」みたいな先進的な機能も持っていたが、ラベルは実質不可視だった。 それがまっとうなものに見えていた唯一の理由は、Lotusのマクロに比べたらずっとましということだった。Lotusマクロはワークシートのセルに長々と入れられたキーストロークの並び以外の何物でもなかった。 1991年6月17日、私はMicrosoftExcelチームで働きはじめた。私の肩書きは「プログラムマネージャ」だった。私にはこのマクロの問題を解決する方法を作り出すこ

  • LLMでコードレビューする際の自分用環境を整える

    LLMでコードレビューといえばCodeRabbitのようなサービスがすでに存在していたり、 自前でコードレビュー用のGitHub Actionsを作成している事例なども散見されるようになった。 さらに最近はGitHub Copilotのbotがレビュアーとして参加してくれる機能もリリースされておりLLMによるコードレビュー環境は検証〜実践段階手前くらいまで進んでいるように感じる。 一方でこれらのLLMのコードレビューに対してはコードレビューの観点が求めるレベルに達していないという感覚もある。PR単位でのレビューなので言語やフレームワーク一般の観点でのレビューかせいぜい単一プロダクトに閉じた観点しかないことが多い。静的解析よりはもちろん柔軟とはいえ、来プロダクションレベルの人間のレビューでは業務知識や関連プロダクト全体を通じたシステムの観点からの良し悪しといったことを考慮してレビューをする

    LLMでコードレビューする際の自分用環境を整える
  • 令和ロマンから皆さまへ。

    【令和ロマンたちのつぶやき】 くるま https://twitter.com/kuruma_takahira ケムリ https://twitter.com/smoke_matsui 【毎週月曜22:30〜無料ラジオ】 「令和ロマンのご様子」 https://stand.fm/channels/5e1d9174a6c0bf4883c32ef4 【毎週土曜23:00〜有料オーディオエッセイ】 「令和ロマンのUBUGOE」 https://apps.apple.com/jp/app/apple-store/id1526260857 【令和ロマンくんのおグッズ】 https://suzuri.jp/krm_craft 【公式TikTok】 https://www.tiktok.com/@reiwaroman #吉興業 #お笑い #M1 #令和ロマン #くるま #ケムリ #漫才

    令和ロマンから皆さまへ。
  • ChatGPT画像生成(o3)で「パワポ並み」図解を生成。たった5行のプロンプトと、スキマ時間でできる効率的な運用方法を解説|たてばやし淳.エクセル兄さん@ ChatGPT書籍8冊執筆

    o3さんが作る図解がもう、ほぼパワポなんよ。 私よりまとめるセンス高い。 pic.twitter.com/UWzDbrTFyg — エクセル兄さん(たてばやし淳)@AI時代のExcel術_書籍多数 (@excel_niisan) April 19, 2025 概要: 最新のChatGPTを使うと、AI画像生成だけで、まるでパワーポイントで作ったかのような図解資料を作成できます。 今回は、特に進化した「o3」を用いて、高品質な図解画像を生成する具体的な方法をご紹介します。 その核となるのは、たった5行の命令文(プロンプト)です。忙しい方でもスキマ時間を活用できる、効率的な運用テクニックと合わせて解説します。 【要点】 ・パワポ風図解を作る「5行プロンプト」 ・ChatGPT(o3)で高品質な図解を生成する具体的な手順 ・スキマ時間で図解を量産する方法 ・日語文字化けを防ぐコツ・修正方法

    ChatGPT画像生成(o3)で「パワポ並み」図解を生成。たった5行のプロンプトと、スキマ時間でできる効率的な運用方法を解説|たてばやし淳.エクセル兄さん@ ChatGPT書籍8冊執筆
  • 不均衡データに対する機械学習:理論と実践 - tomtom58’s blog

    はじめに 1. 不均衡データとは何か 1.1 不均衡データの定義と実例 1.2 なぜ不均衡データが問題なのか 1.3 数学的視点から見た不均衡データの課題 2. 不均衡データへの対処の根的な考え方 2.1 基的アプローチの体系 2.2 統計的基盤: なぜこれらの方法が機能するのか 3. データレベルの対処法: サンプリング技術 3.1 アンダーサンプリング手法 3.1.1 ランダムアンダーサンプリング(RUS) 3.1.2 情報損失を最小化するアンダーサンプリング Tomek Links Condensed Nearest Neighbor Rule (CNN) One-Sided Selection (OSS) 3.2 オーバーサンプリング手法 3.2.1 ランダムオーバーサンプリング(ROS) 3.2.2 SMOTE (Synthetic Minority Over-samplin

    不均衡データに対する機械学習:理論と実践 - tomtom58’s blog
  • 研究者向けの技術研修資料を公開します | | AI tech studio

    はじめに こんにちは、AI Labの岩崎です。普段はResearch Engineerとして他チームの実験サポートや研究成果の社会実装などをしています。タイトルの通り、CyberAgentにあるAI Labという研究機関で技術研修を行った話をします。 AI Labは現在インターンを含めて100名近いメンバーが在籍しており、これはメガベンチャーである弊社の中でも大規模な組織です。このように規模が拡大する中で、他社での経験があるメンバーはもちろんのこと、先月まで大学で研究を行っていたメンバーであっても、入社後すぐに共著や社会実装を通じてプロダクトと連携できる程度の技術力が求められます。 小規模な組織であれば技術力の高いメンバーが他のメンバーをフォローすることも可能でしたが、現在の組織規模ではチームや個人間で研究開発力に差が生じつつあります。そうした背景があるAI Labではオンボーディングは用

    研究者向けの技術研修資料を公開します | | AI tech studio
  • 「開運!なんでも鑑定団」で紹介された宋時代の版本、研究者にとっては事件級の大発見だった

    中唐文学会 @zhong1tang2 これ、はっきり申し上げまして大事件です。 韓昌黎こと韓愈(768〜824)は、まさに中唐を代表する文人であり、詩文は一流の腕前であり、「唐宋八大家」の一人として知られます。 さらに思想方面では「匹夫而為百世師」と称賛され、宋代儒学の先駆者となった大人物です。 tv-tokyo.co.jp/kantei/smp/kai… 2025-04-02 13:13:18 中唐文学会 @zhong1tang2 宋朝の版は、年代も早く、また校勘がしっかりされている場合が多いので、あるいはこのの発見により、今まで知られていなかった異なるテキストが見つかる可能性があります。 韓愈の文学の研究者や、唐宋書誌学の研究者にとって大きな朗報です。 2025-04-02 13:17:45 GrimoireBook @GrimoireBook お宝鑑定団に韓愈の『韓昌黎集』全巻が

    「開運!なんでも鑑定団」で紹介された宋時代の版本、研究者にとっては事件級の大発見だった
  • VSCodeでドキュメント作成するならまずこれを入れよう - Qiita

    なぜMarkdownか 記法が簡単で表現力が高い(※1) テキストなので差分管理がしやすい QiitaもMarkdown形式を採用している ※1 プレビュー機能があるとなおよい! VSCodeを使うならこの拡張機能を入れてみよう Markdown All in One https://marketplace.visualstudio.com/items?itemName=yzhang.markdown-all-in-one) まずはこれを入れていたら間違いないと思う! 詳細は拡張機能の公開サイトを見ていただくといいですが、とりあえずのおすすめポイントは これを入れていたら大体の機能が使える(最初に入れるべき拡張機能) 便利なショートカットが用意されている 太字:Ctrl+B 表のフォーマット:Alt+Shift+F パスの補完をしてくれる ファイルリンク(特に画像)のパスを補完してくれる

    VSCodeでドキュメント作成するならまずこれを入れよう - Qiita
  • 「Visual Studio Code」と「WSL」+「Docker」をもっと便利に使いこなそう

    第10回の今回は、VS CodeのDocker拡張機能を活用して、WSL+Docker環境をより便利に使う方法や、VS CodeからWSL環境に直接接続する方法を解説します。 はじめに アプリケーション開発において、エディターや統合開発環境(IDE)は欠かせないツールです。シンプルなエディターでもコードを書くことはできますが、補完機能やデバッグ機能が充実したIDEを使えば開発効率が大幅に向上します。IDEにはさまざまな選択肢があり、IntelliJ IDEA、Eclipse、Visual Studioなどが有名です。その中でも「Visual Studio Code」(以下、VS Code)は無料で利用でき、軽量かつ拡張性が高いことから、多くの開発者に支持されています。 特にVS CodeはWSL(Windows Subsystem for Linux)との親和性が高く、Linux環境での開

    「Visual Studio Code」と「WSL」+「Docker」をもっと便利に使いこなそう
  • 国立国会図書館のOCRライブラリが凄くよかった件(Windows向け) - Qiita

    はじめに 日語OCR, 有料の業務用ソフトには色々と高性能なものがあるんですが、無料の場合の選択肢は意外に限られてます。最近ではGeminiなどにOCRさせることも試みてますが、縦書きに弱いのが欠点。加えて、私がやっているような著作権が切れた戦前ののデジタル化の場合、認識率の低い旧字体が多いのが悩みの種。 そこで最近知ったのが、国立国会図書館が公開しているOCRライブラリ、NDLOCRです。国会図書館のデジタル資料(国立国会図書館デジタルコレクション)から全文テキストデータを作成するために開発されたとのこと。 NDLOCRは、現在ver2.1がGithubに公開されています。古いが多い国会図書館の資料向けに作られているだけあって、旧字体でも高い精度で認識してくれます。今回は、このライブラリを試してみました。基Githubサイトに書いてある通りなんですが、いくつか注意すべき点をメモ

    国立国会図書館のOCRライブラリが凄くよかった件(Windows向け) - Qiita
  • LLMにJSONやソースコードを出力させるStructured Generationの技術 - NTT docomo Business Engineers' Blog

    こんにちは、イノベーションセンターの加藤です。この記事では、大規模言語モデル(LLM)にJSONやソースコードを正しく出力させるための生成手法であるStructured Generationについて紹介します。 Structured Generationとは パーサーを用いた制約手法 正則言語とは 正則言語のStructured Generation 文脈自由言語とは 字句解析について 正則言語+文脈自由言語のStructured Generation まとめ Structured Generationとは 大規模言語モデル(LLM)はよくチャットボットとしての活用が目立ちますが、LLMの入出力を外部のプログラムに繋ぎ込むことでより高度な自然言語処理システムを作ることができます。 例えばOpenAIのCode Interpreter1はLLMをPythonの実行環境と接続することで、ユーザ

    LLMにJSONやソースコードを出力させるStructured Generationの技術 - NTT docomo Business Engineers' Blog
  • MCPサーバーで開発効率が3倍に!2025年必須の10大ツール - Qiita

    はじめに 最近、あるプロジェクトGitHubリポジトリの内容をAIに分析させたくて、「どうやってClaudeとGitHubを連携させればいいんだろう...」と頭を抱えていたんです。何時間もネットで調べた末に出会ったのがMCPサーバーでした。これが当に目から鱗だったんですよ!😲 「石の上にも三年」というように、私は根気強く数週間かけて様々なMCPサーバーを試してきました。そして今日は、私の開発ワークフローを劇的に変えた10個の素晴らしいMCPサーバーを、4つの主要カテゴリーに分けて紹介したいと思います! そもそもMCPサーバーって何?🤔 リストに入る前に、MCPサーバーについて簡単に説明しますね。MCPは「Model Context Protocol」の略で、AIモデルが外部ツールやデータソースと安全かつシームレスに連携するためのオープンスタンダードなんです。 簡単に言えば、お気に入

    MCPサーバーで開発効率が3倍に!2025年必須の10大ツール - Qiita
  • AIを学びたい中学生のためのリンク集|shi3z

    今日、母校の中学校に行って子供たちに深層学習用PCを寄付するので、これを使ってAIとプログラミングを学ぶためのリンク集を置いておくことにする。 普通のPCやスマホから無料で使えるAIChatGPT  老舗/最新モデルが使える 全般に強い https://chat.openai.com/ AIStudio (Google Gemini) プログラミングや科学知識に強い

    AIを学びたい中学生のためのリンク集|shi3z