tomonori13のブックマーク - はてなブックマーク

東大・松尾研、2024年度「大規模言語モデル講座」の講義スライド資料を無料公開／LLMの活用法からモデル構造、応用まで幅広く学べる

tomonori13 2025/08/14

リンク

【無料】グーグル神AIツール5選　「Google AI Studio」はこれがやばい (1/7)

「Google AI Studio」は、グーグルが提供する生成AI開発プラットフォームだが、実は隠れた「無料の神ツール集」とも言える存在である。ただし重要な点として、このサービスは「実験的な技術」を含んでおり、完全に保証されたプロダクションレベルのサービスではない。Googleの利用規約にも「実験的技術が含まれており、不正確または不快なコンテンツを提供することがある」と明記されている。つまり、無料で高機能な反面、「お試し・実験環境」的な位置づけなのだ。最大の魅力は、有料級の機能が完全無料で使い放題になることだ。リアルタイム音声対話、テキストから動画生成、1000ページ級PDF一括解析など、他社なら月額数千円～数万円クラスの機能が、Googleアカウントひとつで全て0円。まさに「こんなのタダでいいの？」レベルの神仕様である。「AI にお金をかけたくないけど、本格的に活用したい」という人に

tomonori13 2025/07/19

リンク

Amazon S3 へデータ転送速度が早いと噂の s5cmd を使って aws s3 cp と比べてみた | DevelopersIO

はじめに S3 バケットへのファイル転送において一般的な aws s3 cp コマンドと、高速転送可能な s5cmd の転送速度を検証しました。先日、海外リージョンの S3 バケットへ小さなファイルを大量アップロード時に利用したところ、転送時間が想像よりもずっと早かったです。そんな私の中でホットな s5cmd が本当に早いのか気になりました。条件を整えて aws s3 cp と s5cmd cp でファイル転送した転送時間と転送速度を計測してみました。ところで s5cmd ってなに s5cmd は、S3 と S3 互換オブジェクトストレージ、ローカルファイルシステム上のファイル操作できるコマンドラインツールです。マルチコアをフル活用した並列処理により非常に高速に転送できること強みです。 Mac なら homebrew で簡単にインストールできます。検証結果早見実行環境に依りますが、

tomonori13 2025/07/13

リンク

データアナリストのためのLLM時代のSQL作成術｜Mercari Analytics Blog

メルカリのデータアナリストの@__hiza__です。メルカリではデータアナリストとして日々SQLを使ったデータ分析をしつつ、業務外ではPythonを使ったアプリケーション開発を行っており、どちらの作業にもLLMを活用しています。この記事ではデータアナリストに向けて、LLMにSQLを作成させて効率的にデータ分析を行うテクニックと、その背景にある応用可能な考え方を説明します。関連記事メルカリでは、LLMをデータ分析の現場に活かすさまざまな取り組みが生まれています。例えば、対話形式で誰でも手軽にデータ分析ができる社内ツール「Socrates」があります。これはデータアナリストに限らず、より多くのメンバーがデータを活用できるようになる強力なツールです。一方で、私たちデータアナリストが日々向き合う、より複雑で専門的な分析を効率化する取り組みも行っています。先日、私と同じデータアナリストの

tomonori13 2025/07/05

リンク

私的年間新作映画ベスト10×10年分（2015年-24年）、全解説 - 名馬であれば馬のうち

（迷えるように見えてたいして迷っていない若者に助言をくれる謎のおじいさん）人は年始に餅をつきますが、わたしは年間ベストリストを作ります。ここ十年、年毎の変わり目に、映画、マンガ、ゲームのリストをこねこねしてきました。大学時代は推理小説研究会の一員としてミステリ小説の年末ベスト投票にかかわり、最近ではSF 小説の年間ベストとオールタイムベストの投票に参加しました。あと、去年はVRコンテンツのベストリストにもコメントを寄せました。ちまたではピート・ベスト、ジョージ・ベストとならぶ三大ベスト人間としてもっぱらの評判です。年末ベストリスト作りとは、なにか。他人のことばを借りましょう。それは自分がつまらない人間であると確認する作業です。個別として非凡な作品たちのならんだリストが、集合として耐えがたい凡庸さを放つのはなぜでしょう？　一貫した人格のようにふるまっていたはずの自分が、まるで分裂してい

tomonori13 2025/06/10

リンク

【ついにきたか】OpenAI Codex - OpenAIが生み出した天才コーディングエージェント

概要 OpenAIは2025年5月16日、新たなAI搭載のコーディング支援エージェント「Codex」を発表しました。これは従来のコード補完モデル（旧Codex API）とは異なり、クラウド上で動作する自律型のソフトウェア開発エージェントです。Codexは並列に複数のタスクをこなすことができ、コードの新機能実装、コードベースに関する質問への回答、バグ修正、プルリクエストの提案など、様々な作業を代理で実行してくれます。各タスクはクラウド上の独立したサンドボックス環境で実行され、ユーザーのリポジトリがあらかじめ読み込まれた状態で処理が行われます。 Codexの頭脳となっているのは「codex-1」と呼ばれる最新モデルで、OpenAIの高度な大規模言語モデル「o3」系列をソフトウェア開発向けに最適化したものです。このモデルは実際のコーディングタスクを用いた強化学習（実環境で試行錯誤させ

tomonori13 2025/05/18

リンク

Cursor入門のツボ - Qiita

Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? VScodeは使ってる。コードもAIに書かせてる。Cursorは使ってない。ツボだけ知りたい。この記事の対象・ふだんVScodeを使っている人で、・すでにChatGPTやClaudeなどでAIコーディングをしている人で、・コードのコピペ作業が大変と感じている人で、・しかしながらCursorみたいな新しいツールを覚えるのもイヤだという人この記事はそういう人（一週間前の自分）向けの記事です。一連の導入にあたって、つまずきポイントやツボのところにざっと触れていますので、上記のリテラシーのある方ならすんなりとCursorに移行でき

tomonori13 2025/05/11

リンク

はじめてのBillGレビューのこと - The Joel on Software Translation Project

Joel Spolsky / 青木靖訳 2006年6月16日金曜かつてExcelは名もないまったく無様なプログラミング言語を持っていた。私たちはそれを「Excelマクロ」と呼んでいた。はなはだ機能不全なプログラミング言語で、変数もなく(値はワークシートのセルに入れる必要があった)、サブルーチンもなく、つまるところ、ほとんど保守不能なものだった。「Goto」みたいな先進的な機能も持っていたが、ラベルは実質不可視だった。それがまっとうなものに見えていた唯一の理由は、Lotusのマクロに比べたらずっとましということだった。Lotusマクロはワークシートのセルに長々と入れられたキーストロークの並び以外の何物でもなかった。 1991年6月17日、私はMicrosoftのExcelチームで働きはじめた。私の肩書きは「プログラムマネージャ」だった。私にはこのマクロの問題を解決する方法を作り出すこ

tomonori13 2025/05/10

リンク

LLMでコードレビューする際の自分用環境を整える

LLMでコードレビューといえばCodeRabbitのようなサービスがすでに存在していたり、自前でコードレビュー用のGitHub Actionsを作成している事例なども散見されるようになった。さらに最近はGitHub Copilotのbotがレビュアーとして参加してくれる機能もリリースされておりLLMによるコードレビュー環境は検証〜実践段階手前くらいまで進んでいるように感じる。一方でこれらのLLMのコードレビューに対してはコードレビューの観点が求めるレベルに達していないという感覚もある。PR単位でのレビューなので言語やフレームワーク一般の観点でのレビューかせいぜい単一プロダクトに閉じた観点しかないことが多い。静的解析よりはもちろん柔軟とはいえ、本来プロダクションレベルの人間のレビューでは業務知識や関連プロダクト全体を通じたシステムの観点からの良し悪しといったことを考慮してレビューをする

tomonori13 2025/05/05

リンク

令和ロマンから皆さまへ。

【令和ロマンたちのつぶやき】くるま　https://twitter.com/kuruma_takahira ケムリ　https://twitter.com/smoke_matsui 【毎週月曜22:30〜無料ラジオ】「令和ロマンのご様子」 https://stand.fm/channels/5e1d9174a6c0bf4883c32ef4 【毎週土曜23:00〜有料オーディオエッセイ】「令和ロマンのUBUGOE」 https://apps.apple.com/jp/app/apple-store/id1526260857 【令和ロマンくんのおグッズ】 https://suzuri.jp/krm_craft 【公式TikTok】 https://www.tiktok.com/@reiwaroman #吉本興業 #お笑い #M1 #令和ロマン #くるま #ケムリ #漫才

tomonori13 2025/04/29

リンク

ChatGPT画像生成(o3)で「パワポ並み」図解を生成。たった5行のプロンプトと、スキマ時間でできる効率的な運用方法を解説｜たてばやし淳.エクセル兄さん@ ChatGPT書籍8冊執筆

o3さんが作る図解がもう、ほぼパワポなんよ。私よりまとめるセンス高い。 pic.twitter.com/UWzDbrTFyg — エクセル兄さん(たてばやし淳)@AI時代のExcel術_書籍多数 (@excel_niisan) April 19, 2025 概要: 最新のChatGPTを使うと、AIの画像生成だけで、まるでパワーポイントで作ったかのような図解資料を作成できます。今回は、特に進化した「o3」を用いて、高品質な図解画像を生成する具体的な方法をご紹介します。その核となるのは、たった5行の命令文（プロンプト）です。忙しい方でもスキマ時間を活用できる、効率的な運用テクニックと合わせて解説します。【要点】・パワポ風図解を作る「5行プロンプト」・ChatGPT(o3)で高品質な図解を生成する具体的な手順・スキマ時間で図解を量産する方法・日本語文字化けを防ぐコツ・修正方法

tomonori13 2025/04/29

リンク

不均衡データに対する機械学習：理論と実践 - tomtom58’s blog

はじめに 1. 不均衡データとは何か 1.1 不均衡データの定義と実例 1.2 なぜ不均衡データが問題なのか 1.3 数学的視点から見た不均衡データの課題 2. 不均衡データへの対処の根本的な考え方 2.1 基本的アプローチの体系 2.2 統計的基盤: なぜこれらの方法が機能するのか 3. データレベルの対処法: サンプリング技術 3.1 アンダーサンプリング手法 3.1.1 ランダムアンダーサンプリング（RUS） 3.1.2 情報損失を最小化するアンダーサンプリング Tomek Links Condensed Nearest Neighbor Rule (CNN) One-Sided Selection (OSS) 3.2 オーバーサンプリング手法 3.2.1 ランダムオーバーサンプリング（ROS） 3.2.2 SMOTE (Synthetic Minority Over-samplin

tomonori13 2025/04/20

リンク

研究者向けの技術研修資料を公開します | | AI tech studio

はじめにこんにちは、AI Labの岩崎です。普段はResearch Engineerとして他チームの実験サポートや研究成果の社会実装などをしています。タイトルの通り、CyberAgentにあるAI Labという研究機関で技術研修を行った話をします。 AI Labは現在インターンを含めて100名近いメンバーが在籍しており、これはメガベンチャーである弊社の中でも大規模な組織です。このように規模が拡大する中で、他社での経験があるメンバーはもちろんのこと、先月まで大学で研究を行っていたメンバーであっても、入社後すぐに共著や社会実装を通じてプロダクトと連携できる程度の技術力が求められます。小規模な組織であれば技術力の高いメンバーが他のメンバーをフォローすることも可能でしたが、現在の組織規模ではチームや個人間で研究開発力に差が生じつつあります。そうした背景があるAI Labではオンボーディングは用

tomonori13 2025/04/18

リンク

「開運！なんでも鑑定団」で紹介された宋時代の版本、研究者にとっては事件級の大発見だった

中唐文学会 @zhong1tang2 これ、はっきり申し上げまして大事件です。韓昌黎こと韓愈（768〜824）は、まさに中唐を代表する文人であり、詩文は一流の腕前であり、「唐宋八大家」の一人として知られます。さらに思想方面では「匹夫而為百世師」と称賛され、宋代儒学の先駆者となった大人物です。 tv-tokyo.co.jp/kantei/smp/kai… 2025-04-02 13:13:18 中唐文学会 @zhong1tang2 宋朝の版本は、年代も早く、また校勘がしっかりされている場合が多いので、あるいはこの本の発見により、今まで知られていなかった異なるテキストが見つかる可能性があります。韓愈の文学の研究者や、唐宋書誌学の研究者にとって大きな朗報です。 2025-04-02 13:17:45 GrimoireBook @GrimoireBook お宝鑑定団に韓愈の『韓昌黎集』全巻が

tomonori13 2025/04/03

リンク

VSCodeでドキュメント作成するならまずこれを入れよう - Qiita

なぜMarkdownか記法が簡単で表現力が高い（※１）テキストなので差分管理がしやすい QiitaもMarkdown形式を採用している ※１プレビュー機能があるとなおよい！ VSCodeを使うならこの拡張機能を入れてみよう Markdown All in One https://marketplace.visualstudio.com/it ems?it emName=yzhang.markdown-all-in-one) まずはこれを入れていたら間違いないと思う！詳細は拡張機能の公開サイトを見ていただくといいですが、とりあえずのおすすめポイントはこれを入れていたら大体の機能が使える（最初に入れるべき拡張機能）便利なショートカットが用意されている太字：Ctrl＋B 表のフォーマット：Alt+Shift+F パスの補完をしてくれるファイルリンク（特に画像）のパスを補完してくれる

tomonori13 2025/03/31

リンク

「Visual Studio Code」と「WSL」＋「Docker」をもっと便利に使いこなそう

第10回の今回は、VS CodeのDocker 拡張機能を活用して、WSL＋Docker環境をより便利に使う方法や、VS CodeからWSL環境に直接接続する方法を解説します。はじめにアプリケーション開発において、エディターや統合開発環境(IDE)は欠かせないツールです。シンプルなエディターでもコードを書くことはできますが、補完機能やデバッグ機能が充実したIDEを使えば開発効率が大幅に向上します。IDEにはさまざまな選択肢があり、IntelliJ IDEA、Eclipse、Visual Studioなどが有名です。その中でも「Visual Studio Code」(以下、VS Code)は無料で利用でき、軽量かつ拡張性が高いことから、多くの開発者に支持されています。特にVS CodeはWSL(Windows Subsystem for Linux)との親和性が高く、Linux環境での開

tomonori13 2025/03/31

リンク

国立国会図書館のOCRライブラリが凄くよかった件(Windows向け) - Qiita

はじめに日本語OCR, 有料の業務用ソフトには色々と高性能なものがあるんですが、無料の場合の選択肢は意外に限られてます。最近ではGeminiなどにOCRさせることも試みてますが、縦書きに弱いのが欠点。加えて、私がやっているような著作権が切れた戦前の本のデジタル化の場合、認識率の低い旧字体が多いのが悩みの種。そこで最近知ったのが、国立国会図書館が公開しているOCRライブラリ、NDLOCRです。国会図書館のデジタル資料（国立国会図書館デジタルコレクション)から全文テキストデータを作成するために開発されたとのこと。 NDLOCRは、現在ver2.1がGithubに公開されています。古い本が多い国会図書館の資料向けに作られているだけあって、旧字体でも高い精度で認識してくれます。今回は、このライブラリを試してみました。基本、Githubサイトに書いてある通りなんですが、いくつか注意すべき点をメモ

tomonori13 2025/03/27

リンク

LLMにJSONやソースコードを出力させるStructured Generationの技術 - NTT docomo Business Engineers' Blog

こんにちは、イノベーションセンターの加藤です。この記事では、大規模言語モデル(LLM)にJSONやソースコードを正しく出力させるための生成手法であるStructured Generationについて紹介します。 Structured Generationとはパーサーを用いた制約手法正則言語とは正則言語のStructured Generation 文脈自由言語とは字句解析について正則言語+文脈自由言語のStructured Generation まとめ Structured Generationとは大規模言語モデル(LLM)はよくチャットボットとしての活用が目立ちますが、LLMの入出力を外部のプログラムに繋ぎ込むことでより高度な自然言語処理システムを作ることができます。例えばOpenAIのCode Interpreter1はLLMをPythonの実行環境と接続することで、ユーザ

tomonori13 2025/03/20

リンク

MCPサーバーで開発効率が3倍に！2025年必須の10大ツール - Qiita

はじめに最近、あるプロジェクトでGitHubリポジトリの内容をAIに分析させたくて、「どうやってClaudeとGitHubを連携させればいいんだろう...」と頭を抱えていたんです。何時間もネットで調べた末に出会ったのがMCPサーバーでした。これが本当に目から鱗だったんですよ！😲 「石の上にも三年」というように、私は根気強く数週間かけて様々なMCPサーバーを試してきました。そして今日は、私の開発ワークフローを劇的に変えた10個の素晴らしいMCPサーバーを、4つの主要カテゴリーに分けて紹介したいと思います！そもそもMCPサーバーって何？🤔 リストに入る前に、MCPサーバーについて簡単に説明しますね。MCPは「Model Context Protocol」の略で、AIモデルが外部ツールやデータソースと安全かつシームレスに連携するためのオープンスタンダードなんです。簡単に言えば、お気に入

tomonori13 2025/03/15

リンク

AIを学びたい中学生のためのリンク集｜shi3z

今日、母校の中学校に行って子供たちに深層学習用PCを寄付するので、これを使ってAIとプログラミングを学ぶためのリンク集を置いておくことにする。普通のPCやスマホから無料で使えるAI ChatGPT 老舗/最新モデルが使える　全般に強い https://chat.openai.com/ AIStudio (Google Gemini) プログラミングや科学知識に強い

tomonori13 2025/03/11

リンク

はてなブックマーク

タグ

tomonori13のブックマーク (2,117)

お知らせ

今週のはてなブックマーク数ランキング（2025年8月第2週）

今週のはてなブックマーク数ランキング（2025年8月第1週）

月間はてなブックマーク数ランキング（2025年7月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス