yk_uminamiのブックマーク - はてなブックマーク

はじめての「相関と因果とエビデンス」入門：“動機づけられた推論” に抗うために

人文系大学生〜学部卒の方々を念頭に置いた講演でのスライドです。Enjoy！＊書籍：林岳彦著『はじめての統計的因果推論』（岩波書店）の情報はこちら→ https://www.iwanami.co.jp/book/b639904.html

yk_uminami 2024/04/27

リンク

僕たちがグラフニューラルネットワークを学ぶ理由

グラフニューラルネットワーク - Forkwell Library #50 https://forkwell.connpass.com/event/315577/ での講演スライドです。サポートサイト：https://github.com/joisino/gnnbook グラフニューラルネットワーク（機械学習プロフェッショナルシリーズ）好評発売中！：https://www.amazon.co.jp/d/4065347823 連絡先: @joisino_ (Twitter) / https://joisino.net/

yk_uminami 2024/04/27

勉強

リンク

JMOOC - 無料で学べる日本最大のオンライン大学講座（MOOC）

まずはJMOOCにログイン JMOOCにログインするとお気に入りの講座をリストに登録して通知を受け取ったり、JMOOCのメールマガジンを受け取ることができます。 Google ID,Facebook ID共に所有していない場合、各プラットフォーム（gacco,Open Learning,Japan）にて個別に受講登録をして頂ければ受講できます。 ※すでに各プラットフォーム（gacco、OpenLearning,Japan）でアカウント登録している場合は、登録済みのものと同様のIDで登録いただくことで、将来的にシングルサインオンのシステム構築が完了した際に、共通IDによる受講情報の一元管理が可能になります。現在FaceBookIDでのログインは、一時的ではございますが、ご利用になれません。

yk_uminami 2024/04/24

リンク

『因果推論』（金本拓：オーム社）は因果推論に留まらず現代的なマーケティング分析手法まで網羅したバイブル - 渋谷駅前で働くデータサイエンティストのブログ

因果推論: 基礎から機械学習・時系列解析・因果探索を用いた意思決定のアプローチ作者:金本拓オーム社Amazon 著者の金本さんからご指名でご恵贈いただいたのが、こちらの『因果推論 ―基礎から機械学習・時系列解析・因果探索を用いた意思決定のアプローチ―』です。正直に白状しますと、因果推論とタイトルにつく技術書はここ数年でゴマンと出版されており、本書も紙冊子で頂戴したものの僕はあまり期待せずにページをめくり始めたのでした（ごめんなさい）。ところが、ほんの数ページめくっただけでその内容に僕は仰天しました。グラフィカルで実務家にとっての分かりやすさを重視した因果推論の解説と実践にとどまらず、現代的なマーケティング分析では必須の種々の手法についてまで懇切丁寧に解説とPythonによる実践例が付された本書は、文字通り「マーケティング分析実務家にとってのバイブル」になり得る素晴らしい一冊だと直感し

yk_uminami 2024/04/23

リンク

いちばんやさしいローカル LLM｜ぬこぬこ

概要ローカル LLM 初めましての方でも動かせるチュートリアル最近の公開されている大規模言語モデルの性能向上がすごい Ollama を使えば簡単に LLM をローカル環境で動かせる Enchanted や Open WebUI を使えばローカル LLM を ChatGPT を使う感覚で使うことができる quantkit を使えば簡単に LLM を量子化でき、ローカルでも実行可能なサイズに小さくできる 1. はじめに大規模言語モデル（LLM）の数は数年前と比べてたくさん増えました。有名な LLM を使ったチャットサービスとして、OpenAI の ChatGPT や Anthropic の Claude、Google の Gemini などがありますが、これらのサービスの中で利用されている大規模言語モデルは公開されていません。現状、様々な評価指標により LLM の性能が測定されていますが、

yk_uminami 2024/04/22

リンク

もし「GitHub Copilot」を現役弁護士が使ったら？ - MNTSQ Techブログ

こんにちは。GitHub Copilotを先日初めて触って、感銘を受けたMNTSQ代表の板谷です。MNTSQの代表をしておりますが、現役の弁護士でもあります。なぜ私が、GitHub Copilotに感銘を受けたかというと、「プログラミングの LLM による進化」は、契約という言語をコーディングするためにもドンピシャで使えそうだと感じたからです。例えば、GitHub Copilot では、自分の過去のコードを参照して、最適なコードをサジェストしてくれます。これは、契約に関わるすべてのビジネスパーソンが求めていたものです！契約の 99.9%が過去のコードの使い回しであるにもかかわらず、毎回ゼロからコーディングするのが本当に苦痛だからです。ちなみに、前回契約と理由なく diff があると取引先に怒られます。笑しかし、GitHub Copilot 的なものがプログラミング言語だけでなく契約

yk_uminami 2024/04/20

LLM

リンク

タイタニック研究家がとある乗客にまつわる誤解と謎を解き明かしていく話。沈みゆく船と共に最期を迎えた二人の紳士、グッゲンハイムとジリオ

春野ユウ @haruno_yu_0617 タイタニック関連の調査/創作/雑多な話 🚢Titanic/movie & history 💙V.Giglio & B.Guggenheim(G&G) ⭐研究/創作に関するご質問やお仕事のご依頼はこちらへ（★を@に）→harunoyu1912★gmail.com ⭐作品の感想や簡単な質問はマシュマロへ☺ marshmallow-qa.com/haruno_yu_0617… 春野ユウ @haruno_yu_0617 タイタニックオタクの私が、とある乗客にまつわる誤解と謎を解き明かしていく話。なぜ誤った情報が広がったのか？　その誤りを遺族はどう思っていたのか……？当時の新聞、関係者の自伝や寄稿、手紙など頑張って収集し、漫画にまとめました。是非ご覧ください……！ (全23P) #タイタニック号の日 pic.twitter.com/ygUe0ngBL

yk_uminami 2024/04/16

リンク

Obsidianを使って生産性を高める - Qiita

目次 1.はじめに 2.Obsidianとは 3.Obsidianのインストール 4.プラグインの導入 5.おすすめのプラグイン 6.Obsidian参考サイト 7.おわりに 1. はじめに生産性を高めるツールは色々存在します。タスク管理を例に挙げると、私はタスク管理にはカンバンツールが好きで、オフラインで使えるWekanやFocalBoardというツールを使ってきました。しかし、タスク管理は〇〇、エディタは△△、作業記録は××といったように複数のツールを使うのは非常に面倒です。機会があってマークダウンエディタであるObsidianを活用する方法を調べてみたところ、このツール1つで様々なツールの代替ができて非常に有用だと感じたので、Obsidianの導入方法とタスク管理機能を含めた個人的におすすめなプラグインを紹介し、Obsidianの活用方法を紹介していこうと思います。まだまだ

yk_uminami 2024/04/15

あとで読む

リンク

GitHub - drawdb-io/drawdb: Free, simple, and intuitive online database design tool and SQL generator.

You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

yk_uminami 2024/04/14

あとで読む

リンク

Command R+はトークナイザーもすごかった - Qiita

はじめに最近Command R+が界隈を賑わせています。その賑わいの中でも「Command R+の日本語の応答速度が速い。」という声を良く聞きます。(半分以上X経由なので、よく聞くというよりも良く見るが近いですが、) そこで今回はCommand R+の日本語の応答速度が本当に速いのか、なぜ速いのかについてトークナイザー観点で述べたいと思います。応答速度とトークナイザーの関係及びCommand R+のトークンナイザーまず前提として、入力あたりのトークン数が少なければ少ないほど応答時間が短くなります。よってトークナイザーは応答速度に大いに関係します。詳しくは以下の記事で解説しています。少しだけ述べるとトークン数縮小に伴う語彙数増加によるEmbedding層肥大化による速度遅延<<トークン数増加による速度遅延となっています。ELYZAのfastのモデルが速い理由の一つもこの理由です。

yk_uminami 2024/04/13

LLM

リンク

RAGの性能を高める「Self-RAG」を3分で理解する

本記事では、よく聞く「Self-RAG」についてざっくり理解します。軽めの記事です。はじめまして。ナレッジセンスの門脇です。生成AIやRAGシステムを活用したサービスを開発しています。この記事は何この記事は、RAGの新手法として昨年発表された「Self-RAG」の論文[1]について、日本語で簡単にまとめたものです。この論文は「CRAG」[2]など、最近出ている別のRAGアーキテクチャにも影響を与えているので、理解する価値がありそうです。今回も「そもそもRAGとは？」については、知っている前提で進みます。確認する場合は以下の記事もご参考下さい。本題ざっくりサマリー RAGの性能を高めるための新しい手法です。ワシントン大学などの研究者によって2023年10月に提案されました。Self-RAGという手法を使うメリットは、回答品質を上げられること、ハルシネーション（幻覚）を減らせるこ

yk_uminami 2024/04/10

あとで読む

リンク

Command R の概要｜npaka

以下の記事が面白かったので、簡単にまとめました。・Command R: Retrieval-Augmented Generation at Production Scale 1. Command R「Command R」は、「RAG」や「Tool」などの長いコンテキストタスク向けに最適化されたLLMです。CohereのEmbeddingおよびRerankと連携して動作するように設計されており、RAGアプリケーションに最高クラスの統合を提供し、エンタープライズユースケースで優れています。特徴は、次のとおりです。・RAGとToolの使用に関する高い精度・低遅延、高スループット・128Kコンテキスト長、価格が安い・10の主要言語に対応 (日本語含む) ・研究・評価のためにHuggingFaceでウェイトを公開「Command R」は、Cohere のホスト型APIですぐに利用でき

yk_uminami 2024/04/07

LLM

リンク

RAG用途に使える、Wikipedia 日本語の embeddings とベクトル検索用の faiss index を作った - A Day in the Life

この記事は、情報検索・検索技術 Advent Calendar 2023の12月4日の記事である。昨今のLLMの台頭により、外部情報を In-Context Learning として利用しLLMの生成結果の性能を高めることが可能な RAG(Retrieval Augmented Generation) の重要性の高まりを感じる。ただ、RAG を使ったシステムを構築してみようにも、データが少ないと面白みが少なかったりする。その為、Wikipedia 日本語の約550万文から簡単に検索可能でRAGの入力データとして使えるような embeddings と、素早い速度でベクトル検索できるような faiss 用の index を作成した。例えば、Wikipedia から該当の文を検索する用途はこのように使える。 from datasets.download import DownloadMana

yk_uminami 2024/04/04

LLM

リンク

宇多田ヒカル「First Love」都市伝説は実在した! CDはプレスで音が変わる

yk_uminami 2024/04/01

リンク

中学生でもわかる深層学習

第1章　理論編・深層学習とは (p.13-) ・ニューラルネットワークとは (p.31-) ・どうやって学習するか: 勾配降下法 (p.57-) ・深層学習の注意点 (p.91-) 第2章　応用編・分類問題 (p.110-) ・画像認識 (p.120-) ・音声認識／自然言語処理 (p.151-) ・講演のまとめ (p.167-)

yk_uminami 2024/03/30

あとで読む

リンク

LLMの現在 - Speaker Deck

今のLLMを取り巻く状況について紹介します。

yk_uminami 2024/03/30

リンク

農業テロ｜さがみ

みなさんは農業テロという単語を知っているだろうか。農業テロは農業に対してのテロ行為（病原菌をばら撒くなど）を指す。＜実際の例＞・1989年にブラジルのバイーア州でカカオプランテーションにカカオの天敵である天狗巣病を引き起こす菌類が発生した。バイーア州はブラジルのカカオ生産の中心地だった。バイーア州は地理的に他の地域と隔絶しており、菌類もバイーア州に入ってきたことはなかった。プランテーションの環境も味方して病気は瞬く間に広がった。ブラジルは当時世界第二位のチョコレート生産国だった。それが4年後にはチョコレートの純輸入国となった。その現状は今も変わらない。この出来事によって2５万人の農園労働者が職を失い、100万人が都市へ移住した。多くの人が自殺した。この出来事はたった六人によって引き起こされた。菌類は彼らによってばら撒かれたのだ。彼らはカカオ生産に関する専門的な知識を持つ技術者だった。こ

yk_uminami 2024/03/30

リンク

波　2024年4月号おつむの良い子は長居しない　第12回／高嶋政伸

※このエッセイには性暴力場面の撮影に関する記述があります 12　インティマシーコーディネーター昨年はハードな役が続きました。何人もの愛人を囲い、人を殺めることもためらわない詐欺師。歯向かう者は消し、臓器ブローカーに死体を売り払う男。ショットガンで人を撃ち、手をナタで切り落とすサイコパスの連続殺人鬼。中でも一番ハードだったのは、自分の娘に幼い頃から性的暴行を加え続けている父親の役。そう、NHKドラマ「大奥」で演じた徳川家慶です。放送後、大きな反響をいただきました。この作品は、まず台本を読んだ段階でストーリーがとても独創的なのが気に入りました。が、僕にとっても娘役の俳優さんにとっても心身ともにハードな現場になるのは明らかでしたので、お受けするにあたって僕は必ず「インティマシーコーディネーター」さんを付けてください、とお願いしました。制作サイドも最初からそのつもりでいらしたというので、それ

yk_uminami 2024/03/29

リンク

RAGの新しい手法「CRAG」を3分で理解する

本記事では、最近よく聞くようになった「CRAG」についてざっくり理解します。軽めの記事です。はじめまして。ナレッジセンスの門脇です。生成AIやRAGシステムを活用したサービスを開発しています。この記事は何この記事は、RAGの新手法として最近注目されている「Corrective Retrieval Augmented Generation (CRAG)」の論文[1]について、日本語で簡単にまとめたものです。「そもそもRAGとは？」については、知っている前提で進みます。確認する場合は以下の記事もご参考下さい。本題ざっくりサマリー RAGの性能を高めるための新しい手法です。Googleなどの研究者によって2024年2月に提案されました。CRAG（日本語にすると「修正型検索拡張生成」）という手法を使うメリットは、ハルシネーション（幻覚）を減らせることです。CRAGが従来の「RAG」より

yk_uminami 2024/03/28

LLM

リンク

大学で読んだ情報科学関連の教科書 - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

先日、博士（情報学）になりました。学部と大学院をあわせた 9 年間で読んだ情報科学関連の教科書・専門書を思い出を振り返りつつここにまとめます。私は授業はあまり聞かずに独学するタイプだったので、ここに挙げた書籍を通読すれば、大学に通わなくてもおおよそ情報学博士ほどの知識は身につくものと思われます。ただし、特に大学院で重要となる論文を読み書きすることについては本稿には含めておりません。それらについては論文読みの日課についてや論文の書き方などを参考にしてください。 joisino.hatena blog.com 凡例：（半端）とは、数章だけ読んだ場合か、最後まで読んだものの理解が浅く、今となっては薄ぼんやりとしか覚えていないことを指します。☆は特におすすめなことを表します。学部一年寺田文行『線形代数増訂版』黒田成俊『微分積分』河野敬雄『確率概論』東京大学教養学部統計学教室『統計学

yk_uminami 2024/03/27

あとで読む

リンク

はてなブックマーク

タグ

yk_uminamiのブックマーク (5,325)

お知らせ

今週のはてなブックマーク数ランキング（2024年6月第3週）

今週のはてなブックマーク数ランキング（2024年6月第2週）

月間はてなブックマーク数ランキング（2024年5月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス