「tf-idf」を検索 - はてなブックマーク

1 - 28 件 / 28件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

tf-idfの検索結果1 - 28 件 / 28件

3年かけてたどり着いた英語記事を読むための方法 - Qiita
- 969 users
- qiita.com/tomoyamachi
- テクノロジー
- 2019/10/25
2023/07/03 要約ツールに｢ChatGPTを利用する場合｣を追加し、サンプルの生成結果を記載しました。以前は英語の記事の読み書きが苦手だったのを、このようにして克服した、という話を書きます。成果を数値で測ってないですが、RSSフィードに登録している英語メディアの数が大幅に増えました。以前は全体の5%程度に対し、今は50%以上が英語メディアになっています。英語に対する心理的ハードルは大きく下がりました。また、読む力を付けたことで自作のOSSのREADMEもほぼ自力で書けるようになりました。 https://github.com/goodwithtech/dockle/blob/master/README.md では始めます。全体像僕の場合、1000文字以上の英文記事を読む場合、STEP1に含まれる内容は必ず行います。 STEP2に含まれるものは、辞書なしで読めないときだけ行
- 英語
- あとで読む
- english
- chrome
- ツール
- 文章
- IT
- Dropbox
- Qiita
- Eng
ChatGPTに自社データを組み込んで新しい検索体験を模索してみました｜masa_kazama
- 521 users
- note.com/masa_kazama
- テクノロジー
- 2023/03/03
イントロChatGPTやBing、NotionAIなどの大規模自然言語モデル(LLM)を活用したサービスが注目を集めています。対話、要約、翻訳、アイデア生成などの多様なタスクにおいて、とても性能が高いです。ただ、ChatGPTでは、ときどき嘘が混じっていたり、文献が捏造されたりすることがあります。 ChatGPTとの対話画面（結果の書籍は存在しない）それを防ぐために、BingやPerplexityでは、文献を引用した上で、なるべく嘘が紛れ込まない形で回答してくれます。 Perplexityでは引用もつけてくれるしかし、これらのAIは、Web上の公開されている一部のデータを元に学習しているので、公開されてないデータに対しては当然ながら、正しく回答できません。そこで、この記事では、自社が保有しているデータをChatGPTに組み込んで、自社オリジナルのPerplexityのようなシステムを作る
- ChatGPT
- AI
- あとで読む
- gpt
- データ
- search
- 文章
- 検索
- プログラミング
- 自然言語処理
【Day 2】東大松尾研のLLM講座資料が公開されたから、詳しく読んでいくよ【備忘録】 - Qiita
- 357 users
- qiita.com/mohki7
- テクノロジー
- 2024/02/11
自己紹介データサイエンティストを目指して日々勉強している、慶應大学理工学部4年生（202.01.09時点）取得資格、コンペ優勝経験など、リアルタイムの情報は👇👇👇をみてね X: @A7_data←普段はXで活動しています。ありがたいことに、フォロワーは6500人を超えました😌 プロフィールページ👇👇👇 X👇👇👇 Day2の概要 Day2のテーマは「Prompting and Augmented Language Model」ということで、LLMの活用法に焦点が当てられている。（学習済みLLMを追加学習なしで活用する技術について）項目としては大きく3つ。プロンプティングや文脈内学習とは何かプロンプティングによる性能改善方法 Augmented Language Modelの概要 LLMの使い方に焦点を絞っているので、今回の授業だけでも幅広い人に役立ちそう。言語
- LLM
- あとで読む
- ChatGPT
- AI
- 資料
- qiita
- 学習
- training
- 自然言語処理
- 大学
【SEO対策】Googleの200の上位表示アルゴリズムを一挙公開！！ - Evergreen Blog ～弱者のためのファン創造コンテンツマーケティング～
- 348 users
- www.specializedblog.com
- テクノロジー
- 2019/09/07
GoogleのSEO対策をする上で、アルゴリズムを理解しておくことは非常に重要です。 Googleのアルゴリズムについて「キーワード」や「被リンク」など、代表的なものを解説したサイトは多数見つかります。しかし、200近く存在するといわれているGoogleのアルゴリズムについて、詳細な情報を発信しているサイトはほとんどありません。もっと具体的な情報がわかれば、SEO対策もしやすくなりますよねちょっとした差かもしれませんが、細かいSEO対策をするとしないとで、ライバルサイトと差をつけることができます。 Googleは検索順位を決めるのに機械的に処理しています。コンテンツの質がまったく同じなら、アルゴリズムの細かい指標が基準となって、ランキングが決められます。今の時代、代表的なアルゴリズムは皆対策しているので、ライバルと差別化するのが難しいです。ライバルがSEO対策できてい
グーグルが普及する前、みんな何使ってた？
- 274 users
- www.gizmodo.jp
- テクノロジー
- 2020/08/01
グーグルが普及する前、みんな何使ってた？2020.08.01 11:0026,182 Daniel Kolitz - Gizmodo US ［原文］（ Rina Fukazu ）今でこそ、たいていのことは｢ググればわかる｣時代だけど...。 1997年、最近お気に入りの映画『オースティン・パワーズ』のことを友達にアツ〜く語るあなた。すると友達は｢ランディ・クエイドが最高だった｣と一言。あなたの頭のなかでは｢あれ？｣と戸惑いつつ、話を聞いていたら友達がクリント・ハワードのことを言っていることに気づく。友達にそう伝えてみるも、お互い納得しあえず...。一日モヤモヤしつつ、家に帰ってパソコンを立ち上げてから40分ほど経過...｢やっぱり、ランディ・クエイドは出演してないよ！｣ 2020年、Google（グーグル）が広く使われる前の時代、人々はどのようにして日常の疑問を解決したり、情報収集し
- 検索
- web
- 歴史
- google
- あとで読む
- search
- インターネット
- history
- ネット
“LLM for SRE“の世界探索 - ゆううきブログ
- 224 users
- blog.yuuk.io
- テクノロジー
- 2024/03/21
ChatGPTが登場した当初、対話や要約、翻訳、コード生成などの典型的な言語タスクができても、SREやAIOpsの研究開発にはあまり関係ないのではないかと正直思っていた。AIOpsでは典型的にはいわゆるObservabilityデータ（メトリクス、ログ、トレースなど）が入力となるため、自然言語ではなく数値のデータを解析することが求められる。自然言語のタスクを研究対象としていなかったため、AIOpsとChatGPTに強い関係性は見いだせなかった*1。しかし、自分で大規模言語モデル（Large Language Model: LLM）を日常的に使用したり、表題にあるようにSREのためのLLM（LLM for SRE, LLM4SRE）に関する論文を読むうちに、LLMのテキスト生成器としての性質よりもその優れた推論機械としての性質に注目するようになった。特にSREの障害診断は、人間の専門家が推
- LLM
- SRE
- あとで読む
- AI
- 機械学習
- 自然言語処理
- 論文
本当に役立つFAQ検索システムを目指して - Nota TechConf
- 168 users
- scrapbox.io/nota-techconf
- テクノロジー
- 2021/03/11
Nota Tech Conf 2021 Spring 3日目の発表資料です 2021/3/11 こんばんは daiizdaiiz.iconです Helpfeelの検索技術の話をします開発、運用チームプロダクトオーナー daiiz.icon プロジェクトマネージャー akix.icon Webディレクター akix.icon などテクニカルライターカスタマーサクセスエンジニア、デザイナー rakusai.iconakix.icondaiiz.iconshokai.icontakeru.iconTiro.icon 予測検索 Helpfeel CTO /masui/増井俊之.iconの展開ヘルプをベースとするFAQ検索システム PayPayフリマ様 FAQ テキパキと高速に検索できているクエリの表現に合わせて柔軟に結果が提示される Agenda いかにして探すか 1. 入力に対して遅
- アルゴリズム
- あとで読む
- 検索
- 開発
- helpfeel
- slide
- システム
- FAQ
- icon
- algorithm
自然言語処理でBERTまでの流れを簡単に紹介 - moriyamaのエンジニアリング備忘録
- 158 users
- nmoriyama.hatenablog.com
- テクノロジー
- 2020/01/24
はじめまして@vimmodeです。普段はMNTSQというリーガルテックの会社で自然言語処理をしています。今回はBERTとBERTまでの流れを簡単に紹介します。自然言語処理で今やデファクトスタンダードとなりつつであるBERT。登場当時はモデルの複雑さに伴う計算環境や計算リソースの確保が難しく気軽に動かせなかったが、ColabやKaggleカーネル環境が整備されたきたおかげで誰でも気軽に使えるようになりました。また、haggingface社が公開したBERTと関連モデルのラッパーライブラリであるtransformersによりわずか10行程度でBERTモデルを記述できます。一方、自然言語処理を始めて間もない段階でいきなりBERTを突きつけられても理解の壁が高いと思いますので、今回は数式やコードを使わずにBERTに至るまでの流れを簡単に紹介したいと思います。 ※これらはあくまで私の理解であり
情報検索に興味が沸いたのでGoで検索エンジンを自作している - 🤖
- 155 users
- kotaroooo0-dev.hatenablog.com
- テクノロジー
- 2020/12/11
この記事はRecruit Engineers Advent Calendar 2020の11日目の記事です。 TL;DR 対象読者は転置インデックスを少し知ってるくらいの検索初心者です検索エンジンに興味が湧き、仕組みを知るためにGoで自作しています自作検索エンジンのAnalyzerとIndexerとSearcherを紹介しますはじめにここ最近、以下の観点から情報検索への興味が強いです。技術面: フリーワード検索機能を実装した際にElasticsearchの使いやすさと多機能さに圧倒されたこと。プロダクト面: 検索がプロダクトに不可欠な機能かつ、非エンジニアにとって検索エンジンは未知であり知識の乖離が大きいため、エンジニアだからこその価値を提供しやすいこと。検索エンジンの仕組みを知り情報検索分野に詳しくなるために自作し始めました。プログラミング言語Goを読んで学んでいるので
- go
- あとで読む
- golang
- 検索
- 検索エンジン
- programming
- SearchEngine
- 技術
- システム
- search
LLM時代の強化学習 - どこから見てもメンダコ
- 145 users
- horomary.hatenablog.com
- テクノロジー
- 2023/11/25
強化学習におけるLLMの活用パターン調査はじめに：実世界における強化学習の課題 LLM×強化学習人間はゼロショット推論によりサンプル効率の良い学習ができる LLMによるゼロショット推論の例さまざまなLLM活用パターン 1. 報酬モデルとしてのLLM LLMによる代理報酬モデル VLMによる外観ベース代理報酬モデル外部知識にもとづく報酬モデル設計 2. 計画モデルとしてのLLM LLMによるセマンティック計画 LLMによる構造的な探索計画 3. 方策モデルとしてのLLM LLM as 確率方策マルチモーダルLLM as 確率方策参考：GPTアーキテクチャの転用 4. 世界モデルとしてのLLM Language Models Meet World Models (あとで書く) おわりに：VLM as 確率方策に期待はじめに：実世界における強化学習の課題レトロゲームで人間並みのパ
- LLM
- あとで読む
- 強化学習
- 機械学習
- AI
- 学習
- 言語
- 勉強
AIはハチ=米津玄師を見破れるか ? -J-popアーティストの歌詞を分析してみた- - Qiita
- 100 users
- qiita.com/kazuya-n
- テクノロジー
- 2019/09/14
はじめに一年前にこんな記事を書きました。未だにちょくちょくいいねを頂いているので、自然言語処理の練習を兼ねて久しぶりに遊んでみた系の記事を投稿しようと思います。やったこと歌詞データのクローリング Mecabによる分かち書き tf-idfによるベクトル化ベクトル化した歌詞によるアーティストのクラスタリングとUMAPでの可視化 (おまけ) fastTextでハチ=米津玄師を見分けられるのか? 分析にはJupyter Labを用いました。歌詞データ今回用いる歌詞データについて説明します。クローリングで取得先立って歌詞データのクローリングをしました。とある人気アーティスト順に歌詞を取得できるサイトより、45人のJ-popアーティストにつき、最大50曲分の歌詞を取得しCSVに保存しました。実際にクローリングに用いたコードを公開するのもどうかと思うので、ここでは割愛します。。。Bea
Serverless連載3: Goでサーバーレス用の検索エンジンwatertowerを作ってみました | フューチャー技術ブログ
- 100 users
- future-architect.github.io
- テクノロジー
- 2020/03/27
サーバーレス連載の3回目は検索エンジンを作ってみたお話です。クラウドサービスが充実してくるにつれて、サーバーレスではいろいろなことができるようになっています。HTTPサーバーは動きますし、RDBやNoSQLなストレージも使えますし、PubSubみたいなサービスも利用できます。これらを駆使するとそこそこ複雑な処理も記述できます。一方で、上から下までサーバーレスにしようとするとできないものもいくつかあります。例えば、RDBも使えるといっても制約があり、LambdaやCloud FunctionsからRDSやCloudSQLを雑に使うとコネクションを張りすぎる問題があります。LambdaにはRDS Proxyが出始めています。あと、RDBそのものは基本的に常駐型なのでサーバーレスではないです。一応サーバーレスなのもありますが、起動時間が結構かかるらしい（自分ではまだ試してないです）。それ以外
- go
- golang
- あとで読む
- serverless
- elasticsearch
- 検索エンジン
- 検索
- search
3年かけてたどり着いた英語記事を読むための方法 - Qiita
- 93 users
- qiita.com/tomoyamachi
- テクノロジー
- 2019/11/03
2023/07/03 要約ツールに｢ChatGPTを利用する場合｣を追加し、サンプルの生成結果を記載しました。以前は英語の記事の読み書きが苦手だったのを、このようにして克服した、という話を書きます。成果を数値で測ってないですが、RSSフィードに登録している英語メディアの数が大幅に増えました。以前は全体の5%程度に対し、今は50%以上が英語メディアになっています。英語に対する心理的ハードルは大きく下がりました。また、読む力を付けたことで自作のOSSのREADMEもほぼ自力で書けるようになりました。 https://github.com/goodwithtech/dockle/blob/master/README.md では始めます。全体像僕の場合、1000文字以上の英文記事を読む場合、STEP1に含まれる内容は必ず行います。 STEP2に含まれるものは、辞書なしで読めないときだけ行
- 英語
- あとで読む
- 文章
- English
- qiita
大規模言語モデルの知識を補完するための Retriever の紹介 - ACES エンジニアブログ
- 92 users
- tech.acesinc.co.jp
- テクノロジー
- 2023/03/31
こんにちは、株式会社ACESでインターンをしている篠田 (@shino__c) と申します。普段は博士課程の学生としてNLPの研究をしています。ここ数ヶ月で ChatGPT に加えて GPT-4 等の大規模言語モデル (LLM) が次々とリリースされていますね。 ChatGPT (gpt-3.5-turbo) はAPIの使用料が安いことから、多くの人が気軽にLLMを使用できるようになり、AI、特にNLPを売りにしている多くの企業は技術的にどうやって競争優位性を築けばいいのか模索しているのではないでしょうか。その問いに対する１つの答えになりそうなものに、Retriever というものがあります。例えば、社内にある外部には出せない文書を元に顧客からの質問に答える質問応答のサービスを作りたい場合、ChatGPT のような LLM の訓練にはそのようなデータは使われていないため、prompt
- LLM
- ChatGPT
- NLP
- 検索
- AI
- 自然言語処理
- あとで読む
- 機械学習
- 言語
Elasticsearchで分散表現を使った類似文書検索
- 89 users
- yag-ays.github.io
- テクノロジー
- 2019/09/03
概要 Elasticseachに分散表現のベクトルに対する類似文書検索が実装されたということで、以下のElasticのブログ記事を参考に類似文書検索を試してみました。 Text similarity search in Elasticsearch using vector fields | Elastic Blog 類似文書検索とは、与えられたクエリの文書と似ている文書を文書集合内から検索する技術です。この際に必要となるのが「似ている」という概念で、計算機上でどうやって2つの文書間の類似度を数値として表現するかがポイントになります。例えば、互いの文書に出現する単語の一致度や重複度合いを測ったり、TF-IDFやBM25などで文書をベクトル化して比較する方法があります。ただしこれらの方法では、言い換え表現や表記の違いにより同じ意味の単語が異なる単語だと判定されたり、文書の中では重要でない単語に
学習済み日本語word2vecとその評価について - 株式会社ホクソエムのブログ
- 89 users
- blog.hoxo-m.com
- テクノロジー
- 2020/02/20
ホクソエムサポーターの白井です。今回は日本語の word2vec に着目し、日本語の学習済み word2vec の評価方法について紹介します。自然言語は非構造化データであるため、単語や文章を計算機で扱いやすい表現に変換する必要があります。そのための方法の1つに word2vec があり、Bag of Words (BoW) や tf-idf とならんでよく用いられます。一般に、word2vec は Mikolovが提案した手法 (CBOW, Skip-gram) をはじめ、 GloVe や fastText など、単語をベクトルで表現する単語分散表現のことを指します。 word2vec は教師なし学習のため、コーパスさえ準備できれば誰でも新しい単語分散表現を学習することができます。しかし、実際に word2vec を使う際に、どのように評価すれば良いのかがよく分からず、配布されて
Rustで扱える機械学習関連のクレート2021 - Stimulator
- 86 users
- vaaaaaanquish.hatenablog.com
- テクノロジー
- 2021/01/24
- はじめに - 本記事では、Rustで扱える機械学習関連クレートをまとめる。普段Pythonで機械学習プロジェクトを遂行する人がRustに移行する事を想定して書くメモ書きになるが、もしかすると長らくRustでMLをやっていた人と視点の違いがあるかもしれない。追記：2021/02/24 repositoryにしました。こちらを随時更新します github.com 追記；2021/07/26 GitHub Pagesでウェブサイトにしました vaaaaanquish.github.io - はじめに - - 全体感 - - 機械学習足回り関連のクレート - Jupyter Notebook Numpy/Scipy Pandas 画像処理形態素解析/tokenize - scikit-learn的なやつ - 各ライブラリと特徴比較 - Gradient Boosting - XGBoos
- Rust
- 機械学習
- Python
- あとで読む
- ml
- ライブラリ
- 勉強
RecSys 2019 ベストペーパーを読んだメモ - Qiita
- 85 users
- qiita.com/smochi
- テクノロジー
- 2019/09/17
紹介論文 Are We Really Making Much Progress? A Worrying Analysis of Recent Neural Recommendation Approaches (RecSys 2019) 日本語では「本当にそんなに進捗出てるの？ -或いは最近のNN推薦手法に対する警鐘-」という感じだろうか。元論文はこちら https://arxiv.org/pdf/1907.06902.pdf 概要 DNNが登場してから推薦分野でもDeepXXな手法が増えている新手法の登場頻度が高いため、代表的なタスクであるtopN推薦に対してすらSOTAが何か追えなくなっているそこでトップ会議（KDD, SIGIR, WWW, RecSys）のDNN関連研究18本を追試した 18本のうち、現実的な努力を行った上で再現できたのが7本（RecSysでの発表によると、）
SQLで始める自然言語処理 - やむやむもやむなし
- 83 users
- ymym3412.hatenablog.com
- テクノロジー
- 2020/12/24
こちらの記事はRecruit Engineers Advent Calendar 2020の24日目の記事です。メリークリスマス！ adventar.org 仕事の分析で使うデータはほとんどがBigQueryに保存されているため、基本的な分析作業の多くはBigQueryでSQLを書くことで行なっています。 BigQueryでテキストデータを扱おうと思うとSQLではできない or 取り回しが悪いことも多く、一度Pythonでスクリプトを書いてその結果を再度BigQueryのテーブルに格納し、Joinして分析に使うということをしていました。しかしこのやり方だとテキストデータを分析したいときは毎回Pythonのコードを書きにいかねばならず、またPythonでのテキスト処理も決して早いとはいえず、せっかくBigQueryでさくさく分析しているのにどうしてもテキスト処理に部分が作業時間のボトルネッ
- bigquery
- sql
- NLP
- 自然言語処理
- あとで読む
- DWH
- 機械学習
- Python
外部データをRetrievalしてLLM活用する上での課題と対策案 - ABEJA Tech Blog
- 77 users
- tech-blog.abeja.asia
- テクノロジー
- 2023/07/03
はじめに ABEJAでデータサイエンティストをしている服部です。今回はLLMで外部データを使うケースについてのお話をしたいと思います。はじめに LLMと外部データの利用 RetrievalとLLM 0. (事前準備)参照したいテキストデータをDBに格納 1. ユーザの入力文とのテキスト類似度を計算して、関連テキストを抽出する(Retrieval) 2. 関連テキストをLLMのプロンプトに入れ込み、ユーザの入力文に回答する。 Retrieval時の課題 LangChainでの用意 Case1: それぞれの文章がRetrievalしにくい形で保存されている対策案: ページ構造を意識した形で各文章を格納する他の対策案聞き方を明確にする類似度を測るクエリ文章を置き換える不要そうな文章をデータから削除するデータ自体をLLMで整形し直す Case2: 未知の単語を含む仮説: ニャオハ
ダジャレを判定する - Stimulator
- 74 users
- vaaaaaanquish.hatenablog.com
- テクノロジー
- 2020/12/11
- はじめに - 近年、IT業界のダジャレは熾烈の一途を辿っている(ITだけに) 。類義語を巧みに取り入れたダジャレ、難読化されたダジャレなどが増加し、一体どれで「初笑い」すれば良いのか悩む若者も少なくない。そのような背景があり、ダジャレを判定するアルゴリズムの開発も盛んである。ルールベースによる判定では、@kurehajimeが提案、開発したdajarep *1 や、@fujit33によるShareka *2が存在する。特にSharekaは、ルールベースのロジックにも関わらず、反復型とされる種類のダジャレに対して高い精度での判定を可能にしている。また、機械学習モデルを用いた判定手法として、谷津(@tuu_yaa)らが開発したDajaRecognizer *3がある。DajaRecognizerは、多くのルールベースによって子音音韻類似度をPMIとして定義、Bag-of-Words、
- mecab
- BERT
- python
- 形態素解析
- machinelearning
- nlp
- あとで読む
- 機械学習
メルカリの検索基盤の変遷について | メルカリエンジニアリング
- 70 users
- engineering.mercari.com
- テクノロジー
- 2022/02/07
※この記事は、"Blog Series of Introduction of Developer Productivity Engineering at Mercariの一環で書かれています。はじめにこんにちは、メルカリ、サーチインフラチームのshinpeiです。今回はメルカリの検索基盤の裏側について、そのアーキテクチャ変遷について書こうと思います。2018~2021年の4年間で、大きく3回、変化をしました。設計の段階では希望と期待にあふれているアーキテクチャでも、問題は後からやってきます。設計には良し悪しがあり、変化することで知見を得ながら、改善を続けています。え、これだと危ないのでは？、、あぁ、やはりそうなるのね。などと、ご笑覧いただければ幸いです。前回までのお話メルカリの検索は、創業時から、Solrをベースにしたシステムで組まれてました。その変遷はこちらのスライドにまとめてあ
24時間で漫画みたいにニュースを読めるアプリを開発した話
- 67 users
- techblog.yahoo.co.jp
- テクノロジー
- 2020/07/16
先日アスクル/一休/PayPay/ヤフー/ZOZOテクノロジーズで共同開催した、企業内ハッカソンイベント「Internal Hack Day」参加者からの寄稿記事を紹介します。イベントについてはこちらをご覧ください。こんにちは。ヤフー株式会社新卒エンジニアの池田です。先日、開催された社内ハッカソンイベント「Internal Hack Day」に同期と一緒に参加してきました！　初めてハッカソンに参加するメンバーも多いなか、オンラインでアプリ開発に取り組みました。そのような状況で、何を作ったのか、どう工夫してハッカソンに取り組んだのかについてまとめました。チーム構成私たちは入社前から仲の良かったヤフーの2020新卒の4人で参加しました。全員エンジニアで各メンバーのスキルやバックグラウンドは以下のようになっています。たまたまですが、iOSと機械学習に精通したメンバーが多かったため、
- 開発
- あとで読む
- アプリ
- 学習
- プログラミング
- 漫画
- ニュース
- news
Pythonで検索エンジンをゼロから作って学んだこと Part.2
- 66 users
- logmi.jp
- テクノロジー
- 2019/12/06
2019年9月16、17日、日本最大のPythonの祭典である「PyCon JP 2019」が開催されました。「Python New Era」をキャッチコピーに、日本だけでなく世界各地からPythonエンジニアたちが一堂に会し、さまざまな知見を共有します。プレゼンテーション「入門自作検索エンジン」に登壇したのは加藤遼氏。講演資料はこちらシンプルな検索エンジンを作る加藤遼氏：ここからは実際に事例を踏まえながら、どういうものを作っていくかの実装の話をしていきます。実際に作っていく検索エンジンは、これです。これは「PyconSearch」という、今年のPyConのセッションを検索できるもので、わりと便利なサイトです。これを実際に作っていきながらどういうことをやっていくかという話を進めていきます。まずは要件から決めていきましょう。「PyConJPのトークを検索できる」ことが目的ですが、
- python
- あとで読む
- 機械学習
- 勉強
- 文章
- search
- 検索
- HotEntry
- column
セキュリティエンジニアのための機械学習
- 64 users
- www.oreilly.co.jp
- テクノロジー
- 2021/10/18
情報セキュリティのエンジニアや研究者を読者対象とした機械学習の入門書。フィッシングサイト、マルウェア検出、侵入検知システムなどの情報セキュリティ全般の課題に対して、機械学習を適用することでどのようなことが可能になるのか？本書ではサイバーセキュリティ対策でとても重要なこれらの知識を実装レベルで身につけることができます。また、どうすれば機械学習による検出を回避できるか、という点についても同時に解説します。サンプルコードはPython 3対応。Google Colaboratory上で実際に手を動かしながら学ぶことができます。訳者まえがきまえがき 1章　情報セキュリティエンジニアのための機械学習入門 1.1　なぜ情報セキュリティエンジニアに機械学習の知識が必要なのか 1.2　本書のコードサンプルの実行環境 1.2.1　Google Colaboratory入門 1.2.2　GPU/TPUラ
ElasticsearchとKibela APIを使ってSlackでのCSお問い合わせ対応業務を改善した話 - BASEプロダクトチームブログ
- 61 users
- devblog.thebase.in
- テクノロジー
- 2020/12/11
この記事はBASE Advent Calendar 2020の11日目の記事です。 devblog.thebase.in BASE株式会社 Data Strategy チームの@tawamuraです。 BASEではオーナーの皆様や購入者様のお問い合わせに対して、Customer Supportチームが主となって対応をしています。その中でもいくつかの技術的なお問い合わせに対しては、以下のようにSlackの専用チャンネルを通して開発エンジニアに質問を投げて回答を作成することになっています。 CSチームから調査を依頼されるお問い合わせの例これらのCS問い合わせ対応は日々いくつも発生しており、CSお問い合わせ対応を当番制にして運用してみた話でもあるように週ごとに持ち回り制で各部門のエンジニアが対応しているのですが、どうしても調査や対応に時間が取られてしまうという問題が発生していました。 dev
- elasticsearch
- slack
- Kibela
- lambda
- bot
- あとで読む
- techfeed
機械学習の歴史 - AI.doll
- 57 users
- doll.hatenadiary.com
- テクノロジー
- 2019/07/13
WikipediaのTimeline of machine learningというページに機械学習の歴史がまとめられた表があったので、あとから見返しやすいように全て日本語にしてみた。日本語訳はガバガバかもしれないので心配な人は元ページを見てね。ムムッってとこがあったらコメントで教えてほしい年表 1763 ベイズの定理のベーストマス・ベイズ(Thomas Bayes)の著書, "An Essay towards solving a Problem in Doctorine of Chances"がベイズが死んだ2年後, 彼の友人により修正・編集され出版された. 1805 最小二乗アドリアン=マリ・ルジャンドル(Adrien-Marie Legendre)が最小二乗(méthode des moindres carrés)について記述. 1812 ベイズの定理ピエール=シモン・ラプ
実践自然言語処理
- 56 users
- www.oreilly.co.jp
- テクノロジー
- 2022/01/19
自然言語処理（Natural Language Processing：NLP）の本格的な実践書。過去10年間で起きたブレークスルーにより、NLPは小売、医療、金融、法律など、さまざまな分野での利用が増えてきました。急速に利用が拡大する中で、産業界でNLPを使ったシステムを構築するのに必要な知識を学べる講座や書籍は不足していました。本書を読むことで、NLPの要素技術やSNS、Eコマース、医療、金融といった具体的なビジネスへの適用方法に加えて、NLPシステムを開発するためのベストプラクティスを詳しく学べます。賞賛の声序文訳者まえがきまえがき第I部　基礎 1章　自然言語処理入門 1.1　実世界での自然言語処理 1.1.1　NLPのタスク 1.2　言語とは何か 1.2.1　言語の構成要素 1.2.2　自然言語処理の難しさ 1.3　機械学習、ディープラーニング、そして自然言語処理の概要 1
- 機械学習
- 言語
- 勉強
- あとで読む
- 自然言語処理
- NLP
- 本
- language
- 学習