[B! algorithm][Algorithm][nlp] yukimori

Crochemore-Perrin アルゴリズム - Qiita

Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? どうも、文字列大好き @hdbn です。「文字列アルゴリズム Advent Calendar 2016」には間に合いませんでしたが、1月10日は「糸 (string) の日」ということで文字列 (string) アルゴリズムの記事を書くことにしました。この記事では文字列照合アルゴリズムの中で最も美しいアルゴリズムの１つである Crochemore-Perrin のアルゴリズムを紹介します。アルゴリズムの正しさの証明はほぼ元の論文をなぞっていますが、説明を簡単にするために計算量に影響を与えない範囲でオリジナルのアルゴリズムから少し変更

yukimori_726 2017/01/11

リンク

高次元ベクトルデータ検索技術「NGT」の性能と使い方の紹介

この結果を見て単語ベクトルが変わるとNGTの性能が変わってしまうように感じた方がいるかもしれません。しかし、実はこれらの単語ベクトルはデータの次元数や件数が違っているため、それぞれの条件をあわせてみる必要があります。興味がある方は論文を読んで見比べて欲しいと思いますが、ここで重要なことは、NGTが高い精度にも関わらず、せいぜい100ミリ秒程度で検索できるという規模感であるということです。その規模感を感じてもらうために、これらの実験結果をご紹介しました。この実験以外にも論文の中では単語ベクトルの応用としてアナロジーと呼ばれる合成ベクトルでの実験やその他の比較手法の比較、実験結果の考察などもありますが今回は割愛します。これまで紹介した内容と同じような実験はLinux系のサーバーであれば公開しているExperimental softwareという実験プログラムを使うと簡単に試すことができます。

yukimori_726 2016/11/30

リンク

NLP若手の会 (YANS 2016) に参加 & スポンサーしました - Gunosyデータ分析ブログ

はじめまして。データ分析部の大原です。最近家での作業中は、「雨強め」などの自然音を聞いています。歌詞も無いので音楽に惑わされることなくリラックスして作業できるので良い感じです。さて、少し前の事になりますが、8月28日(日)〜8月30日(火)にNLP若手の会 (YANS)に参加しました！ YANSとは YANSとはYoung Researcher Association for NLP Studiesの頭文字を取ったもので、自然言語処理関連の若手研究者・若手技術者のアクティビティを高めることを目的としたコミュニティで、2006年から毎年この時期に開催されています。 NLP関連の研究をしている多くの大学から、または業務でNLP関連の技術を活用している企業の方が多く集まり、互いに自分の研究の紹介・意見の交換などをでき、有意義な時間を過ごせます。今年の開催地は、和歌山県白浜で、海沿いで非常に

yukimori_726 2016/09/15

[[yans]

リンク

【論文を読む】Deep neural network に外部知識DB を参照する補正項を組み込むと、少量学習データでも NLP意味計算精度アップした件 - Qiita

【論文を読む】Deep neural network に外部知識DB を参照する補正項を組み込むと、少量学習データでも NLP意味計算精度アップした件MachineLearningDeepLearningrdfNLP自然言語処理【関連記事】 HirofumiYashima Qiita記事（2016/08/17）「【概念・語彙意味関係知識ベース参照型 word2vec（ GloVe ）】Joint representation 論文の C＋＋言語公式実装コードをサンプルデータで動かして挙動確認してみた」ニューラル言語モデル × オントロジーセマンティック知識DB参照モデル融合のアプローチが切り開く可能性（文書コーパスから、各トークンの意味表現ベクトルを組成する neural network モデルのアルゴリズムに、外部知識DBに記述さ

yukimori_726 2016/07/21

リンク

Sublime Textの「あいまい一致」をリバースエンジニアリング | POSTD

Sublime Text は、私のお気に入りのプログラミング用テキストエディタです。 Sublime Textで気に入っている特徴の1つは、あいまい検索アルゴリズムです。ファイルや関数の検索が超高速なのです。これまで多くの人が、インターネット上で、この仕組みについて質問していましたが、満足の行く回答はありませんでした。そこで、私が自らこれを解明することにしました。全部読むのが面倒な方へ本文を読まずに最終結果だけ知りたいですか？　了解！　私は、あなたを責めたりしませんよ。インタラクティブなデモ：こちらをクリックソースコード： C++ 、 JavaScript Sublime Textの仕組み Sublime Textのあいまい一致とは何でしょうか。そして、なぜそれはそんなに賢いのでしょうか。聞いてくれてうれしいです。 Sublime Textには、2つの非常に便利なナビゲーション関

yukimori_726 2016/05/13

リンク

編集距離 (Levenshtein Distance) - naoyaのはてなダイアリー

昨日最長共通部分列問題 (LCS) について触れました。ついでなので編集距離のアルゴリズムについても整理してみます。編集距離 (レーベンシュタイン距離, Levenshtein Distance) は二つの文字列の類似度 (異なり具合) を定量化するための数値です。文字の挿入/削除/置換で一方を他方に変形するための最小手順回数を数えたものが編集距離です。例えば伊藤直哉と伊藤直也 … 編集距離 1 伊藤直と伊藤直也 … 編集距離 1 佐藤直哉と伊藤直也 … 編集距離 2 佐藤B作と伊藤直也 … 編集距離 3 という具合です。編集距離はスペルミスを修正するプログラムや、近似文字列照合 (検索対象の文書から入力文字にある程度近い部分文字列を探し出す全文検索) などで利用されます。編集距離算出は動的計画法 (Dynamic Programming, DP) で計算することができることが

yukimori_726 2009/03/31

リンク

はてなブックマーク

タグ

関連タグで絞り込む (0)

algorithmとAlgorithmとnlpに関するyukimori_726のブックマーク (6)

お知らせ

今週のはてなブックマーク数ランキング（2025年11月第5週）

今週のはてなブックマーク数ランキング（2025年11月第4週）

はてなブックマーク一部機能のメンテナンスに関するお知らせ

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス