[B! serch] operandoのブックマーク

UI/UXが無意識に検索行動に与える影響について

検索技術勉強会「Search Engineering Tech Talk #1」でお話した内容です。株式会社メルカリ Director of Search Engineering Tairo Moriyama（森山大朗） https://twitter.com/tairoRead less

operando 2019/04/29

serch

リンク

「いい検索」を考える

DMやPrivate Channelを使うな、といっても意味がないから、なんでDMを使ってしまうのかをまず考える、そこからPublic channelの使い方を考えましょうみたいな話 https://eof-github.github.io/eof2019/

operando 2019/04/29

serch

リンク

WikipediaのデータからElasticsearch用類義語辞書をつくる - Qiita

Elasticsearchには類義語によるクエリ拡張機能があります。これを適用するとまどマギと検索したときにまどかマギカと書かれた文書もヒットするようになります。 (LuceneやSolrにもありますがここではElasticsearchの話だけします) この類義語辞書は、人手で作ること (e.g., FRILの商品検索をnGramから形態素解析にした話 - mosowave) もできますが、今回はなるべく手間をかけたくないのでWikipediaのリダイレクトデータから自動で類義語辞書を作る方法を紹介します。 (自動といってもノイズも含まれてるので実用的に使うにはある程度人手でフィルタリングする必要があります。それでも一から人手で作るよりは手間が少ないと思います) (ElasticsearchではWordNetでの類義語検索に対応しているようですが、これを書いてる2015年12月時点

operando 2017/12/20

リンク

知識ゼロからElasticsearchを実践で使えるようになろう！ - $shibayu36->blog;

以前少しだけElasticsearchを触った時に、自分流Elasticsearch入門 - $shibayu36->blog; というElasticsearchに入門した時のメモをまとめていた。しかし、その頃はElasticsearchを使って完全に一人で一つの機能を作るというところまではいけなかった。最近になってまたElasticsearchを一から導入する仕事をすることになった。この時以前自分がまとめた記事を読みながらやっていたのだが、実践で一から導入するためにはこの記事だけでは知識が足りなかった。そこで、前の記事の知識をベースに、一から導入するために少しずつ学んでいき、自分のブログにまとめるなどのことをしてきたので、今回はその締めくくりとして、知識ゼロからElasticsearchを使えるようになるために学習したことについて書いておきたいと思う。今回書くこと・書かないこと今

operando 2016/09/11

serch

リンク

A new way to search for content in your apps

operando 2016/09/03

リンク

検索結果の疑問を解消するための基礎知識 - クックパッド開発者ブログ

こんにちは、買物情報事業部の荒引 (@a_bicky) です。業務ではクックパッド特売情報のサーバーサイドや商品検索周りを担当しています。突然ですが、とある商品検索の機能を使っていて次のようなことが起きたら不思議ですよね。「ねぎ」で検索したら「たまねぎ」がヒットした！「ドレッシング」で検索したのに「たまねぎドレッシング」がヒットしない！「豚　薄切り」で検索したのに「豚ロース肉薄切り」がヒットしない！「たまご」と「卵」の検索結果が違う！今回は上記の疑問を解消するために検索の基礎的な内容について説明します。以下、特売情報の商品を検索することを例に説明しますが、一般的な内容なので「商品」を「レシピ」等に読み替えることも可能です。大量のページから目的のページを探すための索引たいていの本の巻末には索引が載っていますよね。特定の内容が載っているページを探す場合、1ページ目から順番に

operando 2016/02/02

serch

リンク

ログイン - はてな

パスワードを忘れた方はパスワードの再設定を行ってください。初めての方ははてなID登録 (無料) してください。うまくログインできない方はお問い合わせをご覧いただき、Cookieの設定をご確認ください。

operando 2015/12/24

serch

リンク

N-gramモデルを利用したテキスト分析　―インデックスページ―

↑ページ先頭 N-gramモデルを利用した事例あるテキストから、任意のN-gram単位で共起頻度を集計し（N-gram統計を取る）、その結果を利用してテキストや言語の性格を見いだす研究によく利用される。 N-gramモデルで、ある文字列の直後に、特定の別な文字列は出現する確率を求める。「an」の後には、必ず母音（aiueo）で始まる単語が結びつく確率が100% 「q」の後には、「u」が結びつく可能性が高い。『論語』では「子」の後に「曰」が結びつく可能性が高い。「百人一首」を平仮名に開いた場合の延べ数は、上位十五位までで全体の五割の使用量を占める（全部で六十八種の異なる平仮名（濁点含む）が使われている）音声認識やOCR（原稿読みとりソフト）での利用読みにくい文字でも、共起頻度の発生確率を考慮すれば、正しく原稿を可読出来る ↑ページ先頭人文学的へのN-gramモデル導入近藤みゆ

operando 2015/12/09

serch

リンク

n-gram文字列の切り出し (Python) - プログラミング工場 / Python

2010年01月19日 15:10 カテゴリPython n-gram文字列の切り出し (Python) Posted by yawamen No Comments No Trackbacks Tweet 指定されたn単位で文字列を切り出す． #!/usr/bin/env python # -*- coding: utf-8 -*- def ngram(text, n): results = [] if len(text) >= n: for i in xrange(len(text)-n+1): results.append(text[i:i+n]) return results text = u'今日はとてもいい天気です．' for e in ngram(text, 2): print e 実行結果今日日ははととててももいいいい天天気気でですす．タグ：#Py

operando 2015/12/09

serch

リンク

スペル訂正エンジンについてのサーベイ #TokyoNLP

Loading… Flash Player 9 (or above) is needed to view presentations. We have detected that you do not have it on your computer. To install it, go here. スペル訂正エンジンについてのサーベイ #TokyoNLP - Presentation Transcript スペル訂正エンジンについてのサーベイ #tokyonlp @nokuno 自己紹介• @nokuno / id:nokuno• #TokyoNLP主催• Social IME / StaKK開発者• Web系ソフトウェアエンジニア近況報告近況報告その1言語処理学会で発表しました近況報告その2シリコンバレーに行ってきました近況報告その3 情報処理学会誌にTokyoNLPが載

operando 2015/12/09

serch

リンク

タグ一覧N-gram

アフターコロナにおけるエンジニアチームの作り方，グローバルな視点でのエンジニア獲得と開発とコミュニケーションの在り方について取り上げます。 LINE テクノロジー＆エンジニアリング大全「LINE DEVELOPER DAY 2020」より，注目すべきテクノロジー，エンジニアリングをピックアップし，詳説インタビューを実施しました。プロダクト思考で開発が進む「みてね」の今とこれから～みてねの生みの親笠原健治氏，開発マネージャ酒井篤氏が考える，プロダクトとエンジニアリングの素敵な関係

operando 2015/12/09

serch

リンク

はてなブックマーク

タグ

関連タグで絞り込む (2)

serchに関するoperandoのブックマーク (11)

お知らせ

月間はてなブックマーク数ランキング（2024年7月）

今週のはてなブックマーク数ランキング（2024年7月第4週）

今週のはてなブックマーク数ランキング（2024年7月第3週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス