The requested URL was rejected. Please consult with your administrator. Your support ID is: 3550184438928800800
The requested URL was rejected. Please consult with your administrator. Your support ID is: 3550184438928800800
前回の » プログラマーがてっとり早く検索スキルを上げる方法 で Google 日本語版と Google 英語版とをうまく使い分けることを説明しましたが、その具体的な方法を紹介します。 紹介する方法は Chrome での方法です。他のブラウザでも似たようなことはできると思います。 Chrome には、あらかじめキーワードを登録して、アドレスバーにそのキーワードと文字列をつなげて打ち込むと素早く検索できる機能があります。たとえば、「ruby」を検索したいなと思ったら、アドレスバーに「g ruby」と入力するだけです。 これを実現するにはあらかじめ g というキーワードを登録しておきます。Chrome のメニューから「環境設定」を選択、なかほどの「検索エンジンの管理...」というボタンを押します。 「検索エンジン」というウィンドウが開くので、一番下にいって、名前、キーワード、URL の順に登録
ビッグデータ活用の第一歩。大量に蓄積されたデータを駆使してアプリケーションをインテリジェント化する。プログラマがデータサイエンティストとして飛躍するための一冊。レコメンデーション、クラスタリング、分類を、コードを書いて原理から理解する。 著者:Haralambos Marmanis、Dmitry Babenko 訳者:伊東直子、真鍋加奈子、堀内孝彦 価格:本体3,800円、税込3,990円 発行:みかん書院 発売:星雲社 発行日:2012年10月31日 ページ数:368ページ 寸法:182 x 233 x 19 ISBN:978-4-434-17203-8 Cコード:C3055 目次 第1章 インテリジェントウェブとは 1.1 インテリジェントWeb アプリケーションの例 1.2 インテリジェントアプリケーションの基本要素 1.3 アプリケーションはインテリジェンスか
Autonomous trucking company TuSimple last week successfully completed a fully autonomous semi-truck run on public roads in China without a human present in the vehicle and without human intervention. Shoppable Business wants to make it easier for businesses in the Philippines to source and procure branded products and other inventory, with an emphasis on making sure products are authentic. The B2B
ManifoldCFにふくまれる商用ソフトウェア用のコネクタをビルドするには、サードパーティのライブラリ、パッケージ、そのソフトウェアが必要な場合があります。開発者はビルドする時にこれらサードパーティのソフトウェアを入手する必要はありますが、条件付きでコンパイルすることができるため、コネクタ自体のソースコードはApacheとして配布することができます。できる限りすべてをApacheライセンスに準拠するようにしたいと思っていますが、現実的には状況はすぐには変わりません。 サードパーティのソフトウェアを含めてビルドする手順はWikiページに掲載しています。 2023年11月1日 - ManifoldCF 2.26を公開しました! 開発者コミュニティは2.25リリースを承認しました 2023年06月1日 - ManifoldCF 2.25を公開しました! 開発者コミュニティは2.25リリースを承
[対象: 中〜上級] A/Bスプリットテストや多変量テストの適切な実行方法について英語版のGoogleウェブマスター向け公式ブログが説明しました。 A/Bテストは、クローキングのようなガイドライン違反になったり重複コンテンツのようなインデックス・ランキングに悪い影響を与えたりすることがあるのでしょうか。 公式ブログの説明によれば以下に説明する点に注意してテストすれば問題は起こらないとのことです。 クローキングをやらない クローキングはユーザーエージェント (User-Agnet、UA) に基いてユーザーと検索エンジンに対して同じURLで異なるコンテンツを見せることでガイドライン違反に違反します。ユーザーにはテスト用のページを見ながら検索エンジンには常にオリジナルのページを見せるとクローキングに相当してしまうのでやってはいけません。ガイドライン違反としてみなされ順位を下げられたりインデックス
承前:「アカデミック・リンクは何をめざしているか:高等教育における図書館を基盤とした新たな学習環境の構築に向けて」(第11回情報メディア学会研究大会参加記録) - かたつむりは電子図書館の夢をみるか 引き続いて第11回情報メディア学会研究大会の記録その2、筑波大・宇陀先生のコーディネートの元、第一線で活動されている大学図書館員お三方を交えたパネルディスカッション「重なり合う実空間と電子空間:ラーニングコモンズ×ディスカバリーサービス」の記録です。 研究大会URL 情報メディア学会: JSIMS Ustream映像 JSIMS Annual Conference(11th) 午前中から最大限に盛り上がったテンションを引き継いだディスカッション。 宇陀先生からの無茶ぶり(?)とパネリストの皆さんの切り返しが続く中、最後には衝撃のオチが・・・?! ってことで以下、当日の記録です。 例のごとくmi
Completed parts of the series: A Solr Field Type for numeric(ish) IDs Using localparams in Solr (or, how to boost records that contain all terms) Requiring/Preferring searches that don’t span multiple values Boosting on Exactish (anchored) phrase matching Those of you who read this blog regularly (Hi Mom!) know that while we do a lot of stuff at the University of Michigan Library, our bread-and-bu
NHN Japan ウェブサービス本部の「キョウ」と申します。 NAVERサービスのマークアップ等を担当している、「突っ込みづらいキャラ」で有名な男ですw 今回はマークアップエンジニアやSEOエンジニアの中で注目を集めている、 schema.orgについてご説明させていただきます。 この記事を読んでいる方の中には「schema.org公式サイト(英)」 「schema.org 日本語訳」をご覧になった方も多いと思いますが・・・ 皆様理解できましたか? 正直難易度が高いと思うので、初心者向けに内容を砕いて説明していきます。 目次 1. schema.orgとは? 2. schema.org導入メリットは? 3. schema.org 初心者向けQ&A 4. schema.org実践編 5. 最後に 1. schema.orgとは? 簡単に説明すると、schema.orgの仕様通りにH
お世話になっております、開発チームの池上です。 最近ちょっとした検索機能にSolrを導入しました。Solrは検索エンジンのミドルウェアでご存知の方も多いと思います。大規模な構成による導入実績が豊富でWeb上にもたくさんの事例がありますが、今回は慎ましい構成の事例を紹介させて頂こうと思います。 使用しているSolrのバージョンは2012年1月時点で最新の3.5.0です。 なお、検索エンジンやSolrに関する基礎的な情報につきましては、有用な解説がすでに多数存在していますので割愛させて頂きます。 今回はつぎの前提条件と要件を意識して構築しました。 前提条件 サーバは極力少なめで ミッションクリティカルな機能ではない データ量はそれほど多くない 要件 更新はある程度頻繁 遅くとも数分以内にはインデックスに更新を反映させたい 一般的なWeb検索のように「いい感じに見つける」よりは「(入力されたキ
こんにちは、NAVER Japan 検索サービス開発1チームで開発を担当している金森です。 先日「NAVER まとめ」にトピック機能を追加しましたが、そのタイミングでまとめサービス内で使用しているサジェスト検索機能のリプレイスを行いました。 今回このブログでは、実装したサジェスト検索の仕組みと、日本語入力ならではの諸々の面倒くさい問題とその対応について紹介したいと思います。 目次 まとめにおけるサジェスト検索 使用した技術 全体的な検索の流れ サジェストのためのローマ字変換 拗音のローマ字変換 入力途中の文字 「いんてrねt」の対応 ローマ字変換のまとめ その他注釈など まとめ 今後の課題 1. まとめにおけるサジェスト検索 サジェスト検索は皆さんお馴染みのとおりの機能で、簡単に言うと「検索語の入力中に検索候補が表示されるもの」と言えるかと思います。 まとめサービスでは、Web版の画
あなたが普段使っている検索エンジン、 その真髄は本書の中にある! 近年の情報爆発にともなって、膨大な情報から必要な情報を探し出す検索技術が、ますます重要になり、また大きく変化、発展してきた。本書は、従来の古典的な情報検索から、最近のウェブの情報検索までの基礎をわかりやすく扱った、網羅的で最先端の入門書である。最初に、文書の前処理、インデックス付け、逆インデックス、重み付け、スコア付け、検索システムの評価といった、情報検索の基礎、特にサーチエンジンに関わる話題をとりあげる。次に、より先進的な話題として、適合フィードバックやクエリー拡張を用いた検索の強化手法、構造化された文書からの情報検索、文書のスコア付けにおける確率論の応用といった話題をとりあげる。その後に、カテゴリー集合への分類問題、クラスタリングの問題といった、様々な形の機械学習と数値手法を取り扱う。最後に、ウェブサーチの問題を扱う。情
なぜ衝動買いしてしまうのか? 蓄積されるあなたの思考(嗜好) この1冊で推薦システムの体系を網羅 本書は、推薦システムに関する基本的な技術から最先端のトピックまでを体系的にまとめられており、情報推薦分野の概観を把握するのに最適の入門書である。推薦システムは、情報検索や情報フィルタリング、文書分類など、さまざまな研究領域における基礎となり、機械学習やデータマイニング、知識ベースシステムなど、異なる分野の手法が用いられている。本書では、これらの分野の概説が丁寧に説明されている。学生から社会人までにお勧めする。日常から経験している情報推薦技術とは何か、いかにして推薦内容を決めているのかについて体系的に学べる入門書! 第1章 はじめに 1.1 第1部:基本概念への手引き 1.2 第2部:最新動向 第2章 協調型推薦 2.1 ユーザベースの最近傍推薦 2.2 アイテムベースの最近傍推薦 2.3 評価
$ git-lfs clone https://huggingface.co/bert-base-uncased # 日本語の場合 $ git-lfs clone https://huggingface.co/tohoku-nlp/bert-base-japanese-v3 参考ページ qiita.com qiita.com Python プログラムが Kill されたので メモリサイズを増やす デフォルトでは 物理メモリの半分だった C:\Users\hoge\.wslconfig [wsl2] memory=56GB swap=0$ free -h total used free shared buff/cache available Mem: 54Gi 519Mi 53Gi 3.0Mi 549Mi 53Gi Swap: 0B 0B 0B $ sudo vi /etc/wsl.conf
今回と次回の記事で形態素解析とNグラムの違いをみていきたいと思います。 結論から言うとNグラムの方が再現率が高く、検索語が含まれる文章を確実に拾い上げることができます。 逆に形態素解析の方は、解析ミスによって取りこぼすことがあります。 形態素解析フィールドを検索 前回の記事の繰り返しになりますが 形態素解析でトークナイズしたブログのタイトルフィールドを検索語「ブログ」で検索してみます。 1件ヒットすると思います。 <result name="response" numFound="1" start="0"> <doc> <str name="URL">http://abiru.hoge.com/</str> <str name="bloger">あびる優</str> <date name="timestamp">2008-09-23T09:19:07.043Z</date> <str na
相対性理論のボーカルが頭から離れないmikioです。熱いわっふるの声に応えて今回はTokyo Cabinetのテーブルデータベースにおける検索機能の実装について語ってみたいと思います。とても長いのですが、最後まで読んだあかつきには、自分でも全文検索エンジンを作れると思っていただければ嬉しいです。 デモ モチベーションをあげていただくために、100行のソースコードで検索UIのデモを作ってみました。Java 6の日本語文書を対象としているので、「stringbuffer」とか「コンパイル」とか「倍精度浮動小数」とかそれっぽい用語で検索してみてください。 インデックスがちゃんとできていれば、たった100行で某検索エンジン風味の検索機能をあなたのデータを対象にして動かすことができます。ソースコードはこちら(テンプレートはこちら)です。 でも、今回はUIの話ではないのです。ものすごく地味に、全文検索
大手SIから「検索ヒット率」が低くて困っていると言われたので 再現率を上げればよいのかと資料作って行ってみたら 実は上げたいのは精度の方だったという笑えない話で 作った資料がボツになったのでここに上げときます。 検索エンジンで取りこぼしを減らす(再現率を上げる)技術 ノーマライズ 全角半角、大文字小文字、ー有り無し等の表記揺れ対応 コンピューター:コンピュータ 、jal:JAL ステミング 活用形対策 買う、買った、買え -> 買う、cars -> car 基本形( 語幹 )への変換 サブストリング 文字列の部分一致 「データ」 で 「株式会社NTTデータ」 をヒットさせる シノニム 同意語、別名 マック = マクドナルド = マクド 副作用 取りこぼしを減らす施策を実施した場合には再現率が上がる一方で、誤抽出が増えるため精度は下がる。 京都知事 : 東京都知事 ラーメン : いつものレ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く