タグ

自然言語処理に関するhaidaのブックマーク (12)

  • mixi Engineers’ Blog » mixi日記キーワードランキングの秘密

    皆さん、先月の半ば頃からmixiのトップページの3列目に「日記キーワードランキング」というコーナーが登場していたのをご存じでしょうか。手前味噌ながら、これはとても面白い機能で、毎日ランキングが更新される度に素敵なランキングが作られていて悦に入っているmikioです。今回は日記キーワードランキングの秘密についてお話します。 日記キーワードランキングとは、日記に書かれた言葉の使用頻度を統計的に処理して、今話題になっている度合を算出し、その上位をランキング形式で表示する機能です。トップページには5位までが表示されるので、それをチェックするだけで最新の流行を把握することができます。さらに「30位までを読む」に進むと30位までのキーワードとその関連日記が表示されます。詳細を知りたい場合はキーワードをクリックすると、そのキーワードで日記検索をした結果を見ることができます。一通り見るのに10分くらいでし

    mixi Engineers’ Blog » mixi日記キーワードランキングの秘密
  • 携帯電話でのフィルタリングサービス

    haida
    haida 2007/08/28
    犯罪対策プロジェクト
  • Hyper Estraier: a full-text search system for communities

    Our team of highly trained cybersecurity professionals provides expertise in compliance, tool assessments, threat hunting, incident response and more. Critical Start is leading the way in Managed Detection and Response (MDR) services. With a unique approach that treats every security alert as equal, Critical Start's proprietary Trusted Behavior Registry allows security analysts to resolve every al

  • PukiWiki 【FrontPage】

    なんだかやけに長い説明ばかり検索に引っかかったので書きました。 Linuxのローカル環境でDockerコンテナ内のXアプリ(GUIアプリ)を利用するには $ xhost localhost + を実行した後に $ docker run --rm --net host -e "DISPLAY" container_image_name x_app_binary_path とすれば良いです。 もっと読む SSHなどよく知られたサービスポートで何も対策せずにいると数えきらないくらいの攻撃リクエストが来ます。不必要なログを増やしてリソースを無駄にし、もし不用意なユーザーやシステムがあると攻撃に成功する場合もあります。 SshguardはC作られており、flex/bisonのパーサールールを足せば拡張できますがカスタム版をメンテナンスするのも面倒です。必要なルールを足してプルリクエストを送ってもマー

    PukiWiki 【FrontPage】
  • 第6回 N-gramと形態素解析との比較 | gihyo.jp

    これまでに、N-gramと形態素解析の2つの検索エンジンの、見出し語の切り出し方法を説明しました。今回は、2つの見出し語の切り出し方法を比較し、それぞれの得意な点、不得意な点を明らかにしていきます。 2つの手法の概要 はじめに、2つの手法をおさらいしてみます。 形態素解析 検索対象のテキストを形態素解析を行い分かち書きを行う 分かち書きした単位を見出し語として転置インデックスを作成する 転置インデックスを元に検索を行う N-gram 検索対象のテキストをN文字単位の文字列片に分解する 分解した文字列片を見出し語として転置インデックスを作成する 検索語をN文字単位の文字列片に分け検索を行う 文字列の出現位置情報を利用すれば、漏れのない完全一致の検索が可能 大きな違いは、「⁠転置インデックスの見出し語をどのように作るか」というプロセスが異なる点です。形態素解析は構文解析を行って分かち書きを行う

    第6回 N-gramと形態素解析との比較 | gihyo.jp
  • NRIが“連想検索エンジン”を独自開発 - @IT

    2007/07/11 野村総合研究所は7月11日、ユーザーが興味のあるキーワードを入力すると、検索語に関連の深い内容のキーワードを自動的に検索結果に表示する検索技術“連想検索エンジン”を開発したと発表した。今後、システム開発を含む自社のITソリューションサービスで連想検索エンジンを活用した製品やサービスを事業化していくとともに、同社の公式ホームページでも活用していく。 一般的な検索では、検索にヒットしなかった場合に入力するキーワードを変えるなど工夫が必要だが、関連するキーワードを提示することで、目的の情報により早くたどり着けるという。キーワードの関連性を定義した「連想辞書」は自動生成する。また、文書データを入力して目的に合わせた連想キーワードの登録が行える。 検索のフロントエンド部分にはRuby on Railsを用い、ミドルウェア層にはオープンソースソフトウェアを採用した。開発スタイルと

    haida
    haida 2007/08/16
    連想検索
  • ILU 言語理解研究所 | 感情を宿したAI(人工知能)

    Message 言葉を理解するAIが、 あなたの想いを かたちにします 人の言葉を理解し、人によりそう。 そんなAIをめざして、ILUは30年以上研究開発を続けてきました。 わたしたちの技術は多くのサービスを世に送り出し、 言葉のデータベースには、今日も新しい用例が学習されています。 あなたの想いをILUのAIに託してみませんか。 詳しくみる

    ILU 言語理解研究所 | 感情を宿したAI(人工知能)
  • nazuki.jp

    nazuki.jp 2018 Copyright. All Rights Reserved. The Sponsored Listings displayed above are served automatically by a third party. Neither the service provider nor the domain owner maintain any relationship with the advertisers. In case of trademark issues please contact the domain owner directly (contact information can be found in whois). Privacy Policy

  • ヤフー、きざしカンパニーと資本業務提携--ブログ解析技術を応用

    ブログで話題のキーワードを紹介する「kizasi.jp」を運営するきざしカンパニーとヤフーは7月19日、資業務提携すると発表した。ヤフーはきざしカンパニーの第三者割当増資を引き受け、5%の株式を取得する。取得金額は明らかにしていない。 ヤフーはポータルサイト「Yahoo! JAPAN」において、きざしカンパニーから技術およびコンテンツ提供を受けて、ブログやニュースで話題になったキーワードを紹介する「Yahoo!トレンドワード」を展開している。ヤフーはこの技術を使ってYahoo!掲示板Yahoo!知恵袋などのコンテンツも解析し、新たなコンテンツにしていきたい考え。 きざしカンパニーのブログ解析技術「kizasiサーチエンジン」は、時間情報を持つ大量のデータを解析して、ある時期に突然多く登場したキーワードだけを抽出する機能を持つ。ただし、解析にはキーワードを特定するための辞書データが必要に

    ヤフー、きざしカンパニーと資本業務提携--ブログ解析技術を応用
  • Mooter 形態素解析(Codename マリモ)

    ・『新しい単語』、『言い回し』、『話し言葉』を辞書不要で解析可能。 ・専門用語の解析、ケータイサイトやブログに適している。 参考サイト ムーターブログによる日形態素解析の説明 @IT - アットマーク・アイティ様にマリモの特徴を取り上げて頂きました。 ・Java 2 Developer Kit(JDK) version 1.2.2以上のJava2開発環境 ・推奨マシンスペック Pentium(R)III相当 450MHz以上 ・必要メモリ容量 512MB以上のRAM ・必要ディスク容量 500MB以上の空き容量

    haida
    haida 2007/08/10
    新語・流行語に強い日本語解析エンジン
  • Page2

    LinkTree - HOME http://sadako.nobody.jp/ http://monodebank.nobody.jp/ http://okichi.xxxxxxxx.jp/ http://utaneko.gozaru.jp/ http://urananaon.atukan.com/ LinkTree -

  • 自然言語処理研究室 - 長岡技術科学大学 電気系 自然言語処理研究室

    ようこそ! 長岡技術科学大学 電気系 自然言語処理研究室へようこそ。研究室では、自然言語処理とテキストマイニングに関する様々な研究を行っています。 最近の研究室 国際会議に2件採録されました(9/4) 今年11月にフィリピンのセブ島で開催される自然言語処理に関する国際会議 PACLIC 22に研究室から2件の論文が採録されましたので ご報告します。 Extracting Troubles from Daily Reports based on Syntactic Pieces [ 国際会議#08PACLIC-kakimoto ] Generating Story Reviews Using Phrases Expressing Emotion [ 国際会議#08PACLIC-ota ] オープンハウスを開催しました(8/25-29) 今年度もオープンハウスを開催して、「人工無

    haida
    haida 2007/08/01
    自然言語系の研究室。資料が結構あって良いな。
  • 1