タグ

自然言語処理に関するmsknのブックマーク (9)

  • プロダクトリスト | 株式会社プリファードインフラストラクチャー

    Sedueは圧縮されていながらランダムアクセス可能なインデックスを持つ全文検索エンジンです。 インデックスを圧縮することでメモリに収まるサイズになり、検索速度の劇的な高速化が可能です。 完全一致検索のほか、誤りを許す曖昧検索もサポートします。 reflexaは単語と単語の関連性を機械的に判断します。 reflexaは文書集合を元に、ある単語と意味が近かったり、似たグループに属しているような単語を学習します。 reflexaを応用すれば、ユーザーの質問に対し杓子定規に一致する答えばかりでなく、 豊富な回答を提供できます。

  • はてなブックマーク全文検索機能の裏側

    そろそろ落ち着いて来たころ合いなので、はてなブックマーク全文検索機能の裏側について書いてみることにします。 PFI側は、8月ぐらいからバイトに来てもらっているid:nobu-qと、id:kzkの2人がメインになって進めました(参考: 制作スタッフ)。数学的な所は他のメンバーに色々と助言をしてもらいました。 はてな側は主にid:naoyaさんを中心に、こちらの希望や要求を聞いて頂きました。開発期間は大体1〜2か月ぐらいで、9月の上旬に一度id:naoyaさんにオフィスに来て頂いて合宿をしました。その他の開発はSkypeのチャットで連絡を取りながら進めてました。インフラ面ではid:stanakaさん、契約面ではid:jkondoさん、id:kossyさんにお世話になりました。 全文検索エンジンSedue 今回の検索エンジンはSedue(セデュー)という製品をベースにして構築しています。Sedu

    はてなブックマーク全文検索機能の裏側
  • 文科省統合データベースプロジェクト「ライフサイエンス分野の統合データベース整備事業」 - NBDC

    ページの内容や事業の一環としてNBDCが開発・提供するウェブサービスのお問い合わせ、研究データ・データベースなどに関するご相談などお気軽にお寄せください。 お問い合わせ

    文科省統合データベースプロジェクト「ライフサイエンス分野の統合データベース整備事業」 - NBDC
  • 言語情報処理 用語集

    [索引] [あ行] [か行] [さ行] [た行] [な行] [は行] [ま行] [や行] [ら行] [わ行] あ行 アーリーアルゴリズム (Earley algorithm) 文脈自由文法に基づく構文解析アルゴリズム.ある非終端記号の直後に現われ得る終端記号を事前に予測することによって解析効率を改善している点が特徴. IIS (Improved Iterative Scaling algorithm) 最大エントロピー法のパラメタを学習するアルゴリズム. 曖昧性 (ambiguity) 自然言語処理では,複数の解析結果が得られることを曖昧性があるという.例えば複数の語義がある場合は語義(選択)に曖昧性があるといい,かかり受け解析において複数の可能性がある場合は,かかり受けに曖昧性があるという.曖昧性は様々な処理レベルで存在し,曖昧性解消(ambiguity resolution, disa

  • 自然言語処理研究室 - 長岡技術科学大学 電気系 自然言語処理研究室

    ようこそ! 長岡技術科学大学 電気系 自然言語処理研究室へようこそ。研究室では、自然言語処理とテキストマイニングに関する様々な研究を行っています。 最近の研究室 国際会議に2件採録されました(9/4) 今年11月にフィリピンのセブ島で開催される自然言語処理に関する国際会議 PACLIC 22に研究室から2件の論文が採録されましたので ご報告します。 Extracting Troubles from Daily Reports based on Syntactic Pieces [ 国際会議#08PACLIC-kakimoto ] Generating Story Reviews Using Phrases Expressing Emotion [ 国際会議#08PACLIC-ota ] オープンハウスを開催しました(8/25-29) 今年度もオープンハウスを開催して、「人工無

  • 日本の言語資源・ツールのカタログ

    毎日新聞CD-ROM (1991年) Type Text Type.linguistics annotation/corpus Description 1991年の毎日新聞の記事を収録したCD-ROM。約10,000記事。 Annotation.document keyword Creator 毎日新聞社 Contact person 日外アソシエーツ (data-saleあっとnichigai.co.jp) Price 126,000円 Subject.language 日語 Date 1991 Format 1 CD-ROM. Format.encoding Shift_JIS Relation IsPartOf 毎日新聞CD-ROM URI http://www.nichigai.co.jp/sales/mainichi/mai

  • 言語情報処理 ポータル

    IWSLT 2008 (International Workshop on Spoken Language Translation) (2008/10/20-21, Hawai'i, USA) AMTA 2008 (The 8th Biennial Conference of the Association for Machine Translation in the Americas) (2008/10/21-25, Hawai'i, USA) JEITA 知識情報処理技術に関するシンポジウム 「先端Web技術は企業を変えるか」 (2008/10/23, ベルサール神保町, 東京) EMNLP 2008 (Conference on Empirical Methods in Natural Language Processing) (2008/10/25-27, Hawai'i, USA

  • 自然言語処理 - Wikipedia

    自然言語処理(しぜんげんごしょり、英語: Natural language processing、略称:NLP)は、人間が日常的に使っている自然言語をコンピュータに処理させる一連の技術であり、人工知能言語学の一分野である。「計算言語学」(computational linguistics)との類似もあるが、自然言語処理は工学的な視点からの言語処理をさすのに対して、計算言語学言語学的視点を重視する手法をさす事が多い[1]。データベース内の情報を自然言語に変換したり、自然言語の文章をより形式的な(コンピュータが理解しやすい)表現に変換するといった処理が含まれる。応用例としては機械翻訳や仮名漢字変換が挙げられる。 自然言語の理解をコンピュータにさせることは、自然言語理解とされている。自然言語理解と、自然言語処理の差は、意味を扱うか、扱わないかという説もあったが、最近は数理的な言語解析手法(統

    自然言語処理 - Wikipedia
  • 長尾真 - Wikipedia

    長尾 真(ながお まこと、1936年(昭和11年)10月4日[1] - 2021年(令和3年)5月23日)は、日の情報工学者[1]。京都大学名誉教授[6]。 京都大学工学部[1]電子工学科卒業。京都大学総長[1]、国際高等研究所所長、独立行政法人情報通信研究機構理事長[1]、国立国会図書館長[1][7]を歴任。 人物[編集] Wikimedia Conference Japan 2009 にて(2009年11月22日、東京大学工学部2号館) 専門は、自然言語処理・画像処理[1]・パターン認識。パターン認識の分野では、手書き文字の認識方式を提案した。この手法は、初期の郵便番号読み取り装置へ応用された。以降、電子図書館システムの研究を主に手がけている。自動翻訳やAIにつながる技術の原理を開発した[8]。 自伝に「情報を読む力、学問する心」(ミネルヴァ書房、2010年)がある。 弟子には金出武

    長尾真 - Wikipedia
  • 1