NLPに関するzoningのブックマーク (16)

  • 天天中彩票异常

    但是在第四个项目,双杠上,日队再度经历“噩梦”,赛前就备受右手伤病困扰的田中佑典出现了掉杠等失误,仅得到分,日队从此退出了金牌的竞争。 比!中国年龄段国青队再一次以这样的比分输给了沙特队。这个结果也意味着中国国青队已经提前无缘小组出线,应验了外界的戏谑,即对参加大赛的中国队来说,每一次都是“揭幕战、生死战、荣誉战”,然后大谈“看到了希望”。这样的循环往复,已经不知道多少年、多少次了。而对记者而言,甚至都已经感到了绝望。 巴黎与那不勒斯的欧冠比赛,这也是内马尔职业生涯第场欧冠比赛。《马卡报》对比了内马尔、梅西、罗的前场欧冠比赛数据。 金庸曾对朋友说自己“古人最佩服范蠡,今人最佩服吴清源。”他赞吴清源:“棋如《笑傲江湖》中的独孤九剑,没有定式,变化无穷。他就像风清扬,清灵飘逸,仙风道骨。” “我们期望通过优质供应链服务向全球的输出,由‘向’转变,在全球构建‘双小时’通路,实现中国小时通达全

    zoning
    zoning 2012/06/30
  • KyTea - the Kyoto Text Analysis Toolkit

    語 This is the home of the Kyoto Text Analysis Toolkit (KyTea, pronounced "cutie"). It is a general toolkit developed for analyzing text, with a focus on Japanese, Chinese and other languages requiring word or morpheme segmentation. Features Download/Install Documentation Analysis: Method Details, IO Formats, API Training: Training Models, Extra Models Domain Adaptation with KyTea Development Fea

    zoning
    zoning 2012/01/02
  • 修論(可変次数 CRF)の英訳 - アスペ日記

    ここのところ一ヶ月ぐらい、修士論文(可変次数 CRF)の英訳に取り組んでいた(うまくいったら国際学会とやらに出してみようかなと。ちなみに出したことはない)。ただの翻訳のつもりが、始めてみるといろいろとまずいところや足りないところが見つかったので、いろいろと修正した。その結果: 厳密になった。 ストーリーができた。 (多少)簡潔になった。 と、自分では思っている。 英訳&修正したバージョン:http://vocrf.net/docs/thesis_en.pdf 元の修士論文:http://vocrf.net/docs_ja/thesis.pdf 英訳した部分に相当するのは、日語版の 12〜24ページに相当する(図を使った例は省いた)。 とりあえず、これで先行研究の人に意見を聞いてみようかな。

    修論(可変次数 CRF)の英訳 - アスペ日記
    zoning
    zoning 2011/11/14
  • ALAGIN 言語資源・音声資源サイト - ホーム

    ●○お知らせ○● ログインするには右の「ALAGIN会員」のログインフォームからお願い致します。 各資源の契約書の入手及 び記載方法等につきましては、右の「ALAGIN会員」よりログイン頂く事で参照できます。 ALAGINフォーラムへご入会希望の方は「フォーラム参加のご案内 」をご覧ください。

    zoning
    zoning 2011/05/05
  • 上位下位関係抽出ツール Version1.0: Hyponymy extraction tool

    上位下位関係抽出ツール Version1.0 : Hyponymy extraction tool 目次 上位下位関係抽出ツールとは 新着情報 注意事項 ダウンロード 動作環境 実行 機械学習用モデルファイル 実行結果 オプション引数 ディレクトリ構成 実行コマンド入力例 抽出上位下位関係数 参考文献 Copyright 上位下位関係抽出ツールとは 上位下位関係抽出ツールは,Wikipediaダンプデータ(XMLファイル)から機械学習を使って上位下位関係となる用語ペアを数百万対のオーダーで抽出できるツールです. 上位下位関係とは,"XはYの一種(一つ)である"と言えるXとYの関係を言います. Xのことを下位語,Yのことを上位語と呼びます. 別の言い方をしますと,上位下位関係は「上位概念ー下位概念」または「概念ーインスタンス(具体例)」の関係を持つ語の対となります. 抽出できる上位下位関係の

    zoning
    zoning 2011/05/05
  • 日本語 WordNet (wn-ja)

    語 WordNet リリース * 画像 * ダウンロード * 今後の予定 * 参考文献 * リンク * English プロジェクトでは、 Princeton WordNet や Global WordNet Gridに 着想をえて、日語のワードネットを構築し、オープンで公開します。 独立行政法人情報通信研究機構(NICT)では、自然言語処理研究をサポー ト する一環として、2006年に日語ワードネットの開発を開始しました。最初の 版、version 0.9は、2009年2月にリリースされました。このversion 0.9は、 Princeton WordNetのsynsetに対応して日語をつけています。もちろん、 Princeton WordNetにはない日語synsetを付与する必要があり、また、 Princeton WordNetにみられるsynsetの階層構造に、

    zoning
    zoning 2011/05/05
  • Mooter 形態素解析(Codename マリモ)

    ・『新しい単語』、『言い回し』、『話し言葉』を辞書不要で解析可能。 ・専門用語の解析、ケータイサイトやブログに適している。 参考サイト ムーターブログによる日形態素解析の説明 @IT - アットマーク・アイティ様にマリモの特徴を取り上げて頂きました。 ・Java 2 Developer Kit(JDK) version 1.2.2以上のJava2開発環境 ・推奨マシンスペック Pentium(R)III相当 450MHz以上 ・必要メモリ容量 512MB以上のRAM ・必要ディスク容量 500MB以上の空き容量

  • TinySegmenter: Javascriptだけで実装されたコンパクトな分かち書きソフトウェア

    TinySegmenterはJavascriptだけ書かれた極めてコンパクトな日語分かち書きソフトウェアです。 わずか25kバイトのソースコードで、日語の新聞記事であれば文字単位で95%程度の精度で分かち書きが行えます。 Yahoo!形態素解析のように サーバーサイドで解析するのではなく、全てクライアントサイドで解析を行うため、セキュリティの 観点から見ても安全です。分かち書きの単位はMeCab + ipadicと互換性があります。 デモ 日語の文章を入力し、解析ボタンをクリックしてください。 ダウンロード TinySegmenterはフリーソフトウェアです. 修正BSDライセンスに従ってソフトウェアを使用,再配布することができます. Download TinySegmenter version 0.2 使い方 <script type="text/javascript" src

  • 日本語ウェブコーパス 2010

    概要 コーパスの HTML アーカイブは,ipadic-2.7.0 の見出し語をシードとして,かつての Yahoo! Web API による検索結果に含まれるウェブページを収集したものです.テキストの抽出においては,文字コードを UTF-8 に統一した後,いくつかの記号をデリミタとして文への分割をおこない,さらに文を構成する文字の種類や数によるフィルタリングを施しています.N-gram コーパスについては,テキストアーカイブに出現する頻度 10 以上の N-gram を収録しています. コーパスの英語名称は Nihongo Web Corpusn 2010 (NWC 2010) です. 謝辞 コーパスの作成においては,様々なウェブサービス,ツール,コーパスを利用させていただきました.開発者・研究者の皆様に感謝いたします. コーパスの作成・保存・配布には Amazon Web Serv

    zoning
    zoning 2011/05/05
  • はてなグループの終了日を2020年1月31日(金)に決定しました - はてなの告知

    はてなグループの終了日を2020年1月31日(金)に決定しました 以下のエントリの通り、今年末を目処にはてなグループを終了予定である旨をお知らせしておりました。 2019年末を目処に、はてなグループの提供を終了する予定です - はてなグループ日記 このたび、正式に終了日を決定いたしましたので、以下の通りご確認ください。 終了日: 2020年1月31日(金) エクスポート希望申請期限:2020年1月31日(金) 終了日以降は、はてなグループの閲覧および投稿は行えません。日記のエクスポートが必要な方は以下の記事にしたがって手続きをしてください。 はてなグループに投稿された日記データのエクスポートについて - はてなグループ日記 ご利用のみなさまにはご迷惑をおかけいたしますが、どうぞよろしくお願いいたします。 2020-06-25 追記 はてなグループ日記のエクスポートデータは2020年2月28

    はてなグループの終了日を2020年1月31日(金)に決定しました - はてなの告知
  • 形態素解析器IgoのRuby版を作った - 猫背ミジンコ

    解析結果がほぼMeCab互換のJavaおよびCommon Lispで実装された形態素解析器IgoRuby版を作りました。 正確にはIgoのエンジン部分をRubyに移植しましたですけれども。 ソース ソースはGitHubに公開。 また、RubyGems.orgにgemを公開してあるので、インターネットに接続している環境ならRubyGemsでインストールできます。 インストール コマンドラインで下記を入力。$ gem install igo-rubyigo-rubyは、別途Igoと同じ解析用辞書ファイルが必要です。(igo-pythonと同じ方式。ただし、igo-pythonの方は辞書ファイルの生成機能も実装予定とのことです。) 解析用辞書ファイルの生成方法については、Igoのページを参照してください。 使い方 Igo::Taggerクラスのコンストラクタに辞書ファイルが入ったディレクトリを

    形態素解析器IgoのRuby版を作った - 猫背ミジンコ
  • 形態素解析器IgoのPython版作った

    いろんなメモです。おもにプログラミング関係。 a memorandum. most of all contents are related to programming. Java(とCL)で書かれた形態素解析器であるIgoPythonにほぼそのまま移植しました。 Java版で作った辞書がそのまま使えるようにしたので、辞書を作る部分は(まだ)移植してません。 mmapしてるのでGAEでは動きません。すぐ取りかかる予定です。 またGAE版の辞書はBigEndianなのでそこらへんも対応する予定です。 https://code.launchpad.net/~hideaki-t/+junk/igo-pyに置きました。 簡単なテストしかしてません。問題があったら教えてください! 簡単なサンプル # coding: utf-8 import igo.Tagger t = igo.Tagger.Ta

    形態素解析器IgoのPython版作った
  • Igo - a morphological analyzer

    目次 概要/特徴 リリースノート インストール/使い方 jarファイル 解析用辞書作成 形態素解析 コマンド BuildDic Igo Java API Tagger Morpheme サンプルコード MeCabとの相違点 解析結果 機能 辞書ファイル 単語エントリフォーマット 制限/注意点 禁則文字 バイナリ辞書エンディアン ライセンス バグ報告など 概要/特徴 Javaで実装された形態素解析器。→ Common Lisp版 辞書フォーマット及び解析結果は、ほぼMeCab互換。 単機能。 Java形態素解析器としては比較的高速。 スレッドセーフ。 リリースノート version 0.4.3: 2011年06月17日 形態素解析部の微細なパフォーマンスチューニング インストール/使い方 1) jarファイルの取得/作成 jarファイルは以下のいずれかの方法で取得/作成する。 ダウンロード

    zoning
    zoning 2011/05/05
  • 日本語係り受けコーパス(JDC)

    概要 日語ウェブコーパス2010(NWC2010)(約1億ウェブページ)より CaboChaを用いて, 助詞を介した語と語の係り受けを抽出したものです. 類似のコーパスとしてALAGINの日語係り受けデータベースがあります. コーパスでは次のような形で収録されています. NCV (名詞) (助詞) (動詞) 338,092,129種類(約3.3億ユニークペア) レビュー を お送りする 496 テレクラ で いる 6 大気 が 存続する 1 化量 を 言う 1 Private と 定義する 1 けんぎゅうか が 伝来される 2 プロテスタンティズム を 生み出す 1 脳内 で アップされる 6 NCN (名詞) (助詞) (名詞) 166,724,808種類(約1.6億ユニークペア) 司会 が 仕事 25 こころ という ちよ 1 場所 から 大筒 1 見直し へ 訴訟 3 ここ

    zoning
    zoning 2011/05/05
  • http://www.simplestream.co.jp/index.php?main_page=html_tweet

    zoning
    zoning 2011/05/05
  • Google Code Archive - Long-term storage for Google Code Project Hosting.

    Code Archive Skip to content Google About Google Privacy Terms

    zoning
    zoning 2011/05/05
  • 1