[B! 自然言語処理] hirometricsのブックマーク

hirometrics id:hirometrics

自然言語処理に関するhirometricsのブックマーク (13)

いやなブログ - 文字列操作の比較表: Ruby, Python, JavaScript, P...
文字列操作の比較表: Ruby, Python, JavaScript, Perl, C++ Ruby, Python, JavaScript, Perl, C++ の文字列操作の比較表を作りました。配列操作の比較表の続編です。間違いなどがあったらご指摘いただけると助かります。 Ruby (String) Python (str) JavaScript (String) Perl C++ (std::string)
hirometrics 2016/11/01
JavaScript Ruby tr

JavaScript

Ruby

Python

プログラミング

Perl

比較

自然言語処理
リンク
言語処理するのに Python でいいの？ #PyDataTokyo
第90回 Start Python Clubでの発表資料「Python 機械学習プログラミング」と振り返る機械学習の動向と展望 1. The document discusses various social media and video sharing platforms and tools for integrating them, including YouTube, Twitter, Flickr, iTunes, and Facebook. 2. It mentions several services that allow embedding or sharing content between platforms, such as CDTube for YouTube, ZonTube for Amazon, and amz.ly for shortening Amazon
hirometrics 2015/05/23
自然言語処理

Python

プログラミング

サイボウズ

viaHotEntry
リンク
英文校正アプリGrammarlyが予想以上に高性能で感動
最近、英語ライティング校正アプリが色々リリースされています。おそらく最も有名なのがGinger(ジンジャー)です。以前面白そうだと思って有料版を試したものの、予想を下回るしょぼさにがっかりしたことがあります。解約を忘れたので追加一ヶ月分の課金もされました。トホホ。んで、今回発見したのがGrammarly(グラマリー)。こちらも英語ライティングの文法やスペルミス等を修正してくれるソフトだそうです。ということで、早速自腹で有料版を試してみました。＊Grammarlyの基本的な使い方 Grammarlyが類似ソフトGingerと異なる最大の点が、文章校正をする場所です。Gingerはブラウザにインストールするエクステンション内に英文をコピペし、そこで校正をします。はっきり言って小さくて使いづらい。英文の識別も遅いし。ところがGrammarlyの場合、文章校正はすべてサイト内で行います。イ
hirometrics 2015/05/10
英語

IT

自然言語処理

viaPresso
リンク
言語処理100本ノック 2015
言語処理100本ノックは，実践的な課題に取り組みながら，プログラミング，データ分析，研究のスキルを楽しく習得することを目指した問題集です実用的でワクワクするような題材を厳選しました言語処理に加えて，統計や機械学習などの周辺分野にも親しめます研究やデータ分析の進め方，作法，スキルを修得できます問題を解くのに必要なデータ・コーパスを配布しています言語はPythonを想定していますが，他の言語にも対応しています
hirometrics 2015/03/13
viaPresso

自然言語処理

Python

プログラミング
リンク
Python による日本語自然言語処理
はじめにこの文書は、 Steven Bird, Ewan Klein, Edward Loper 著萩原正人、中山敬広、水野貴明　訳『入門自然言語処理』 O'Reilly Japan, 2010. の第12章「Python による日本語自然言語処理」を、原書 Natural Language Processing with Python と同じ Creative Commons Attribution Noncommercial No Derivative Works 3.0 US License の下で公開するものです。原書では主に英語を対象とした自然言語処理を取り扱っています。内容や考え方の多くは言語に依存しないものではありますが、単語の分かち書きをしない点や統語構造等の違いから、日本語を対象とする場合、いくつか気をつけなければいけない点があります。日本語を扱う場合にも
hirometrics 2014/11/04
日本語

自然言語処理

プログラミング
リンク
Python - Perl + Java = ？はてなブログのデータとパソコン工房のPCを使って「word2vec」で遊んでみた - はてなニュース
統計処理用のマシンを使って、自然言語処理で遊ぼう！ BTOパソコンで有名な「パソコン工房」から「統計処理用のPCを企画しているので、何かできないか」と相談された編集部は、はてなエンジニアと相談して「word2vec」を使って遊んでみることに。はてなブログのデータとかっこいいパソコンを使って、最新の自然言語処理で楽しむ様子をお楽しみください！記事の終わりには2TBの外付けHDDが当たるプレゼントのお知らせも。（※この記事は株式会社ユニットコムによるPR記事です） ―― BTOパソコンのショップ／サイトで有名な「パソコン工房」さんから、以下のような依頼が来ました。データサイエンティスト向けに、統計処理用に使えるパソコンをいろいろと考えています。なので、何か面白い処理に使って、PR記事にしてほしいんです！ ▽ 【パソコン工房公式サイト】BTOパソコン（PC）の通販 ―― ということで、はて
hirometrics 2014/04/24
自然言語処理
リンク
GeoNLPプロジェクト - 地名情報基盤のためのオープンなソフトウェア・データ・サービス
識別子の付与地名語辞書に登録した地名語をLODに接続するためには、地名語に対してGeoLODシステム内でユニークなIDを付与しなければならない。GeoNLPの基本方針は、辞書制作者が独自に制作した複数の地名語辞書を組み合わせて利用する、というものである。しかし、この方針を前提とすると、地名語辞書内でユニークなIDを与えても、システム全体でユニークなIDとなる保証はないという問題が生じる。この問題の解決策としてよく用いられる方法は、フィールド内の文字列を連結した文字列をキーとし、それをハッシュ関数に与えて固定長のIDを生成するなど、フィールド内容を変換することでIDを生成する方法である。もしフィールド内の文字列にユニーク性があれば、この方法でもIDを生成できる。しかし、この方法はフィールド内容の修正に弱く、内容の微修正を越えて永続性のあるIDを生成する目的には適していない。そこで2段階
hirometrics 2013/08/13
自然言語処理
リンク
知って得する！５５のRubyのトリビアな記法
Rubyはたのしい言語です。Rubyを触っているとマニュアルにも書いていない「小さな発見」に遭遇することがよくあります。このような「発見」は、プログラムの質や効率の改善には直結しないかもしれません。いや、むしろチームプログラミングでは妨げになる可能性すらあります。しかしその一方で、言語自体が自分の知らない領域を持ち続けていることが、その対象に対する興味を失わせないための大きな要因である、というのもまた疑いのない事実なのです。つまり「発見」はたのしさに直結しているのです。このブログにおいて「知って得するRubyのトリビアな記法」というタイトルで、今まで３回記事を書きました。 “知って得する21のRubyのトリビアな記法” “第２弾！知って得する12のRubyのトリビアな記法” “第３弾！知って得する12のRubyのトリビアな記法” これらのトリビアには、ネット検索で見つけたもの、Twitt
hirometrics 2013/03/05
自然言語処理
リンク
60.html　統計的テキスト解析(5)～統計法則と指標～
大量のテキストに使用された要素の頻度を集計し、そのデータを値が大きい順に並べると、その順位(ランク)と頻度の間には次の法則があることがわかっている。順位×頻度≒定数この法則を「ジップの法則」と呼ぶ。ジップ(Zipf)は、この研究を1929年から始めたそうである。その結果に関連する主な著書として、Zipf(1935, 1949)がある。当初はPrinciple of Least Effort 用語を用いていた。ジップの発見した法則は、単語の使用頻度と順位との関係から導き出した法則であるが、言語に限らず何らかの頻度と順位との関係に適用される。頻度、順位、定数をそれぞれf,r,cで表すと、ジップの法則は次の式で表される。定数cは、データから求めることになる。表1に、福田総理の所信表明演説文における単語を出現頻度が高い順に並べ、その順位と単語の頻度データを示す。横軸をランク、縦軸を頻度と
hirometrics 2012/11/23
TTR, 異なり語数・延べ語数

自然言語処理
リンク
NINJALフォーラム第14回「私の日本語の学び方」
国立国語研究所（NINJAL）は，日本語学・言語学・日本語教育研究を中心とした研究機関です。研究者向けの研究資料・コーパスから，一般の方向けのイベント情報・読み物まで，さまざまなコンテンツを公開しています。
hirometrics 2012/10/11
言語学

自然言語処理
リンク
授業資料/正規表現 - OGI-Wiki
文字種による指定（Unicode文字プロパティ*1 VSCodeやHimawariでは下段のsc=を含む方で指定する。）
hirometrics 2012/06/22
主に日本語処理の正規表現

programming

自然言語処理
リンク
Sign in - Google Accounts
hirometrics 2012/06/21
自然言語処理

database
リンク
オントロジ（おんとろじ）
情報科学においては、対象世界（知識領域）をある視点でみたときに立ち現われてくる構成要素（概念）を明示的に表現し、それらの関係を体系的に記述したもののこと。セマンティックウェブでは概念や意味を共有し、コンピュータが文書の意味を理解したり、情報を再利用したりするための基盤機構として構築される語彙（ごい）のセットをいう。本来は哲学分野で「存在論」を指す言葉だが、情報科学や認知科学などでは意味や概念を取り扱うときに必要となる体系的な知識記述をいう。この分野では、米国人コンピュータ科学者のトム・グルーバー（Thomas R. Gruber）による「概念化の明示的な記述」という定義が受け入れられている。人間が日常取り扱っている会話や文章には、省略や多義的表現が多く含まれており、提示された情報だけでは正確な理解や解釈ができないことが普通である。例えば、会話や文中に「りんご」という単語が登場したとき、
hirometrics 2012/06/16
存在論・自然言語処理との関わり

Web

自然言語処理
リンク
1