文字列操作の比較表: Ruby, Python, JavaScript, Perl, C++ Ruby, Python, JavaScript, Perl, C++ の文字列操作の比較表を作りました。配列操作の比較表の続編です。間違いなどがあったらご指摘いただけると助かります。 Ruby (String) Python (str) JavaScript (String) Perl C++ (std::string)
文字列操作の比較表: Ruby, Python, JavaScript, Perl, C++ Ruby, Python, JavaScript, Perl, C++ の文字列操作の比較表を作りました。配列操作の比較表の続編です。間違いなどがあったらご指摘いただけると助かります。 Ruby (String) Python (str) JavaScript (String) Perl C++ (std::string)
第90回 Start Python Clubでの発表資料 「Python機械学習プログラミング」と振り返る機械学習の動向と展望 1. The document discusses various social media and video sharing platforms and tools for integrating them, including YouTube, Twitter, Flickr, iTunes, and Facebook. 2. It mentions several services that allow embedding or sharing content between platforms, such as CDTube for YouTube, ZonTube for Amazon, and amz.ly for shortening Amazon
最近、英語ライティング校正アプリが色々リリースされています。おそらく最も有名なのがGinger(ジンジャー)です。 以前面白そうだと思って有料版を試したものの、予想を下回るしょぼさにがっかりしたことがあります。解約を忘れたので追加一ヶ月分の課金もされました。トホホ。 んで、今回発見したのがGrammarly(グラマリー)。こちらも英語ライティングの文法やスペルミス等を修正してくれるソフトだそうです。ということで、早速自腹で有料版を試してみました。 *Grammarlyの基本的な使い方 Grammarlyが類似ソフトGingerと異なる最大の点が、文章校正をする場所です。Gingerはブラウザにインストールするエクステンション内に英文をコピペし、そこで校正をします。はっきり言って小さくて使いづらい。英文の識別も遅いし。 ところがGrammarlyの場合、文章校正はすべてサイト内で行います。イ
はじめに この文書は、 Steven Bird, Ewan Klein, Edward Loper 著 萩原 正人、中山 敬広、水野 貴明 訳 『入門 自然言語処理』 O'Reilly Japan, 2010. の第12章「Python による日本語自然言語処理」を、原書 Natural Language Processing with Python と同じ Creative Commons Attribution Noncommercial No Derivative Works 3.0 US License の下で公開するものです。 原書では主に英語を対象とした自然言語処理を取り扱っています。内容や考え方の多くは言語に依存しないものではありますが、単語の分かち書きをしない点や統語構造等の違いから、日本語を対象とする場合、いくつか気をつけなければいけない点があります。日本語を扱う場合にも
統計処理用のマシンを使って、自然言語処理で遊ぼう! BTOパソコンで有名な「パソコン工房」から「統計処理用のPCを企画しているので、何かできないか」と相談された編集部は、はてなエンジニアと相談して「word2vec」を使って遊んでみることに。はてなブログのデータとかっこいいパソコンを使って、最新の自然言語処理で楽しむ様子をお楽しみください! 記事の終わりには2TBの外付けHDDが当たるプレゼントのお知らせも。 (※この記事は株式会社ユニットコムによるPR記事です) ―― BTOパソコンのショップ/サイトで有名な「パソコン工房」さんから、以下のような依頼が来ました。 データサイエンティスト向けに、統計処理用に使えるパソコンをいろいろと考えています。なので、何か面白い処理に使って、PR記事にしてほしいんです! ▽ 【パソコン工房公式サイト】BTOパソコン(PC)の通販 ―― ということで、はて
識別子の付与 地名語辞書に登録した地名語をLODに接続するためには、地名語に対してGeoLODシステム内でユニークなIDを付与しなければならない。GeoNLPの基本方針は、辞書制作者が独自に制作した複数の地名語辞書を組み合わせて利用する、というものである。しかし、この方針を前提とすると、地名語辞書内でユニークなIDを与えても、システム全体でユニークなIDとなる保証はないという問題が生じる。 この問題の解決策としてよく用いられる方法は、フィールド内の文字列を連結した文字列をキーとし、それをハッシュ関数に与えて固定長のIDを生成するなど、フィールド内容を変換することでIDを生成する方法である。もしフィールド内の文字列にユニーク性があれば、この方法でもIDを生成できる。しかし、この方法はフィールド内容の修正に弱く、内容の微修正を越えて永続性のあるIDを生成する目的には適していない。 そこで2段階
Rubyはたのしい言語です。Rubyを触っているとマニュアルにも書いていない「小さな発見」に遭遇することがよくあります。このような「発見」は、プログラムの質や効率の改善には直結しないかもしれません。いや、むしろチームプログラミングでは妨げになる可能性すらあります。しかしその一方で、言語自体が自分の知らない領域を持ち続けていることが、その対象に対する興味を失わせないための大きな要因である、というのもまた疑いのない事実なのです。つまり「発見」はたのしさに直結しているのです。 このブログにおいて「知って得するRubyのトリビアな記法」というタイトルで、今まで3回記事を書きました。 “知って得する21のRubyのトリビアな記法” “第2弾!知って得する12のRubyのトリビアな記法” “第3弾!知って得する12のRubyのトリビアな記法” これらのトリビアには、ネット検索で見つけたもの、Twitt
大量のテキストに使用された要素の頻度を集計し、そのデータを値が大きい順に並べると、その順位(ランク)と頻度の間には次の法則があることがわかっている。 順位×頻度≒定数 この法則を「ジップの法則」と呼ぶ。ジップ(Zipf)は、この研究を1929年から始めたそうである。その結果に関連する主な著書として、Zipf(1935, 1949)がある。当初はPrinciple of Least Effort 用語を用いていた。 ジップの発見した法則は、単語の使用頻度と順位との関係から導き出した法則であるが、言語に限らず何らかの頻度と順位との関係に適用される。 頻度、順位、定数をそれぞれf,r,cで表すと、ジップの法則は次の式で表される。定数cは、データから求めることになる。 表1に、福田総理の所信表明演説文における単語を出現頻度が高い順に並べ、その順位と単語の頻度データを示す。横軸をランク、縦軸を頻度と
文字種による指定 (Unicode文字プロパティ*1 VSCodeやHimawariでは下段のsc=を含む方で指定する。)
情報科学においては、対象世界(知識領域)をある視点でみたときに立ち現われてくる構成要素(概念)を明示的に表現し、それらの関係を体系的に記述したもののこと。セマンティックウェブでは概念や意味を共有し、コンピュータが文書の意味を理解したり、情報を再利用したりするための基盤機構として構築される語彙(ごい)のセットをいう。 本来は哲学分野で「存在論」を指す言葉だが、情報科学や認知科学などでは意味や概念を取り扱うときに必要となる体系的な知識記述をいう。この分野では、米国人コンピュータ科学者のトム・グルーバー(Thomas R. Gruber)による「概念化の明示的な記述」という定義が受け入れられている。 人間が日常取り扱っている会話や文章には、省略や多義的表現が多く含まれており、提示された情報だけでは正確な理解や解釈ができないことが普通である。例えば、会話や文中に「りんご」という単語が登場したとき、
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く