[B! 解析] wogawaraのブックマーク

wogawara id:wogawara

解析に関するwogawaraのブックマーク (10)

Javaで、画像から文字(数字)を認識しその位置を取得する処理をしたいのですが、処理の仕方がわかりません。その処理を教えてください。も... - Yahoo!知恵袋
Javaで、画像から文字(数字)を認識しその位置を取得する処理をしたいのですが、処理の仕方がわかりません。その処理を教えてください。もしくは、解説されているサイトを教えてください。 Javaで、画像から文字(数字)を認識しその位置を取得する処理をしたいのですが、処理の仕方がわかりません。その処理を教えてください。もしくは、解説されているサイトを教えてください。
wogawara 2016/02/17
Java

数字

画像

文字

解析

ocr
リンク
PHPでバイナリプログラミングその1
はじめまして、5月から入社した久保田と申します。九州からはるばる上京してエンジニアとして働いています。普段はanatooというIDでブログ書いたりしています。また、BlankaというPHP5.3で動くフレームワークを開発していたり、はてな記法パーサなどに利用されているパーサコンビネータなどを公開しています。今後、勉強会などにも積極的に参加していこうと思いますのでお会いしたときはよろしくお願いします。さて、この記事ではPHPでのバイナリの扱い方について説明します。バイナリとは、ざっくりと言えばテキスト以外のバイト列のことです。バイト列とは1バイトで構成される任意の長さを持つ列の事で、1バイトとは256通りの値を表現できる8ビットのデータのことです。画像や音楽、映像などのバイナリは全て、テキストエンコーディングに沿わないバイト列によって表現されています。これらのバイナリを扱う
wogawara 2015/08/19
php

バイナリ

file

binary

解析

読込
リンク
dfltweb1.onamae.com – このドメインはお名前.comで取得されています。
このドメインはお名前.com から取得されました。お名前.com は GMOインターネットグループ(株) が運営する国内シェアNo.1のドメイン登録サービスです。 ※表示価格は、全て税込です。 ※サービス品質維持のため、一時的に対象となる料金へ一定割合の「サービス維持調整費」を加算させていただきます。 ※1 「国内シェア」は、ICANN(インターネットのドメイン名などの資源を管理する非営利団体)の公表数値をもとに集計。gTLDが集計の対象。日本のドメイン登録業者(レジストラ)（「ICANNがレジストラとして認定した企業」一覧（InterNIC提供）内に「Japan」の記載があるもの）を対象。レジストラ「GMO Internet Group, Inc. d/b/a Onamae.com」のシェア値を集計。 2023年5月時点の調査。
wogawara 2015/06/19
xdebug

デバッグ

PHP

var_dump

解析

Eclipse

pdt
リンク
AdMatrix Analytics（アドマトリックスアナリティクス） – Get this Extension for 🦊 Firefox (en-US)
wogawara 2015/05/29
firefox

SEO

ページ

内容

解析

addon

アドオン
リンク
ダウンロードファイル一覧 - Igo - OSDN
JavaおよびCommon Lispで実装されたミニマムな形態素解析器。辞書および出力はほぼMeCab互換。 Java版ドキュメント Common Lisp版ドキュメント ※ 現在は https://github.com/sile/igo に移行済み Link 高橋さんによるPythonポーティング: igo-python kyowさんによるRubyポーティング: igo-ruby siahrさんによるPHPポーティング: igo-php JARに辞書込みの形態素解析器: Gomoku 比較的省メモリな形態素解析器: Sanmoku
wogawara 2014/05/09
形態素解析

文字

解析

PHP

文章

単語

調査

分割
リンク
Igo - a morphological analyzer
目次概要/特徴リリースノートインストール/使い方 jarファイル解析用辞書作成形態素解析コマンド BuildDic Igo Java API Tagger Morpheme サンプルコード MeCabとの相違点解析結果機能辞書ファイル単語エントリフォーマット制限/注意点禁則文字バイナリ辞書エンディアンライセンスバグ報告など概要/特徴 Javaで実装された形態素解析器。→ Common Lisp版辞書フォーマット及び解析結果は、ほぼMeCab互換。単機能。 Javaの形態素解析器としては比較的高速。スレッドセーフ。リリースノート version 0.4.3: 2011年06月17日形態素解析部の微細なパフォーマンスチューニングインストール/使い方 1) jarファイルの取得/作成 jarファイルは以下のいずれかの方法で取得/作成する。ダウンロード
wogawara 2014/05/09
形態素解析

文字

解析

PHP

文章

単語

調査

分割
リンク
[PHP]文章を解析して単語ごとに分解する（形態素解析） | PHP Archive
日本語は英語と違い、単語同士が明確に区切られていないので、一つ一つの単語の品詞を調べる場合は、いわゆる「分かち書き」をする必要があります。分かち書きとは次のように単語を分けて書くことです。これは日本語です → これ | は | 日本語 | ですプログラミングで分かち書きを行うには大変な労力がかかるので、ゼロから開発するのは現実的ではありません。簡単に行う方法の一つは Yahoo! API を利用することです。クエリを送るだけで簡単に解析結果を受け取ることができるので便利ですが、リクエスト回数に上限があったり、クレジット表記が義務付けられたりするので、状況によっては使いにくくなります。もう一つはサーバーに MeCab をインストールする方法です。 Mecab はオープンソースの形態素解析エンジンで、様々な分野で活用されている実績あるプログラムです。可能ならこちらを導入するのがベ
wogawara 2014/05/09
形態素解析

文字

解析

PHP

文章

単語

調査

分割

mecab
リンク
形態素解析アーカイブ | PHP Archive
今回も igo-php を用いた形態素解析のサンプルなので、導入についてはこちらを御覧ください。通常分かち書きをする場合、名詞は細かく分割され、次のように解釈されます。「これは形態素解析の実験結果です。」 → 「これ | は | 形態素 | 解析 | の | 実験 | 結果 | です | 。」もちろん間違ってはいないのですが、感覚的には「形態素解析」「実験結果」はそれぞれひとつの単語でまとめられていたほうが自然です。「東京特許許可局」などの場合も同様に一つの単語として扱うことがほとんどです。法則を見てみると、名詞が連続している場合は複合名詞になるというシンプルなものなので、それを踏まえて次のようにしてみました。 <?php require_once 'lib/Igo.php'; $igo = new Igo(dirname(__FILE__) . "/ipadic", "U
wogawara 2014/05/09
形態素解析

文字

解析

PHP

文章

単語

調査

分割
リンク
「良質なコンテンツ」を測定する7つの指標
コンテンツが重要な時代になってきました。SEOでは良質のコンテンツ作成が王道だ、と昔から言われていましたが、最近のGoogleのアルゴリズム変更はその理想論を現実に近付けました。「コンテンツマーケティング」という言葉も耳にするようになりました。ただ、自社サイトの特性に合わせて良質のオリジナルコンテンツを作るためには、工夫やリソースが必要になります。そこで、何が「良いコンテンツ」なのかを定義し、その「良さ」を客観的に評価できるようにしておくと便利です。著名ライターに依頼したり、コストをかければ良いというわけではありません。精度や効率を無視してお金をかけ続けるような運用は、最初はよくても長続きしないでしょう。そこで今回は、良いコンテンツの定義と測定方法について考えてみます。良質なコンテンツを読むとどうなるのか？良いコンテンツに出会うと、ユーザーはどう行動するのでしょうか？　いつものよう
wogawara 2012/10/12
条件

Google

解析

コンテンツ

SEO

サイト

サイト作成

評価

ノウハウ

まとめ
リンク
3/5 HTML解析ツールを作る [Javaプログラミング] All About
HTML解析ツールを作る(3ページ目)今回は、URLを入力するとそのページにアクセスし、そこに含まれているリンクやイメージファイルを抜き出す解析ツールを作ってみます。 ParserCallbackでHTMLのタグを解析する続いて、HTMLのソースコードを解析して特定の要素を取り出す方法について考えてみましょう。誰もが考えそうなのは、正規表現を使ってタグの特定の要素を抜き出すというものですね。これでも確かに可能ですが、JavaにはHTMLソースコードを解析するのに便利なものが用意されていますからそれを使ってみましょう。 Javaには、HTMLなどの構文解析を行うクラスが用意されています。これらは一般に「パーサ」と呼ばれています。HTMLの解析には、javax.swing.text.html.HTMLEditorKit.Parserというクラスが用意されており、このクラスによりタグやデータを
wogawara 2012/09/30
クラス

java

html

タグ

ノウハウ

解析
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx