Igo: GoogleAppEngineで形態素解析サーバで用意したサーバ(※追加修正あり。後述)を使って形態素解析を行うJavaScriptを書いてみた。 制限 結構制限が多い。 対応がUTF-8のみ レスポンスのJSONに含まれる文字列内のASCII以外の文字を16進数表記(\uXXXX)にエスケープすればEUC-JPやShift_JISでも大丈夫だった(2010/10/20) JSONPを使ってサーバと通信しているため、一回のリクエストテキストの最大長が制限される 具体的に何文字まで可能かは使用ブラウザとGoogleAppEngineの制限に左右される(数百文字なら大丈夫?) (詳しくは知らないけど)解析サーバがGoogleAppEngineの使用制限を越えたら当然使えなくなる 形態素解析JavaScript 形態素解析を行うJavaScript関数群。 やっていることは、ほとんどi
Play framework は Rails ライクな Java のフレームワーク Posted in Groovy & Grails (RSS), Java (RSS) CodeZine で Java の軽量フレームワークが特集されていて、「Apache Wicket」 や 「Apache Click」 と共に、「Play framework」 が紹介されています。「Play framework」 は、RoR(Ruby on Rails) スタイルのWebアプリケーション開発を Java で実現するフレームワークで、テンプレートエンジンには Groovy を使用しています。 関連情報 ・Javaで軽快に使える「軽量フレームワーク」特集 ~本格的なRoRスタイルフレームワーク「Play!」(1):CodeZine ・Javaで軽快に使える「軽量フレームワーク」特集 ~本格的なRoRスタイル
Javaでは、クラス生成やメソッド呼び出しをソース上に直接書いてコンパイル時に決定されるだけでなく、文字列(クラス名)を使ってクラスを生成したり、 メソッド名の文字列を使ってメソッドを呼び出したりすることが出来る。 クラス(インスタンス)生成 [/2015-04-26] Classのメソッド [/2021-03-21] instanceof [2007-02-16] Classからのインスタンス生成(非推奨) [/2018-04-30] インスタンス生成 [/2013-08-06] 総称型による限定 [2007-05-02] 内部クラスのインスタンス生成 [/2008-02-10] メソッド呼び出し staticメソッド実行 [/2017-07-23] メソッド実行(引数なし) [/2017-07-23] メソッド実行(引数あり) [/2017-07-23] 可変引数メソッド [/2015
なぜ、いまScalaなのか? TwitterがScalaを利用しているのは有名ですが、他にも位置情報を利用したfoursquareはScalaで構築されたLiftというWebフレームワークを利用していますし、GTDツールとして有名なRemember The MilkもScalaの利用を検討しているようです。 Scalaは、Java Virtual Machine(以下JVM)上で動くオブジェクト指向+関数型言語です。簡潔で柔軟な記述が可能であり、マルチコアを意識したライブラリがあり、JVMでのスケールメリットを享受できることが、これらの企業で採用に踏み切った理由であると考えられます。 Scalaは、非常にバランスの取れたプログラミング言語です。本連載では、Scalaの基本的な文法を解説しながら、オブジェクト指向と関数型言語を組み合わせたプログラミングスタイルについて、解説したいと思います。
このドメインは お名前.com から取得されました。 お名前.com は GMOインターネット(株) が運営する国内シェアNo.1のドメイン登録サービスです。 ※表示価格は、全て税込です。 ※サービス品質維持のため、一時的に対象となる料金へ一定割合の「サービス維持調整費」を加算させていただきます。 ※1 「国内シェア」は、ICANN(インターネットのドメイン名などの資源を管理する非営利団体)の公表数値をもとに集計。gTLDが集計の対象。 日本のドメイン登録業者(レジストラ)(「ICANNがレジストラとして認定した企業」一覧(InterNIC提供)内に「Japan」の記載があるもの)を対象。 レジストラ「GMO Internet Group, Inc. d/b/a Onamae.com」のシェア値を集計。 2024年5月時点の調査。
What is Balie? features: language identification tokenization sentence boundary detection named-entity recognition see ca.uottawa.balie.test.samplecode.java legal: machine learning using Weka open source software (GNU GPL) Get the latest version! >> Download Balie v1.8 (Ungava release) at SourceForge now! Screenshots:
何回かに分けて書きます。 Twitterにお手製のプログラムから投稿する際には認証が必要です。 この認証の形式、TwitterではBasic認証とOAuth認証が選べます。 が、OAuthが推奨のようです。Basic認証はDepricatedな香り。 OAuth認証についてはネット上それなりに記事が見受けられますが、それを見た感想 「わっかんねえ。。。」 認証が何段階にも別れている上、登場人物が、User、Consumer、Service Providerという風に3人。 実際にプログラムを書いてみてやっと理解しました。 OAuthの仕様はこちら。 http://oauth.net/core/1.0/ 仕組みは簡単にまとめると、こうです。 OAuth Authentication is done in three steps: 1. The Consumer obtains an unau
追記:自分がつぶやければいいだけなら、Twitter4Jでつぶやく練習で紹介している方法が簡単です。 API Version 1.1に対応しました。 辻村浩『 Twitter API プログラミング』(ワークスコーポレーション, 2010)を読みました。形式について言うと、ソースコードが頻繁に折り返していて読みにくい(というかほとんど読めない)のがちょっと残念でした。内容について言うと、OAuth認証を利用する方法をもう少し具体的に書いた方がいいんじゃないかと思いました。OAuth認証は最初の関門なので、すべてのメジャーなプログラミング言語について、具体的な実装を載せておいてくれるととても便利だったはずです。 というわけで、OAuth認証を利用するクライアントの作り方を書いておきましょう。 まず、http://dev.twitter.com/appsでアプリケーションを登録し、Concum
※2010/4/23 sessionのクリアについてご指摘頂き、追記しました。Google App Engine for Java(GAE/J)にて、どんなアプリを使う場合でも (自分的に)ほぼ必須となる設定ファイルのまとめ。 ていうか、リファレンス読めばいーんだけどさ 1.sessionを有効にする & クリアの設定をする Javaでsession使わないケースなんてあるのか? appengine-web.xml に 下記を追加 <sessions-enabled>true</sessions-enabled> GAE/Jでsessionを使う場合、このままだとDatastoreにsession情報が残ったままなので定期的にクリアするcronを設定する web.xml に 下記を追加 <servlet> <servlet-name>_ah_sessioncleanup</servlet-
プログラム上からPDFの文章を取り出したいと思うことがあったので、方法を調べてみた。 PDFBoxというツールを使うと結構いい感じに抽出できた。 以下に簡単なサンプルプログラムを示す。 import java.io.*; import org.apache.pdfbox.pdfparser.PDFParser; import org.apache.pdfbox.pdmodel.PDDocument; import org.apache.pdfbox.util.PDFTextStripper; public class ExtractPDF { private static String extractText(String filePath) throws FileNotFoundException, IOException { FileInputStream pdfStream = ne
Javaネットから切り離されている間に面白いことやってて気になって仕方がなかった。どうしてプログラマに・・・プログラムが書けないのか? コンピュータを一台も持ってないけどプログラマになりたい、という奇妙な人が、それも大量にいますからね.... 皆さんきらびやかな世界を想像していたのに、プログラミングというのが如何に地味な作業なのかを知ってガックリ肩を落として別の業界に転職していきます。という現状を考えると、FizzBuzzを10分で解く人がいたら採用候補のような気がします。すくなくともその言語を多少は知ってるっぽい。RubyとかPerlとかでワンライナーで回答したら、10分かかってたって良さげ。「いまからRuby、いやプログラミング言語勉強します」ってわけではないのは分かる。むしろ「ワンライナーにこだわるとは、こいつ結構スキモノだな」とか思いそう。そういうスキモノ度を計るためにもコードは見
2008年04月06日 SolrのTomcatへのインストールでハマる 早速SolrをTomcat6.0の環境にインストールしてみる。 最初は、IBMの記事を参考にしたのだが、「以下のいずれかの方法で、Solr のホーム・ロケーションを設定します」のあたりで具体的に何をすべきかのかがわからなくなってしまった。 とりあえず、apache-solr-1.2.0.war ファイルはダウンロードしてあったので、これを $TOMCAT_HOME/webapps の下に置いてみたり、TomcatのWebアプリケーションマネージャ(http://localhost:8080/manager/html/)から配備してみたりしたが、いずれも失敗。画面が出るはずのURL(http://localhost:8080/solr/admin/)にアクセスしても、404エラーになってしまう。 Webアプリケーションマ
米Googleは2009年12月30日、Javaのコレクションライブラリ「Google Collections Library 1.0」を発表した。Java 5以上の基本コレクションライブラリで、Java Collections Frameworkの拡張と位置づけている。 Google Collections Libraryは、Javaのコレクション型、実装、関連機能などを集めたもの。List、Set、Mapなどの既存のコレクションフレームワークのユーティリティクラス、MultiMap、MultiSet、BiMapなどの新しいコレクション型、コンカレントハッシュマップビルダのMapMaker、クラスとコレクションのソーティングに必要な共通の作業を支援するメソッドを追加するOrderingなどを含む。 コレクションの振る舞いをカスタマイズできるForwardingSetなどのフォワーディング
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く