タグ

ブックマーク / www.mwsoft.jp (2)

  • JavaのHTTP通信でプロキシを使う

    概要 通信先によってプロキシを切り替える(社外はプロキシ、社内はダイレクトみたいな)要件に出くわしたので、この機にJavaのプロキシの設定方法をいろいろ調べてみた。 System.setPropertyで設定したり、URLのopenConnection時に設定したり、ProxySelectorを使ったり、いろいろな方法があるようだ。 下準備A - パケットキャプチャ パケットキャプチャを導入すると、プロキシが使われているか簡単にチェックできる。例ではWiresharkを利用。 http://www.wireshark.org/ 以下はUbuntuでのインストールと簡易な実行例。 // インストール $ sudo apt-get install tshark // eth0のポート80とプロキシで使う予定のポート(下記例では8080)のhttp通信を監視してみる $ sudo tshark

    tinsep19
    tinsep19 2013/12/03
    こんな感じでやるのか。java.net.ProxySelector
  • 日本テレビ東京で学ぶMeCabのコスト計算 | mwSoft

    今回はこの言葉の解析をMeCab+NAIST辞書にお願いして、結果を分析することで、MeCabが行っているコスト計算について勉強してみたいと思います。 とりあえず実行してみる さっそくMeCabに「日テレビ東京」を解析してもらいましょう。 $ echo 日テレビ東京 | mecab 日 名詞,固有名詞,地域,国,*,*,日,ニッポン,ニッポン,, テレビ東京 名詞,固有名詞,組織,*,*,*,テレビ東京,テレビトウキョウ,テレビトーキョー,, EOS 「日 | テレビ東京」と分けていますね。視聴率的には負けていますが、NAIST辞書的には日テレビよりもテレビ東京が優先されたようです。 ちなみに「フジテレビ東京」ではどうなるでしょうか。 $ echo フジテレビ東京 | mecab フジテレビ 名詞,固有名詞,組織,*,*,*,フジテレビ,フジテレビ,フジテレビ,, 東京 名詞,

    tinsep19
    tinsep19 2010/03/08
    連接コストのこの微妙な数値の決定方法はどうやって決めたんだろう。
  • 1