テキストマイニングを使う技術/作る技術 2006-12-28-3 [書評・感想] テキストマイニングの分野で有名なIBMの那須川哲哉氏による入門書。 全編具体的で分かりやすい。 ■那須川哲哉 / テキストマイニングを使う技術/作る技術 ―基礎技術と適用事例から導く本質と活用法 テキストマイニングというと、ブログや掲示板での特定の何かの評判情報 検索など、近年その活躍の場が一般ユーザの目に付くところまで広がって 来ている。 この本はテキストマイニングを支える技術、事例紹介、技術以外の側面 (運用など)はもちろん、「テキストマイニングとは何か」ということ についても初心者にも分かりやすいよう、かなり丁寧に解説されている。 一番重要なポイントが最初の方で述べられてる。これ、大切。 [...]テキストマイニングというものは、あくまで人間が膨大な文書データ を有効活用するた
こんなブログテキストがあったわけですが。 →音楽配信メモ オリコンが自分たちに都合の悪い記事を書いたジャーナリストを潰すべく高額訴訟を起こす 烏賀陽さんはメールの冒頭で「みなさんのお知恵、お力を貸してください。記事にしてください。ブログに書いてください。ウエブサイトに載せてください。メールを転送してください。言いふらしてください」と書いた。 みんなができることは簡単だ。このことをリアルの社会で話のネタにしたり、ふざけるなと憤ってネット上で「今こんなことが起きているんだよ」と広めてくれるだけでいい。それが大きなうねりになれば、オリコンだって態度を軟化させざるを得なくなる。 「みんなができること」より「烏賀陽さんがしたほうがいいこと」を最初に考えて欲しいのだった。 1・「月刊誌「サイゾー」編集部」に送られてきた、という「損害賠償訴訟の訴状」の公開 2・それに対する対応およびコメントやトラックバ
Word2007の文書をテキストに変換する『Docx-Converter』 December 7th, 2006 Posted in 便利ツール(ウェブ) Write comment さてそろそろWindowsもバージョンアップの時期に来ましたね。同時にOffice製品も刷新されるようです。 ただちょっと困ってしまうのがWordの文書形式が互換性のない.docxになってしまう点。今までのOfficeを使っている人にはこのファイルがそのままでは読めません(マイクロソフトから無償で変換ツールが配布されますが)。 そこで登場したのがDocx-Converterです。このサイトでは新形式である.docxファイルを単純なテキストに変換してくれます。複雑な図版入りの文書は無理ですが、とりあえず読んでみたいというときには使えます。もちろん変換ツールを入れるのが一番いいのですが、外出先であったり、そんな時
前回 は各オブジェクトの基本的な特徴を見ただけで終わってしまった。今回はこれらをコンテキストという観点から見てみたい。 前回のまとめ 呼び出し外側のscopeblock中身戻り値 __send____send__不可能(そもそもコンテキストを保存していない)可能保持しないメソッドの戻り値 Method[],call参照不可能可能メソッド本体とselfメソッドの戻り値 UnboundMethod不能参照不可能-本体メソッドの戻り値 Proc[],call,yield参照可能不可能closureProcの最後の値 Continuation[],call-不可能「続き」戻らない Proc#callにおいてブロック付きの呼び出しが不可能であることは前回は記述しなかった。 sshiさんにご指摘いただいた 。 Procを作成するときに指定するブロック仮引数の記述は、メソッド定義の際の仮引数の記述にとて
わたし的棚ぼた一万円選書 急に千葉さんに手渡された封筒、開けてみたら1万円札が1枚。何ごとかと思えば、同期の出張を代わったお礼をもらったらしい。 「葵はワンオペで育児してくれたから」と半分わけてくれました。 泡銭の1万円 これはもう、わたし的1万円選書をしろという思し召しなのでは……
今回のモダシンラジオはここ2週間で観た映画について一人語りする回です。以下の4本の映画について14分48秒程喋っております。 ・ゴールドボーイ ・DOGMAN ドッグマン ・瞼の転校生 ・デューン 砂の惑星PART2 さて、モダシンラジオのデータをホスティングしてもらっているSpotify for Podcasters(旧Anchor)の私のページはこちらです。 https://podcasters.spotify.com/pod/show/kazuyoshi-nagasawa このSpotify for PodcastersページのRSSは以下になります。こちらのRSSではenclosureタグなどでlength値などがしっかり入っているのでこれを購読しておくとよいかと思います。 https://anchor.fm/s/66ff2830/podcast/rss ここで聴く!という人は以下
こんな属性があるのを知らなかった。 実際には、Iframe の属性ではなさそうだが。 どうも、javascript で以下のように指定してあげる事により、 リッチなテキスト編集機能が有効になるようだ。 iframe.contentDocument.designMode = "on"; ちょっとサンプルを作ってみた。 選択範囲の色変えたり、画像貼付けたり出来ます。 http://gomibako.hahaue.com/rth.html (Firefox only) 実際に文字の状態を変化させたりしたい場合は、 同要素の execCommand メソッドを使用すればよい。 たとえば、文字を太字にしたい場合は、 以下のように指定するだけで良い。 iframe.contentDocument.execCommand("bold",false,null); 色を赤くしたければ、 iframe.con
メールや掲示板などの本文へ、罫線を使って記述したテキストの表を挿入したいときに便利なソフト「YFrame」v1.22が、8月31日に公開された。Windows 2000/XPに対応するフリーソフトで、現在作者のホームページからダウンロードできる。 「YFrame」は、「MS Excel」上のデータ、または“|”記号で区切ったテキストデータを、テキスト記述の表へ変換できるソフト。使い方は簡単で、「MS Excel」上などのテキストデータを本ソフトへ貼り付けて[CREATE FRAME]ボタンを押すだけ。あとは、自動生成された表をクリップボードへコピーして、メールや掲示板に貼り付ければよい。 本ソフトで作成した表は、テキスト文字ですべて形成されており、たとえば枠は“┏”“┤”“+”といった罫線や記号を使って記述される仕組み。また、表の各セルで文字の長さが違っていても、自動でセルの大きさを調整し
OPMLファイルやHTML、テキストファイルからの一括登録機能の追加 はてなアンテナで、複数のページを一括で登録する機能を追加しました。OPMLファイルやHTML、またテキストファイルに対応しています。(テキストファイルからはURLと判別できる文字列を抽出します。) 一括登録の確認画面では、一括登録しないページのチェックを外したり、グループ設定を行うことができます。 たとえば、他のはてなアンテナユーザーのOPMLからの一括登録や、これまでRSSリーダーで読んでいたけどサイト単位で更新を取得したいからアンテナに移行する、といったときにお使いいただくと便利かと思います。 OPMLの配信を開始しました はてなアンテナで、ユーザーのアンテナのOPML出力に対応いたしました。 アンテナURLの最後に /opml とつけて、 http://a.hatena.ne.jp/ユーザー名/opml というUR
「セックスワークの非犯罪化を要求するグループ UNIDOS」の構成員であったブブさんを、京都★ヘンナニジイロ祭のゲストとして迎えることについて 2006年9月に行われる京都★ヘンナニジイロ祭では、【前夜祭企画】として「セックスワーカーとカムアウトーー『売女日記』の上映中止をめぐって」というプログラムがあります。このプログラムには「売女日記~お客と一緒に撮るポルノ」の監督であるブブ・ド・ラ・マドレーヌさんをゲストとしてお迎えします。 ブブさんは京都のメトロなどでも長年パフォーマンスを続けてきた人で、セックスワーカーであることを明らかにして表現を続けてきました。 そして、実はブブさんは「セックスワークの非犯罪化を要求するグループ UNIDOS」のメンバーでもありました。 私はこれまで、厳しく「UNIDOS」の運動のあり方を批判してきました。京都★ヘンナニジイロ祭の実行委員の1人でもあるひびのが
米Googleと米eBayは米国時間8月28日に,複数年にわたる広告関連の契約を締結したことを発表した。提携内容には,eBay海外サイト向けのテキスト広告サービスと,無料通話機能の導入が盛り込まれている。 Googleは,eBayの米国外のWebサイト向けにテキスト・ベースの広告を配信する排他的プロバイダとなる。また,eBayの米国および海外サイトにclick-to-call機能を統合する。 click-to-callは,ユーザーが広告主や販売事業者に無料電話をかけられるサービス。広告のリンクやアイコンをクリックするとIP電話が立ち上がり,直接通話が行える。eBay傘下のSkypeのVoIPサービスおよびGoogleの音声対応インスタント・メッセージング・サービス「Google Talk」と連携する。 eBayサイトにおけるGoogleテキスト広告の配信とclick-to-call機能の統
なにが書かれてあるのか、いまひとつよくわからない本を読みつづけるというのは、けっこう忍耐のいることである。むずかしいだろうとは予想していたが、「資本論」はおもった以上に難解であった。読みがすすまない。わからない部分がでてくると、前のページにもどって確認したりもするので、さらに読みは遅々としてすすまない。するとしだいに、かんたんな本を読みたい、すぐに理解できる本を読みたい、というだらしない欲求がわいてくるが、そこをぐっとおさえて「資本論」を読む。おもえばわたしは、「すぐにわかったような気にさせてくれる本」ばかり選んで読んできたのだ。そして、やすっぽい受け売りで、いかにもわかったようなことを口にするのがだいすきなのだった。それはまちがいであった。ごめんなさい。わからないことに耐える。わからないことを慈しむ。それでこその「資本論」通読である。 しかし、「資本論」を読むことにはふしぎなよろこびもあ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く