タグ

2006年10月2日のブックマーク (17件)

  • 形態素解析もどきを改良してみた

    形態素解析もどきを改良してみた 「JavaScript形態素解析もどき」を少し改良してみました。今までは漢字、ひらがな、カタカナ、英数字、記号などで分けていただけなので、 「今日はいい天気でした。」 という文章を解析すると 「今日|はいい|天気|でした|。」 となって、「はいい」などと変な区切りができたりしていました。 そこで、助詞で区切ってから、その後で漢字、ひらがな、などで分けるようしてみました。そうすると 「今日|は|いい|天気|で|した|。」 という感じで分けることができます。 ただ、 「とても大きい」 という文章だと 「と|て|も|大|きい」 となってしまったりで、問題もありますが。 JavaScript のソースはこんな感じです。 function SimpleAnalyzer() { this.re = new RegExp; this.re.compile("[一-龠々

    形態素解析もどきを改良してみた
  • エブログ マルコフ連鎖で文章生成(JavaScript)

    マルコフ連鎖で文章生成(JavaScript) マルコフ連鎖による文章生成。マルコフ連鎖と言っていいのかあまり自信はないのだが、とりあえず文章を作ってはいる感じ。 テキストエリアに入力された文章を解析して、その中の単語を使って、自動生成します。文章生成ボタンを何度か押すと文章が変わっていくと思います。 意味不明であったり、そのままの文、同じ文が続けて出たりはしてしまいますが。 メロスは激怒した。必ず、かの邪智暴虐(じゃちぼうぎゃく)の王を除かなければならぬと決意した。メロスには政治がわからぬ。メロスは、村の牧人である。笛を吹き、羊と遊んで暮して来た。けれども邪悪に対しては、人一倍に敏感であった。きょう未明メロスは村を出発し、野を越え山越え、十里はなれた此(こ)のシラクスの市にやって来た。 ここに文章が作成されます。 posted by knit at 19:45 | Comment(9)

    エブログ マルコフ連鎖で文章生成(JavaScript)
  • エブログ JavaScript で形態素解析もどき

    JavaScript形態素解析もどき JavaScript形態素解析のようなものを。 totonの日記 - すべての漢字を取り出す正規表現 「すべての漢字を取り出す正規表現」をPHPで試す:phpspot開発日誌 これらの記事を参考にして JavaScript で漢字、ひらがな、カタカナ、英数字に区切ることをしています。 ただ、文字コード的にちゃんとできるのか、よくわかりません。Seesaa はShift_jis なのでおかしくなる場合もあるかも知れないです。 下のテキストエリアに文章を入力して解析ボタンを押すと解析結果が表示されます。解析というか、単純に改行で区切っているだけですが。 サンプルは青空文庫の太宰治 走れメロスの冒頭部分。 メロスは激怒した。必ず、かの邪智暴虐(じゃちぼうぎゃく)の王を除かなければならぬと決意した。メロスには政治がわからぬ。メロスは、村の牧人である。笛

    エブログ JavaScript で形態素解析もどき
  • http://capsctrl.que.jp/kdmsnr/diary/20060928.html

  • 8maki.jp

    This domain may be for sale!

  • 非検索会議 後編 - pho's blog

    では、最後まで書こう。 茂木さん search and choice 人間はsearchが不得意で、choiceが得意。 不得意なsearchを機械にやってもらっていて、良い仕組み。 脳の学習に終わりはない。学習が続き、サチることはない。 (サチュレート、飽和って実験系の人しかわかんなくない?) 脳の指向性はどんどん変わる。新しい物が出てくると、 前の物が非常に古く見えてしまう。 脳は、utility(効用)ベースで動く 利他的行動のように一見効用を無視した動き(anomalies)も 新しい効用概念であって、常に効用ベース。 というような感じのことを、いきなりはじまってがーーーって話してた。 始めの三人の人もすごい勢いだったが、さらに凄まじい。 良いデザインとは何か 行動し、脳内報酬(ドーパミン)が出てきて、行動が強化される。 そういうサイクルらしい。行動することにより、学習する。 やり

    非検索会議 後編 - pho's blog
  • type5::blog – beyond your ideas.

    昨年(2023年)、人生初めての入院、手術というものを体験した。これはその顛末を記す手記である。 初夏の候、母親に不動産投資を勧めていて良い物件が出たので同行するために帰富していた。せっかくだからというので、旧友と繁華街に飲みに行った帰りのこと。富山の旨い鮨をし、帰りのタクシーに乗り込んだところタバコ(iQOS)がないのに気づく。富山のタクシーは東京のそれと比べてとても煙草臭い。喫煙者あるあるかもしれないが、タバコを吸うくせにタバコ臭いのはきらいなのだ。そのため、早く自分の煙草を吸いたい気持ちと早くタクシーを降りたい気持ちが相まって、自宅から1.5kmほど離れたコンビニで降ろしてもらった。O […] 続きを読む

  • blog.8-p.info: To Search or Not to Search

    「非」検索会議に行ってきた。 六木駅は相変わらず地底奥深くにあるし、ヒルズは LL 階とか何進数だよそれって感じではあったけど、スタッフのひとたちのおかげで無事ヤフーまでたどりつく。エレベーターで茂木さんといっしょになってびびった。 橋さん 自分が使っている「非検索」 フィルタ: 検索結果のフィードなんかを Fresh Reader で読んでます。 みんなに聞く: 検索語が思い浮かばないものが探せる。ブログで聞いてみたり、はてなの人力検索を使ってみたり。 おいしい中華をブログで聞く。おいしい店は混雑すると嫌なので、自分から情報開示していくひとは少ない。情報交換的な give & take があるといい。 デジタルハリウッド大学で、ダイビルの階段数を教室から出ずに求めさせてみたんだけど、みんなばらばらに考えさせて平均値をとってみたら結構あたった。話し合いは Wisdom of Crowd

  • http://takibi.info/ppt/2006/09/web_20.html

  • 検索結果を評価する - アイデ屋

    先日、Yahoo主催の「非」検索会議に行ってきました。 パネラーの一人、増田さんの話で「私たちは常に検索しながら、暮らしている。」という話がありました。 例えば、六木ヒルズに行こうと、まず路線を検索する。駅で切符を買うために料金のボタンを検索する。駅に着いたら、最寄の出口を検索する、という感じ。 そう言われると確かに何をするにも、検索、判別、決定の繰り返し。 橋さんが試しに1日の自分の検索回数をカウントしてみたところ、200回!もあったそうです。 そうなると、より短時間で正確な検索結果を得たいものです。 ★アイデア - 「検索結果の評価」 YahooGoogleをはじめ、沢山の検索エンジンがありますが、中々期待の結果が得られなくてイライラすることもあります・・・ 検索結果の1番目がまったく的外れで、ページを2つ3つ進めてやっと見つけた結果がどんぴしゃ、なんてことも結構ありますよね。

    検索結果を評価する - アイデ屋
  • 「非」検索会議 - はてダ保管所 by ogijun

    増井さんAppleへ!!! しかもその経緯が西堀晋さんのときと同じパターンだ。すごい。むっちゃたのしみです。

    「非」検索会議 - はてダ保管所 by ogijun
  • [O] 非検索会議に行ってきた

  • Hatena ID

  • 本日の一期一会はこの一冊 – 書店で購入した書籍の感想を書いていくブログです。

  • 本日の一期一会はこの一冊 – 書店で購入した書籍の感想を書いていくブログです。

    剃毛することがありましたが、ツルツルになる部分の脱毛に臨みたいですね。 (ちなみに部位はvio)エステ脱毛初心者におすすめなお得なキャンペーンです。 毛の生えかたが癖で外側から内側に丸くうねっててハート型みたいになってしまったり、Tバックなどもおしゃれに着こなすことができるようになり、他社の6分の1の期間である6ヶ月で脱毛するまでのメカニズムがちょっと異なるんですね。 生え揃う前にレーザー当ててくれない。脱毛する時には事前にムダ毛を処理する方法です。 そのような場合は、皮膚科であれば当たり前のことですが、それだと痛みが感じられ苦痛の時間となります。 また、ずっと迷っていて、心なしか肌自体もしっとりしておくと後で肌トラブルの原因となります。 ラココだと他で脱毛卒業が可能です。lacoco(ラココ)での無料カウンセリングはこちらから申し込めます。 欧米ではまだ数が少ない脱毛器を使っているとはあ

  • 本日の一期一会はこの一冊 – 書店で購入した書籍の感想を書いていくブログです。

  • 【勉強】非検索会議への誘い:一人シリコンバレー男:オルタナティブ・ブログ

    今回も、百式さんが主催しました、 非検索会議にいってまいりました! かなりの濃い内容のお話だったので、 頭の中で整理をしつつレポートとしたいと思います。 まずは前編のPassion for the Futureの橋大也と百式の百式管理人の お話をマインドマップでまとめてみました。 自分が話を聞きながらメモを作った限りのものなので、 橋さんや百式さんの意図とは違った表現があるかもしれません。 前半のテーマは「選ばれるサイトとは何か?」がテーマでした。 感じたところとしては、 橋さんのお話をまとめると、検索しなくても、 RSSによる受信の体制や、タグによる検索効率UPによって、 文章を打ち込み検索しなくても自分のほしい情報を手に入れられる環境が 整いだしたと言うところなんでしょうかね。 百式さんのお話としては、 とにかくシンプルにこだわってユーザインターフェースを構築することが、 ユーザ

    【勉強】非検索会議への誘い:一人シリコンバレー男:オルタナティブ・ブログ