Code Archive Skip to content Google About Google Privacy Terms
Matz日記 で紹介されている google-sparsehash を眺めてみた. ひさびさに Google 気分. :~/src/sparsehash-0.8 omo$ wc `find src/google/ -type f` 253 1348 10336 src/google//dense_hash_map 237 1309 9884 src/google//dense_hash_set 238 1244 9616 src/google//sparse_hash_map 223 1214 9245 src/google//sparse_hash_set 919 4776 37957 src/google//sparsehash/densehashtable.h 42 189 1187 src/google//sparsehash/sparseconfig.h 884 4642 371
はてなグループの終了日を2020年1月31日(金)に決定しました 以下のエントリの通り、今年末を目処にはてなグループを終了予定である旨をお知らせしておりました。 2019年末を目処に、はてなグループの提供を終了する予定です - はてなグループ日記 このたび、正式に終了日を決定いたしましたので、以下の通りご確認ください。 終了日: 2020年1月31日(金) エクスポート希望申請期限:2020年1月31日(金) 終了日以降は、はてなグループの閲覧および投稿は行えません。日記のエクスポートが必要な方は以下の記事にしたがって手続きをしてください。 はてなグループに投稿された日記データのエクスポートについて - はてなグループ日記 ご利用のみなさまにはご迷惑をおかけいたしますが、どうぞよろしくお願いいたします。 2020-06-25 追記 はてなグループ日記のエクスポートデータは2020年2月28
修士課程へ進む人は2年間、博士課程へ進む人は5年間、 特定の研究室にお世話になります。 22歳からの数年間は、その後の人生に大きな影響を与えます。 しかし、悲しいことに大学の教授の質はてんでバラバラです。 日本屈指の大学でさえ、電波教授がかなりの割合で存在します。 (電波教授が指すものは、研究能力がなく、それを補うために学生の業績を食い物にしている人です) なるべく、電波教授とは遭遇したくはないものですが、 電波教授を見抜くのは簡単ではありません。 そこで、電波教授の特徴をまとめてみます。 しゃべりが上手い理論が非常に弱い研究室の目標が興味をそそる最近の発表論文に著者名が書かれていない関連分野の研究室と交流が無い比較的新しい分野出張が多い博士課程の学生が多い場合がある 電波教授の武器はしゃべりです。しゃべりによる誤魔化しで生き延びているといっても過言ではありません。 どのような研究をする場
カイ二乗値で単語間の関連の強さを調べる 2007-09-19-1 [Algorithm][Programming] カイ2乗値を使って単語間の関連度を調べる方法。 つまり、関連語を探すときに、χ二乗値を関連度として使う。 perl によるサンプルコード (chiword.pl)。昔、勉強がてら作ったコード。 #!/usr/bin/perl use strict; use warnings; my %cnt; my $pair_num; while (<>) { chomp; next if /^\s*$/; my @list = sort split(/,/, $_); for (my $i = 0; $i < @list; $i++) { for (my $j = $i + 1; $j < @list; $j++) { next if $list[$i] eq $list[$j]; $c
こんにちは satoです。mecabのユーザ辞書を追加したのですが,いろいろはまったので誰かがはまった時のためにメモっておきます。 1)品詞IDの取り方 2)ユーザ辞書の追加方法 3)禁止語句とか独自の要素を付けたい csvファイルの最後に追加すればOK 4)context_id.cpp(88) [it != left_.end()] cannot find LEFT-... ってエラーが出る left-id right-id の文字コードが csvファイルの文字コードと違うのが原因 nkf --utf8とかで文字コードをそろえる 5)CHECK_CLOSE_FALSE(sysdic->isCompatible(*d)) sys.dic と ユーザ辞書の文字コードが違うと出るエラー utf8とUTF8は違うと判定されるのでutf-8と書く 6)追加した辞書に品詞IDが付かない or 65
Railsの開発にMacが支持される理由の1つにTextMateというエディタの存在は大きいでしょう。それほどTextMateは使いやすく、多くのプログラマが愛用しています。 WindowsにもTextMateを模したIntypeというエディタがありますが、常用するには機能不足でした。 そこで今日は、TextMateライクな「E Text Editor」を紹介します。EはTextMateに非常に影響を受けた非常に使いやすいエディタです。 TextMateにもあったProjectTreeがEにもあります。ここで、Projectのファイル構成を確認しながら作業を行うことが出来ます。Intypeに一番欲しかった機能です。また、テーマも複数用意してあり、黒地に白系の色使いもすぐに変更することができます。 TextMateでいう「⌘ + T」の機能が、「Ctrl+Shift+T」で動きます。ファイル
いつも「STARDUST GIRLS BLOGスタ☆ログ」をご利用頂き、ありがとうございます。 夏帆の告知情報になります。 今後とも応援よろしくお願いします。 <ラジオ> 9/6(土)、市川由衣さんのラジオ番組に出演させて頂くことになりました。 9月6日(土)13時〜14時15分 原宿アメブロ放送局(アメスタ)とTOKYO FMの公開収録番組 「Ameba Yu & i」に出演します。 公開スタジオなので、皆さん遊びに来てください。 (地図URL:http://studio.ameba.jp/about_amest.html) 来られない方はWebで番組をご覧になれます。 (アメスタURL:http://studio.ameba.jp/) <DVD> ●『P&Gパンテーンドラマスペシャル かるた小町』現在発売中 ●『東京少女』現在発売中 ●『うた魂(たま)♪』9/12発売 ●『砂時計』11
なんとか自前でトレーニングしてテストできる環境になったので,忘れる前に書いておこう. ディレクトリの初期構造は以下の通り.各exeファイルはOpenCVのインストールディレクトリから取ってこよう(ひょっとするとビルドし直さないといけないかも?). bg/ negative.txt classifier/ positive_samples/ pos_1.jpg pos_2.jpg ... pos_100.jpg negative_samples/ neg_1.jpg neg_2.jpg ... neg_100.jpg test/ lena.jpg test.txt vec/ xml/ createsamples.exe facedetect.exe haarconv.exe haartraining.exe performance.exe positive.txt OpenCVの顔検出プログ
Wekaの日本語情報 データマイニングツールWekaに関する日本語による情報.データマイニングツールとしての使い方なども紹介していきます. weka-jpでは,データマイニングツールWeka*の使い方に関する日本語での情報を提供していきます. Wekaはニュージーランドのワイカト大学において開発されたデータマイニングツールで,分類学習やクラスタリング,相関ルール生成のみならず,データの前処理や視覚化に関する機能も含む統合型ツールです. Wekaに実装された機械学習やクラスタリングのアルゴリズムは他のツールとAPIやCLIを通して利用可能であるため,多くのツールでライブラリとして利用されています. 本サイトでは,利用方法に関する解説記事を作成し,公開する予定です. 記事の作成に関して,より多くの方にご協力を頂きたいと考えております. 更新履歴 2023年11月1日:Weka関連リンクのページ
Browsing System for Weblog Articles based on Automated Folksonomy Tsutomu Ohkura Graduate School of Information Science and Technology, Tokyo University ohkura@r.dl.itc.u- tokyo.ac.jp Yoji Kiyota Information Technology Center, Tokyo University kiyota@r.dl.itc.u- tokyo.ac.jp Hiroshi Nakagawa Information Technology Center, Tokyo University nakagawa@dl.itc.u- tokyo.ac.jp ABSTRACT Folksonomy is a new
Folksonomyの機械化:Blog記事へのマルチタグ付与 大倉 務 清田 陽司 中川 裕志 東京大学 理学部 情報科学科 東京大学 情報基盤センター 東京大学 情報基盤センター ohkura@is.s.u-tokyo.ac.jp kiyota@r.dl.itc.u-tokyo.ac.jp nakagawa@dl.itc.u-tokyo.ac.jp 1 はじめに 1.1 Folksonomy とは 最近、Folksonomy1 と呼ばれる新しい整理法が注目 を集めている。Folksonomy とは、個々のユーザーが自 身の視点でタグ(自由に選んだキーワード)をアイテ ムに付与することで、システム全体としてみれば多様 なタグが個々のアイテムに付与されるというもので、 ユーザーの語彙や視点が分類に反映されるという特徴 をもつ(図 1)。Flickr2 や del.icio.us3 といった
suffix tree にもとづいた n-gram の trie 構造化とその応用 一井 崇∗ 清田 陽司† 吉田 稔 † 中川 裕志 † 1 はじめに 用例や言い換えパタン,質問応答といった,文字列で 表現される情報をコーパスから得るために,文書検索 によって検索語句を含む文書を求め,それらを参照す ることでその情報要求を満たす手法が多数提案されて いる。しかしコーパスが大きくなるにつれ,検索結果 の文書数が膨大になってしまい,すべての文書を参照 することは現実的でなくなってしまった。また 1 文書 の区切りも明確でないことが多く,bag-of-words モデ ルのような,1 文書が意味のよいまとまりになっている との仮定が必ずしも成り立たないことも多い。 そこで,本研究では,同じ文書に現れることよりも文 字や単語列として近接していることをより重要と考え, 近接する n 文字 (もしくは
jQuery、ProtoType、.Netなどのフレームワークを使ったサンプル、デモが豊富にあります。しかも、サンプルをダウンロード可能。サンプルやデモを見ているだけでも、インスピレーションが沸いてきます。 詳細は、以下から。AjaxRain かなりのサンプル数があるので探していた物を見つけることができるかも。タグで分別されているので、探すのは意外と簡単にできそうです。ちなみにサンプルの1ページあたりの表示数を変更できるのですが、100以上を入れると100にされます。 毎月このサイトでAJAXなどを使ったコードのコンテストをしているので、腕に自信のある方は応募してみては。詳しくはこちらから。 AjaxRain.com Rain Fest
Ubicompはユビキタスコンピューティングに関する国際学会で今回が第9回目である。開催地はインスブルック。 今回は紙による予稿集、CD-ROMのほかに論文・ビデオを収録したUSBメモリーが配布された: 採択率 論文の採択率は150件の投稿で29件採録 (19%) で相変わらず競争率そのものは高い。 今回は、以下の三つのカテゴリのどれかを申告して投稿するスタイルをとっている。PCも3分割されていて、まずそれぞれのカテゴリごと論文を審査して、最終的に全体会議で採否を決定する。カテゴリごとの採択率は Experience 11/47 Sensors 8/38 Systems 10/65 となっている。System論文が多い・通りにくいというのはメーリングリストでも議論になっていた。システムアーキテクチャ(ミドルウェア)の論文はオリジナリティ・新規性を示すのが難しい→通りにくい→減少傾向、という
yacc/lexとは Cでプログラミング言語の処理系を実装するのであれば、 多くの場合、yaccとlexというツールを使います。 実のところ、Cとyacc/lexで簡単なプログラミング言語を作る、というのは、 以前、「C言語ヨタ話 」で書いた「 電卓を作ってみよう」 の焼き直しになります。yaccとlexの説明もそちらに簡単に書いたので、 そちらを見てください――と言いたいところですが、 まあここでも軽く説明します。 内容的には重複、というかコピペしている部分もありますが。 プログラミング言語の処理系は、通常、以下のような手順を取ります。 字句解析 ソースプログラムを、「字句(トークン)」の並びに分割する処理です。 構文解析 トークンの並びから、解析木を構築する処理です。 この後、Cなどの機械語を吐くコンパイラや Javaのようなバイトコードを吐くコンパイラなら、 「コード生成」という処理
Screaming Masterpiece: The Trailer 先月観た映画。アイスランドの現代音楽シーンを概観するドキュメンタリー。 映画そのものはなんてことはないバンド紹介+観光案内みたいな内容だったけど、なにぶん簡単な性格なものですっかりアイスランド行きたくなってしまいました。寒いとこっていいよね。 以下、本作のシーンよりお気にのアイスランディックミュージシャンをピック。 Bjork - All is full of love とりあえずアイスランドといえばこの人。オーラ凄いな。 Sigur Ros - Popplagid 映画の冒頭シーンから。シガーロスを代表する名曲。 Mum ムーム。大好きです。 Mugison この人達、買った記憶がないんだけどなぜか音源持ってた。 Quarashi 3年くらい前に流行に乗ってちょっと売れてたミクスチャーバンド。 別に好きではないんだけど
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く