タグ

ブックマーク / blog.livedoor.jp/tak_tak0 (33)

  • 真の違法・有害コンテンツの所在 : 研究開発

    18歳未満の飲酒、喫煙 ※ 20歳未満でもダメですが、条件をこのように厳しくしてもなおこの件数です。 20歳未満のユーザは当の自分の年齢で登録している場合が多いです。 日記の内容を読む限り、年齢は高い確率で真実です。 逆に、年齢を偽って登録していても、日記の内容を読む限り、明らかにずっと下の年齢であるということが明白な者もいます。 煙草の税収を支えているのは未成年の割合が非常に多いのではないかと思えてきました。 実際、(未成年にも関わらず)煙草増税のことを気にしている者が多数います。 こういう問題があるとなると、 マーケティングの観点からは、 ユーザ(特にリテラシーが低い低年齢)に対しコンテンツの閲覧にフィルタリングをかけるだけではなく、 コンテンツのPOSTにもフィルタリングが必要なのではないかと思います。 「KFCでゴキブリ揚げた」 みたいに、 例え事実ではなくとも冗談では済まないこ

    真の違法・有害コンテンツの所在 : 研究開発
  • 大学新卒者採用における面接評価の構造 : 研究開発

    総合研究大学院大学 複合科学研究科  情報学専攻 卒 博士(情報学) 自然言語処理や機械学習データ分析に関する研究内容とwebシステムの開発と運用について書いています。 シリコンバレーベンチャーみたいに深い技術の事業化をしたいと思っています。 ご興味ある方はご連絡ください。 結論に書かれているのですが、 面接評価において具体的に定量的な評価が行われているわけではなく 客観的でも合理的でもない不明確な理由で評価されているということを肯定しています。 こちらも参照 採用活動における不明瞭な選考基準 大学新卒者採用における面接評価の構造 ]岩脇千裕 独立行政法人 労働政策研究・研修機構 日労働研究雑誌 49(10),2007 90 年代の半ば以降, 大学新卒者(以下「新卒者」)の雇用環境は様変わりした。新卒一括採用の慣行は崩れ, 今日の若者は, 正規雇用され組織の中核的な仕事を担う人々と,

    大学新卒者採用における面接評価の構造 : 研究開発
  • 民間IT企業の研究活動 : 研究開発

    多分この数字より多いです。 小さなメーカーでも、その業界の研究論文は、普通は幾つも書くものです。 民間企業で普通は研究しないみたいな(異常な)風潮になっているのはIT系ぐらいです。 人工知能技術のネットビジネスでの活用 内山幸樹 ホットリンク株式会社 人工知能学会誌 24(4) 2009 私は、2000年に、「ほっとする」情報社会の実現、知識循環プラットフォームの実現を目指し。 ホットリンク株式会社を創業した。今でいうWeb2.0にあたるサービスを当時からつくってきており、 その過程でさまざまな学術機関との連携をおこなってきた。 近年でも、人工知能技術を活用しているベンチャー企業はいくつもあるが、 比較的長い間、人工知能に関する技術を活用する試みを続けてきたと考えている。 ..... 2.1 東京大学石塚教授との出会い 1999年、ソニーがネットだけで完結する販売方法の損害販売会社(現 ソ

    民間IT企業の研究活動 : 研究開発
    denken
    denken 2009/11/11
    「小さなメーカーでも、その業界の研究論文は、普通は幾つも書くものです。 民間企業で普通は研究しないみたいな(異常な)風潮になっているのはIT系ぐらいです。」
  • 研究をやる上で踏まえておくべき非常識 : 研究開発

    総合研究大学院大学 複合科学研究科  情報学専攻 卒 博士(情報学) 自然言語処理や機械学習データ分析に関する研究内容とwebシステムの開発と運用について書いています。 シリコンバレーベンチャーみたいに深い技術の事業化をしたいと思っています。 ご興味ある方はご連絡ください。 東京大学大学院情報理工学系研究科電子情報学専攻 A教授の話 「教科書に書いてあることとか、信じちゃダメだよ。教科書に当のことなんか一つも書いてないんだから」 「偉い先生の言うこととか鵜呑みにしちゃダメだよ。」 「そういう、新しい知識を作り出していくことが君たちの仕事なんだから」 ※補足 「何であんなに会場がすぐ近くにあるのか知ってる?」 「シンポジウムとか終わった後、「こっちです〜」と、僕が先生たちを連れていくわけよ、でも次の会場に付くときにはもう半分ぐらい人数が減ってるんだよ」 「勝手にどっか行っちゃうんだよ」

    研究をやる上で踏まえておくべき非常識 : 研究開発
    denken
    denken 2009/05/07
    かわりもの
  • ネット掲示板の盛り上がりとメッセージ参照関係の可視化を実装 : 研究開発

  • ブログタイトルに注目したsploggerの判別手法 : 研究開発

    総合研究大学院大学 複合科学研究科  情報学専攻 卒 博士(情報学) 自然言語処理や機械学習データ分析に関する研究内容とwebシステムの開発と運用について書いています。 シリコンバレーベンチャーみたいに深い技術の事業化をしたいと思っています。 ご興味ある方はご連絡ください。 という感じの内容を 次の情報処理学会 自然言語処理研究会で発表します。 この研究報告では、ブログの文を見ても、 splogの判定にはほとんど役に立たないということを主張します。 ブログの文なんかを読んで、何が書かれているのかなんかを考えてはいけないのです。 著者はこれまで複製文字列検知によるブログエントリ単位でのsplog フィルタリング手法の研究を行ってきたが,splog を特定するためには,よりシンプルで適切な特徴量があるこということを示す。 実質的にsplogger と呼ばれるユーザがほとんどのsplog

    ブログタイトルに注目したsploggerの判別手法 : 研究開発
    denken
    denken 2009/02/25
    「ブログのdescription、タイトルなどからsploggerを特定する という感じの内容を 次の情報処理学会 自然言語処理研究会で発表します。」
  • 標本の信頼性の計算方法 : 研究開発

    ランダムサンプリングした結果が、どの程度母集団の分布に近いのかを 計算しなければならなくなったので計算しました。 この統計が実際のblogosphere の縮図としての信頼度がどの程度あるのか 大標法による母比率 p の推定を行う. 必要なサンプル数を算出する根拠となっている数式は次の通り N =母集団の大きさ E =許容できる誤差の範囲 P =想定する調査結果 k =信頼度係数 サンプルの値は0 か1 しかとらないものとすると, サンプルの値の平均値がサンプルが1 の確率に等しくなるため,以下の式が成り立つ. 信頼度99%の場合 t値は 2.576 である. このときsplog 率の99%信頼区間は以下の範囲になる. ( 0.257253385 - 0.066179304093958225 ) / 39.3827× 2.576 =0.191074080906041775 / 39.38

    標本の信頼性の計算方法 : 研究開発
  • 日本語 BlogSphere 統計情報 1/28〜2/3 : 研究開発

    splog率は26%ぐらいです。 思ったより減っています。 この期間にサンプル中に 目立った話題は何もありませんでした。 google のミスとか? 浅間山が噴火とか? 節分とか? あまりありませんでした。 風邪、インフルエンザなどは割と多く見受けられました。 学年閉鎖 今回は割と詳しくメモしました。 内容の内訳 ペット       17 (bloggerの)子供   10 体調、健康に関すること 24 体重、体温など、記録  4 ゲーム  18   (オンライン 15 ) (主に競馬)ギャンブル  9 漫画    10 アニメ   7 ジャニーズ  10 料理をした 9 (レシピつき 4 ) コンビニエンスストア小売品 5 〜を買ってきた(※買った、ではない)  5 書籍の感想 10 映画の感想 9 番組の感想 6  (ドラマ 3 / バラエティ 3 ) 音楽   21 (フラゲ 3 /

    日本語 BlogSphere 統計情報 1/28〜2/3 : 研究開発
  • ソーシャルブックマークに関する研究 : 研究開発

    総合研究大学院大学 複合科学研究科  情報学専攻 卒 博士(情報学) 自然言語処理や機械学習データ分析に関する研究内容とwebシステムの開発と運用について書いています。 シリコンバレーベンチャーみたいに深い技術の事業化をしたいと思っています。 ご興味ある方はご連絡ください。 ブックマークをメタデータとして使うということは当り前ですが共通です。 ・リコメンデーション ・情報検索のimprovement ・その他マイニング などが普通です。 特にリコメンデーションが人気すぎますので、 これ以外の利用法を考え出せれば..... "普通"は del.icio.us を用います。 国内だと、 ほとんど b.hatena.ne.jp を用います この研究では Folksonomy という言葉を覚えておいてください 言及されている場合が多いです。 後は、 一般的な(外部からの)タグ付けがなされているデ

    ソーシャルブックマークに関する研究 : 研究開発
  • 求人バーティカルサーチ 転職in : 研究開発

    総合研究大学院大学 複合科学研究科  情報学専攻 卒 博士(情報学) 自然言語処理や機械学習データ分析に関する研究内容とwebシステムの開発と運用について書いています。 シリコンバレーベンチャーみたいに深い技術の事業化をしたいと思っています。 ご興味ある方はご連絡ください。 半年前から準備してたサービスがやっとリリースされました。 これを作る過程で様々なノウハウが得られた気がします。 転職IN http://tenshoku-in.jp/ 地方の求人情報を自動収集 求人検索「転職in」 - ITmedia News こう言っては何ですが世界不況を追い風に出来ればいいですね。 求職している人、どなたも、どうぞご利用ください。 また逆に、人手不足だけど人材募集にお金をかけられない企業は人材を採用する機会です。 自社サイト内に好き勝手に求人情報を載せるだけで十分です。 後はこちらで何とかすると

    求人バーティカルサーチ 転職in : 研究開発
    denken
    denken 2008/12/18
    taktakさんも.inサービスを手がけるほどのムーブメント
  • FreeTTSで音声合成 : 研究開発

    FreeTTSを使えばjava音声合成音声認識ができます。 もっともシンプルなデモは freetts-1.2.1/demo/freetts/HelloWorld/FreeTTSHelloWorld.java です。 実行時にパスを通す必要があるファイルはこれらだと思います。 freetts-1.2.1\lib\freetts.jar freetts-1.2.1\lib\cmu_us_kal.jar freetts-1.2.1\lib\cmulex.jar 実行時に音声を指定するオプションが必要です。 -Dfreetts.voices=com.sun.speech.freetts.en.us.cmu_us_kal.KevinVoiceDirectory これが音声データであり、 kevin, kevin16 にあたります。 実際に音声が入っているのは freetts-1.2.1\lib\

    FreeTTSで音声合成 : 研究開発
  • 排除率は9割以上!エージェントシステム開発のホットリンク高性能スパムブログ排除技術を開発 : 研究開発

    総合研究大学院大学 複合科学研究科  情報学専攻 卒 博士(情報学) 自然言語処理や機械学習データ分析に関する研究内容とwebシステムの開発と運用について書いています。 シリコンバレーベンチャーみたいに深い技術の事業化をしたいと思っています。 ご興味ある方はご連絡ください。 http://www.hottolink.co.jp/entry298.html わたくしのsplog filterの技術を導入したシステムです。 スパムちゃんぷるーなんかよりも圧倒的に優れていると自負しています。 日経産業新聞に取り上げられました。 あまり知られていないですが、ユーテラス という社もこういうシステムを開発しています。 社長 成澤氏はわたくしよりも前からsplog対策の研究をしています。 サービスの提供も、企画中であったか、もうすでに行っているのか、という段階だったはずです。 ------------

    排除率は9割以上!エージェントシステム開発のホットリンク高性能スパムブログ排除技術を開発 : 研究開発
    denken
    denken 2008/11/08
    「splog filterの技術を導入したシステムです。 スパムちゃんぷるーなんかよりも圧倒的に優れていると自負しています。」
  • 危険なコンテンツを自動的に検出する : 研究開発

    総合研究大学院大学 複合科学研究科  情報学専攻 卒 博士(情報学) 自然言語処理や機械学習データ分析に関する研究内容とwebシステムの開発と運用について書いています。 シリコンバレーベンチャーみたいに深い技術の事業化をしたいと思っています。 ご興味ある方はご連絡ください。 犯罪を事前に予知するの続きです。 というわけで作りました。 alarming description 今はブログエントリしか見ていません......原理的には、どんなコンテンツにたいしても(※wwwに限らず)適応できます。 当は、当に危険なコンテンツはこんな表層には出てこないでしょう。 何度も主張しているように、webダークマターを見なければいけないのです。 ネット上の「犯行予告」を止める一番の近道は 秋葉原事件の容疑者は携帯向けのマイナーな掲示板サイトを利用していた。あらゆる予告に対応するためには、ネット上のあ

    危険なコンテンツを自動的に検出する : 研究開発
    denken
    denken 2008/11/07
    「予告.inなんかみたいな安直なシステムと違う点として、何よりも 悪質なキーワードだけでフィルタリングをかけようとする安直すぎる方法であると、 余計なものがいくらでも引っ掛かります。」
  • 商品レビューなど自動まとめ : 研究開発

  • 報道機関の名前 : 研究開発

    総合研究大学院大学 複合科学研究科  情報学専攻 卒 博士(情報学) 自然言語処理や機械学習データ分析に関する研究内容とwebシステムの開発と運用について書いています。 シリコンバレーベンチャーみたいに深い技術の事業化をしたいと思っています。 ご興味ある方はご連絡ください。 全世界のニュースメディアを調べていたのすが、名前のつけ方は全世界的にほとんど変わりありません。 通信社 日 (普)共同通信 (普)時事通信 アメリカ (普)AP通信(Associated Press) つまり、無理に日語訳すれば「共同通信」ということです。 (固)ブルームバーグ 中国 (普)新華社通信 フランス (普)AFP(Agence France Presse) イギリス (固)ロイター通信 ロシア (普)インタファクス通信(Interfax) (普)の社名は、見ての通り、ほとんど普通名詞の積み重ねだけの社

    報道機関の名前 : 研究開発
    denken
    denken 2008/10/23
    「報道各社の名前は、全世界的に、名前自体に全然意味がないのです。」
  • blogに書かれる話題の統計的傾向は? : 研究開発

    denken
    denken 2008/10/16
    「とりあえず、あなたのblogに書かれていることを分析します。を作りました。」
  • ブログ通信簿の内部的処理② : 研究開発

    denken
    denken 2008/10/14
  • 行動ターゲティング広告、インターネットマーケティング研究 : 研究開発

    総合研究大学院大学 複合科学研究科  情報学専攻 卒 博士(情報学) 自然言語処理や機械学習データ分析に関する研究内容とwebシステムの開発と運用について書いています。 シリコンバレーベンチャーみたいに深い技術の事業化をしたいと思っています。 ご興味ある方はご連絡ください。 知らない人のために念のために記述すると、DEWSとは、 電子情報通信学会 データ工学研究専門委員会の第二種研究会として毎年3月に開催されるデータ工学ワークショップです。 明日の広告 変化した消費者とコミュニケーションする方法 (アスキー新書 045) (アスキー新書 45) ----------------------------------------------------------- インターネットマーケティングの基礎と現状 田村直樹 NTTデータ  ※2006年12月 現在ではバナー広告のクリック率は 0.

    行動ターゲティング広告、インターネットマーケティング研究 : 研究開発
  • splog対策 各社からの回答? : 研究開発

    総合研究大学院大学 複合科学研究科  情報学専攻 卒 博士(情報学) 自然言語処理や機械学習データ分析に関する研究内容とwebシステムの開発と運用について書いています。 シリコンバレーベンチャーみたいに深い技術の事業化をしたいと思っています。 ご興味ある方はご連絡ください。 各社からの回答? blog/splog統計情報 御社は当にsplog対策を行っていますか? 御社のコンテンツを監視していると、 どう見ても自社サイトへのアクセス増加のために 意図的にsplog(など違法コンテンツ)を見過ごしているようにしか思えません。 御社は当にsplog対策を行っていますか? このような文面で問い合わせをしました。 問い合わせを行ったCSPは Livedoor, 楽天-infoseek,JUGEM,FC2,Cocolog,Goo です。 ・JUGEM 回答がありません。 ・Cocolog 回答

    splog対策 各社からの回答? : 研究開発
    denken
    denken 2008/09/05
    baiduは話を聞いてくれるだけいい会社だな
  • 日本語blog研究 : 研究開発

    総合研究大学院大学 複合科学研究科  情報学専攻 卒 博士(情報学) 自然言語処理や機械学習データ分析に関する研究内容とwebシステムの開発と運用について書いています。 シリコンバレーベンチャーみたいに深い技術の事業化をしたいと思っています。 ご興味ある方はご連絡ください。 blog(を通したwebコミュニケーション、webコミュニティ)とかの研究をしたいなら、こういうところから調べればいいでしょう まず、 splogblog統計情報 とか見ておいてください。 blogからのバズマーケティングの論文は割とあるのですが、 文系アプローチだと、 何だかんだ言うだけ言って、何か作るわけでもないんですが、 理系アプローチでも、そのようなものが多いです。 Blog ビジネスの可能性 NTTデータ ビジネスイノベーション部 藤村剛 あまり、定式化できない問題を取り扱ったり、システム開発的研究だっ

    日本語blog研究 : 研究開発