2010年8月11日のブックマーク (7件)

  • すべての部分文字列を考慮した文書分類

    全ての部分文字列を考慮した文書分類 岡野原 大輔 † 辻井 潤一 †‡§ † 東京大学情報理工学系研究科コンピュータ科学専攻 ‡ SORST, 科学技術振興事業団 § School of Informatics, University of Manchester { hillbig, tsujii }@is.s.u-tokyo.ac.jp 稿では,全ての部分文字列が素性として利用される文書分類モデル,及びその効率的な学習,推定手法を提案す る.文書分類に有効な部分文字列は,単語と異なる場合や,署名やテンプレートなど,非常に長くなる場合が少な くない.しかし,部分文字列の種類数は文書長の二乗に比例するため,それらを素性として直接用いて学習する ことは,計算量的に困難だった.稿では,テキスト長に比例する個数のみ存在する極大部分文字列に関する統 計量を扱うことで,有効な部分文字列を漏れなく

  • Structured support vector machine - Wikipedia

    The structured support-vector machine is a machine learning algorithm that generalizes the Support-Vector Machine (SVM) classifier. Whereas the SVM classifier supports binary classification, multiclass classification and regression, the structured SVM allows training of a classifier for general structured output labels. As an example, a sample instance might be a natural language sentence, and the

    r_kurain
    r_kurain 2010/08/11
  • 「急加速の原因は運転ミス」報道にも喜べない?トヨタの視界を曇らす米連邦大陪審の動向とアウディ5000騒動の記憶

    リコール騒動を巡ってトヨタ自動車に辛く当たってきた米国メディアの論調に変化が見られる。たとえば、ウォールストリートジャーナルは、米当局がトヨタに有利な情報を意図的に公表しなかった疑いがあると報じた。しかし、一度傷ついたイメージの回復が容易ではないことは、1980年代に同じ経験をしたアウディが証明済みだ。また、ニューヨーク州連邦地裁の連邦大陪審はハンドル部品の不具合問題に絡みトヨタに召喚状を送っており、刑事責任を追及される可能性は残されている。トヨタがリコール騒動を過去の出来事として振り返れる日はまだ遠い。(文/ジャーナリスト、ポール・アイゼンスタイン) トヨタにとっては、一歩前進、一歩後退といった状況のようだ。 同社は今、輝かしい過去の評判を汚した一連の安全性問題により自ら招いたダメージを克服しようと苦闘している。 昨年10月のいわゆる「予期せぬ加速」問題を端緒とする一連のリコールが始まっ

    「急加速の原因は運転ミス」報道にも喜べない?トヨタの視界を曇らす米連邦大陪審の動向とアウディ5000騒動の記憶
    r_kurain
    r_kurain 2010/08/11
  • 日本の大学教育が崩壊している 大学生の2割が就職も進学もできない | JBpress (ジェイビープレス)

    文部科学省が8月5日に発表した平成22年度学校基調査(速報)によると、今春、大学を卒業した学生の就職率は60.8%と、昨年から7.6%ポイントも減った。残り4割のうち、大学院進学などを除いた就職も進学もしていない卒業生が16.1%に上る。 この他にも、アルバイトや派遣社員を含めると2割以上が「進路未定者」で、ほぼ同数の留年者がいる。進学者の中にも、就職できずに仕方なく大学院に行った学生がかなりいることを考えると、実質的な「無業者」の比率は3割近いだろう。 慢性的な過剰状態にある大学卒業生 この最大の原因はもちろん不況だが、企業が中高年の過剰雇用を温存して新卒採用で雇用調整を行っている影響も大きい。 日の企業に独特の「新卒一括採用」も批判されているが、これは終身雇用・年功序列などの日的雇用慣行の一部であり、それだけをやめることは難しい。 新卒で「白紙状態」の労働者を多くの職場の転勤で教

    日本の大学教育が崩壊している 大学生の2割が就職も進学もできない | JBpress (ジェイビープレス)
    r_kurain
    r_kurain 2010/08/11
  • 児童虐待についての基本データ : 少年犯罪データベースドア

    2010年08月10日22:52 児童虐待についての基データ 私は少年犯罪データベース主宰であるとともに、子どもの犯罪被害データベース主宰でもありますので、ここらで児童虐待についての基的なデータを示しておきます。 『非行臨床の現場からとらえた子どもの成長と自律』の著者のひとりである前島知子さんが、掲載論文のために厚生労働省の人口動態統計にある死因のうちの年齢別他殺被害者数統計をまとめたものを送ってきていただき、それに刺激されて幼児の中でも殺され方の性質がまったく違う0歳児(嬰児)だけを別に分けたものを私が追加したものがちょうどできあがったところでしたので。 当サイトではすでに嬰児殺(赤ちゃん殺し)と幼児殺人被害者数統計というのをアップしておりますがこちらは警察統計で、昭和47年以降しかありませんし、また未遂事件も含まれています。 厚生労働省の統計は完全に殺された者だけの数が判りますし、

    児童虐待についての基本データ : 少年犯罪データベースドア
  • ごく簡単なHTMLの説明

    HTML来簡単で便利なものです。「30分間HTML入門」で基は十分。まずシンプルに自分の情報を表現してみてください。 You can write a document as simple as you like. In many ways, the simpler the better. -- Tim Berners-Lee 簡単なHTMLの説明 少し詳しいHTMLの説明 XHTMLから次世代ウェブへ 電子テキストで情報発信 簡単なHTMLの説明 だんだん説明の量が増えてきたので、コンパクトな入門ページを用意しました。 基がきちんと分かる30分間(X)HTML入門 HTMLを使った人間・コンピュータ双方にわかりやすい表現 (スライドのHTML版) 何のためのHTMLHTMLは画面をレイアウトするためではなく、文書を環境に依存せずに共有できるように記述するための約束です。そこを正

  • 長文日記

    r_kurain
    r_kurain 2010/08/11