タグ

2009年6月23日のブックマーク (14件)

  • フリーランスのIT技術者を支援するオンラインツール32選

    印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます 昨今の厳しい経済情勢の中、数多くのITプロフェッショナルが必要に迫られて、あるいは自身の選択によって、フリーランスの道を選んでいる。そこで記事では、そういった道を選んだ彼らを支援するオンラインツールを32個選び、紹介する。 雇用情勢の厳しい中、数多くのITプロフェッショナルがフリーランスという道を選んでいる。こういった人たちのなかには、自らの選択でその道に飛び込んだ人もいれば、職を失って仕方なくその道に入ったという人もいる。 フリーランサーとして成功できるかどうかは、当人がどれだけ自分を売り込めるかということにかかっている。とはいうものの、フリーランサーとしての日々を楽にしてくれる素晴らしいオンライツールが数多く存在しているのである。

    フリーランスのIT技術者を支援するオンラインツール32選
    rin1024
    rin1024 2009/06/23
  • 1Uラックマウント可能なサーバを自作する - marqs blog

    はてなでは以前から自社製サーバを使用しているのですが、今年の春に、新たに自社製1Uハーフサーバを開発しました。 最近、タワー型だとメーカー製でもかなり安価なサーバがあるのですが、データセンターでの運用を考えると1ラックへの集積度が問題になってくるので、必然的にラックマウント可能なサーバが求められます。1Uサーバの中で価格対性能比のよいものを探すと、まだまだはてな的に使いやすいサーバが少ないので、今回このような1Uラックマウント可能なサーバを自社開発しました。 さてこのサーバの特徴としては、 ケーブル類がフロントアクセス 組み立て簡単 いけてるインフラアルバイトのid:hxmasakiが組み立てると15分 1ラックに60台以上搭載可能 もちろん、電源容量との兼ね合いもあります ディスクのホットスワップが可能 低消費電力 お値段据え置き 以前の自社製サーバとほぼ同価格 といったところがあげられ

    1Uラックマウント可能なサーバを自作する - marqs blog
    rin1024
    rin1024 2009/06/23
    みによんくのシャーシなら売れるよ!あれ?
  • DBSJ Journal論文のスタイルファイル(MS Word版)-16ポイント

    rin1024
    rin1024 2009/06/23
  • dews.pdf

    rin1024
    rin1024 2009/06/23
  • 出現頻度と連接頻度に基づく専門用語抽出

    出現頻度と連接頻度に基づく専門用語抽出 論文では,専門用語を専門分野コーパスから自動抽出する方法の提案と実験的評価 を報告する。論文では名詞 ´単名詞と複合名詞µ を対象として専門用語抽出につい て検討する。基的アイデアは、単名詞のバイグラムから得られる単名詞の統計量を 利用するという点である。より具体的に言えば、ある単名詞が複合名詞を形成するた めに連接する名詞の頻度を用いる。この頻度を利用した数種類の複合名詞スコア付け 法を提案する。ÆÌ Áʽ ÌÅÊ テストコレクションによって提案方法を実験的に 評価した。この結果、スコアの上位の ½¸ ¼¼ 用語候補以内、ならびに、½¾¸¼¼¼ 用語候 補以上においては、単名詞バイグラムの統計に基づく提案手法が優れていることがわ かった。 キーワード 用語抽出,専門用語,単名詞,複合名詞 Ì ÖÑ ÜØÖ Ø ÓÒ × ÓÒ Ç ÙÖ

    rin1024
    rin1024 2009/06/23
    あ、こっちは誤植が無いw
  • Web上の情報からの人間関係ネットワークの抽出

    rin1024
    rin1024 2009/06/23
    共起情報を用いている
  • 出現頻度と連接頻度に基づく専門用語抽出 - yasuhisa's blog

    この前の続き。先週の週末にやるつもりだったけど、暇がなかった。 MeCabで区切った単語を再びつなげる - yasuhisa's blog 前回の流れとしては 専門用語を一つの単語として取ってくるのは難しい MeCabを使うと細かくなりすぎる 専門用語には名詞のsequenceが多そう じゃあ、名詞つなげてみればいいんじゃね? ということで名詞を繋げてみるだけというところをやりました(それだけ。。。)。id:niamさんがコメントしてくださったように"出現頻度と連接頻度に基づく専門用語抽出",自然言語処理, 2003を使うと専門用語らしさ(?)のようなスコア付けができるようなので、それをやってみることにしました。とりあえずp6のLR(CN)のところまでを実装。あとはスコア付けの関数を2つくらい用意して、評価指標の関数を用意すれば、という感じです。 # -*- coding: utf-8 -

    出現頻度と連接頻度に基づく専門用語抽出 - yasuhisa's blog
    rin1024
    rin1024 2009/06/23
    重要語抽出
  • 森研究室 - 専門用語自動抽出システム(配布)

    1. はじめに 自動用語抽出は専門分野のコーパスから専門用語を自動的に抽出する技術として位置付けられます。従来、専門用語の抽出は専門家の人手によらねばならず、大変に人手と時間がかかるため up-to-dateな用語辞書が作れないという問題がありました。そこで東京大学情報基盤センター中川裕志教授と横浜国立大学環境情報研究院森辰則研究室は、共同で、与えられた特定分野のコーパスのみの情報から専門用語を特定、抽出するシステムを開発してきました。システムは、その成果をプログラムとして広く公開するものです。 2. 原理 専門用語の多くは複合語、とりわけ複合名詞である場合が大半を占めています。よって、システムでは名詞(単名詞と複合名詞)を対象として専門用語抽出を行います。 まず対象となるコーパスから専門用語の候補となる語を抽出します。候補語は、名詞句が連続した複合名詞、または単名詞となります。単名詞

    rin1024
    rin1024 2009/06/23
    重要語抽出
  • ”専門用語(キーワード)自動抽出システム”のページ

    1.専門用語(キーワード)自動抽出システムとは? 当サイトでは、専門用語(キーワード)自動抽出システムの基システムおよび応用システムを提供しています。 専門用語(キーワード)自動抽出システムとは、単なる文章の単語分割ではありません。一般に文章中では複数の単語の組み合わせで複雑な概念を表す場合が多く、文章の内容が専門的な事項に特化すればその傾向はさらに顕著なものとなるでしょう。したがって文章中からキーワードを抽出する場合、単語分割機能だけでは意味を成しません。そこで、このシステムでは、(1)形態素解析プログラムによる単語分割、(2)複合語の作成、(3)文章中における重要度の計算、という3つのステップを踏むことで、複合語により複雑な概念を表すことが多い専門用語をキーワードとして文章中から抽出することに成功しました。 自作の文章からキーワードを抽出したい! メタデータ作成のためにウェッブサイト

    rin1024
    rin1024 2009/06/23
    重要語抽出
  • 専門用語(キーワード)自動抽出用Perlモジュール "TermExtract"の解説

    はじめに  テキストデータから、専門用語を取り出すためのPerlモジュール"TermExtract"を解 説します。 日語の文章中から単語を切り出す定番のソフトとして、「茶筅」や「案山子」があ りますが、そのまま専門用語の抽出に使うには次の2つの問題があります。 ひとつは、複合語に対応していないことです。専門用語の多くは単語を組み合わせて、 複雑な概念を表すことが多くなります。特に「茶筅」の場合は単語を品詞単位で細かく 分割するため、そのまま使うには難があります。 もうひとつは、どの用語が重要であるか判断する仕組みを持たないことです。 その問題点を解決したソフトに東京大学・中川裕志教授、横浜国立大学・ 森辰則助教授が作成した「専門用語自動抽出システム」があります。 それは、1)「茶筅」の形態素解析結果を複合語に組み立て、2)その複合語(単語の場 合もある)を重要度の高い順に返すものです。

  • 企業に対するニュースの 影響予測のための重要語抽出

    rin1024
    rin1024 2009/06/23
    重要語抽出
  • 専門用語(キーワード)自動抽出サービス 「言選Web」

    このページでは文章中から専門用語(キーワード)を切り出すことができます。文章中から厳選された言葉を選んでくれますからその名の通りゲンセンWebなのです! このシステムは専門用語自動抽出用Perlモジュール"TermExtract"の機能を、Web上で提供するものです。ただしスタンドアロン版と比べて利用できる機能に制限があります。 次のいずれかで専門用語(キーワード)を切り出すデータを指定します。 Web上のhtml化された文章もしくはPDFをURLで指定 文章を直接入力するか貼り付ける Windows上のテキストファイル、もしくはPDFを指定 入力ボックス下のチェックボックスから和文、英文を選択。 専門用語(キーワード)抽出ボタンをクリック しばらくすると専門用語(キーワード)が重要度の高い順に表示される。 ●URL指定は右の欄へ ●文章を入力もしくは貼り付けてる場合は下の欄へ ●お使いの

  • ジップの法則 - Wikipedia

    ウィキペディア(30ヶ国語版)における単語の出現頻度 ジップの法則(ジップのほうそく、Zipf's law)あるいはジフの法則とは、出現頻度が k 番目に大きい要素が、1位のものの頻度と比較して 1/k に比例するという経験則である。Zipf は「ジフ」と読まれることもある。また、この法則が機能する世界を「ジフ構造」と記する論者もいる。 包括的な理論的説明はまだ成功していないものの、様々な現象に適用できることが知られている。この法則に従う確率分布(離散分布)をジップ分布という。ジップ分布はゼータ分布(英語版)の特殊な形である。 この法則はアメリカ言語学者ジョージ・キングズリー・ジップに帰せられている。ジップ以前に似た観察をしていた先行研究としてFelix Auerbach(英語版)、Jean-Baptiste Estoup(フランス語版)などの研究があり、ジップ自身もそのことを1942年

    ジップの法則 - Wikipedia
    rin1024
    rin1024 2009/06/23
    経験則
  • Tutorial_ja - bayon - Google Code

    Code Archive Skip to content Google About Google Privacy Terms

    rin1024
    rin1024 2009/06/23
    "bayonは汎用的に利用できるデータクラスタリングツールで、現在は Repeated Bisection法 と K-means法 に対応しています。 " ばよえーん