I’m a software engineer living in San Francisco, constantly trying to level up my BBQ and powerlifting skills. ?? ?️? ?️♀️ ? A year and two blogs ago, I wrote about the way I prefer to organize my Django projects and deployments. Since then, I’ve refined my approach, taking into account the experience I’ve accrued, and the changing nature of Django itself. In this blog post, I’ll share with you
前回のエントリーで予告した通り、今回は「ベイズの定理」です。 事前に断っておきますが、ベイズの定理は簡単です。 内容は小学生レベルの算数ですから、解らなくても自信を持って何回か読みなおせば絶対にわかります。 (わからなかったらコメントに質問してね) ベイズの定理ってなんぞ? ベイズの定理とはトーマス・ベイズ(1702-1761)というイギリスの牧師によって発見されました。 今やベイズの定理はあらゆる所に使われいます、スパムメールを振り分けたり、犯罪捜査に使われたり、マーケティングに使われたり、人工知能に使われたり、沈没しちゃった潜水艦を見つけたり、株の売買に使われたり、結婚相手を見つけちゃったり・・・ ベイズ万能すぎるだろ!! 「ベイズの定理」を理解はしなくても、言葉だけでも覚えていれば何かと便利です。 何かしらの問題に直面した際に、 「ふむ・・・このxにベイズの定理を使えば・・・」 とつ
This domain may be for sale!
Project Gutenberg は小説や詩、論文、教養書、演説原稿などなどなど、著作権切れあるいは著作権のないテキストの一大データベース。主にはやはり英語だが、他の諸言語のデータもそこそこある。 このテキストはまるっと自由に使えるので、文章解析などをやるには宝の山。 だけど、肝心のテキストの前後にヘッダやフッタや、とにかく様々な情報がくっついているのが、かなり難。 ある程度書式を決めといてくれれば良かったのに*1、誰もが自由気まま勝手に制作していて、めっちゃフリーダムでアナーキーなことになっている。 区切りのフォーマットがそもそもファイルによってバラバラだし。 そんな区切りもあればいい方で、なんの区切りもなく「誰がスキャンしました」だの「間違ってるかもしれないからチェックしてね!」だの書いてあったり、最悪の場合、それが本文と空行1つしかあいてないという。 しかたなくそのまま解析したりな
This page is no longer maintained and may contain outdated information. New Website 2020 On August 26 2020, the Project Gutenberg website underwent some major changes. These changes had been previewed since early 2020, and visitors to the old site were invited to try the new site, including giving input via a brief survey. The old site is no longer available. If you found yourself on this page une
Ask questions, get *live* answers from your network! Aardvark finds the perfect person to answer any question in real-time.What is Aardvark? Aardvark is a new kind of tool that lets you tap into the knowledge and experience of friends and friends-of-friends. Aardvark lives on your existing buddylist in your IM program. You send messages to Aardvark just like you do when talking with a friend. How
日本語/English 奥村・船越研究室では,ことばを計算機で処理する技術(自然言語処理)に関する研究と,その技術を用いた応用システムの開発を行なっています. ことばの理解というテーマでは,難しいとされる,意味,文脈理解に関する研究を中心に行なっています.それと同時に,世の中で役に立つシステムの開発も行なっています.具体的には,テキスト要約,人々の意見,感情を分析する評判分析,ソーシャルメディアを対象としたテキストマイニング,人とテキストや音声でやりとりする対話システムなどに関するシステムを開発しています. 奥村教授は2027年3月に定年退職を迎えますので,研究室に関心を持ってくださっている方々は,船越先生にお問い合わせください. 主な研究テーマ | 研究室に加わりたい皆さんへ | アクセス 新着情報 2024/7/21 ACM Multimedia 2024 に以下の論文が採録されました
大量のテキストに使用された要素の頻度を集計し、そのデータを値が大きい順に並べると、その順位(ランク)と頻度の間には次の法則があることがわかっている。 順位×頻度≒定数 この法則を「ジップの法則」と呼ぶ。ジップ(Zipf)は、この研究を1929年から始めたそうである。その結果に関連する主な著書として、Zipf(1935, 1949)がある。当初はPrinciple of Least Effort 用語を用いていた。 ジップの発見した法則は、単語の使用頻度と順位との関係から導き出した法則であるが、言語に限らず何らかの頻度と順位との関係に適用される。 頻度、順位、定数をそれぞれf,r,cで表すと、ジップの法則は次の式で表される。定数cは、データから求めることになる。 表1に、福田総理の所信表明演説文における単語を出現頻度が高い順に並べ、その順位と単語の頻度データを示す。横軸をランク、縦軸を頻度と
結婚カンファレンス2010公式サイト keccon2010.appspot.com/ 撮影:2010-07-03 場所:目黒雅叙園 平成22年5月2日、庄司嘉織さんと永田祐子さんが結婚されました! これを記念して、結婚カンファレンスを開催。 同じ業界の二人だからこそ実現した、披露宴でも二次会でもない、 結婚カンファレンス、略して「keccon」! YouTube動画 www.youtube.com/results?search_query=keccon2010&aq=f Twitterハッシュタグ#keccon twitter.com/#search?q=#keccon read more read less
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く