並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 15 件 / 15件

新着順 人気順

gosenの検索結果1 - 15 件 / 15件

  • 大規模テキスト処理を支える形態素解析技術(工藤拓氏・Google) - Cafe Babe

    第80回知識ベースシステム研究会を開催したが,二日間で58名の方々に参加して頂き,積極的に議論に加わって頂いた.この場を借りて,参加してくれた方々に感謝したい.大変遅くなった(爆)が,Googleの工藤拓氏による招待講演「大規模テキスト処理を支える形態素解析技術」の概要を,このブログで報告しておきたい.工藤氏の専門分野は統計的自然言語処理と機械学習であるが,日本語形態素解析エンジンMeCabの開発者であり,他にも自然言語処理関連の有益なツールや,Webベースの日本語入力を可能にするAjax IMEのようなユニークなサービスを提供しているなど,時代をリードする研究開発者の一人である.彼の活動に興味があれば,彼のブログ「きまぐれ日記」は必見だろう. なお,当日は弊社側の不手際で,予定していた工藤氏の重要なデモをおこなうことができなかった.弊社はネットワーク会社であるにもかかわらず,ネットワーク

      大規模テキスト処理を支える形態素解析技術(工藤拓氏・Google) - Cafe Babe
    • Unix を使える学生は急速に減っている - 武蔵野日記

      午前3時から NLP(自然言語処理)若手の会シンポジウム・情報処理学会自然言語処理研究会関係の仕事を黙々とする。大学運営関係のお仕事は9月中旬までないので、いまのうちに溜まった仕事を片付け、9月の準備をしておき、10月以降に備えたい(授業が週3コマある)。 (2014-08-21 追記)タイトルだけ見て反応する人が多いので、よくあるコメントについて冒頭で説明しておく。 「最近の若い者はなっとらん」と言っているだけで、教育もしていないなら当然。→8月20日に追記したが、教員なので教育するのが仕事の一部であり、研究室に配属された学生は最初週20時間(1個2時間×10個)の勉強会に出てもらい、それぞれ合計すると演習を解いたりするのに週20時間かかるようなので、合計週40時間基礎勉強に使ってもらっている。(参考: 研究室の勉強会のスケジュール) 必要性がないとやらないのでは?→世の中の99%の人に

        Unix を使える学生は急速に減っている - 武蔵野日記
      • はあちゅう 公式ブログ - 下ネタとセクハラ、表現の自由とハラスメントの境界線について - Powered by LINE

        この件も自分でまとめておきます。 はあちゅう@ha_chu私に童貞というキーワードでたどり着いた人にぜひ読んでほしい本を2冊つぶやきます。1冊目はこちら。 https://t.co/uQH2wD9GT7 2017/12/19 12:56:29 はあちゅう@ha_chu2冊目はこちら。 童貞以外すべてに牙をむく過激派童貞大学生・テツと、そんなテツを時に鋭くツッコみ時にまったりなだめる穏健派童貞大学生・ガクが展開する童貞こじらせ妄想トーク! 「童貞哲学」… https://t.co/yFL2yDEj31 2017/12/19 12:58:36 はあちゅう@ha_chuあと、これも合わせて読んでほしい!この件については以上です! →はあちゅう 過剰な配慮と強すぎる「弱者」に違和感 https://t.co/Nmk7OmXTbd 2017/12/19 13:03:13 田端 信太郎@tabbata

          はあちゅう 公式ブログ - 下ネタとセクハラ、表現の自由とハラスメントの境界線について - Powered by LINE
        • 痛いニュース(ノ∀`) : 小林よしのり激怒 「河西智美の手ブラ写真は聖母と天使の宗教画。これをポルノ扱いする日本はおかしい」 - ライブドアブログ

          小林よしのり激怒 「河西智美の手ブラ写真は聖母と天使の宗教画。これをポルノ扱いする日本はおかしい」 1 名前: ロシアンブルー(埼玉県):2013/01/12(土) 13:19:06.82 ID:qXLDQVTzP AKB48河西智美の写真集が発売白紙になったと今日知った。 上半身裸の胸を男児の手で覆い隠した表紙用の写真が「読者に不快感を与える」と判断されたらしい。ヤンマガみたいなエロい漫画が載ってる青年誌に、この程度の写真が載せられないことにも十分驚いたが、写真集そのものが発売白紙というニュースには、つくづくあきれた。この国のヒステリック・バッシングの流行は、常軌を逸してるんじゃないか? 誰かをイジメてやろう、隙あらばバッシングしてやろうと、「良識」や「正義」を振り回す大衆がどんどん 増えている。昔も『ハレンチ学園』や『ふしぎなメルモ』などで、バッシングはあったが、大概PTAなど

          • ゴー宣ネット道場

            ゴー宣道場 「小林よしのり/2024.2ゴー宣DOJOに来なさい!」動画配信! 令和6年2月1日 SCHEDULE今後の開催予定 第114回2024/2/10(土)14:00~17:00テーマ:ゴー宣DOJO「安倍政権と以後の政局」 第115回2024/3/16(土)14:00~17:00テーマ:ゴー宣DOJO「チェブリンに保守思想を分かるまで教える」 第116回2024/4/20(土)14:00~17:00テーマ:ゴー宣DOJO

            • Java製形態素解析器「Kuromoji」を試してみる

              概要 Javaの比較的新しい形態素解析器、Kuromoji。 lucene-gosenやGomokuのように辞書内包で、jarを落とせばその場で利用でき、Unidicに対応していて、ソースがLuceneのtrunkにコミットされているという、何かと気になる特徴の持ち主。 複数のモードを持っているようで、Searchモードを使うと「日本経済新聞」を「日本 | 経済 | 新聞」のように検索で利用しやすい形にばらして解析してくれたり、Extendedモードを使うと未知語をuni-gramにしてくれたりもするらしい。 今日はそんなKuromojiさんの導入から簡易な使い方までをさらっと追いかけてみた。 導入 まずは下記ページからダウンロード。今回はkuromoji-0.7.5.tar.gzを利用。 Downloads - atilika/kuromoji https://github.com/at

              • AKB さしこが博多に王国を築く恐れがある - ゴー宣ネット道場

                ゴー宣道場 「小林よしのり/2024.2ゴー宣DOJOに来なさい!」動画配信! 令和6年2月8日 SCHEDULE今後の開催予定 第114回2024/2/10(土)14:00~17:00テーマ:ゴー宣DOJO「安倍政権と以後の政局」 2024/3/2(土)18:00~テーマ:「歌謡曲を通して日本を語る」@横浜LIVE 第115回2024/3/16(土)14:00~17:00テーマ:ゴー宣DOJO「チェブリンに保守思想を分かるまで教える」 第116回2024/4/20(土)14:00~17:00テーマ:ゴー宣DOJO

                • 「天皇陛下は安倍政権を批判するな」安倍首相のブレーンである八木秀次麗澤大学教授が天皇陛下を批判!|情報速報ドットコム

                  安倍首相のブレーンである麗澤大学教授の八木秀次氏が天皇陛下の護憲発言について、「両陛下のご発言が、安倍内閣が進めようとしている憲法改正への懸念の表明のように国民に受け止められかねない」というような批判の発言をしていることが判明しました。これは2014年04月01日に発売された「正論5月号」での発言で、八木氏は天皇陛下が護憲を強調していることは安倍政権への批判であり、このような発言を控えるように述べています。 しかしながら、天皇陛下は今まで一度も具体的に安倍政権の名前をあげて批判をしたことはなく、これは八木氏の被害妄想に近いと言えるでしょう。この発言には保守系の方々からも強い批判の声が出ており、漫画「ゴーマニズム宣言」で有名な小林よしのり氏も「根も葉もない言い掛かりだ」と自身のブログ上に書いています。 八木氏は安倍首相のブレーンなので、これを安倍首相側が言わせるように仕向けた可能性があるかも

                    「天皇陛下は安倍政権を批判するな」安倍首相のブレーンである八木秀次麗澤大学教授が天皇陛下を批判!|情報速報ドットコム
                  • 「オオカミが来たぞ」は奥の深い寓話である

                    ゴー宣DOJO 「チェブリン・モン子さん特別インタビュー【2024/3/16 ゴー宣DOJO「チェブリンに保守思想をわかるまで教える」連動】」動画配信! 令和6年2月21日 SCHEDULE今後の開催予定 2024/3/2(土)18:00~テーマ:「歌謡曲を通して日本を語る」@横浜LIVE 第115回2024/3/16(土)14:00~17:00テーマ:ゴー宣DOJO「チェブリンに保守思想を分かるまで教える」 第116回2024/4/20(土)14:00~17:00テーマ:ゴー宣DOJO

                    • 【皇族の人権】佳子さまからの警告「皇族は全員鬱病」「高い塀に囲まれた空間で、幽閉されているのと同じ」 : 哲学ニュースnwk

                      2023年09月07日09:05 【皇族の人権】佳子さまからの警告「皇族は全員鬱病」「高い塀に囲まれた空間で、幽閉されているのと同じ」 Tweet 1: それでも動く名無し 2023/09/07(木) 08:23:03.28 ID:NiUo+muXp 今号の文藝春秋「佳子さまからの警告」を読んだ。 眞子さま結婚をめぐる姉妹の葛藤や、 「重い鬱状態」と表現されている心理状態のこと、 女性宮家の議論が遅々として進まない中、 結婚して皇籍離脱するのか、それとも皇室に残るのか、 延々と決着のつかないままズルズルと長年引きずられて、 どのような苦しみを味わわれているのか、 そしてそのことを国民がまったく理解していないことなどが、 宮内庁幹部、担当記者らの証言からストレートに伝えられている。 「お世継ぎを生まなければ『なぜ生まないんだ』と批判される」 「皇族の人権をどう考えるか」 「高い塀に囲まれた空

                        【皇族の人権】佳子さまからの警告「皇族は全員鬱病」「高い塀に囲まれた空間で、幽閉されているのと同じ」 : 哲学ニュースnwk
                      • Java製形態素解析ライブラリ「lucene-gosen」を試してみる

                        概要 Javaの有名な形態素解析器でありながら、長らく「公式サイトどこ?」な状況だったSenとGoSenですが、最近はlucene-gosenなるGoSenベースのライブラリがちゃんと管理された状態で公開されてるとか。 lucene-gosen http://code.google.com/p/lucene-gosen/ しかもこの子は辞書内包なのでjarを落とすだけで使えて、Lucene用AnalyzerやSolr用Toknizerも付いていて、日本語の検索用インデックスを貼る時に便利な各種フィルタも用意されているという、至れり尽くせりな構成になっているとか。 これは触ってみねばということで、とりあえず簡単な形態素解析、辞書の追加、Luceneでの利用、Solrでの利用を試してみました。 ちなみに上のURLでCommiterのところに名前が出ているKoji SekiguchiさんはSol

                        • 最近残念な橋下徹。頼むから、口を慎め!

                          橋下徹の正論には期待していた。が、下品と権力弱者への暴言が最近ヒドく、目に余る。どうにか諌められないか?悩んだ私は、彼自身の言葉(by 橋下)で諌めることにした。(悪橋下)「小林よしのりや中野剛志に共通するのは批判はするが具体策は一つもないこと by 橋下」(ブーメラン)(年上で面識のない人に向かって)「呼び捨てにすんじぇねえよ。 by 橋下」ここで注目してほしいのは、小林氏は、橋下より年上だという事。もちろん、両方「橋下徹」の発言です。こんな風に橋下暴言と、そのブーメラン発言を紹介。最近、この中野氏の事を橋下は嫌いのようです。(悪橋下)「中野の著書やその他をざっとチェックしたらこりゃ酷いね。(略)ちょっと注目されたらまあ下品で無責任な悪口のオンパレード。批判はするが具体策は一切ない。 by 橋下」(ブーメラン)「官僚として仕事をしそして研究もしている中野剛志の主張は具体的である。 by

                          • Solrの日本語対応 -新しく追加されたトークナイザ・トークンフィルタ- 株式会社ロンウイット

                            先日、Lucene/Solrのbranch_3x(3.6)とtrunk(4.0)にコミットされた日本語向けのトークナイザ・トークンフィルタをご紹介します。 LuceneのJIRAのチケット LUCENE-3305 にて、日本語形態素解析器Kuromojiが導入されました。 これにより、日本語ドキュメントに対して形態素解析に基づく単語分割が可能になります。 従来、Lucene/Solrで日本語対応をする場合は、lucene-gosenやSenを使用する方法などをとってきましたが、今回の対応であらかじめLucene/Solrに組み込まれたものを使用するということが可能になります。 また一方で、LUCENE-2906にて、CJK文字に関するトークンフィルタも追加されました。 本記事では、これらのトークナイザ・トークンフィルタに関して、2012/2/23時点のソースに基づいて調査したものを解説いた

                              Solrの日本語対応 -新しく追加されたトークナイザ・トークンフィルタ- 株式会社ロンウイット
                            • Java製形態素解析エンジン「Igo」を試してみる

                              IgoはJavaで作られた形態素解析エンジンです。 JavaはJVMという閉じた空間で動作する分、Cなどのネイティブアプリと連携する際の安定性や性能がイマイチ。 そのため形態素解析をしたい場合もMeCabを使わずにJava製のものを利用するケースが目立ちます。IgoはJavaで形態素解析をする場合に選択肢の1つとして挙げられます。 @Date 2010/12/18 @Env Igo0.4.2/Fedora14 IgoはMeCabの辞書を利用することができ、ほぼMeCabと同じ解析結果を返すことを意識して作られているそうです(詳細は公式サイト参照)。 Igo - Java形態素解析器 http://igo.sourceforge.jp/ 下記ページによると、実行速度もMeCabと比べてそれほど大きく劣ることはないようです。 Igo : MeCabと形態素解析速度比較 http://d.hat

                              • ゴー宣DOJO

                                ゴー宣DOJO 「『日本人論』 特別映像」動画配信! 令和6年6月2日 SCHEDULE今後の開催予定 特別回2024/7/27(土)14:00~17:30テーマ:「愛子さましか勝たん!」 第119回2024/9/14(土)14:00~17:00テーマ:ゴー宣DOJO 2024/10/5(土)15:00~17:30テーマ:「歌謡曲を通して日本を語る」@福岡LIVE 第120回2024/11/2(土)14:00~17:00テーマ:ゴー宣DOJO in広島

                                1