タグ

ブックマーク / srad.jp (7)

  • DiaParserの日本語係り受け解析をGoogle Colaboratoryで動かす | yasuokaの日記 | スラド

    ネットサーフィンしていたところ、DiaParserという係り受け解析ツールを見つけた。Transformers上で、22の言語の係り受け解析をおこなえるらしいが、品詞付与をおこなわずに、元の文に対してダイレクトに係り受け解析をおこなうようだ。とりあえず、DiaParserの日語モデルを、Google Colaboratory上でdeplacyに繋いでみよう。 !pip install deplacy diaparser fugashi unidic-lite ipadic from transformers.tokenization_bert_japanese import MecabTokenizer tokenizer=MecabTokenizer(mecab_dic="unidic_lite") from diaparser.parsers import Parser parser

    gayou
    gayou 2020/11/02
    コードを見る限りでは、結局mecabも使っているようだが。
  • 古典中国語(漢文)の形態素解析・係り受け解析のためのudkanbun | yasuokaの日記 | スラド

    思うところあって、古典中国語(漢文)の形態素解析・係り受け解析をUniversal Dependenciesでおこなうpython3モジュールudkanbunを、PyPIからリリースした。UDPipe・MeCab用の言語モデルを、モジュールに含めておいたので % python3 >>> import udkanbun >>> lzh=udkanbun.load() >>> s=lzh("不入虎穴不得虎子") >>> print(s) # text = 不入虎穴不得虎子 1    不    不    ADV    v,副詞,否定,無界    Polarity=Neg    2    advmod    _    Gloss=not|SpaceAfter=No 2    入    入    VERB    v,動詞,行為,移動    _    0    root    _    Gloss=e

    gayou
    gayou 2019/09/02
    漢文の辞書
  • 現代・古典日本語の形態素解析・係り受け解析のためのunidic2ud | yasuokaの日記 | スラド

    私(安岡孝一)の8月21日の日記で公開したudkanbunを改造して、UniDicのMeCab辞書と、UDPipeのjapanese-gsdモデルが読めるようにした。これをさらに「Chamame2UD.py」と機能統合して、手元に辞書がある場合はローカルで高速に、ない場合はWeb APIを叩くことで低速に、動作するよう書き直してみた。unidic2udというpython3モジュールとして、PyPIからリリースしたので、ぜひ使ってみてほしい。インストールは、とりあえずは % python3 >>> import unidic2ud >>> ja=unidic2ud.load("gendai") >>> s=ja("笑顔で彼は座った") >>> print(s) # text = 笑顔で彼は座った 1    笑顔    笑顔    NOUN    名詞-普通名詞-一般    _    5   

    gayou
    gayou 2019/09/02
  • 世間はまだまだテーブル・レイアウトが主流? | スラド

    kirara(397)曰く、"東京webデザイナー日記で、日経平均銘柄225社サイトの脱テーブル率調査という興味深い報告が掲載されている。同報告では日経平均銘柄225社の全サイトのトップページを調査してあり、レイアウトがCSSかテーブルか、文書型宣言は何か、などが一覧できる。 また、調査結果がグラフにまとめられたレポートがPDFでダウンロードできる。 これは5月18日、銀座で開催されたイベント「CSS Nite」にて発表された資料との事。 PDFを読んでみると、なかなか衝撃的な結果が報告されている。225サイトの調査結果は以下の通り。 「100% pure CSS」なのは28社(12.4%) -->この内「XHTML+CSS」なのは15社(6.6%) 「CSS/テーブル混在(ハイブリッド)」なのは32社(14.2%) 「テーブルのみ」なのは155社(68.9%) 非CSSのうち「100%

  • 「男がセックス以外に考えていること」がベストセラーに。中身は白紙。 | スラド

    「男がセックス以外に考えていること (原題: What Every Man Thinks About Apart From Sex)」がベストセラーになっているそうだ (International Business Times の記事、家 /. 記事より) 。 200 頁に及ぶこの、中身は全て白紙となっており、男はセックス以外には何も考えていないことを示唆している。なお、ベストセラーとなった理由はこれをノートとして使うのが学生の間で流行っていることにあるようだ。

  • 持ち運びできる携帯型カーナビが人気 | スラド

    NHKニュースによると、持ち運びできる携帯型カーナビゲーションシステムが相次いで発売され、価格が比較的安いため人気が出ているそうだ。 三洋電機やソニーなどが製品を発売、歩行者向けの設定を備えた製品や自転車に乗るときにも利用できるような製品などが発売されているとのこと。価格が比較的安いこともあり、去年の出荷台数は98万8000台と、この3年間でおよそ2.5倍に増えたそうだ。 メーカー担当者によると、メディアプレーヤー機能などを備えている点も支持されているそうで、ワンセグテレビなどの機能を搭載させ、地デジへの完全移行を前にした買い替え需要も狙っているとのこと。 持ち運びで使うとなると、もはや「カー」ナビとは言わない気がしますが、皆さんは使ってますか?

    gayou
    gayou 2010/05/06
    カーナビ
  • IPアドレスやCookieなしにユーザを識別する研究 | スラド

    EFF(電子フロンティア財団)はIPアドレスCookieなどを用いず、コンフィギュレーションデータからユーザやそのコンピュータを識別する研究プロジェクトを行っているそうだ(家記事より)。 「Panopticlick」というこのプロジェクトでは、User Agent stringやプラグインのバージョン、フォントといったデータを総合してユーザを識別することは可能かを検証しているとのこと。例えばウェブページ閲覧時に送信されるUser Agent stringにはOSやブラウザの情報など平均10.5ビットの情報が含まれており、これだけでもおよそ1500分の1の確率でユーザを識別できるとのこと。 Panopticlickのサイトでは、ユーザのブラウザ情報などをデータベースと比較して一意に識別できるか診断してくれるWebツールが公開されている。診断時のデータは匿名でデータベースに記録されるため、

    gayou
    gayou 2010/01/30
  • 1