タグ

2020年8月7日のブックマーク (30件)

  • HelpLine

    '/ ' をomniboxに入力してHelpfeel検索する 自分用のヘルプをChromeブラウザのomnibox(URLを表示したり検索を行なったりすることができる画面上部のテキストエリア)で検索できるようになります。 データはScrapboxページに記述します。Scrapboxページ内で 「? xyzに関する説明」 のようなヘルプ文字列を書いておいてHelpLineボタンを押すと、この説明がChromeのデータベースに読み込まれ、omniboxで検索できるようになります。HelpLineをomniboxで起動するには「/ 」(スラッシュとスペース)を押します。 Scrapbox以外のページを表示しているときにHelpLineボタンを押すとダイヤログが表示され、ヘルプ文字列を登録することができます。

    HelpLine
    yuiseki
    yuiseki 2020/08/07
    増井さんの新発明のHelpLineってやつが便利そうなのでいろいろ試してみたい
  • ネット民意 動かすのは誰

    新型コロナウイルスへの政府の対応や検察庁法改正案への批判など、ネット投稿が民意としての影響を強めている。外国人排斥で過激な主張をする「ネトウヨ」(ネット右翼)の存在も注目を集める。 ネット上の民意はどのように生まれ、誰が動かしているのか。日経済新聞社データエコノミー取材班は、東京大大学院の鳥海不二夫准教授、データ分析会社のホットリンクの協力を得て日のツイッター上の投稿状況を分析した。 ※主に政治的な意見を含む投稿を分析対象とし、直近の選挙(東京都知事選)に重なる期間に、候補者に関連するキーワードを含んだ投稿を抽出した。

    ネット民意 動かすのは誰
  • spaCyを使った先進的な自然言語処理 · 無料のオンラインコース

    このコースについてspaCyは産業応用向きの自然言語処理用Pythonライブラリです。この無料のオンラインコースでは、ルールベースと機械学習を用いた先進的な自然言語処理システムをspaCyで作る方法をインタラクティブに学ぶことができます。 私について私はspaCyのコア開発者で、Explosionの共同創業者の一人のInesです。AI機械学習、自然言語処理の最新の開発ツールを専門としており、Web関連のものを作るのも大好きです。 spaCyウェブサイトソースファイルInesのTwitter

    spaCyを使った先進的な自然言語処理 · 無料のオンラインコース
    yuiseki
    yuiseki 2020/08/07
  • 第2章: spaCyによる大量データの解析 · spaCyを使った先進的な自然言語処理

    1データ構造(1) 2文字列からハッシュへ 3Vocabとハッシュと語彙素 4データ構造(2) 5Docオブジェクトを作る 6Doc、スパン、固有表現をゼロから作る 7データ構造のベストプラクティス 8単語ベクトルと意味的類似度 9単語ベクトルの検査 10類似度の比較 11予測とルールの組み合わせ 12パターンのデバッグ(1) 13パターンのデバッグ(2) 14効率的なフレーズマッチング 15国名と関係の抽出

    第2章: spaCyによる大量データの解析 · spaCyを使った先進的な自然言語処理
    yuiseki
    yuiseki 2020/08/07
  • ginza(spacy)で固有表現抽出のtrain - iMind Developers Blog

    概要 固有表現抽出を行いたかったので、spacyでnerのtrainを行ってみる。 例として既存のginzaのモデルでは「10,000円」はMONEYとして抽出されるけど「\10,000」は認識されない問題を解決するモデルを作成。 バージョン情報 ginza==2.2.0 Python 3.7.4 参考ページ ner(Named Entity Recognition)の学習については下記ページを参考にした。 https://medium.com/@manivannan_data/how-to-train-ner-with-custom-training-data-using-spacy-188e0e508c6 ginzaではtrain_ner.pyというスクリプトが用意されている。 https://github.com/megagonlabs/ginza/blob/develop/ginz

    ginza(spacy)で固有表現抽出のtrain - iMind Developers Blog
    yuiseki
    yuiseki 2020/08/07
    こっちのほうが詳しい&コードがきれいだな
  • How to Train NER with Custom training data using spaCy.

    This blog explains, how to train and get the named entity from my own training data using spacy and python. This blog explains, what is spacy and how to get the named entity recognition using spacy. Now I have to train my own training data to identify the entity from the text. In before I don’t use any annotation tool for annotating the entity from the text. But I have created one tool is called s

    How to Train NER with Custom training data using spaCy.
    yuiseki
    yuiseki 2020/08/07
  • Docker

    yuiseki
    yuiseki 2020/08/07
    docker image初めて公開した
  • GitHub - yuiseki/languagecrunch-ja: LanguageCrunch NLP server docker image with Japanese support

    yuiseki
    yuiseki 2020/08/07
    コード置いた
  • 首相、お盆帰省の自粛求めず コロナ、緊急事態再発令を否定 | 共同通信

    安倍晋三首相は6日、広島市内で記者会見し、新型コロナウイルスの感染再拡大に関連して、お盆の時期の帰省自粛を求めなかった。基的な感染防止策の徹底を求めた上で「高齢者の感染につながらないように十分注意してほしい」と呼び掛けた。同時に「直ちに緊急事態宣言を出す状況ではないが、高い緊張感を持って注視し、医療提供体制が逼迫しないようにきめ細かい対策を講じていく」と語った。 新型コロナの感染状況について「重症者数や死者数が大幅に抑えられている」と述べ、4月の緊急事態宣言発出時とは状況が異なるとの認識を示した。

    首相、お盆帰省の自粛求めず コロナ、緊急事態再発令を否定 | 共同通信
    yuiseki
    yuiseki 2020/08/07
    oh
  • レバノンで起きた爆発の威力を物語る衛星写真。爆発前と比較

    Search, watch, and cook every single Tasty recipe and video ever - all in one place! News, Politics, Culture, Life, Entertainment, and more. Stories that matter to you.

    レバノンで起きた爆発の威力を物語る衛星写真。爆発前と比較
  • Dockerを使った軽量なFastAPIの開発環境を構築 - Qiita

    はじめに 最近FastAPIを使う機会がよくあり,Dockerでサクッと構築して使い捨てしたかったので メモとして軽量で構築する方法を残したいと思います. 準備 Docker及びDocker Composeが使える環境

    Dockerを使った軽量なFastAPIの開発環境を構築 - Qiita
    yuiseki
    yuiseki 2020/08/07
  • GitHub - artpar/languagecrunch: LanguageCrunch NLP server docker image

    yuiseki
    yuiseki 2020/08/07
  • Containers & APIs · spaCy Universe

    yuiseki
    yuiseki 2020/08/07
  • GitHub - jgontrum/spacy-api-docker: spaCy REST API, wrapped in a Docker container.

    yuiseki
    yuiseki 2020/08/07
  • spaCyで英文の固有表現認識 - け日記

    今回はspaCyを使って英文の固有表現認識を行ってみます。 GiNZAを使った日語の固有表現認識はこちら↓です。 ohke.hateblo.jp 固有表現抽出 固有表現認識 (named entity recognition: NER) は、文書から固有表現 (named entity) を抽出・分類することです。 固有表現には、固有名詞や、数字を含む表現などが該当します。固有表現は、時事性を持っていたり、数字によって膨大なパターンが存在していたりするため、辞書化が難しいものです。 そのため「辞書には無いけどこれはXに分類される単語だな」ということだけでもわかると、この後のタスクの精度改善に寄与できます。 分類 (ラベル) はいくつか定義がありますが、例えばMUC (参考) で定義されているのは7種類です。 ラベル 例 組織名 IEEE, 阪神タイガース 人名 田中, 所ジョージ 地名

    spaCyで英文の固有表現認識 - け日記
    yuiseki
    yuiseki 2020/08/07
  • はじめての自然言語処理 spaCy/GiNZA を用いた自然言語処理 | オブジェクトの広場

    前回は BERT についてその概要と使い方を紹介しました。今回は自然言語処理ライブラリである spaCyspaCyフロントエンドとする日NLPライブラリの GiNZA について紹介します。 1. 始めに 記事では欧米で有名な自然言語処理ライブラリである spaCy とリクルートと国立国語研究所の共同研究成果である日NLPライブラリ GiNZA について紹介します。記事の前半では、spaCy と GiNZA の概要と日語を処理する際の基的な機能/操作について説明します。後半では、spaCy で提供される文章分類機能について、前回までに紹介した手法も含めて精度を比較してみます。 2. spaCy と GiNZA の概要 spaCy は Explosion AI 社の開発する Python/Cython で実装されたオープンソースの自然言語処理ライブラリで MIT ライセ

    はじめての自然言語処理 spaCy/GiNZA を用いた自然言語処理 | オブジェクトの広場
    yuiseki
    yuiseki 2020/08/07
  • spaCy + GiNZAを使って固有表現抽出とカスタムモデルの学習をしてみる - もふもふ技術部

    自然言語処理をするときはよくRasa NLUを使っているのですが、内部的にはspaCyが使われている模様です。どちらもパイプラインでモジュールをつなげていって自然言語処理をシンプルにするフレームワークだと理解しているのですが、spaCy単独で使うとどういう感じなのか把握したかったんで試してみます。 こちらのエントリを参考にspaCyの基的な動きを確認。 https://qiita.com/moriyamanaoto/items/e98b8a6ff1c8fcf8e293 $ mkdir spacy-ner $ cd spacy-ner 必要なライブラリをインストール。GiNZAはspaCyフレームワークのっかった形で提供されている日語の学習済みモデルを含むライブラリです。簡単にいえばspaCyを日語で動かせるようにするものです。 $ pip install spacy $ pip in

    yuiseki
    yuiseki 2020/08/07
    spaCyで固有表現抽出の精度を高める方法めも
  • What's New in v2.3 · spaCy Usage Documentation

    yuiseki
    yuiseki 2020/08/07
  • 日本語正式サポートされた自然言語処理ライブラリspaCyのStreamlit可視化が超お手軽だった - OPTiM TECH BLOG

    R&D チームの徳田(@dakuton)です。 最近、spaCyの日語版モデルが正式サポートされたのでいろいろ触ってみたところ、解析結果ビジュアライズを全部まとめるStreamlitアプリも同じ月に提供されていることがわかったので、今回はそちらを紹介します。 なお、ビジュアライズ機能の一部(係り受け解析)は1年前の記事「その他」で紹介しています。 tech-blog.optim.co.jp 実行手順 spaCyのUniverseプロジェクトであるspacy-streamlitをインストールします。 pip install spacy-streamlit 起動用スクリプト(streamlit_app.py) import os import pkg_resources, imp import spacy_streamlit models = ["ja_core_news_lg", "ja_

    日本語正式サポートされた自然言語処理ライブラリspaCyのStreamlit可視化が超お手軽だった - OPTiM TECH BLOG
  • 港区議を公然わいせつ容疑で逮捕 高校生に下半身露出か:朝日新聞デジタル

    神奈川県警は6日、東京都港区議の赤坂大輔容疑者(48)=日維新の会所属=を公然わいせつの疑いで現行犯逮捕し、発表した。容疑を否認しているという。 宮前署によると、赤坂容疑者は6日午後1時半ごろ、川崎市宮前区のカラオケ店の駐車場内で、女子高校生3人に「見てくれないか」などと言い、下半身を露出した疑いがある。調べに対し、「右手で性器を隠して、左手でズボンを下ろしていたので見せていません」などと説明しているという。 直前に赤坂容疑者が「いいバイトしない?」などと声をかけてきたため、不審に思った他の女子高校生1人が近くの交番に行き、駆けつけた警察官が逮捕したという。 現在、赤坂容疑者は区議4期目。

    港区議を公然わいせつ容疑で逮捕 高校生に下半身露出か:朝日新聞デジタル
  • SNSは行き場を失った「怒り」の最終処分場。

    先月、「読み手を怒らせて、ビューを稼ごうとするコンテンツには気を付けよう」といったご主旨の記事をbooks&appsで読みました。 「読み手を怒らせて、ビューを稼ごうとするコンテンツ」には、気をつけなくちゃ。 「ちょっと立ち止まる」って来物凄く大事だと思うんですよね。 怒っちゃいけないとは言わないけれど、せめてちょっとだけ確かめてみませんか、操られてないか考えてみませんか、と。ただそれだけで防ぐことが出来た不幸な事件って、実際のところ山のようにあると思うんですよ。 だから我々は、「怒り」という感情のトリガーを他人に明け渡してしまうべきではない。 「煽られる」ことに慣れっこになるべきではない、憤るにしても、自分の意志で、きちんとした情報で、主体的に憤らなくてはならない。 怒りという感情のトリガーは自分のものであるべきで、アジテーターに簡単に煽られ、他人の意のままに怒りを表出するのは違うんじ

    SNSは行き場を失った「怒り」の最終処分場。
  • 原シナイ文字から派生した文字体系 - Wikipedia

    地球上で使われている音素文字 (「アルファベット」と呼ばれることがあるが、厳密な用語法は下記参照) の大多数は、原シナイ文字から派生したものである。ラテン文字 (今日、多数の言語で表記に使っている)、類縁のヘブライ文字、アラビア文字、いわゆるルーン文字 (ゲルマン人のルーン文字とマジャル人のロヴァーシュ文字)、エチオピア文字 (ゲエズ文字)、インドの文字体系であるデーヴァナーガリー、フィリピンやインドネシアの伝統的な文字体系などがある。クリー語のカナダ先住民文字もおそらくそうである。チェロキー文字のように、こういった文字体系の外見をまねて作られたが音節を表記する体系もある。 原シナイ文字から派生したのではない音素文字体系としては、オル・チキ文字、注音符号、メロエ文字等を挙げることができる。 青銅器時代中期の音素文字で最初のものは、エジプトヒエログリフから生じた。 系統[編集] 凡例[編集]

    yuiseki
    yuiseki 2020/08/07
  • 未解読文字 - Wikipedia

    この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。出典を追加して記事の信頼性向上にご協力ください。(このテンプレートの使い方) 出典検索?: "未解読文字" – ニュース · 書籍 · スカラー · CiNii · J-STAGE · NDL · dlib.jp · ジャパンサーチ · TWL(2007年3月) ファイストスの円盤 未解読文字(みかいどくもじ)とは、未だ解読されていない文字体系のことである。 未解読となる原因[編集] 人類は文字を獲得して以来、様々な事柄を文字にして記録に残してきた。昔の人間が書いた内容は様々な学問の分野において価値がある。しかし現在の視点から見て、昔の文字体系の全てが伝えられてきたわけではなく、詳細不明となった昔の文字体系の全てを解明することはできていない。 理由として以下のことが挙げられる。 既知の言語からかけ離れた関係の孤立した言語

    未解読文字 - Wikipedia
    yuiseki
    yuiseki 2020/08/07
  • ロンゴロンゴ:Wikipedia

    ロンゴロンゴ (ラパ・ヌイ語: Rongorongo, [ˈɾoŋoˈɾoŋo]) は、イースター島で19世紀に発見された、文字あるいは原文字と思われていた記号の体系。 概要[編集] ロンゴロンゴの記された24の木片(文字板)が19世紀後半に収集されたが、風雨による損傷や、破損、焼失部分のあるものも多かった。これらは現在、世界各地の博物館に分散しており、イースター島に残っているものはない[注釈 1]。ロンゴロンゴの記された木板は流木など、大きさ、形状が様々なもので、中にはイースター島の首長の杖や、古くから伝わる鳥人信仰に基づいた伝統儀式(ある種の競技)における勝者(tangata manu = 「タンガタ・マヌ」、鳥人と呼ばれる)の小像、伝統的な女性用の三日月形の装飾品「レイミロ」(reimiro)に記されているものもある。また、ロンゴロンゴの短文を含んでいると思われるペトログリフも見つか

    ロンゴロンゴ:Wikipedia
    yuiseki
    yuiseki 2020/08/07
  • 消費減税に首相も関心、税率ゼロ%の方が対応容易=自民・安藤氏

    8月6日、自民党の安藤裕衆議院議員は、ロイターのインタビューに応じ、新型コロナウイルスの影響で苦境にあるあらゆる業界に対する粗利補償を行う必要があり、消費税率をゼロ%に引き下げることが急務との持論をあらためて強調した。写真は都内で6月撮影(2020年 ロイター/Issei Kato) [東京 6日 ロイター] - 自民党の安藤裕衆議院議員は6日、ロイターのインタビューに応じ、新型コロナウイルスの影響で苦境にあるあらゆる業界に対する粗利補償を行う必要があり、消費税率をゼロ%に引き下げることが急務との持論をあらためて強調した。

    消費減税に首相も関心、税率ゼロ%の方が対応容易=自民・安藤氏
  • 欠番の「日本航空123便」が航空機位置情報アプリに出現? 真相をアプリ運営会社と日本航空に聞いた

    8月6日午前0時ごろ、“JL123”というコードの航空便が、航空機の位置情報をリアルタイムに表示するアプリ「Flightradar24」上に現れた。アプリの地図上で成田空港に姿を見せた同便は同日午前1時までに姿を消した。 JL123が表しているのは「日航空123便」。1985年8月12日に日航空123便墜落事故が起きて以来、この便名は欠番となっている。この事態に気付いたアプリユーザーからは、「なぜ存在しないはずの便が表示されているのか」など、困惑の声が上がった。 アプリ上にJL123が現れたのは何かの不具合なのか、それとも──。真相を確かめるため、Flightradar24の運営会社であるスウェーデンFlightradar24と、日航空に取材した。 Flightradar24は「コールサインを受け取っただけ」 なぜアプリ上にJL123が表示されているのかという質問に対し、Flight

    欠番の「日本航空123便」が航空機位置情報アプリに出現? 真相をアプリ運営会社と日本航空に聞いた
    yuiseki
    yuiseki 2020/08/07
    JAL123
  • 欠番の「日本航空123便」がフライトレーダーに出現 ネットも一時騒然、真相は?

    「えっ日航空123便(JL123)って……なんで?」──。民間航空機の現在位置をリアルタイム表示するサービス「Flightrader24」に欠番であるはずのJL123が出現し、「これは一体何……」と話題になっています。 成田空港に突然現れたJL123が話題に この謎の光景を投稿したのはm3600(@m3600)さん。投稿は1万回以上(2020年8月6日現在)リツイートされ、さまざまな憶測や予測、議論がなされています。 Flightrader24で表示されたJL123便の詳細 m3600さんは「自宅付近の上空を通過する貨物便の情報を見ようとしてFlightrader24をスクロールしたところ、偶然発見した」とのことです。 ほぼ同時刻に投稿した神乃木リュウイチ(@kaminogi)さんも「JALの123便が墜落して多数の死傷者を出したのが1985年のちょうどこの時期8月12日で、以降JAL

    欠番の「日本航空123便」がフライトレーダーに出現 ネットも一時騒然、真相は?
  • 高さを「自動的」に調整する枕。快適に眠れる高さがこれならわかる | ZEREMA (ゼレマ)

    ZEREMA (ゼレマ)は、高さを自動的に調整する枕です。 使い方 首の高さは人それぞれです。ですが、枕の高さは普通のものだとそう簡単に変えられません。 変えられるものであっても、快適に眠れる高さというのはわかりづらいです。寝ている間のことで意識がないため、自分ではなかなかわかりません。眠りに入りやすい高さなら自分で試せますが。 高さの合わない枕を使うと、首や背骨のカーブが伸ばされ、寝るのに最適な姿勢を取りづらくなります。そうすると、そのことが快眠を妨げる原因になります。 また、呼吸器が圧迫されて呼吸障害が起こり、いびきが発生することもあります。これでは、周囲の人にまで迷惑をかけてしまいます。 このZEREMA (ゼレマ)ならば、一人一人の首の高さに合わせて高さを自動的に調整してくれるので、快眠することができ、いびきも防げるのです。 この枕は、頭から首、背骨へと続くラインを崩さないように、

    高さを「自動的」に調整する枕。快適に眠れる高さがこれならわかる | ZEREMA (ゼレマ)
  • TypeScript + React: Component patterns

    Published on July 28, 2020 Stefan on Mastodon Reading time: 10 minutes More on TypeScript, React, Preact This list is a collection of component patterns for React when working with TypeScript. See them as an extension to the TypeScript + React Guide that deals with overall concepts and types. This list has been heavily inspired by chantastic’s original React patterns list. Contrary to chantastic’s

    TypeScript + React: Component patterns
  • 真実はペイウォール、嘘は無料

    Current Affairsより。 でたらめの政治経済。 ネイサン・J・ロビンソン ペイウォールは、迷惑なものの正当化されています。優れた文章を書くのにも、ウェブサイトを運営するのにも、写真をライセンスするのにもお金が掛かります。あなたが質の高いものを望むのであれば、たくさんのお金が掛かります。従って、コンテンツにアクセスするための料金を人々に請求することは非常に納得できます。あなたは新聞の定期購読を無料で受け取れるとは思っていないでしょう、では、なぜウェブサイトは違うのでしょうか? 私は雑誌を運営しており、ライターに相応の対価を支払うことがいかに難しいかを知っているので、オンライン・コンテンツのお金を支払わなければならないことに不平を言わないようにしています。 しかし、私たちが気づいたこともあります。ニューヨーク・タイムズ、ザ・ニューヨーカー、ワシントン・ポスト、ニュー・パブリック、ハ