manboubirdのブックマーク / 2021年4月4日 - はてなブックマーク

manboubird id:manboubird

2021年4月4日のブックマーク (31件)

(PDF) Differentiated Fashion Recommendation Using Knowledge Graph and Data Augmentation
manboubird 2021/04/04
knowledgeGraph

fashion

recommendation

paper
リンク
Introducing our Hybrid lda2vec Algorithm | Stitch Fix Technology – Multithreaded
The goal of lda2vec is to make volumes of text useful to humans (not machines!) while still keeping the model simple to modify. It learns the powerful word representations in word2vec while jointly constructing human-interpretable LDA document representations. We fed our hybrid lda2vec algorithm (docs, code and paper ) every Hacker News comment through 2015. The results reveal what topics and tren
manboubird 2021/04/04
lda2vec

stitchFix

lda

fashion

topicModel

python
リンク
Improving search experience with a taxonomy in the fashion domain
manboubird 2021/04/04
farfetch

knowledgeGraph

ontology

search

fashion

slide
リンク
Personalized Clothing Recommendation Based on Knowledge Graph
manboubird 2021/04/04
knowledgeGraph

paper

fashion

recommendation

ontology

clothing
リンク
Deep Text Mining of Instagram Data Without Strong Supervision
manboubird 2021/04/04
paper

instagram

dataMining

sns
リンク
Representing Fashion Product Data with Schema.org: Approach and Use Cases
manboubird 2021/04/04
paper

ontology

fashion

schemaOrg

knowledgeGraph
リンク
Training Mask RCNN on Cloud TPU (TF 2.x) | Google Cloud
manboubird 2021/04/04
tensorFlow

maskRcnn

googleCloudPlatform
リンク
Cloud TPU（TF 2.x）での Mask RCNN のトレーニング | Google Cloud
フィードバックを送信 Cloud TPU（TF 2.x）での Mask RCNN のトレーニングコレクションでコンテンツを整理必要に応じて、コンテンツの保存と分類を行います。概要このチュートリアルでは、COCO データセットで Cloud TPU を使用して Mask RCNN モデルを実行する方法を示します。 Mask RCNN は、コンピュータビジョンの難しい課題の 1 つであるオブジェクト検出と画像セグメンテーションに対応するように設計されたディープニューラルネットワークです。 Mask RCNN モデルは、画像内の個々のオブジェクトそれぞれのインスタンスに対し、境界ボックスとセグメンテーションマスクを生成します。このモデルは、Feature Pyramid Network（FPN）および ResNet50 バックボーンに基づいています。このチュートリアルでは Te
manboubird 2021/04/04
tensorFlow

maskRcnn
リンク
Knowledge Graphs – Communications of the ACM
Key InsightsData was considered a material object, tied to bits, with no semantics per se. Knowledge was traditionally conceived as the immaterial object, living only in people’s minds and language. The destinies of data and knowledge became bound together, becoming almost inseparable, by the emergence of digital computing in the mid-20th century.Knowledge Graphs can be considered the coming of ag
manboubird 2021/04/04
knowledgeGraph

paper

cacm

history
リンク
Word Embeddings in Python with Spacy and Gensim | Shane Lynn
manboubird 2021/04/04
wordEmbeddings

spacy

gensim

nlp
リンク
Zalando Engineering Blog - The Democratization of ‘Data Science As A Service’
manboubird 2021/04/04
zalando

dataScience

annotation
リンク
GitHub - spotty-cloud/spotty: Training deep learning models on AWS and GCP instances
manboubird 2021/04/04
spotty

deeplearning

cloud

googleCloudPlatform

aws

python
リンク
Building the Product Knowledge Graph at Amazon with Luna Dong - #457
manboubird 2021/04/04
knowledgeGraph

amazon

video

dataIntegration
リンク
DGL-KE: Training Knowledge Graph Embeddings at Scale
manboubird 2021/04/04
deepGraphLibrary

paper

knowledgeGraph

graphEmbeddings
リンク
GitHub - awslabs/dgl-ke: High performance, easy-to-use, and scalable package for learning large-scale knowledge graph embeddings.
manboubird 2021/04/04
dglKe

knowledgeGraph

aws
リンク
https://jp.techcrunch.com/2013/12/04/20131203google-trends-gets-smarter-by-enlisting-data-from-knowledge-graph/
manboubird 2021/04/04
knowledgeGraph

googleTrend

google

search
リンク
データをググる感覚で利用できる「Google Dataset Search」--その中身や展望は
George Anadiotis （Special to ZDNET.com）翻訳校正：石橋啓一郎 2018-09-13 06:30 データサイエンスやアナリティクスの重要性が高まり、それらの大衆化も進んでいる中、仮説を検証したり、知見を引き出したりするのに適したデータを見つけることは、ますます重要になっている。かつては研究者やギークだけのものだった領域が、今でははさまざまなプロフェッショナルや組織、ツールも扱うものになっており、そこに参加する人の幅も広がり続けている。もちろん、単に自分の関心のために調べる人たちもいる。よく組織化された、豊富なデータを持っている組織にも、所有しているもの以外のデータを利用しなければならない場合がある。典型的な例は、天候や環境に関するデータだろう。例えば、農業に関するデータと気象現象の相関を調べて収穫量を予測したい場合や、過去に起こった現象に対する
manboubird 2021/04/04
schemaOrg

google

search
リンク
ナレッジグラフを使った解釈可能な推薦システム | メルカリエンジニアリング
以下の図が、構築したナレッジグラフの一部分を図示したものと、その中から上の表に対応する部分を拡大したものです。ナレッジグラフの属性ノードの情報を活用することで、お客さまが以前に購入した本と同じ著者の本を推薦するといった、商品情報をもとにした推薦が可能になります。モデルについて知識グラフを使った推薦は HeteRec [Yu et al., 2014] をはじめ、数年前から盛んに研究されています。今回はそのなかでも解釈性が高く、大きなデータにもスケールする KGCN [Wang et al., 2019] をもとにモデルを作りました。KGCN はグラフニューラルネットワークをもとにしたモデルです。技術的な詳細については英語版の記事を参照してください。実験以下の 3 つのタスクをメルカリの本のデータを使って実験することで、ナレッジグラフを使った推薦の有効性を確認しました。商品推薦
manboubird 2021/04/04
knowledgeGraph

recommendation

mercari
リンク
グラフデータ分析入門編
グラフ分析ナイト (エンジニア向け) https://dllab.connpass.com/event/159148/ グラフ畳み込みネットワークなど、グラフ上の機械学習/深層学習技術の概要についてご説明します。Read less
manboubird 2021/04/04
graph

graphMining

slide

deepGraphLibrary

deeplearning
リンク
KaggleOpsを考える ~ MLflow + Colaboratory + Kaggle Notebook ~ - GMOインターネットグループグループ研究開発本部
2020.10.05 KaggleOpsを考える ~ MLflow + Colaboratory + Kaggle Notebook ~ こんにちは。次世代システム研究室のY. O.です。筆者はデータ分析のスキルアップのためにkaggleというデータ分析プラットフォームを活用しています。kaggleを始めてから約2年間を経て、スキルアップの枠を超え、趣味・生活の一部・etc.になってきてしまっているのも認めざるを得ません。。。今回は、先日kaggleの自然言語処理コンペ（Tweet Sentiment Extraction）で2位になった結果を題材に、振り返りの意味を込めて”こうしておけば良かった”という点をMLOpsの観点でまとめていきたいと思います。ここで、kaggleを取り巻くMLOpsの構成をKaggleOpsと勝手に呼ぶこととし、少なくとも筆者は今後のコンペでも以下にまとめ
manboubird 2021/04/04
mlOps

mlflow

kaggle
リンク
東大松尾研究室、無料でディープラーニングや自然言語処理を学べる講座開講松尾豊氏が講師を務める講座も | Ledge.ai
TOP > Article Theme > AI（人工知能）ニュース > 東大松尾研究室、無料でディープラーニングや自然言語処理を学べる講座開講松尾豊氏が講師を務める講座も東京大学松尾研究室は1月29日から、無料でディープラーニング（深層学習）や自然言語処理について学べる、短期間のオンライン講座の受講者を募集している。対象は学生（大学院、大学、高専、専門学校生、高校、中学など）。募集は2月8日（月）の10時00分まで。選考結果は2月15日（月）までに受講決定者にメールで連絡する。今回、募集しているオンライン講座は「スプリングセミナー2021：深層強化学習」「プリングセミナー2021：深層生成モデル」「プリングセミナー2021：Deep Learning for NLP講座」の3つ。なお、人工知能（AI）研究の第一人者で、東京大学松尾研究室を率いる松尾豊氏は企画・監修だけではなく、
manboubird 2021/04/04
nlp

deeplearning

course
リンク
GitHub - megagonlabs/ginza: A Japanese NLP Library using spaCy as framework based on Universal Dependencies
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
manboubird 2021/04/04
ginza

recruit

nlp

analyzer

sudachi

japanese
リンク
GitHub - megagonlabs/ginza: A Japanese NLP Library using spaCy as framework based on Universal Dependencies
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
manboubird 2021/04/04
ginza

recruit

nlp

analyzer

sudachi
リンク
Python自然言語処理テクニック集【基礎編】
自分がよく使用する日本語自然言語処理のテンプレをまとめたものです。主に自分でコピペして使う用にまとめたものですが、みなさんのお役に立てれば幸いです。環境はPython3系、Google Colaboratory（Ubuntu）で動作確認しています。 Pythonの標準機能とpipで容易にインストールできるライブラリに限定しています。機械学習、ディープラーニングは出てきません！テキストデータの前処理が中心です。前処理系大文字小文字日本語のテキストにも英語が出てくることはあるので。 s = "Youmou" print(s.upper()) # YOUMOU print(s.lower()) # youmou 全角半角日本語だとこちらのほうが大事。全角半角変換のライブラリはいくつかありますが、自分はjaconv派。 MIT Licenseで利用可能です。 import jaco
manboubird 2021/04/04
python

nlp

tips

unicode

japanese

dataCleaning

sudachiPy

ginza
リンク
【日本語モデル付き】2021年に自然言語処理をする人にお勧めしたい事前学習済みモデル - Qiita
要点 T5（Text-To-Text Transfer Transf ormer、論文、日本語解説記事）の日本語モデル（事前学習済みモデル）を作り、公開しました。ご活用ください。 T5とは、様々な自然言語処理タスクの入出力がともにテキストになるよう問題形式を再定義することにより、一つの事前学習済みモデルを多様なタスク用に転移学習させることができる高い柔軟性を持ち、かつ、性能も優れている深層ニューラルネットワークです。転移学習の例: 文章分類、文章要約、質問応答、対話応答、機械翻訳、含意関係認識、文の類似度計算、文法的妥当性判定、タイトル生成、スタイル変換、誤字修正、検索結果のリランキングなど（固有表現抽出などのシーケンスラベリングの実施例はない？）日本語T5モデルはHugging Face Model Hubからダウンロードできます。ベンチマークとして、ある分類問題について、既存のmT
manboubird 2021/04/04
nlp

model

deeplearning
リンク
Skip List | Brilliant Math & Science Wiki
manboubird 2021/04/04
linkedList

skipList

dataStructure
リンク
AWS CLIでECRにログインする時はget-loginではなくget-login-passwordを使おう - Qiita
aws ecr get-login は非推奨にコマンドリファレンスに記載されています。 Note: This command is deprecated. Use get-login-password instead. AWS CLI Command Reference - get-login https://docs.aws.amazon.com/cli/latest/reference/ecr/get-login.html aws ecr get-login コマンドの出力結果は以下のようになります。 $ aws ecr get-login --no-include-em ail docker login -u AWS -p <password> https://<aws_account_id>.dkr.ecr.<region>.amazon aws.com docker login コ
manboubird 2021/04/04
aws

cli

ecr
リンク
aws-vault でアクセスキーを安全に - FLINTERS Engineer's Blog
あけましておめでとうございます。河内です。数ヶ月前に aws-vault を使い始めて安全の高まりを感じるので紹介します。 AWSのサービス上では IAM Role をできるだけ使ってアクセスキーを使わないようにしていますが、ローカルでの開発時にIAMのアクセスキーを利用することはあります。アクセスキーが漏れると困ったことになります。本番環境で利用している AWS アカウントで漏れると、付与している権限次第では機密情報が漏洩したりサービスが壊される可能性があります。また開発環境としてのみ利用しているAWSアカウントであっても、ビットコインのマイニングなどで容赦なくリソースを消費され高額な請求が来たりする可能性ががあります。そのようなことが起きないようにアクセスキーは安全に管理する必要があります。通常はAWS SDK のデフォルト参照先である ~/.aws/credentials
manboubird 2021/04/04
aws

cli

Security

awsVault
リンク
RSA鍵、証明書のファイルフォーマットについて - Qiita
RSAの公開鍵暗号技術を利用するためには、鍵や証明書のファイルを扱う必要があるため、そのファイルフォーマットについて理解しておく必要があります。実際、いろんな拡張子が登場するので、それぞれの意味を理解していないとすぐにわけがわからなくなります。そんなときのために備忘録をまとめてみました。ファイルの拡張子の注意点 .DERと .PEMという拡張子は鍵の中身じゃなくて、エンコーディングを表しているデジタル暗号化鍵やデジタル証明書はバイナリデータなのですが、MD5のハッシュ値のような単なる値ではなく、データ構造をもっています。.DERや .PEMはそのデータ構造をどういうフォーマットでエンコードしているかを表しています。そのため、.DERや.PEMという拡張子からそのファイルが何を表しているのかはわかりません。暗号化鍵の場合もあるし、証明書の場合もあります。 .DER 鍵や証明書をAS
manboubird 2021/04/04
openssh

pem

extension

ssh

privateKey

cert
リンク
メルペイのミッション「信用を創造する」に深〜く関わるData&MLの歴史を改めて紐解いてみる！ | mercan (メルカン)
「信用を創造して、なめらかな社会を創る」とは、メルペイが創業時から掲げているミッションです。「信用を創造する」は、売る・買うの取引を通じて信用情報を可視化し、その信用に基づいてお金を自由に使える世界をつくること。「なめらかな社会」とは、一人ひとりが今よりも自由に、平等にお金を使い、欲しいものを手に入れたり、やりたいことが叶う社会を指しています。なかでも「信用を創造する」部分に大きく関わるのが、メルペイでデータを活用しビジネスのグロース施策を推進するData & MLグループです。では、Data & MLグループではどんな仕事をしているのか。そして、どういう組織体制なのか。Data & MLにある3つのチームでそれぞれエンジニアリングマネージャー（EM）を務める@zak3、@tori、@hase-ryo、@takafujiに聞いてみました。メルペイData & ML、エンジニアリングマ
manboubird 2021/04/04
merpay

dataManagement

machineLearning
リンク
メルカリ・メルペイの成長を支えるデータ基盤とはどんなものか
「メルカリのデータドリブン文化を支える、データプラットフォームとデータマネジメントの話」の発表資料です https://mercari.connpass.com/event/207191/
manboubird 2021/04/04
dataPlatform

mercari

slide
リンク
- 2021年4月5日
- 2021年4月4日
- 2021年4月3日

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx