yag_aysのブックマーク / 2018年4月3日

文法および流暢性を考慮した頑健なテキスト誤り訂正（前半）

今回はステアラボ人工知能セミナー第15回の動画をお届けします。自然言語処理の研究をされているJohns Hopkins大学の坂口慶祐氏が「文法および流暢性を考慮した頑健なテキスト誤り訂正」についてお話します。 ▼概要自然言語処理において、データにスペリング誤りや文法誤りが含まれる場合、各種タスクにおける精度が著しく悪化する。一方、私達人問はそのうよな誤りに対し非常に頑健な言語拠理メカズニムを備えれらている（例えばこの文のように）。本講演では、このような誤りに対する訂正モデルについて紹介する。具体的には、文字単位での誤りを訂正するリカレントニューラルネットを用いたモデル、単語単位での文法誤りの訂正と依存構造の同時解析モデル、そして強化学習を用いた文単位の誤り訂正モデルについて説明する。

yag_ays 2018/04/03

リンク

日本の研究.com

2018年7月27日(金) ～ 2018年7月29日(日)の記事・注目研究者集計期間：2018-07-26 18:00 ～ 2018-07-29 17:59

yag_ays 2018/04/03

リンク

Spotifyのスケーリングアジャイル – 部隊、分隊、支部やギルドと共に歩む（Spotifyモデル）

(注)ヘンリックの許可を得てざっくり意訳しました。原文は『Scaling Agile @ Spotify with Tribes, Squads, Chapters & Guilds』です。訳に対するヘルプも歓迎します。Thanks Henrik, this article is great for me. プロダクト開発をしている組織において、多角的なチーム構成を実現するのはいつもチャレンジな作業だ！今まで見てきた中で印象に残っている例がひとつある。それはSpotifyだ。Spotifyは3つの都市にまたがって30以上のチームにスケールしているが、アジャイルなマインドセットをキープし続けている。 Spotifyは音楽産業を一変させている魅惑的な企業だ。創業してから6年しか経っていないのに、1500万ものアクティブユーザーを抱え、400万以上の決済が行われている。また、そのプロダクトは「

yag_ays 2018/04/03

リンク

MLPシリーズ『ガウス過程と機械学習』サポートページ

News: Kindle版の配信が4/26に始まりました. (2019/4/26) [Amazon Kindle] 大羽さん担当章に関する, 本サポートページの補足はこちらです. (2019年4月7日) Google Colaboratoryの実習用ノートブックを追加しました. (2019年3月14日) 無事発売されました. (2019年3月9日) [Amazon] [紀伊国屋書店] (正誤表) さまざまな分野でのガウス過程の例天文学: "Finding Galaxies in the Shadows of Quasers with Gaussian Processes", Roman Garnett, Shirley Ho, Jeff Schneider, ICML 2015. 紹介スライド (持橋): gpgalaxy.pdf [paper] 生態学: "Fast and flexi

yag_ays 2018/04/03

リンク

国税庁URL変換器

正版赌博软件下载大全安卓☎️登上绝对刺激的胜负之旅，释放您内心最激烈的冒险欲望！在这个非凡舞台上，揭开命运的红色序章，创造惊天逆袭！

yag_ays 2018/04/03

リンク

深層学習を用いた時系列データにおける異常検知 - 株式会社カブク

はじめにカブクで機械学習エンジニアをしている大串正矢です。今回は深層学習を用いた時系列データにおける異常検知について書きます。背景深層学習を異常検知に使用するにあたって閾値設定や評価尺度であるROCについての記述が日本語のウェブの資料で見つけられなかったので本ブログで記述することにしました。以前のブログに異常検知の基礎的な内容があるのでその内容を踏まえた上で読んで頂けると理解がしやすいと思います。異常検知の基礎時系列データにおける異常検知情報圧縮に関するモデル(AutoEncoderなど) 利点: RNNなどに比べ少ないパラメータで学習可能なため高速欠点: 系列データ特有の過去の値を考慮した予測ができない系列データに関するモデル(RNNなど) 利点: 系列データ特有の過去の値を考慮した予測が可能欠点: 構造上、GPU上での並列化が難しいため学習に時間がかかる本記事では系

yag_ays 2018/04/03

リンク

破った紙の画像、割り符に - 日本経済新聞

日本大学の宮田章裕准教授らは連絡先を交換しなくても、レシートなどの紙を「鍵」にして電子データを受け渡しする技術を開発した。紙をちぎって割り符のように使い、その切れた断面を撮影した人だけが専用サイトからデータを入手できる。初めて会う人との情報交換を想定する。3年以内の実用化を目指す。文字などが書かれた紙を2枚に破り、一方を電子データを送りたい相手に渡す。送る側は手元に残ったもう一方の

yag_ays 2018/04/03

リンク

激化する｢Kaggle人材｣データサイエンティスト争奪戦 —— DeNA業務時間でもコンペ参加OKの新制度創設

ディー・エヌ・エー（DeNA）は、データサイエンス人材の採用強化を目的に、データ分析や機械学習の世界的なコンペティションへの参加に業務時間の20〜100%を使うことを認める新制度を、4月から始めることを明らかにした。対象となるコンペは｢Kaggle（カグル）｣と呼ばれるアメリカ発のプラットフォームで常時開催されている。マイクロソフトやフェイスブックなど、名だたる企業がデータ分析や機械学習の課題を出し、世界各国のデータサイエンティストが、その分析モデルを競い合う場だ。 Kaggle：世界中の企業や研究者がデータを投稿するプラットフォーム。2010年にアメリカで設立された。現在では60万人超のデータサイエンティストや研究者が登録しているとされ、最適モデルを競い合っている。参加者の｢モデル｣は採点され、ランク付けされる。最適モデルを提示した参加者には、企業や研究者から賞金が支払われる。賞金は数

yag_ays 2018/04/03

リンク

Twitter就活とキャリアとか

今回、あまり意図しない転職であったため、いろいろと想定外のことも起こったのですが、私の今までのキャリアも含め、Twitterで就活して良かった点、苦労した点を書いていこうと思います。新卒で某大手のネット企業に入ったのですが、働くということについて疑問を持ったのと、父がガンになり介護が必要などと家族の事情で2年間と半年間、実は実家手伝い（＝実質ニート）という人から見たらだいぶアレな感じでした。ここまで落ちぶれてしまうと、田舎の食品工場でお寿司にたんぽぽを乗せる仕事などが適切な感じなのですが、投げた人生を可能な限りリカバリーしてみようと思ったのでした。今に至るまで2014/4 ~ 2016/9 ニート時代 ProjectEulerなどをやったり、家族を病院に送り迎えしたり、地元のヤンキーたちと遊んでたりしていました。 2016/9 働いてみようかなと思う機械学習については大学と大学院で

yag_ays 2018/04/03

リンク

業務時間のKaggle参加を推奨する新制度導入。DeNA内でのAI技術者育成と活用を強化 | 株式会社ディー・エヌ・エー | DeNA

2016年頃から、アメリカで特に注目が高まっている職業があります。アメリカの大手企業口コミサイト「Glassdoor」が発表する「25 Best Jobs in America（アメリカでもっとも良い職種ベスト25）」によると、2016年から2018年にかけて「データサイエンティスト」が1位を獲得し続けています。日本では一般にまだ馴染みの薄いデータサイエンティストですが、企業活動の上で発生する情報はもちろん、膨大なデータを扱う機械学習などAI 技術の活用が広まる昨今、データサイエンティストによる適切なデータ分析がより求められるようになってきています。 DeNAでは2018年4月より、AIシステム部内のデータサイエンスチームにおける新制度「Kaggle社内ランク」を導入しました。これは様々な事業領域においてAI 技術を活用した取り組みを積極的に行なうDeNAがAI 技術のサービス応用力強化のために

yag_ays 2018/04/03

リンク

Kaggleで大活躍するDeNAの社内制度とは | DeNA×AI

主催者がデータと課題を提供し、参加者は3ヶ月程度の期間内で最も性能の高いAIを作ることを競い合うコンペティションがあります。その最大のプラットフォームがKaggleです。そこでは、企業や研究者から提供された課題を解くべく、世界中から数千人が参加し、日常的に腕を競い合っています。実績をあげた参加者には賞金のほか「Grandmaster」「Master」などの称号が与えられます。また、終了後には参加者同士で解法を共有するオープンな議論の場があるため、機械学習の事例を学ぶ場としての側面も持ち合わせています。 DeNAとその関連企業を含めたDeNA Galaxyでは、日々新しい事業課題が生まれており、AI 技術の活用機会が数多くあります。必要な技術は課題によりさまざまで、専門のリサーチャーが解決すべきことだけではなく、そもそもAI 技術が必要ないことも、少し古い技術で十分であることも、

yag_ays 2018/04/03

リンク

Technical Reports

Unicode® Technical Reports For more information see About Unicode Technical Reports and the Specifications FAQ. Unicode Technical Reports are governed by the Terms of Use and are released under the Unicode License.

yag_ays 2018/04/03

リンク

Python でタイ文字やアラビア文字の個数をうまく数える - Qiita

Unicode 難しい Unicode の扱いには色々と難しいところがある。私は最近になって、いろいろと勉強している。なので、以下の内容には Unicode 初心者によるひどい間違いがあるかもしれない。自分は Unicode の正規化の違い (NFC, NFD, NFKC, NFKD) でややこしい点については知っていたのだけど、それとは別のレイヤの話で、タイ文字・アラビア文字・デーヴァナーガリー文字などを視覚的に文字数を数える時は Grapheme というさらに上の層での数え方が必要らしい。参考: 文字数をカウントする7つの方法 Grapheme つまりプログラミング言語で普通に文字数を数えると Code point の数になる。実際には視覚的に 1 つの文字が、複数の Code point によって構成されている場合がある。視覚的に正しい 1 文字の単位が Graphe

yag_ays 2018/04/03

リンク

GitHub - JohnCoates/Aerial: Apple TV Aerial Screensaver for Mac

You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

yag_ays 2018/04/03

リンク

Pythonでの文字コードの取り扱い - たにしきんぐダム

定期的にこの手の記事が上がってる気がするけどあげていく。 unicode型とかstr型とかいう言い方するとわかりにくいけど、データの実体がどういうものかわかってれば理解しやすいよね。参考 Python - ドキュメント - Unicode HOWTO プログラマのための文字コード技術入門 Unicode のサロゲートペアとは何か Wikipedia - UTF8 Wikipedia - ASCII Unicode Unicode では全ての文字にID(コードポイント)(0 ~ 0x10FFFF)をふっている。コードポイントを表す時は U+{16進数} と書く。 ord()により、ある文字に対応するコードポイント(の10進数表記を得ることができる) chr()により、あるコードポイント(の10進数整数)から対応する文字を得ることができる >>> ord("A") 65 >>> hex(or

yag_ays 2018/04/03

リンク

Treasure Data - Software Engineering Intern (2018 Summer)

トレジャーデータの東京オフィスにおいて、ソフトウェアエンジニア向けサマーインターンプログラムの参加者を募集します。

yag_ays 2018/04/03

リンク

はてなブックマーク

タグ

2018年4月3日のブックマーク (16件)

文法および流暢性を考慮した頑健なテキスト誤り訂正（前半）

日本の研究.com

Spotifyのスケーリングアジャイル – 部隊、分隊、支部やギルドと共に歩む（Spotifyモデル）

MLPシリーズ『ガウス過程と機械学習』サポートページ

国税庁URL変換器

深層学習を用いた時系列データにおける異常検知 - 株式会社カブク

破った紙の画像、割り符に - 日本経済新聞

激化する｢Kaggle人材｣データサイエンティスト争奪戦 —— DeNA業務時間でもコンペ参加OKの新制度創設

Twitter就活とキャリアとか

業務時間のKaggle参加を推奨する新制度導入。DeNA内でのAI技術者育成と活用を強化 | 株式会社ディー・エヌ・エー | DeNA

Kaggleで大活躍するDeNAの社内制度とは | DeNA×AI

Technical Reports

Python でタイ文字やアラビア文字の個数をうまく数える - Qiita

GitHub - JohnCoates/Aerial: Apple TV Aerial Screensaver for Mac

Pythonでの文字コードの取り扱い - たにしきんぐダム

Treasure Data - Software Engineering Intern (2018 Summer)

お知らせ

今週のはてなブックマーク数ランキング（2024年10月第2週）

今週のはてなブックマーク数ランキング（2024年10月第1週）

月間はてなブックマーク数ランキング（2024年9月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス