私は日経 xTECHの記者に加えて、日経NETWORKという雑誌を作る仕事もしている。その日経NETWORKの最新号で、人工知能(AI)に関する記事を執筆することになった。そこで機械学習や深層学習といったAIに関する技術をおさらいするために、都内の大型書店に参考書を買いに出かけた。 その書店の技術書フロアのAI関連書籍コーナーには、多くの本を抱えた先客がいた。10冊以上はあっただろうか。いずれも専門的な技術書ではなく、初心者向けの平易な解説書のようだった。「上司にAIについて報告するように命じられたのだろうか、あるいはAIが有望な分野だと思って自分で学習するつもりなんだろうか」といろいろ想像してしまった。 自分が買ったのも、専門的な技術書ではなく入門書だ。ただし、買ったのは1冊だけ。あらかじめネットで調べておいた本の内容を店頭で確認して購入した。その本を選んだ決め手は「AIを実際に研究して
自分のブログのテキストを分析・可視化してみたい 以前自分のブログの分析を「内部リンク」や「はてブ情報」の観点で行ってみました。 ただ、目的無く分析してしまったので、結局イマイチどう活用してよいかよく分からない結果しか得られませんでした。 そんな前回の反省を全く活かすことなく、また何の目的もなくブログを分析してみることにしました。今回は以前から興味のあった機械学習を用いたブログの文章の分析・可視化(テキストマイニングと呼ばれるらしいです)にチャレンジしてみることにしました。どちらかというとテキストマイニングが主で、使用する素材(学習データ)に困ったので仕方なく自分のブログを使ってみたというのが正直なところです。 ネットでコピペすりゃ簡単にできるだろと思っていたのですが、自分のやりたいことするのはそれなりに大変だったので、知見としてやり方とどんなことが分かるのかを残しておきます。 ブログのテキ
最近携わっているファクトチェック関連のお仕事について デブサミ 2018 でお話する機会 を頂いたので、登壇してきました。 ファクトチェックを技術的に支援する取り組み 昨年 6 月の ファクトチェック・イニシアティブ 設立とともに始まった テクノロジーを用いたファクトチェック支援 を目指すプロジェクト1 では、ファクトチェッカーの方々の業務を自然言語処理や機械学習を用いて効率化したり、またファクトチェックの成果物であるレビューデータをオープンに利活用できる仕組みを作ることを目的としています。 今回のデブサミでは、特に前者の取り組みについてお話ししました。発表資料は以下になります。 発表を終えて 発表では「ファクトチェック」の説明にかなり時間を割いて話をしたので、その分技術寄りの話がちょっと手薄になってしまった感がありました。自然言語処理や機械学習の濃ゆい話を期待していた方にはちょっと物足り
去年の9月頃、Unityで機械学習を行う ML-Agent(ver 0.01)が公開されました。 このライブラリを使用すると、Unity上で作成したゲームで機械学習によるAIを実行したり出来そうです。 最近このML-Agentを使用して色々と試していたのですが、ある程度形になったので色々とこちらの記事にメモを残します。 目次 機械学習? 強化学習? 報酬は"結果"ではなく"連続した動作"に与えられる Unityと強化学習 独自のプロジェクトを作ってみる シーンのセットアップ アクションの設定 Stateの設定 Reward(報酬)の設定 終了とリスタート 学習 その他 関連 機械学習? 機械学習は最近騒がれている技術の一つで、AIの一種です。 その特徴は、「明示的にプログラムされる事なく、経験から学習する」という点にあります。この学習のプロセスは、提供されたデータに基づいてパターンを抽出、
LINE福岡で行なわれたHacker Tackleにて登壇してきました。 発表内容は(1)機械学習を使ったサービス開発の難しい点について整理し(2)その難しさを乗り越えていくためにはてながどのような取り組みを行なっているかについてでした。一口に機械学習を使ったサービス開発といっても、古典的な問題設定でどうやればいいか比較的クリアに見えているものと、R&D要素が強くどう取り組んでよいか分からないものではよい取り組み方も異なってきます。そこで、今回の発表では古典的な問題設定(テキスト分類)であるBrandSafe はてなのリニューアル、R&D要素の強いMackerelの異常検知、それぞれに対し技術的/組織的にどのような取り組みを行なったかについて話させてもらいました。 はてなにおける機械学習の取り組み from syou6162 登壇時間は30分で割と話すことも多かったので、当初話す予定だった
Enjoy these videos? Consider sharing one or two. Help fund future projects: https://www.patreon.com/3blue1brown Special thanks to these supporters: http://3b1b.co/nn2-thanks Written/interactive form of this series: https://www.3blue1brown.com/topics/neural-networks This video was supported by Amplify Partners. For any early-stage ML startup founders, Amplify Partners would love to hear from you
1. どんなもの? Spectral clusteringのためのDeep learning手法を用いて大規模データセットへの適用と埋め込みの一般化を可能にしたSpectralNetを提案した。 2. 先行研究と比べてどこがすごいの? Spectral clusteringはとても有力なクラスタリングアルゴリズムとして知られているが、 大規模なデータセットに対して適用する場合計算量の観点で適用が難しく、 out-of-sample-extension (OOSE) といった問題がある。 先行研究ではdeep learningを用いたクラスタリング手法が多数提案されている。 k-meansベースのdeep learningアプローチ DCN DEC DEPICT variational autoencoderベースのアプローチ VaDE GMVAE data augmentationベースの
R&D部部長の 榊 です。今日は、当社におけるデータサイエンティストの定義と求められるべきスキルセットについて話したいと思います。 概要 下図のように当社における「データ分析を活用したSaasを開発する場合のデータサイエンティストの定義」を作りました。 既存の3つの定義から、良い部分を拝借しました。 各社ごとに、自社にあったデータサイエンティストを定義しておくのが重要ではないか? はじめに 当社は、「データとAIで意思決定をサポートする」を事業ミッションとして掲げており、特に去年から人工知能技術 (※) に長じた人材、言い方を変えればデータサイエンティストの採用と育成に力を入れてきました。しかし、特に社内で「データサイエンティストとは何か」の定義などを作ることもなく、当社に必要な人材のスキルを列挙し、そちらを募集要項に書くことで満足していました。 そんな中で、某強面の役員から、ある日 「そ
<p>Original location: <a href="http://www.tensorflowbook.com/?new">http://www.tensorflowbook.com/?new</a> </p>
プラスに帯電し、電界によってほぼ静止している1つのストロンチウム原子を撮影した写真。よく見ると、黒い部分の中心にうっすらと青い光が見える。(PHOTOGRAPH BY DAVID NADLINGER, UNIVERSITY OF OXFORD) すばらしい写真というものは、ときにデジタル一眼レフカメラと小さな原子、そして好奇心旺盛な博士論文の提出候補者という組み合わせで撮影されるものだ。(参考記事:「単一原子の影の撮影に初めて成功」) 英オックスフォード大学で、量子コンピューターに使う原子を閉じこめる研究をしていたデビッド・ナドリンガー氏は2017年8月7日、一般的なデジタル一眼レフカメラを使ってこの写真を撮影した。黒い背景の前で青紫色のライトに照らされているのは、プラスに帯電したストロンチウム原子だ。両側には2つの金属電極があり、間にできる電界によって、原子はほぼ静止している。この装置は
ざっくり言うと リスト構造のデータに対してランダムアクセスはしちゃだめだぞ。お兄さんとの約束だ! 発端 数年前に他部署の支援で作ったJavaのシステムに、ちょっとデカめのデータを突っ込んだらありえないほど遅いので助けてくれ、と連絡が入った。 まぁクエリとかインデックスをちょっと見れば直るっしょ・・・と鼻をほじりながら支援に向かった。 処理内容 遅い部分の処理は以下のようなものであった。 処理対象のデータをListで受け取る。 それをforループで1件ずつ前処理する。 処理結果をオブジェクトに格納し、ORマッパーでDBにINSERTする。 これだけ? そう、これだけだ。並列処理なんて高級なことはもちろんやってない。 インフラ調査 処理中のサーバのようすを調査する。今回のインフラは典型的な3層3サーバ構成。 WEBサーバはなにもかもが余裕。 APサーバではCPUを1つ使い切っている。 14コア
はじめに 効くか効かないかわからない特徴量が大量にあって、中にはいくつか効くものがきっとある・・・というときに、L1正則化やGroup LASSOが用いられます。これらは微分不可能な点を含むため、通常の勾配法では解けません。 そこで、微分不可能な点を含む凸関数最適化の一手法である近接勾配法について、勉強したことをまとめてみました。 近接勾配法の更新式 微分可能な凸関数$f(\boldsymbol{x})$と微分不可能な点を含む凸関数$g(\boldsymbol{x})$に対して、$F(\boldsymbol{x})=f(\boldsymbol{x})+g(\boldsymbol{x})$を最小化します。 ステップ$k$における点$\boldsymbol{x}_k$とステップ幅$\eta$に対して、近接勾配法は \begin{align} \boldsymbol{x}_{k+1} &= {\
The best place to backorder/drop purchase expiring ccTLD domain names
数ヶ月卒論で取り組んだ程度の知識で恐縮ですが、本記事ではadversarial perturbationの研究の全体像が把握できることを目指します。敵対的摂動はadversarial perturbationの直訳で(必要にかられて)僕が勝手に呼んでいるだけの用語です。この記事はなるべく短くまとめますが、需要があればもう少し長い記事も書くかもしれないです。 index 敵対的摂動とは 敵対的摂動を作る 敵対的摂動から守る 敵対的摂動とは – 有名なのは下の図ですね。出典:Explaining and Harnessing Adversarial Examples. 概要をざっくり説明すると、人の目には見えないノイズを加えることでネットワークの出力をコントロールできてセキュリティ上やばいという話です。 ガードレールに自動運転者を突っ込ませるとかstop signを無視させるとか自動検知システ
膨大な電子情報を保管するデータセンター(DC)が、雪国で相次いで建設されている。冷気で機器を冷やし、電気代を節約できる利点があるからだ。セキュリティーのために詳しい所在地が伏せられるなど謎も多いDCの現状を見た。 北海道石狩市。雪が舞う石狩湾近くの約5万平方メートルの土地に、その建物はある。無機質な外観で、敷地の入り口から両端が見えないほど大きい。一見すると倉庫のようだが、人やトラックの出入りはほとんどない。地図に建物の名前は記されていない。 この建物がサーバーを大量に扱うDCだ。運営する「さくらインターネット」(大阪市)の舟木晃さんに案内してもらった。 有人監視や生体認証など計七つのチェックを受け、サーバーが詰まったロッカーのような箱が並ぶ部屋にたどり着く。 舟木さんが通気口を指さし説明した。「冷たい外気を取り込み、サーバーの熱を抑えています」。24時間態勢でデータを処理しており、大量の
W3CのWebAssemblyワーキンググループは、「WebAssembly」仕様に関する初めてのワーキングドラフトを公開した。WebAssemblyはすでに主要なブラウザで実装が進んでいるため、このまま順調に勧告となるのではないか。 マイクロソフト、Google、Mozilla、Appleなどの主要なWebブラウザベンダが協力して、Webブラウザ上でネイティブコードに近い実行速度で高速に実行できるバイナリフォーマット「WebAssembly」の開発に取り組んでいます。 すでに実装の面では、昨年2017年11月の時点でChrome、Firefox、Safari、Edgeの主要なWebブラウザでのWebAssembly対応が揃っていますが、同時にW3CにおいてWebAssemblyの標準化作業が進められています。 そのW3Cから、WebAssembly仕様について初めてのワーキングドラフトが
人が巨乳に惹かれるのは本能ではなく文化である。 その大きさから歴史の重みを感じ取ってもらいたい。 犬山あおいに蹂躙されたオタク 『ゆるキャン△』の犬山あおいが強い。 『ゆるキャン△』2話 一時期、Twitterを見ていると彼女のイラストが頻繁に流れてきた。今期アニメで一番注目を集めているキャラと言っていいだろう。 しかし、最初から人気があったのではない。アニメの放送がスタートしたのは2018年1月4日からであり、彼女が本格的に登場したのは2話からだ。4話までの彼女は、メインキャラなので登場シーンは多かったが、注目を集めていたのは主人公である志摩リンと各務原なでしこの両名だった。 情況が一変したのは2月に入って5話が放映されてからである。 『ゆるキャン△』5話 乳に打たれたオタクは「エッッッ」と言って倒れた。 これ以降、pixivの閲覧数はうなぎ登りとなる。 「犬山あおい」タグがついたpix
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く