タグ

2021年4月10日のブックマーク (13件)

  • うわっ…私の言語モデル、古すぎ…? | 株式会社AI Shift

    こんにちは、AIチームの戸田です 今回は去年Google検索に導入されたことでも話題になったBERTを使った比較実験の記事を書かせていただきます というのも昨年発表報告を書かせていただいた第10回対話シンポジウム、参加して特に印象に残ったことの一つとして、文章をベクトルに変換するモデルとして BERT^1 を使用するのが当たり前になっていたことがあります 私が遅れているだけなのかもしれませんが、とりあえず文章をベクトル化するときはBERTという雰囲気で、Word2Vecで得られた単語ベクトルをコネコネ…とやっているのは(おそらく)今回の会議では私達だけだったと思います BERTはファインチューニングにより自然言語処理の多くのタスクでState of the artを達成しましたが、単純な文書ベクトル抽出器としての能力はどうなんでしょうか? 私は手軽に文章の分散表現を得る方法としてWord2

    うわっ…私の言語モデル、古すぎ…? | 株式会社AI Shift
    sh19910711
    sh19910711 2021/04/10
    Simple Word-Embedding-based Models https://arxiv.org/abs/1805.09843 / "私は手軽に文章の分散表現を得る方法としてWord2Vecから得られた単語ベクトルの平均やmax poolingをとる SWEM をよく使う"
  • kaggleのkernelから学ぶこんな可視化備忘録 - Qiita

    自分が分析レポートを作るときに、機械学習や統計の知識がない人にもわかりやすいレポートを心がけるの備忘録。 A Data Science Framework: To Achieve 99% Accuracy 常に分析を始める前にdescribe()で綺麗にきちんとデータの情報を把握してから分析するようにしたい カテゴリカルな変数と目的変数もきちんと相関出してる。真似したい! このカーネル、とにかく可視化が綺麗!コードは引用元見てください! カテゴリカルな説明変数と目的変数のヒストグラムと、連続値の箱ひげ図。箱ひげ図はこれよりもseaborn使った方が綺麗かもしれない。 同じ説明変数でも、分類ごとに目的変数との関係の棒グラフや折れ線グラフ 説明変数同士で分析しても面白いですね。真ん中のカテゴリカルな変数VS連続値の変数のグラフめちゃ綺麗 3つの要素をこんな風に盛り込むのも面白い 連続値VS連続

    kaggleのkernelから学ぶこんな可視化備忘録 - Qiita
  • 情緒の設計

    2019/09/14 UX MILK Fest 2019 登壇資料です

    情緒の設計
    sh19910711
    sh19910711 2021/04/10
    "情緒: 事に触れて起こるさまざまの微妙な感情。また、その感情を起こさせる特殊な雰囲気"
  • 構文・述語項構造解析システムKNPの解析の流れと特徴

    構文 述語項構造解析システム KNPの解析の流れと特徴 ・ 笹野 遼平 (東工大) KNPのイメージ? KNP KNPのイメージ? KNP 古い 重い 遅い KNPのイメージ? KNP ルールベースの係り受け解析器である 古い 重い 遅い KNPのイメージ? KNP ルールベースの係り受け解析器である 古い 重い 遅い 内部で何が行われているか分からない KNPのイメージ? KNP ルールベースの係り受け解析器である 古い 重い 遅い 内部で何が行われているか分からない 出力の読み方が分からない KNPのイメージ? 1. ・ ⇒ 係り受け解析器として見ると遅いし、重い、でも… 2. ・ KNP ルールベースの係り受け解析器である 古い 重い 遅い 内部で何が行われているか分からない 出力の読み方が分からない KNPのイメージ? 1. ・ ⇒ 係り受け解析器として見ると遅いし、重い、でも…

    sh19910711
    sh19910711 2021/04/10
    "構文 述語項構造解析システムKNPの解析の流れと特徴 - 笹野 遼平 (東工大)"
  • 運用を続けていくための Scala の書き方 / scala.rookies#1

    scala.rookies#1 (https://scala-rookies.connpass.com/event/105904/) で発表した資料です

    運用を続けていくための Scala の書き方 / scala.rookies#1
  • 遺伝的アルゴリズムでナーススケジューリング問題(シフト最適化)を解く - Qiita

    この記事は ナーススケジューリング問題という最適化の問題を遺伝的アルゴリズムで解いてみたらまあまあの精度が出たので記録です pythonのdeapというライブラリを使っています 前提 ナーススケジューリング問題というものがあります 病院等の医療施設に勤める看護師の勤務スケジュールを決定する問題のことであり,シフトスケジューリング問題の代表例である.日勤・夕勤・夜勤等の複雑なシフト勤務や多岐に渡る制約の考慮のため,実際にスケジュールを求めるのは人手では手間のかかる困難な作業であり・・・ 要するにシフト勤務のスケジュールを自動的に最適に組むというものです 制約が色々あって、必要人数を満たすような基的なものから、公平性、必須な資格/役割、この2人は(仲が悪いから?)一緒に入れないなど、いくらでも複雑になりうる問題て感じで、完璧な解答を作るのは困難なので、近似解を求めるような分野みたいです *

    遺伝的アルゴリズムでナーススケジューリング問題(シフト最適化)を解く - Qiita
  • プログラミングを始めてから働き始めるまでの話。

    プログラミングを始めてから働き始めるまでの話。 日Google Software Engineer (SWE) な人たちが公で語り始める祭りが唐突に始まったので乗っかってみた記事、就職以前編です。 記事はあまり Google 関係なく特にダラダラと書いてるので、そういうのが読みたいわけではない方はどうぞお戻りください。(祭りの元ネタの Google の話は、主に次の記事です) 学生時代から振り返ると、ただただズルズルと長いことやってただけのスキモノでしかないんですが、それでも迷走しているうちに、おもしろい人たちと出会う機会があったり、楽しい会社と縁ができたり、さらに先につながったりすることもあるんですよ、ということが、やっぱりひたすら好きで続けているような人たち (特に若者たち) に多少なりとも伝わったらいいなと思ったので、最初から書いてみました。 生存者バイアスであることは否めま

    sh19910711
    sh19910711 2021/04/10
    "かなりの時間を ACM-ICPC に吸われていきました / お金を出してもらってあちこち行きつつ、違う大学の、でも同じ趣味の同じ世代の人たちと会えて、プログラミングの話を延々してられるのが結局楽しかったのかな"
  • bpftrace 2020 - 睡分不足

    (この記事はLinux Advent Calendar 2020 - Qiitaの2日目の記事です.前日はmasami256さんのTiny Core LinuxLinuxのinitプロセスが実行されるあたりを調べるでした.) みなさんこんにちはこんばんは.bpftraceを使っていますか? (e)BPFといえば最近は専らCiliumなどネットワークが話題ですが,bpftraceはBPF*1を利用したトレーシングツールです.私は昨年からぼちぼち使い始めて,機能追加やバグ修正のパッチをいろいろと投げていた(130+)ら気づいたらコミッタになっていました.ということでbpftraceについては比較的よく知っていると思うので,今年にbpftraceに追加された主要な機能や変更点を紹介したいと思います. bpftrace知らないなぁという方はこちら(拙文です)を,bpftrace使ってないなぁとい

    bpftrace 2020 - 睡分不足
  • 固有ベクトル、主成分分析、共分散、エントロピー入門 | POSTD

    (2015/11/19、記事を修正いたしました。) 目次 線形変換 主成分分析(PCA) 共分散行列 基底変換 エントロピーと情報の取得 とにかくコードが欲しい方へ その他の参考資料 稿は固有ベクトルと行列との関係性について、平易な言葉で、数学にあまり詳しくなくても分かるように書いてみました。この発想に基づいて、PCA、共分散、情報エントロピーについても説明します。 固有ベクトルは英語で「eigenvector」ですが、この eigen はドイツ語で、「そのものだけが持つ」という意味です。例えばドイツ語の「mein eigenes Auto」は、「ほかならぬ私が持つ車」というニュアンスです。このようにeinenは、2つのものの間に存在する特別な関係性を意味します。独特、特徴的、その性質を端的に示すものということです。この車、このベクトルは、私だけのもので、他の誰のものでもありません。 線

    固有ベクトル、主成分分析、共分散、エントロピー入門 | POSTD
    sh19910711
    sh19910711 2021/04/10
    "情報が、「私たちがシステムについて知らないこと」から「知っていること」へと移ることは、エントロピーの変化を示します。知見はシステムへのエントロピーを減らします"
  • しなくていいUX|小山田翔子

    サービス開発において「ユーザーがしたいことをできるようにさせてあげる」という議論は活発だが、いっぽうで「しなくていいことをしないようにさせてあげる」分野はまだまだ発展途上だと思う。なのでここで思っていることを書いてみる。 赤信号に突っ込んで行くバスある日、私は近所でバスに乗っていた。 進む道の信号は赤であり、私はてっきりバスは速度を落として止まるだろうと考えた。 ところがバスは速度を落とさずそのまま赤信号に突っ込んで行くのだ。 私は仰天して、 わあ、なんということだ、交差点で車にぶつかってしまう… そう考えた瞬間、信号が青に変わった。 これが「公共車両優先システム」か...とその時に理解した。 確かに、これならバスの定時性を確保できる。 さらに、道路の利用効率を現実的に考えれば、ただでさえ速度が遅いバスを優先して通すことは、社会の生産性の面でも至極妥当なシステムである。 止まらなくていいも

    しなくていいUX|小山田翔子
    sh19910711
    sh19910711 2021/04/10
    "サービス開発において「ユーザーがしたいことをできるようにさせてあげる」という議論は活発だが、いっぽうで「しなくていいことをしないようにさせてあげる」分野はまだまだ発展途上だと思う"
  • Apache Hadoop Ozone: Apache Hadoop 用のオブジェクトストアの紹介

    著者: Arpit Agarwal ブログ記事は「Introducing Apache Hadoop Ozone: An Object Store for Apache Hadoop」(2018/10/08投稿)の日語翻訳記事です。また、原文の投稿はClouderaとHortonworks合併前に記述されたものであり、いくつかのリンク、リソースにはアクセスできない場合があります。 *訳注: 元記事公開時点では 0.2.1-alpha 版が最新でしたが、日語翻訳時(2020/3/9)は0.4.1-alpha版が公開されています。 1. はじめにApache Hadoop 分散ファイルシステム(HDFS)はビッグデータ用のデファクトファイルシステムになっています。現実世界では、HDFSがどれほどスケーラブルで堅牢であるのかを忘れがちです。私たちのお客様は数千ノードのクラスターを実行してい

    sh19910711
    sh19910711 2021/04/10
    "Ozoneは、小さなファイルと大きなファイルの両方を同じように管理できる分散キーバリューストア / HDFSはPOSIXライクなセマンティクスを提供しますが、Ozoneはオブジェクトストアのようにも動作します"
  • 「マネージメントとはつくること」GMOペパボCTOに聞く組織開発の真髄 | 組織改善するならエンゲージメントサーベイ【Wevox】

    エンゲージメントが高いチーム(※)の秘訣を探る、DIO THINK。今回は、CtoCハンドメイドマーケット「minne」や「カラーミーショップ」「グーペ」などのEC支援サービス、「ロリポップ!」「ムー...

    「マネージメントとはつくること」GMOペパボCTOに聞く組織開発の真髄 | 組織改善するならエンゲージメントサーベイ【Wevox】
    sh19910711
    sh19910711 2021/04/10
    "リーダーシップが高く評価されるのはよくあること / 一方で参加する側がいないと意味がない / 取り組みに積極的に参加する側 / こうしたフォロワーシップもリーダーシップと同じくらい価値のあること"
  • クリーンアーキテクチャ本を読むためのポイント|erukiti

    先日のClean Architectureは全てのプログラマにお奨めしたい良著という記事では、ASCII DWANGOから出ているClean Architecture 達人に学ぶソフトウェアの構造と設計(以下、Clean Architectureと呼ぶ)が、アーキテクチャパターンとしてのクリーンアーキテクチャ The Clean Architecture(日語翻訳版) を採用するかどうかに関わらず、ありとあらゆるプログラマにお勧めしたい良著であると書きました。 Clean Architectureは主に設計(実装面もある程度含む)において、メンテナンスしやすいものを作り上げるために必要な知見をコンパクトにまとめたです。こので押さえておくべき重要な概念は「知識」とその知識を利用する「依存関係」です。 この記事では、前回よりもさらに掘り下げて、Clean Architecture

    クリーンアーキテクチャ本を読むためのポイント|erukiti