タグ

2018年7月30日のブックマーク (8件)

  • テーブルデータに対して、DenosingAutoEncoderで精度向上 - にほんごのれんしゅう

    データセットの問題 Kaggle Porto Seguroでは問題となっている点があって、テストデータとトレインデータのサイズの方が大きく、トレインだけに着目してしまうと、LeaderBoardにoverfitしてしまう問題があります。 これはトレインだけで学習するために起こる問題で、テストデータ・セットを有意義に使う方法として、教師なし学習でまずは次元変換やなんやらを行うという方法が有効なようです。 ディープを用いることでいくつか有益な変換操作を行うことができて、「すべての情報は何らかのノイズを受けている」という視点に立ったときに、恣意的にAutoEncoderの入力にノイズを乗せ、それを除去するように学習するとはっきりと、物事が観測できるようになったりするという特徴を利用しています。 図1. よくある画像の例 画像の利用からテーブルデータの利用に変換する操作を行います。 このテーブルデ

    テーブルデータに対して、DenosingAutoEncoderで精度向上 - にほんごのれんしゅう
    stealthinu
    stealthinu 2018/07/30
    ノイズ除去用のオートエンコーダを噛ますことで画像だけじゃなくテーブルデータでも精度が向上すると。またノイズの乗せ方にテクニックが必要でswap noiseという手法がよいらしい。
  • SEOポイズニングの手法を使用した偽ECサイトについて - tike blog

    はじめに 今年3月、リクルートテクノロジーズ社が偽サイトへの誘導を目的としたSEOポイズニングに関する記事を公開しました。 recruit-tech.co.jp 脆弱性を突くなどして他のサイトに検索エンジン(Google等)のクローラのみがアクセスできるページを不正に設置し、このページを踏み台として攻撃者が運用する偽サイトにユーザを誘導しようとする試みに関する記事です。 同様の試みは、現在も活発に行われています。 記事では、SEOポイズニングの手法を使用した偽ECサイトに関して、現時点で確認できていることを纏めてみたいと思います。 SEOポイズニングの手法について 偽ECサイトへの踏み台として不正に設置されるページは、日国内で一般的に認知されている組織のWebサイトをコピーしたもののようです。 検索エンジンで、このようなWebサイトのCopyright部分をキーワードとして検索すると、

    SEOポイズニングの手法を使用した偽ECサイトについて - tike blog
    stealthinu
    stealthinu 2018/07/30
    これ最終的に出てきてるドメイン所有者だってサイト同様、適当にどっかのドメインの情報を適当にパクってきてるだけって可能性も高いのでは。
  • 9市町障害「業者コケると…どうしようもない」 : 社会 : 読売新聞(YOMIURI ONLINE)

    障害発生が明らかになって5日目、ようやく復旧したシステムを使って残務に追われる職員(27日、坂井市役所で) 福井県あわら市、坂井市、永平寺町、おおい町で証明書発行といった住民サービスが利用できなくなり、庁内業務を含めて計9市町に影響したシステムの障害は、発生から1週間が過ぎた30日にようやく完全復旧となる見通しだ。県と全17市町の業務に関わる民間のシステム会社で発生した通信障害はほぼ1週間に及び、原因も解明されておらず、現代社会を支える情報通信技術が抱えるもろさを露呈した。 ◆失態 「復旧作業は順調に進んでいる。明朝には解決する」。運用する福井システムズ(坂井市)はトラブルを公表した23日以降、楽観的な見通しを示しては翌朝に撤回、という失態を繰り返した。 障害の発生は22日未明。各役場の休みにデータをやりとりする会社のサーバーのソフトを更新しようとして突然、システムが使えなくなった。丸一日

    9市町障害「業者コケると…どうしようもない」 : 社会 : 読売新聞(YOMIURI ONLINE)
    stealthinu
    stealthinu 2018/07/30
    自分の今の立場は置いといてこの手の市町村のシステムは共通化してしまうべきだよねと思う。これのせいでどれだけ日本中で無駄な開発がされて、無駄に心身壊してる人がいるのだろう。
  • テスト自動化とお掃除ロボット

    テスト自動化チームでペアプロにトライした話 / trying to pair programming on test automation team

    テスト自動化とお掃除ロボット
    stealthinu
    stealthinu 2018/07/30
    UIレベルのテスト自動化を行うと、テストそれ自体によるものより、自動化を行うための周辺整備と維持が必要になるため品質が上がる、という話。
  • 自分とは何者なのだろうか : たくろふのつぶやき

    2017年11月29日19:43 カテゴリEducation 自分とは何者なのだろうか 「5月病」というのはよく知られているが、「11月病」というのはあまり知られていない。 そりゃそうだろう。僕が勝手に名付けた症状だからだ。 僕の感覚では、5月病など屁のようなものだが、11月病は下手をすると大学生の一生を狂わせる。 11月病というのは、よくある大学生の戯れ言「自分とは何者なのか」という人生の迷いを指す。命名通り、11月あたりに発症する学生が多い。夏の浮かれた時期が過ぎ、涼しさから寒さへと気候が変わる頃になると、「いまやっていることが当に自分のやりたいことなのか分からなくなってきたんです」のような、わけの分からないことをほざき出す。 大学生の5月病なんぞ、一種の燃え尽き症候群であることが多い。大学受験のストレスから解放され、勉強という「毎日やらなければならないこと」がなくなる。一人暮らしを

    stealthinu
    stealthinu 2018/07/30
    このエントリすごい良いと思う。確かに大学でそういうの起こりがちだがそれは他人に認められることだけ追ってきて自意識が確立してないからという指摘。解決法は「勉強」せよ。
  • 杉田水脈衆院議員の顔は「幸せに縁がない」? 観相学で見てみたら… (1/4) 〈AERA〉|AERA dot. (アエラドット)

    「『LGBT』支援の度が過ぎる」と題した月刊誌「新潮45」への寄稿で、持論を展開した自民党の杉田水脈(みお)衆院議員(比例中国ブロック)。これまでも「男女平等は、絶対に実現しえない反道徳の妄想」「『待機児童』なんて一人もいない。待機しているのは預けたい親」など極端に偏った意見で物議を醸してきた杉田氏は、どんな人物なのか。嘉祥流観相学会代表・岡井浄幸さんが杉田氏の顔を、観相学的に読み解いた。 *  *  * 杉田議員のお顔は、まず全体の印象として「幸せに縁のない」お顔。額は前頭葉に直結する部分、良い気も悪い気も、ここから取り込み、また放出する大切な場所。それが、長い前髪でおおわれてしまって、入る・出るが滞っている。 また、額を出した写真を見ても、政治家としてあまり良い額をしているとは言えません。 まず、眉から生え際まで、額の高さはたっぷりあります。これは非常に頭がよく、情報が豊富であることを

    杉田水脈衆院議員の顔は「幸せに縁がない」? 観相学で見てみたら… (1/4) 〈AERA〉|AERA dot. (アエラドット)
    stealthinu
    stealthinu 2018/07/30
    もう消えてたがこれはいくらなんでも酷いだろ。LGBT差別発言を批判するためにルッキズムで攻撃とか、頭湧いてるとしか思えない。しかもそれをいわゆるリベラル側新聞社がやるとか…
  • Photable: Photo Editor & Collage Maker - Google Play のアプリ

    stealthinu
    stealthinu 2018/07/30
    この手のってどうやってやってんだろ。目をでかくするのと同じような感じなのか、なじませるのにGANみたいな手法つかったりしてるんだろうか。
  • 文字化け - tmtms のメモ

    こんなツイートを見かけたので文字化けを直してみました。 譁�ュ怜喧縺代@縺。繧�▲縺溘ヤ繧、繝シ繝医@縺ヲ縺ソ縺溘¢縺ゥ縲√≧縺昴□繧医��√▲縺ヲ縺薙�譁�ュ怜喧縺題ァ」隱ュ縺励※縺上l繧倶ココ縺�k縺ョ縺九↑縲ゅ>縺溘i諢滓ソ縲ゅ%繧瑚ェュ繧薙□繧医�縺」縺ヲ莠コ縲碁ィ吶&繧後↑縺九▲縺溘崎ソ比ソ。縺雁セ�■縺励※繧九— LINE RECORDS (@LINE_RECORDS_JP) July 26, 2018 見た感じ、UTF-8をシフトJISとして表示したときのようなので、ツイートをコピペしたファイルをシフトJISに変換してみます。 % ruby -e 'p File.read("mojibake.txt").encode("cp932", undef: :replace).force_encoding("utf-8")' "\xE6\x96?\xAD\x97化けしち\xE3\x8

    文字化け - tmtms のメモ
    stealthinu
    stealthinu 2018/07/30
    最初の文字とかどうやれば復元できるんだろ?と思ってたが、やっぱ欠損データがあるためそのままでは復元できないから3byte中2byte合ってるもので推測し、1byteしか情報ないひらがなはそこから推測と。