2017年5月26日のブックマーク (3件)

  • 「絶対要らないハズだけど、なかなか削除できずにいるもの」を対応した小話 | メルカリエンジニアリング

    はじめましてこんにちは。SREの@masartzです。 私は最近joinしたのですが、今回は番環境に古くからあるテーブルの掃除作業をした案件をご紹介します。 tl;dr; 番の住所情報テーブルを消したけど問題なかった話 絶対要らないハズだけど、なかなか削除できずにいるもの を対処する話 番環境の住所情報テーブルをdropするまでの作業 今回、番環境の住所情報テーブルをdropしました。 と言っても、事故でもうっかりでもなく、既に使われていなかったものの整理という作業でした。 何故使われていなかったかというのは、メルカリの住所情報の保持の仕方の変遷が関係しています。 初期にはuser情報と住所情報は1対1の関係でした。イメージとしては以下です。 CREATE TABLE IF NOT EXISTS users ( id INT UNSIGNED NOT NULL, name VARC

    「絶対要らないハズだけど、なかなか削除できずにいるもの」を対応した小話 | メルカリエンジニアリング
    miki_bene
    miki_bene 2017/05/26
  • 書写言語研究におけるサンプルデータの重要性と妥当性 | yasuokaの日記 | スラド

    私(安岡孝一)の2016年2月26日の日記の読者から、近江龍一・西原陽子・山西良典の『ドメインにより意味が変化する単語に着目した猥褻な表現のフィルタリング』(人工知能学会第31回全国大会論文集, 2M2-OS-34a-1, 2017年5月24日)という論文を読んでほしい、との御連絡をいただいた。読んでみたのだが、書写言語研究におけるサンプルデータの重要性を全く理解していない論文で、正直、頭が痛くなった。 研究では猥褻な表現に関する文を集めるために,pixivに投稿されているR-18小説を用いた.R-18小説に分類される小説の中から,2016年10月のウィークリーランキングTop10の小説を選択し,分析に用いた. そんな偏ったサンプルデータ10で、まともな結果が出るわけが無いだろう。しかも、なぜpixivに限定しなければいけないのか、pixivに限定する意図は何なのか、この論文には全く書

    書写言語研究におけるサンプルデータの重要性と妥当性 | yasuokaの日記 | スラド
    miki_bene
    miki_bene 2017/05/26
  • pixiv小説引用問題とそれぞれの論点について

    https://togetter.com/li/1113766 https://matome.naver.jp/odai/2149564479015738601 この問題、確かに出典を明記するべきではなかったし配慮が足りなかったとは思うけど、 それぞれの論点については疑問な点も多い。各論点についてどこが問題でどこが問題でないのか個人的な整理をしておく。 ・「未成年が見れないようにしてあるのに、引っ張り出してきて有害呼ばわりする」について 「有害」の定義について誤解が含まれている。 ここで言う「有害」あるいは「有害情報」というのは一種の専門用語で、 たとえばWikipediaの「有害情報」のページには、 「主に青少年がその情報に接することによって健全な発達・育成を阻害する恐れが有ると考えられているコンテンツの総称」とある。 Wikipediaが信用ならないなら、「有害情報」「有害表現」で検索

    pixiv小説引用問題とそれぞれの論点について
    miki_bene
    miki_bene 2017/05/26