タグ

2022年12月9日のブックマーク (3件)

  • インターネットの60%は重複である #SearchCentralLive

    [レベル: 上級] インターネットのおよそ 60% は重複である 11 月 24 日にシンガポールで開催された Search Central Live Conference Singapore のセッションに登壇した Gary Illyes(ゲイリー・イリェーシュ)氏はこんな数値に言及しました。 重複対象の URL この数値が出てきたのは、クロールとインデックスの詳細をゲイリーが解説したセッションです。 ゲイリーは、次のプロセスにクロールを細かく分解しました。 URL Extraction(URL 抽出) Normalizing(ノーマライズ) Dedupulication(重複解消) 3 番目の Dedupulication(重複解消)のプロセスの説明中に紹介されたのが「インターネットのおよそ 60% は重複である」というデータです。 次のような状態の URL を Dedupulicat

    インターネットの60%は重複である #SearchCentralLive
    dorapon2000
    dorapon2000 2022/12/09
    “こうした URL を統計的に処理すると 60% という数字が出てくるようです。実に半分以上が重複ということになります。”
  • 知財判決速報/裁判例集 - 知財ポータルサイト『IP Force』

    令和5(ネ)10104控訴棄却 名誉回復措置等請求控訴事件 被控訴人東宝株式会社 株式会社スクウェア・エニックス Y1 Y2 株式会社白組 Y3 Y4

    知財判決速報/裁判例集 - 知財ポータルサイト『IP Force』
  • 某年齢制限サービス不具合で全ユーザー向け(?)に本名が晒されました。 - Qiita

    12/9更新:不具合の原因となったコード(再現)と、レトロPC経験者向けの補足コンテンツを追加しました。 今回のポイント テストアカウントは一目で分かる偽名にする(名にしない) メソッドの先頭にバリデーション処理を入れる あらかじめ動作テストしてバグを解決する 自己紹介を読みたい方はこちら 論破しない・ひろゆき名:大和 広幸) 都内中小企業のITコンサルタント兼社内SEを担当、 WEBフルスタック歴8年以上。 小学生の頃にBASICを知り、ホームページや WEBアプリ制作などを経て現在に至る。 近年はカルト宗教二世経験をもとに 心理セラピーや児童保護支援にも取り組んでいる。 なぜ私の名が晒されてしまったのか、その経緯について 数年前、ある顧客向けサービスを運用していたときの話。 そのシステムは新型コロナの影響でサービス提供できず、 コスト削減するため既にサービス終了している。 不具

    某年齢制限サービス不具合で全ユーザー向け(?)に本名が晒されました。 - Qiita
    dorapon2000
    dorapon2000 2022/12/09
    “性「手素戸」 名「赤運斗」 性カナ「テスト」 名カナ「アカウント」”