タグ

mookieのブックマーク (713)

  • ドキュメント南極観測46 アデリーペンギンその7

    繁殖期に形成されるルッカリー(集団営巣地)で、日常的に繰り返されるアデリーペンギンの大ゲンカ。鋭いくちばしでつついたり、かみついたりと、情け容赦ないバトルの結果、とんでもない“顔”になった個体に出会った。 そのペンギンには、なぜか「眉毛」があった。見た瞬間、思い出したのは、かつて連立政権で首相を務めていた、あの方。 ペンギンとは思えない風ぼうに、思わず声を出して笑ってしまった。 とにかく、とぼけた表情にしか見えない。目が合うと失礼だが吹き出してしまう。 居合わせた生物学者の観測隊員も「ん…?」。 居合わせた隊員からは「新種じゃないの?」などと、ちょっと無責任な声も出た。 しばらくして出た専門家の結論は意外なものだった。 「ケンカによってできたハゲ」。 つまり、目の上を攻撃されて毛が抜けてしまったのでは、というのだ。 確かに、彼らのケンカを見ていると、相手ののどから上を狙うことが多いような気

    ドキュメント南極観測46 アデリーペンギンその7
    mookie
    mookie 2023/05/28
  • SimCSEとベクトル検索で類似内容を掲出し、利便性を改善する(Yahoo!検索の関連検索ワードでの事例)

    ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog こんにちは。Yahoo!検索で機械学習エンジニアをしている由川です。 Yahoo!検索では、ユーザーが入力した検索クエリに関連する内容を掲出する関連検索ワードという機能があります(検索結果ページ上部と下部にあります)。従来の方法では、この関連検索ワードを出したくても掲出できないケースがありました。記事では、高品質な文ベクトルを生成する手法SimCSEを用いて検索クエリと意味が類似する内容を掲出することで、関連検索ワード機能を改善させた事例を紹介します。 ※この記事で取り扱っているデータは、プライバシーポリシー の範囲内で取得したデータを個人が特定できない状態に加工しています。詳しくはYahoo! JAPAN プライバシーセンター

    SimCSEとベクトル検索で類似内容を掲出し、利便性を改善する(Yahoo!検索の関連検索ワードでの事例)
    mookie
    mookie 2023/05/08
    Apache Solrにベクトル検索のプラグインを利用してセマンティックサーチを実装
  • Twitter の検索システム、Earilybirdの論文を読む

    2023-04-29 前回の記事の続き1で、Twitter の検索システムシリーズ第 2 弾です。 Earlybird とは?Twitter の検索システムであり、 Apache Lucene をベースにした、リアルタイム検索システム。 論文はここで、 Blog 記事は The Engineering Behind Twitter’s New Search Experienceは 2011 年に公開されている。 TODO: 論文に書かれず、Blog 記事にのみ書かれている内容もあったので読んで追記しておく Web 検索はある程度成熟してきた分野だが、SNS のリアルタイム検索はまだ 2011 年当時いまだ未成熟で未開拓な分野Twitter で新たに開発したのが、 Earlybird と呼ばれるリアルタイム検索に特化した検索エンジンLucene の NRT 機能が導入され始めたのが、2011

    Twitter の検索システム、Earilybirdの論文を読む
  • eBay’s Blazingly Fast Billion-Scale Vector Similarity Engine

    The Similarity Engine's use cases include item-to-item similarity for text and image modality and user-to-item personalized recommendations based on a user’s historical behavior data. Introduction Often, ecommerce marketplaces provide buyers with listings similar to those previously visited by the buyer, as well as a personalized shopping experience based on profiles, past shopping histories and b

    eBay’s Blazingly Fast Billion-Scale Vector Similarity Engine
    mookie
    mookie 2023/05/08
    数十億のベクトル類似性マッチングを処理する超高速でスケーラブルな最近傍検索で、1秒あたり数千のリクエストをこなし、eBayの17億アイテムのアクティブな在庫全体を検索そして、95%の応答が25ミリ秒以内に応答する
  • Introducing sqlite-vss: A SQLite Extension for Vector Search

    Software engineer, available for freelance work! • he/him/his

    Introducing sqlite-vss: A SQLite Extension for Vector Search
    mookie
    mookie 2023/05/01
    ローカルストレージへのベクトル検索とかに使えそう
  • Twitter の検索システムを学ぶ - 概要編

    2023-04-17 Twitter’s Recommendation Algorithm Elon Mask が以前から計画していた、Twitter の検索&推薦関連のシステムが GitHub で公開された。 良い機会なので、いままでの Twitter 検索の記事をまとめつつ、コードも読んでみます。 単発の記事でまとめようとするとドデカ記事になってしまうので、一連の記事を通じて Twitter の検索システムを学んでいきたいと思っており、以下の構成で進めていく。 概要編論文解説コードを読んでみたTwitter’s New Search Architecture 2010-10-06 公開 この時期に新しいアーキテクチャに移行MySQL による検索から Lucene による検索へ移行要件1000 tweets/sec12000 queries/sec1 billion queries /

    Twitter の検索システムを学ぶ - 概要編
    mookie
    mookie 2023/04/26
    検索エンジン
  • セマンティック検索の活用で、Elasticsearchの検索が根本的に変わる!? - Taste of Tech Topics

    こんにちは、@shin0higuchiです😊 業務では、Elasticsearchに関するコンサルティングを担当しています。 最近すっかり春らしく、暖かくなってきました。 新年を迎えたばかりの感覚でしたが、あっという間に時が経ちますね。 さて、今回の記事では、Elasticsearchの検索を根的に変える可能性を秘めたセマンティック検索に関して書かせていただきます。 概要 Elasticsearchは元々、キーワードベースのアプローチを主に取っており、クエリで指定されたキーワードを対象のドキュメント内で検索し、それらの出現頻度や位置に基づいて結果をランク付けしています。この方法では、文脈や意図に関係なく、単純にキーワードの一致度に基づいて検索結果が返されます。 一方、セマンティック検索とは、ユーザーのクエリの背後にある文脈と意図を理解しようとする検索手法で、キーワードだけに頼るのではな

    セマンティック検索の活用で、Elasticsearchの検索が根本的に変わる!? - Taste of Tech Topics
    mookie
    mookie 2023/04/26
    ベクトル検索
  • 漢字「無」の成立ち:原義は舞うこと。「舞」という字の初文。無心に舞い狂う祖先の姿が見えてくる

    漢字「無」の由来:「舞」という字の初文。  漢字「無」の由来:「舞」という字の初文。無心に舞い狂う祖先の姿が見えてくる。 甲骨文や金文からは紛れもなく、この字が「舞うこと」を表していたであろうことが良く分かる。 甲骨文字は実に生き生きと人々の生活を表している。おそらく祖先は祭りや神への奉納の中で、踊り喜びを表現していたであろう。それを表した字が「無」なのだろう。後にこの字の下に両足をつけ、全身で踊る姿が体現されたと考えられる。 甲骨文では手足に飾りをつけ、エクスタシーになって舞い狂う祖先の姿が見えてくる。古代に「無」という概念が在ったのかどうかは分からないが、おそらく無我の境地と現実の「舞う」という行為を字で持って区別したのだろうと思う。 稿は、2020年12月4日金曜日にアップロードしたものに、加筆修正したものである。

    漢字「無」の成立ち:原義は舞うこと。「舞」という字の初文。無心に舞い狂う祖先の姿が見えてくる
    mookie
    mookie 2023/04/25
    無は踊るが語源
  • Why language is not everything that Noam Chomsky said it is | Aeon Essays

    Few scientific disagreements lead to public controversy. But there are times when the subject or the participants in a debate so capture the public imagination that otherwise dry, technical matters of discord among researchers erupt into the media, eliciting a wide array of opinions from experts and non-experts. Getting the public interested is good for science if it leads to deeper thinking about

    Why language is not everything that Noam Chomsky said it is | Aeon Essays
    mookie
    mookie 2023/04/23
    「Oysters oysters eat eat oysters.」
  • 『ピダハン 「言語本能」を超える文化と世界観』 答えは、問いの外にある 医学書院・白石正明さん|好書好日

    アマゾンの先住民ピダハンの村に伝道師として赴いたにもかかわらず、彼らと暮らすうちに無神論者となってしまった。さらにピダハン語の研究で、言語学者としても主流派から放逐された。そんな著者によるノンフィクションである。 言葉のおもしろい。言葉について言葉で説明しなければならない、という原理的な困難に遭遇するからだろうか。ピダハン語以外は通じないため、「ピダハン語を学ぶためにピダハン語を覚えなければならない」という堂々巡りに陥った著者の困難もそれだ。 やがてわかってくるのだが、ピダハン語には数がなく、左右の概念も、色名もないという。つまり私たちの言葉と基設定が違うらしいのだ。 「左を英語でなんと言う?」なら「left」と答えればよい。しかし左右の概念がない言語で、例えば左手をどう表現するか? これはちょうど、前述した「ピダハン語を知らないとピダハン語が学べない」と同じ構図だ。問いと答えが循環

    『ピダハン 「言語本能」を超える文化と世界観』 答えは、問いの外にある 医学書院・白石正明さん|好書好日
    mookie
    mookie 2023/04/23
    Amazon流域に住むピダハン族は左右という単語がないので上流か下流で説明するので、川がないところにいると不安になるらしい。“さて、左手をどう言うかと問われたピダハンはこう答えた。「手は上流にある」”
  • 話をしていた女性が突然真顔で「あたしアンドロイドなんです」と言い出して何のことかわかるまでの数秒間わくわくした

    田中哲弥 @tezyatanaka 小説家。 最新刊は『オイモはときどきいなくなる』福音館書店 amzn.to/2S1KQPw なんと第62回日児童文学者協会賞を受賞です。 tezyatanaka.blog.fc2.com 田中哲弥 @tezyatanaka 最近知り合った女性と事しながらどうでもいい話をしていたら突然真顔で「あたしアンドロイドなんです」と言い出して、ああスマホのことかとわかるまでの数秒間めちゃくちゃわくわくした。 2023-04-19 17:29:13

    話をしていた女性が突然真顔で「あたしアンドロイドなんです」と言い出して何のことかわかるまでの数秒間わくわくした
    mookie
    mookie 2023/04/21
    ウナギ文は文字に起こすと違和感を感じることもあるが、日本語母語話者が会話中で気になることはない気がする。
  • GitHub - facebookresearch/faiss: A library for efficient similarity search and clustering of dense vectors.

    You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

    GitHub - facebookresearch/faiss: A library for efficient similarity search and clustering of dense vectors.
    mookie
    mookie 2023/04/13
    Faissは、Facebook AIが開発した効率的な近似最近傍探索ライブラリで、ベクトル空間の大規模データセットを高速に検索・クラスタリングするためのツール
  • 河村たかしと減税日本 日本維新の会と共闘崩れ 愛知 名古屋 議員選挙 | NHK政治マガジン

    「おふくろさんよ~おふくろさん」 3月23日、みずからの政治資金パーティーで、十八番の森進一を披露した名古屋市長の河村たかし(74)。統一地方選挙を前に、きわめて上機嫌だった。 しかし、これまで共闘していた維新とたもとを分かち、みずからが代表を務める地域政党・減税日からも所属議員が離反するなど、態勢は盤石とは言えない。 “総理を狙う男” 河村たかしは、選挙にどう臨んだのか。 (名古屋局 豊嶋真太郎) 河村人気は健在? 統一地方選挙・前半で行われる愛知県議会議員選挙と名古屋市議会議員選挙の告示日を控え、河村たかしは、名古屋市のホテルで政治資金パーティーを開いた。 当初400人ほどの来場を見込んでいたが、会場には500人を超える支援者が集まり、急きょ追加の座席を用意する事態に。 河村は各テーブルを回り、支援者から求められる写真撮影に次々に応じていった。 ステージに立つと、名古屋市で実施した減

    河村たかしと減税日本 日本維新の会と共闘崩れ 愛知 名古屋 議員選挙 | NHK政治マガジン
    mookie
    mookie 2023/04/09
    “「減税をやめて選挙通ったもんは、1人もおらんでね。防衛戦無敗ですから」 ” 減税日本のわかりやすい要約ですね
  • 「お風呂が湧きました」みたいな日本語を集めたい

    正確には「湧いたお湯でお風呂が満たされました」だけど「お風呂が湧きました」で通じる。 こういう日語ってほかにある?

    「お風呂が湧きました」みたいな日本語を集めたい
    mookie
    mookie 2023/04/09
    定番ですいませんが三上文法の「コンニャクは太らない」ですかね
  • 「B級グルメ」が魅力的だと思う都道府県ランキング! 第2位「愛知県」、第1位は?(ねとらぼ) - Yahoo!ニュース

    mookie
    mookie 2023/04/09
    「豊橋カレーうどん」はあまり見ない印象
  • 55歳で無職生活1年 「転職を甘くみていた」ユーグレナ執行役員が語る反省 | ビズリーチ

    50代以降の輝けるキャリアについて考える企画。今回、「委員」としてお話しいただくのは、ユーグレナで執行役員エネルギーカンパニー長を務める尾立維博さんです。外資系化学大手、シェルケミカルズジャパンのトップを務めた経験もある尾立委員が陥った、転職の失敗とは。

    55歳で無職生活1年 「転職を甘くみていた」ユーグレナ執行役員が語る反省 | ビズリーチ
    mookie
    mookie 2023/04/09
    50代が活躍する秘訣、「成長し続ける」心構え、新しいことに挑戦し続け、自己改革・向上心を忘れず。
  • 【前半戦】選挙に行ったらブクマ・コメントする日記

    今日は統一地方選挙の投票日です。 投票に行ったらこの日記にブクマやコメントして、選挙を盛り上げよう! 投票が面倒だと思った人は、投票行ったら外することにしたら行きたくなるかも? 投票よろしくお願いします! 【追記】 日は統一地方選挙の前半選挙でした。 日が投票日ではなかった地域の方々、混乱させて申し訳ありません。 後半選挙は4/23 (日)となります。対象の選挙は、 ・市区首長・市区議会議員 ・町村首長・町村議会議員 となります。

    【前半戦】選挙に行ったらブクマ・コメントする日記
    mookie
    mookie 2023/04/09
    今回の選挙が無投票当選にならなかった感謝の気持ちを立候補者にこめて投票する。
  • HTMLにsearch要素が追加されたぞ!

    先週、HTML Living Standardの仕様にsearch要素が追加されました。 ブラウザへの実装はまだ先になると思いますが、検索フォームを実装する時は下記のようなHTMLを使用できるようになります。アクセシビリティの面でも率先して使用していきたいですね。 参考: The search element 2023年3月24日、HTML Standardの仕様にsearch要素が追加されました。 Add the <search> elementhttps://t.co/AlmyHd0qxI — HTML Standard (@htmlstandard) March 24, 2023 追加されたsearch要素は、下記で確認できます。 カテゴリは、フローコンテンツです。 4.4.15 The search element -HTML Standard search要素は、検索またはフィル

    HTMLにsearch要素が追加されたぞ!
    mookie
    mookie 2023/04/05
  • 不自然な男の性欲 - やすだ 😺びょうたろうのブログ(仮)

    どうもこんばんは、安田鋲太郎です。 さて今回は男の三大欲求すなわち性欲、性欲、性欲のうちの一つ、性欲についてお話します。 僕は性欲はなにかと男女非対称なものだと思っているので、基的には男側の視点からの話になりますが、スッキリした文章にするために「この部分は男性のみ」とか「ここは男女共通である」といった注釈はほとんど入れていないので、その点については適宜頭のなかで補完してください。 では書いていくー(・ω・)ノ🌸 * 射精するとプロラクチンという脳内物質が放出され、ドーパミンの働きを阻害するので、一時的に性欲だけでなく何に対しても冷静になり、したがってオスはすみやかに天敵が近付いていないか等をチェックすることが出来る。この仕組みが弱かった先祖は、セックス後に恍惚としているうちに熊や大蛇にべられたり餓死してしまったのだろう。 この、いわゆる「賢者タイム」(しかしこの言葉はあまり好きではな

    不自然な男の性欲 - やすだ 😺びょうたろうのブログ(仮)
    mookie
    mookie 2023/03/31
    “寒冷地に棲息する期間の長かったモンゴロイドにとって、体積にたいする表面積は少ないほどよかった” 直感的に表面積を最小化すべく寒冷地の生物が大型化したことと相反するがエネルギー消費という制約条件の話か
  • 意外と知られてない、すごく効果のある文章上達法|ふろむだ@分裂勘違い君劇場

    文章上達法について、「大量に書け」派と「大量に読め」派の人がいます。 「ひたすら大量に文章を書け。文章上達にはそれしかない」というのは書け派の典型。 「まずはラノベを千冊読め。話はそれからだ」というのは読め派の典型。 しかし、大量に文章を書いているのに文章の下手な人はたくさんいますし、 ラノベをたくさん読んだけど面白いラノベの書けない人もたくさんいます。 これはスキル全般に言えることで、 たとえば、アメリカに二十年住んでいるのに英語がいまいちな人なんて、いくらでもいます。 「量をこなせば自ずと質に転換する」のは、もともと才能のある人間だけです。 私のような凡才は、量をこなすだけでは効率よく上達しません。 質の高い修練を大量にやってはじめて、効率よく上達するのです。 では、質の高い修練とはどういうものでしょうか? それは、次の2つです。 (1)優れた文章のどこがどう優れているかを、文章を書く

    意外と知られてない、すごく効果のある文章上達法|ふろむだ@分裂勘違い君劇場
    mookie
    mookie 2023/03/31
    “文章における、「五感」「行動」「説明」の割合全てを同時に増やす、優れた文”