タグ

2020年5月3日のブックマーク (8件)

  • ElasticSearch で文書を検索をしてみる / 桃缶食べたい。

    ElasticSearch で文書を検索をしてみる ElasticSearch で提供されている代表的な文書の検索機能には、全文検索クエリと Term ベースクエリがあります。全文検索クエリは、検索時のキーワードが含まれているるドキュメントを探し出すための検索クエリです。一方 Term ベースクエリは、検索時のキーワードが完全に一致するドキュメントを探し出すための検索クエリになります。 よくある検索エンジンのようにキーワードが含まれている WEB ページを探すというような用途では全文検索クエリが適していますが、ユニークなキー値のようなものをキーワードにして、そのキー値が割り当てられている文書を探すような用途では Term ベースクエリが適しています。全文検索クエリではあらかじめ文書が単語に分割されて、その単語に対して検索が行われますが、Term ベースクエリでは文書が単語に分割されず、キー

  • Railsで作るBFFの功罪

    2017/03/30に行われた Microservices Meetup vol.5 (API Gateway & BFF) の発表資料です。 Ruby on RailsでBFFを構築した際の知見についてご紹介致します。

    Railsで作るBFFの功罪
  • 国の機関サイトの残存率 | 特色あるコレクション(おすすめコンテンツ)|国立国会図書館インターネット資料収集保存事業

    ウェブサイトは時間の経過とともに新陳代謝が進んでいきます。WARPで集めた国の機関サイトの中から1,000万ファイルを抽出して、過去5年間の残存状況を分析しました。 URLの残存率 2010年から2014年の各年に存在したURLが2015年にどのくらい残っているかを示したのが以下のグラフです。残存率は年をさかのぼるにつれて低くなり、5年前(2010年)のURLは60%がなくなっているのがわかります。 内容の残存率 URLが残っていることと内容が残っていることは必ずしも同義ではありません。URLが同じで内容が変わる場合や、反対に同じ内容でURLが変わる場合もあるからです。 そこで、同じ内容が残っているかどうかについてハッシュ値による分析も行いました。ハッシュ値とは、電子ファイルを特定の計算方法で操作して得られる値で、ごく僅かでも内容が変わるとハッシュ値も変わるため、ファイルの内容が同じものか

    sh19910711
    sh19910711 2020/05/03
    "2010年から2014年の各年に存在したURLが2015年にどのくらい残っているか / 残存率は年をさかのぼるにつれて低くなり、5年前(2010年)のURLは60%がなくなっている"
  • VeriFast Termination Checking Introduction(α)

    静的コード解析の会 第2回 (https://metasepi.connpass.com/event/50450/) で発表した資料です。 VeriFastによるC(およびJava)言語の停止性証明に関する解説を行っています。停止性検査を行う理論的背景を説明し、これを行う際にVeriFastの採る大まかな方針と検証のアイデアを説明しています。

    VeriFast Termination Checking Introduction(α)
  • ドングル型の超小型のAruduino互換機を分解してみた - emcppの電子工作日記

    前から気になっていたArduino互換機。Arduino互換機のほとんどは基板むき出しなのに、これは、ちゃんとケースに入っている。しかもUSBメモリみたいなケース。金属製のケースで高級感まである。 どう見てもUSBメモリだ。この中にATmega32U4が入っていて、Arduino leonardo互換機のブートローダーが入っている。Arduino IDEでプログラミングが可能だ。 ダイレクトUSB ドングル型 ATmega32U4 Arduino Leonardo互換機 【注意】USBメモリではありません! 金属製のUSBメモリっぽいケースに、Arduino互換機が入っています。 Arduino Leonardoとして認識しますので、仮想キーボード・マウスの機能が使用できます Amazonで購入 PCに差し込むと、Arduino leonardoとして認識する。 Arduino IDEでキ

    ドングル型の超小型のAruduino互換機を分解してみた - emcppの電子工作日記
  • GitHubに1コマンドでいろいろPUTできるツールghputを作った - Copy/Cut/Paste/Hatena

    ghput pr-comment ghput issue-comment のデフォルトの挙動について注意点を追記しました 最近はGitHubやGH:Eといったサービスのリポジトリと、そのリポジトリと連携するCI/CD環境がある前提で、様々なパイプラインを作ることが普通になってきています。 git push や Pull Request をトリガーにCI/CD環境で実行されるのもテストの実行だけではなく、master mergeのタイミングでのプロダクションデプロイやプロビジョニング、その前段階としてPull Requestタイミングでのdry-runやplanの実行など。 GitHubは便利ですし、それと連携するCI/CD環境があるとその2つだけで様々なものの自動化ができて便利です*1。 そんなGitHub+CI/CDな環境で使えるであろう ghput というツールを作りました。 gith

    GitHubに1コマンドでいろいろPUTできるツールghputを作った - Copy/Cut/Paste/Hatena
  • eBPF+USDTでphpをトレースしてみる、bpftaceとRbBCCでやる - ださろぐ@はてな

    最近プロダクション環境での諸々の調査に使いたいというモチベーションで BPF Performance Tools (Book) 読み進めつつ、提供されているbcc-toolsを試したりbpftraceでlibほげほげの関数パラメータを抜いたりしていた、のだがUSDTを使用したトレースはうまく動かせず悶々としていた。 正直USDTはパッケージ入れておけばいきなりproductionでさくっと使える、という感じでもなく当初の目的からはやや外れているのだが、機構があるのに動かせないというのはなんとももどかしいので、諸々試行錯誤してとりあえず動いた、というころまでの記録を残しておく。対象はphpで。 なぜphpなのかというと、プライベート的にもお仕事的にも馴染みがありワンチャン使える可能性もあるのでは・・という期待と、ツールを試す過程で標準パッケージのphpで $ tplist-bpfcc -l

    eBPF+USDTでphpをトレースしてみる、bpftaceとRbBCCでやる - ださろぐ@はてな
  • poetryを利用した動的なバージョン管理とGitHub ActionsによるPyPIへのrelease - Stimulator

    はじめに この記事を読んで出来る事 poetryによる外部モジュールバージョン管理 poetry-dynamic-versioningによる動的なバージョン付与 GitHub Actionsを利用したPython周りの基的なCI/CD設定 GitHubのReleaseタグ付与をTriggerとしたPyPIへのアップロード 今後私がPythonで何かライブラリ作ろうと思ったらこれを実施するぞというメモです はじめに poetryによるモジュールバージョン管理 PyPIへのアップロード GitHab Actionsを用いたCI/CD その他GitHubでやること 参考 poetryによるモジュールバージョン管理 バージョンをGitHubのタグで管理したい事の方が多いはず。 setup.pyを利用する場合は、一般的にsetuptools_scmを使うが、poetryはsetup.pyのようにb

    poetryを利用した動的なバージョン管理とGitHub ActionsによるPyPIへのrelease - Stimulator