ブックマーク / blog.leko.jp (6)

  • WebAssemblyの形態素解析器GoyaをRustで作った

    Goyaという形態素解析器を Rust で作りました。記事は利用者目線で Goya の紹介をします。技術的な詳細については別途記事を書きます。 形態素解析とは? (このセクションは形態素解析の基礎の話なので知ってる方は読み飛ばしてください) 形態素解析(けいたいそかいせき、Morphological Analysis)とは、文法的な情報の注記の無い自然言語のテキストデータ(文)から、対象言語の文法や、辞書と呼ばれる単語の品詞等の情報にもとづき、形態素(Morpheme, おおまかにいえば、言語で意味を持つ最小単位)の列に分割し、それぞれの形態素の品詞等を判別する作業である。 — 形態素解析 - Wikipedia 例えば早口言葉の”すもももももももものうち”(スモモも桃も桃のうち)という言葉を形態素解析すると以下のような結果が得られます。スモモや桃が名詞、間にある”も・の”は助詞と解析さ

    WebAssemblyの形態素解析器GoyaをRustで作った
  • 開発者ツールで使える便利なcopy関数

    こんにちは。開発者ツールネタです。 ChromeでもFirefoxでもSafariでも使える便利な関数が色々あります。 その中の1つcopy関数について紹介したいと思います。 copy関数とは? クリップボードに渡した文字列をコピーする関数です。 開発者ツールを起動し、コンソールタブを開く。 と実行した後にペーストしてみてください。xxxがコピーされてると思います。 一点注意なのが、 このcopy関数は開発者ツール以外では使用できない特殊な関数 です。 なので.jsファイルとかにcopyと記述しても「そんな関数無いよ」と言われてしまいます。 便利な使い方 jsでごにょった値をコピーして使う、と言ってしまえばそれまでなんですが、 具体的にどんなケースに使えるんだろうという具体例を考えてみます。 他のブラウザではわかりませんが、少なくともChromeではES6のメソッド群が色々使えるので、それ

  • プログラム内でdotenvを読み込むのをやめた話

    dotenvというRuby発のOSSがあります。 .envって名前のファイルに環境変数を列挙してライブラリを読み込むと、それらの値をプロセス内の環境変数として値を展開してくれるというツールです。 もちろんNode.js版の実装も存在します。 Herokuを愛用していた時期によく使っていたのですが、何年か使ってみた結果プロセスの中でrequire('dotenv').config()と書くのではなく、そのプロセスを起動するときにnode --require dotenv/configとrequireオプションを用いてdotenvとプログラムの依存をなくす方向に落ち着きました。 なぜそちらの方がいいのか考えていることを残しておく。 コードがコミットされてない(はずの)ファイルに依存している 当然ですが、dotenvがソースに書かれているということは.envという名前のファイルが存在していること

  • GitHubのトレンドで振り返る2020年のJavaScript

    れこです。この記事はNode.js Advent Calendar 2020の 12 日目の記事です。今回は年の瀬ということで酒の肴になりそうな記事を書きたいと思います。 記事では 2020 年に GitHub のトレンドに上がったリポジトリをいくつかの切り口で集計して、独断と偏見で感想を付け加えます。 この記事を酒の肴に 2020 年の JS/TS について懐かしんでもらえたら幸いです。 集計方法 GitHub のトレンドは過去の履歴が残っていないので非公式に集計されたデータを利用しています。 集計期間は 2020/01/01 から 2020/12/05 までの 341 日間 対象言語はJavaScriptTypeScriptのみ トレンドの過去データのソースはxiaobaiha/github-trending-historyを参照 日ごとにまとめた markdown になっており、

    GitHubのトレンドで振り返る2020年のJavaScript
  • GitHubのトレンドで振り返る2021年のJavaScript/TypeScript

    今年も GitHub のトレンドで 2021 年の JavaScript/TypeScript を振り返ります。去年の記事はこちらです。 — GitHub のトレンドで振り返る 2020 年の JavaScript | WEB EGG 集計方法 GitHub トレンドは過去の履歴を公式に提供していないため、非公式に集計されたデータを利用しています。 データソースはlarsbijl/trending_archiveを使用 去年はxiaobaiha/github-trending-historyを利用したが今年のデータは無かったので変更 日ごとにまとめた markdown になっており、remark で AST→ データ化しました 集計期間は 2021/01/01 から 2021/12/15 まで 対象言語はJavaScriptTypeScriptのみ 集計後のデータはこちらのスプレッドシー

    GitHubのトレンドで振り返る2021年のJavaScript/TypeScript
  • GitHubのトレンドで振り返る2022年のJavaScript/TypeScript

    今年も GitHub トレンドから 2022 年の JavaScript/TypeScript を振り返ります。去年の記事はこちらです。 — GitHub のトレンドで振り返る 2021 年の JavaScript | WEB EGG 集計方法 記事の集計期間は 2022/01/01〜2022/12/07、対象言語は JavaScript および TypeScript です。 なお GitHub がそのリポジトリをなんの言語と見なしてトレンドに掲載したかをもとに集計対象を決定していることにご留意ください。 別言語で書かれた Rust 製の JS 向けのツールや CSS フレームワークなどは基的に対象外となります。 集計に利用したデータですが、GitHub は過去のトレンドを閲覧する方法を提供していないため、独自の仕組みで GitHub トレンドのアーカイブを生成しそのデータを利用しまし

    GitHubのトレンドで振り返る2022年のJavaScript/TypeScript
  • 1