第 3 回: コメント --- セッションリスト 第 1 回: 導入と原則 - https://speakerdeck.com/munetoshi/code-readability-session-1-ver-2-ja 第 2 回: 命名 - https://speake…
はじめに 先日、kaggleのCommonLit Readability Prizeというコンペに参加しました。 このコンペの目的は、 アメリカの教育現場における、3年生から12年生のクラスで使用する読み物の複雑さを評価するアルゴリズムを構築すること というものでした。 現状の課題は以下のように説明されていました(DescriptionをDeepLで翻訳)。 現在、ほとんどの教育用テキストは、伝統的な読みやすさの方法や市販の計算式を使って読者に合わせています。しかし、それぞれに問題があります。Flesch-Kincaid Grade Levelのようなツールは、テキストのデコーディング(単語あたりの文字数や音節数など)や構文の複雑さ(文章あたりの単語数など)の弱い指標に基づいています。そのため、構成要素や理論的妥当性に欠けています。また、Lexileのように市販されている計算式は、コストが
code-readability-links.md Code readability presentation links English version Session 1: Introduction and Principles - https://speakerdeck.com/munetoshi/code-readability-session-1-ver-2-en Session 2: Naming - https://speakerdeck.com/munetoshi/code-readability-session-2-ver-2-en Session 3: Comments - https://speakerdeck.com/munetoshi/code-readability-session-3-ver-2-en Session 4: State - https://sp
先日Cloudflare Workersでウェブページの本文を抽出したくなったことがありました。本文抽出といえば、@mozilla/readabilityが使えそうです。しかし依存に含まれるnwsapiにはFunctionコンストラクタが多用されており*1、Cloudflare Workersでは動作しません。これを修正するのも大変そうです。 そこで、TinyGoを使用してgo-readabilityをwasmにコンパイルしてみることにしました。 TinyGo のドキュメントUsing WASM | TinyGo のままではCloudflare Workersでは動かなかったので、TinyGoに含まれるwasm_exec.jsを少し修正したり*2、 import側もwasmファイルをfetchしているのを変更したり*3すると無事動きました。 動作するコードは https://github.
現状、最低限動いてはいるけどガバガバ Readability.js とは HTML から本文を抽出するライブラリ。 元々はArc90によって開発され、現在はMozillaのFirefox Reader View に使われている。 AIモデルではなくルールベースだが、かなり精度がでる。 自分はこれを AI に食わせるサマリを作るのに愛用していたのだが... DOM API 依存と Cloudflare でJSDOMが動かない問題 DOM API に依存しているので、 jsdom に依存してしまう。 import { JSDOM } from "jsdom"; import { Readability } from "@mozilla/readability"; import html2md from "html-to-md"; function getExtractContent(htmlC
Can we emulate the upcoming CSS contrast-color() function via CSS features that have already widely shipped? And if so, what are the tradeoffs involved and how to best balance them? Relative Colors Out of all the CSS features I have designed, Relative Colors aka Relative Color Syntax (RCS) is definitely among the ones I’m most proud of. In a nutshell, they allow CSS authors to derive a new color f
8月2日に終了したKaggle「CommonLit Readability Prize」コンペにチームで参加し、25位でした。 3682チーム参加で、17位までが金メダル圏内で、もう一歩という結果でした。 コンペ概要 チームでの取り組み 上位解法 全体共通の傾向 1位 2位 3位 4位 5位 6位 9位 12位 13位 14位 15位 16位 コンペ概要 英語の文章の「読みやすさ」の値を-3から3程度の範囲(大きいほど読みやすい)*1で予測する問題でした。 正解の値は、2つの文章の比較結果を利用する「Bradley–Terry model」*2で付けられていたそうです*3。 推論時は文章単体に対してスコアを予測する必要がありました。 データセットのサイズは小さく、学習用データセットが約3000で、評価用データセットが2000*4以下でした。 与えられたデータセットのカラムは、以下の通りです
「読みやすいコードのガイドライン」出版記念特別企画!「読みやすいコメント・読みやすい関数とは? CODE READABILITY LECTURE」レポート LINE株式会社 石川宗寿さんが「読みやすいコードのガイドライン」を出版されました。その内容を元に開かれた「CODE READABILITY LECTURE」のレポートを質疑を中心にお送りします。 こんにちは。 エンジニアHubを運営しておりますエン・ジャパン株式会社のデジタルプロダクト開発本部(デジプロ)で、VPoEをしております、こざわと申します。 さる10月22日に、LINE株式会社の石川宗寿さんが技術評論社より書籍「読みやすいコードのガイドライン」を上梓されました。 実はこちらの本、石川さんがコードの可読性について社内講義された[プレゼンテーションスライド]が元になっています。 当時LINEに在籍していたこざわも、それを受講した
The introduction of hooks in React 16.8 has totally changed the way we implement logic in our React components. React hooks provided us with an entirely new way of encapsulating logic, sharing it between components, and keeping it separate from the view layer. The key to all of this is the fact that we can create our own custom hooks. Before the introduction of React hooks, implementing logic in R
Content in this resource is still under active development and should be considered beta. It may change, move, antecede, or be deleted with or without notice. EXECUTIVE SUMMARY The APCA™ Readabiliy Criterion (ARC™) provides a range of evidence-based recommendations for making visual content on self-illuminated displays more accessible to all users, especially users with visual impairments. These g
HTMLから本文を抽出するpythonのライブラリの一つにreadabilityがあります。 readabilityはpipでインストールすることができます。 コマンドラインから実行することができます。日本語のページから抽出可能か、国立国会図書館のページで試してみます。 python -m readability.readability -u http://www.ndl.go.jp/jp/service/index.html Title:サービス概要|国立国会図書館―National Diet Library <html><body><div><div class="mainbody"> <h2>サービス概要</h2> <h3 id="anchor01">当館のサービス</h3> <div clas
いったいどのように言い表したら 和山やま作品の面白さが伝わるだろうか? あれこれ悩んでいたとき、ふいに浮かんできたのが タイトルに使った、自家製英単語「Re-Readability」だった。 意味は、読んで字の如し。 "何度読み返しても最初読んだ時みたいに面白い!"--ってところか。 なーんて、ひとり勝手に悦に入っていたけど。 念のためにググってみたら・・・あるじゃん、Readability。 実際に英語圏での話で使われていて しかも、主な意味は おもしろく読めること、読みやすいこと。 なんだよー。こんな適当な英単語はないだろうと思っていたのに。 ま、いっか。 日本人だけでなく、英語圏の人々にも 「和山やま」のマンガの面白さが、正しく?伝えられるんだから。 そんなふうに、普段は、そこそこ理路整然と書いてるつもりの本ブログで 頭のネジが何本か抜け落ちたような、ダサい文章を並べさせたのも いっ
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く