タグ

2026年4月6日のブックマーク (15件)

  • 日本語対応オープンソースOCRの比較 その3

    以前の比較から様々なOCRがリリースされていましたので、精度、速度を測ってみます。 GLM-OCRがバウンディングボックスがとれないので、比較はテキストのみです。 今回調べたのは以下 Tesseract PaddleOCR GLM-OCR OwOCR ChromeScreenAI meikiocr NDLOCR-Lite Manga OCR EasyOCR RapidOCR 動作確認のColabは以下(※たまにメモリ不足になります) 結果 ChromeScreenAIが精度、速度ともに最強でした。 古典籍に関しては、NDLOCR-Liteがさすがに強いです。 GLM-OCRは、精度はよいがすごく遅いです。 (ランダム文字列に弱いかと思いましたが、精度出ていました) 詳細 easyOCRのサンプル画像より Model CPU GPU SCORE TEXT

    日本語対応オープンソースOCRの比較 その3
    CLSmooth
    CLSmooth 2026/04/06
  • AI時代の大学教員は、何を教える人になるのか|tarolabo

    生成AIの登場は、大学教育に何を突きつけたのか生成AIの普及によって、大学教育を取り巻く環境は大きく変わりつつあります。文章を書く、要約する、論点を整理する、文献のあたりをつける、アイデアを広げる。こうした知的作業のかなりの部分に、生成AIはすでに入り込んでいます。しかもその応答は速く、ときに驚くほど整っています。 そのため、大学ではしばしば次のような問いが立てられます。学生に生成AIを使わせてよいのか。レポートや卒業論文はこれからどのような意味を持つのか。AIが文章を書けるなら、大学で書くことを学ぶ意味はどこにあるのか。これらはもっともな問いです。実際、従来の「調べてまとめて書く」という課題の一部は、以前よりも容易に代替されるようになりました。 しかし私は、この変化を単なる危機として捉える必要はないと思っています。むしろ生成AIの登場によって、大学教育質がこれまで以上にはっきり見えて

    AI時代の大学教員は、何を教える人になるのか|tarolabo
    CLSmooth
    CLSmooth 2026/04/06
  • 26/4/5 俺が考えた最強の本の読み方 最強読書趣味攻略 - LWのサイゼリヤ

    前から質問箱で無限回聞かれてきたの読み方について書きます(分野や難易度問わず)。 所詮は趣味だし個人差も大きいと思うので自分のやり方を試行錯誤するのが一番いいのだが、俺のやり方はたぶん結論だと思う地点にもう行き着いたのでここらで共有しておく。 ふだん読むの例 読み方を考える前に 読んで得るものを最大にしたい 知識の定着は目的にしない ミクロな情報とマクロな文脈 タイプ別攻略メモ ほとんど全てが未知の ほとんど全てが既知の 中途半端に既知の Tips集 やる気を信じろ ワーキングメモリ枯渇対策 紙メモvsデジタルメモ 読書タイムスパン 読み方を考える前に 題に入る前に、読書の目的などに軽く触れておく。 読んで得るものを最大にしたい わざわざの読み方を考える理由は、を読んで得るものを最大にするためだ。 読み終わった時点で自分が何を得たかきちんと説明でき、かつ、その情報量が最大に

    26/4/5 俺が考えた最強の本の読み方 最強読書趣味攻略 - LWのサイゼリヤ
    CLSmooth
    CLSmooth 2026/04/06
  • Anthropic Academyを3コース受けてみた 体系的に学べた話📚

    はじめに 3月にAnthropic Academyが出ましたね。存在は知っていたのですが、優先して読みたいと思っておらず読めていなかったです。今更ながら読みました。 実際に受けてみたところ、断片的に知っていただけで把握できていなかったこと、体系的に理解できました。4Dフレームワークのように知っているようで言語できていなかった概念を知ることもできました。「知ってるつもり」の状態と思っている人や、Academyってどんなもの?と思っている人に向けての参考程度の記事がかければと思います。 Anthropic Academyとは Anthropicが2026年3月に開設した無料の学習プラットフォーム。全15コース、メール登録のみで受講可能で、修了証も取得できます。 コースは英語だけしかなく、もっぱら私は日語訳して読んでいました。わかりにくいところだけ英語みたいな感じで全然読めます。 YouTub

    Anthropic Academyを3コース受けてみた 体系的に学べた話📚
    CLSmooth
    CLSmooth 2026/04/06
  • NotebookLM に 限界を感じたので、ローカル TTSで技術記事を「聴く」ことにした

    積読が解消しない 気になる技術記事。「あとで読もう」が溜まっていくばかり... 電車時間やランニング、お風呂の時間など手を動かせない時間でなんとかキャッチアップできないだろうか。 ということで、URL を渡したら音声ファイルにしてくれるパイプラインを作りました。 NotebookLM で感じた限界 最初に手を出したのは NotebookLM です。URL やテキストを投げると、AIホストがポッドキャスト風に要約してくれるものです。 試してみたものの、使い続けるうちに以下を感じるようになりました。 事例

    NotebookLM に 限界を感じたので、ローカル TTSで技術記事を「聴く」ことにした
    CLSmooth
    CLSmooth 2026/04/06
  • GitHub Copilot CLI の /fleet が面白い

    はじめに GitHub Copilot CLI の /fleetがおもしろいです. 名前だけ見ると「並列で動くモードなんだな」ぐらいですが, 実際に触ってみると,効くかどうかは prompt の切り方 で大きく変わってきます. 雑に投げるとあまり速くならないですし, うまく分解できるように書くと「これは気持ちいいな」という挙動をしてくれますと思います. 今回は,公式ドキュメントと GitHub Blog の /fleet 記事を見直しながら, /fleet が何をしているのか,どういう prompt だと並列化しやすいのか, そして どんな使い方があるのか について書いてみようと思います. /fleet って何がうれしいの? /fleet は,Copilot CLI に対して「この大きめの仕事を,分解できるなら分解して,並列で進めてね」と渡すためのコマンドです. たとえば,こんな感じです.

    GitHub Copilot CLI の /fleet が面白い
    CLSmooth
    CLSmooth 2026/04/06
  • Bonsai-8B考察 — 1-bit LLMは使い物になるのか - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? Bonsai-8B考察 — 1-bit LLMは使い物になるのか 自分用メモとして書きました。PrismML(Caltech発)がリリースした真の1-bit LLM「Bonsai-8B」。モデルサイズわずか1.15GB。海外LLMコミュニティの議論を調べ、技術的な仕組みから実用性までまとめたもの。 1. Bonsai-8Bとは — Caltech発1-bit LLMの衝撃 PrismMLが開発した真の1-bit LLM。重みが0か1のみ。モデルサイズ1.15GB、MMLU-R 65.7。 PrismMLはCaltech(カリフォルニア工

    Bonsai-8B考察 — 1-bit LLMは使い物になるのか - Qiita
    CLSmooth
    CLSmooth 2026/04/06
  • 無料・高速・多機能でクロスプラットフォーム対応のターミナルエミュレータ「Ghostty」が魅力的な理由

    HashiCorpの共同創設者である Mitchell Hashimoto氏が開発した高速かつ機能豊富な次世代ターミナルエミュレーターであるGhosttyは、ターミナルの速度と操作性を重視するエンジニアを中心に高い支持を集めています。Ghosttyの魅力とはどういうものなのか、一般的な評価に加えてHashimoto氏の見解を通じて人気の理由を確認していきます。 Ghostty https://ghostty.org/ ◆一般的な評価 Ghosttyは特にNeoVimユーザーやAIコーダーの間に愛好家が多いことが知られています。愛好家がGhosttyを推すメリットとして考えられるのはターミナルの速さや操作性ですが、さらに深掘りすると以下の点が挙げられます。 ・高パフォーマンス:Zig言語で開発されているため軽量かつ高速に動作し、さらにGPUアクセラレーションを活用することにより描画の遅延が最

    無料・高速・多機能でクロスプラットフォーム対応のターミナルエミュレータ「Ghostty」が魅力的な理由
    CLSmooth
    CLSmooth 2026/04/06
  • 1.15GBで8Bモデルが動く「1-bit Bonsai」をMacで試した|kazu@生成AI×教育 / 谷 一徳 | AI Academy

    こんにちは、kazuです。 先日PrismMLから発表された1-bit Bonsai 8Bを自分のMac(M3 Pro / 36GB)で試してみました。 結論から言うと、たった1.15GBのモデルで生成速度65tok/sec。通常の8Bモデル(16GB前後)の1/14のサイズとは思えない速さです。 この記事では、Macへの導入手順と実際の使用感を紹介します。 1-bit BonsaiとはPrismMLというCaltech発のAIラボが開発した、全重みを1ビットで表現したLLMです。 通常のLLMは16ビット(FP16)で重みを保持しますが、Bonsaiは各重みを -1, +1 の2値だけで表現します。1ビット重みにより掛け算を大幅に減らせる構造で、メモリもエネルギーも大幅に削減されます。現時点の速度向上は主にメモリフットプリントの削減によるもので、1ビット構造のフル活用は今後に期待されてい

    1.15GBで8Bモデルが動く「1-bit Bonsai」をMacで試した|kazu@生成AI×教育 / 谷 一徳 | AI Academy
    CLSmooth
    CLSmooth 2026/04/06
  • AWSさんから1400万円請求された件

    4/4 JAWS-UG山梨でLTした「AWSさんから1400万円請求された件」の資料

    AWSさんから1400万円請求された件
    CLSmooth
    CLSmooth 2026/04/06
  • 電子工作に必要なハードウェアをAIでサクッと調べられるウェブサイト「Open Hardware Directory」

    シングルボードコンピューターや無線チップなどのオープンソースハードウェアの充実によって、自分好みのデバイスを自作できる環境が整いつつあります。しかし、電子工作初心者にとっては適切なデバイスの選定は難しいものです。そんな時に役立つウェブサイトが「Open Hardware Directory」で、膨大なオープンソースハードウェアの中から自分の目的に合ったデバイスをAIの力を借りつつ探すことができます。 Open Hardware Directory — Browse Open Source Hardware Devices https://openhardware.directory/ Open Hardware Directoryにアクセスしたら、画面中央の入力エリアをクリック。 入力画面が表示されたら作りたいデバイスの特徴を入力します。自然言語で入力するとAIで必要なハードウェアを分析し

    電子工作に必要なハードウェアをAIでサクッと調べられるウェブサイト「Open Hardware Directory」
    CLSmooth
    CLSmooth 2026/04/06
  • Harnessing Claude's Intelligence | 3 Key Patterns for Building Apps | Claude

    One of Anthropic’s co-founders, Chris Olah, says that generative AI systems like Claude are grown more than they are built. Researchers set the conditions to direct growth, but the exact structure or capabilities that emerge aren’t always predictable. This creates a challenge for building with Claude: agent harnesses encode assumptions about what Claude can’t do on its own, but those assumptions g

    Harnessing Claude's Intelligence | 3 Key Patterns for Building Apps | Claude
    CLSmooth
    CLSmooth 2026/04/06
  • 哲学研究の道具箱 - obakeweb

    研究のために使っているもの・やっていることを紹介します。 PCMacBook Air (M4) 日にいたころはiMacをメイン端末にしていましたが、留学先ではほぼすべてをMacBook Airでやっています。去年、一時帰国したついでに新しく出たM4に新調しました(こっちで買うより安いので)。一番控えめなスペックにしましたが、すべてに関して満足しています。一日の大半の時間をこれの前に座って過ごしています。昨年末ごろに不注意でキーボードに水をかけてしまったときはこの世の終わりかと思いましたが、血眼ですぐさま救出し、念入りに干したおかげで、いまのところ異常はないです。 一応、サブ端末としてXiaomi Pad 6(+キーボードつきのカバー+スマートペン)を持っています。普段はデジタル時計を表示させていますが、原稿の校正など手書きでやったほうがスムーズな作業のときに使ったりします。軽いので、M

    哲学研究の道具箱 - obakeweb
    CLSmooth
    CLSmooth 2026/04/06
  • 技術広報は「広報」より「技術」が先にある - 941::blog

    今日は二十四節気では清明。万物が清々しく明るく美しいころ、わかりやすくいうとお花見シーズンです。 ※このブログでは二十四節気という約2週間ごとにやってくる暦にあわせて更新しています 「技術広報」の「技術」とは何か、考えたことがありますか? 技術広報と広報って何が違うの?と聞かれたら、多くの人は「技術寄りのコンテンツを扱う」と答えると思います。間違ってはいないんですが、それだと一般の広報が技術トピックを担当した瞬間に境界が消えてしまいますね。 わたしが技術広報という仕事を18年やってきて辿り着いた答えは、技術エンジニアへの解像度です。 広報は「届ける」仕事ですが、技術広報は「誰に何が刺さるか」を技術の文脈で判断できなければ成立しません。その判断の精度が、解像度です。解像度が高いから、エンジニアが「これは自分たちのことだ」と感じてもらえる発信ができる。解像度が低いまま手を動かせば、その発信は

    技術広報は「広報」より「技術」が先にある - 941::blog
    CLSmooth
    CLSmooth 2026/04/06
  • Claude Codeで分析エージェントを作って3か月運用した話|田口 信元

    はじめにUbie株式会社でプロダクトマネージャー(PdM)を務めている、田口(@guchey)です。 この記事では、Claude Codeのプラグインを活用して、プロダクトの指標変動を自動診断する「分析エージェント」を構築した知見を共有します。具体的には、「プロジェクトAのCVR(コンバージョン率)が下がっているんだけど、なぜ?」と一言投げかけるだけで、原因特定からレポート出力までを完遂するシステムを作りました。 実はこの分析エージェント、最初は「Text-to-SQL」の仕組みから着手したのですが、運用するなかで大きな壁にぶつかりました。当に必要だったのは、自然言語からSQLを書く能力そのものではなく、「なぜ」を問うための膨大な文脈(コンテキスト)をAIに与える仕組みだったのです。 OpenAIが社内データエージェントの構築記(Inside OpenAI's in-house data

    Claude Codeで分析エージェントを作って3か月運用した話|田口 信元
    CLSmooth
    CLSmooth 2026/04/06