akishin999のブックマーク / 2024年2月26日

面倒で難しい「私はロボットではありません」をワンクリックで突破できるCAPTCHA自動回答ツール「Buster」レビュー

ウェブサイトにログインしたり問い合わせフォームを送信したりすると、「私はロボットではありません」といった文言のボット排除システム「CAPTCHA」に遭遇しがちです。CAPTCHAでは「バスを含む画像をクリック」などの問題が出題されますが、「バスの画像を正しく選択しているはずなのに人間と認めてもらえない！」という事態が頻繁に発生します。無料のブラウザ拡張機能「Buster」を使えば、ワンクリックでCAPTCHAを突破できるとのことなので、実際に使ってみました。 GitHub - dessant/buster: Captcha solver extension for humans, available for Chrome, Edge and Firefox https://github.com/dessant/buster BusterはChromeやFirefox、Edge、Operaな

akishin999 2024/02/26

captcha

リンク

【ソフトウェア設計】モジュールをどう分割するのか？

はじめに前々回や、前回に引き続き、ソフトウェア設計の指針に関する話をしたいと思います。関数やクラス、そしてサービスなどシステムの塊の単位をモジュールと呼び、モジュールを作る事で、認知負荷を下げ複雑性と戦うという話をしてきました。では、モジュールは「いつ」分割するのが良いでしょうか？　また、他にも共通モジュールを不用意に作ってしまって苦労した人も多いのでは無いでしょうか？　今回はそのあたりの話をしていきます。 TL;DR 以下があればモジュール設計を見直す単純な要件/普段の利用に対して、タイプ量や約束事が多い共通モジュールが「使われ方」に依存するモジュールの役割を一言で説明できないコード管理や性能/データ整合性など利用に際してのペナルティが高い分割 is NOT 正義 - FizzBuzz Enterprise Edition 複雑性を排除するためにモジュール分割をすることは重

akishin999 2024/02/26

設計

リンク

日本語おしゃべり特化AIアプリが性能よすぎて論破しようと思ったら逆に論破されてしまった「人間いらんやん」

広野萌 @hajipion 日本語おしゃべり特化AIアプリ「Cotomo」すごすぎる。1秒以内に返答がくるのと前の話を覚えてるのが、本当に生きてるみたい。 ↓こちらは現金派のCotomoちゃんを論破しようして逆に論破されるキモ男早口でどもってても聞き取れてるし、オチが天使すぎる👼 声がたまに @harukana_8 に似てるのも良い pic.twitter.com/jhX3X6Giev 2024-02-24 16:54:21 リンク App Store ‎Cotomo（コトモ：音声会話型おしゃべりAI） ‎・1人で運転している時。・推しのキャラを設定したAIと喋りたい時。・恋愛や仕事、将来の話、家族の話。他愛もない話をダラダラしたい時。・友達には少しだけ話しにくい、嬉しかったことや、モヤモヤがある時。・晩酌のお供に。・深夜、ふと誰かに話したくなった時。そんな時、Cotom

akishin999 2024/02/26

ai

リンク

画像生成AI、安いPCでも高速に　衝撃の「Stable Diffusion WebUI Forge」 (1/4)

Stable Diffusion Forgeを表示した様子。基本的な操作は既存のStable Diffusion WebUI AUTOMATIC1111とほぼ同じ画像生成AI「Stable Diffusion」用の新しいユーザーインターフェース「Forge」が2月6日に登場しました。開発したのは、これまで「Controlnet」や「Fooocus」などStable Diffusion関連の様々な重要技術を開発してきたillyasviel（イリヤスベル）さん。何よりインパクトが大きいのは、グラフィックボードのVRAM容量が小さい安価なPCでも最新版のStable Diffusion XL（SDXL）が動かせることです。 RTX 40シリーズが求められたSDXL SDXLは、2023年8月にStabl ity AIが発表した画像生成AI。高画質な出力ができる一方、コミュニティーサイトで話題にな

akishin999 2024/02/26

画像
ai

リンク

『面倒なことはChatGPTにやらせよう』を文系ゴリゴリおじさんが読んでみた。 - Everything you've ever Dreamed

面倒なことはＣｈａｔＧＰＴにやらせよう (ＫＳ情報科学専門書) 作者:カレーちゃん,からあげ講談社 Amazon 『面倒なことはChatGPTにやらせよう』（カレーちゃん氏、からあげ氏著）を２回通読した。著者のひとり、からあげさんは、僕がキャラクターを認識できる数少ないブロガーだ（お会いしたことはない）。現在、データサイエンス研究者として大活躍している。なお、僕は勝手に彼をターミネーター２に出てくるサイバーダイン社の開発者ダイソンさんをイメージしている。人類の未来のために、凶悪なターミネーターを開発することのないことを祈るばかりである。僕はゴリゴリの文系の営業職の50歳のオッサンで、本書の推薦人である松尾教授とは真逆の人間である。もしかしたら本書のターゲットから外れている人物像かもしれない。そういう人物に本書がどう役に立つの？という視点でレビューになる。本書を一語にたとえると「ブルドー

akishin999 2024/02/26

ai
本

リンク

音声・テキスト・画像・音楽の入出力に対応したマルチモーダル大規模言語モデル(LLM)「AnyGPT」が登場

音声・テキスト・画像・音楽など複数の種類のデータを一度に処理できるマルチモーダルな大規模言語モデル(LLM)の「AnyGPT」が発表されました。 AnyGPT https://junzhan2000.github.io/AnyGPT.github.io/ 既存の大規模言語モデル(LLM)のアーキテクチャやトレーニングパラダイムを変更することなく、安定してトレーニングすることができるという新しいマルチモーダルLLMがAnyGPTです。AnyGPTはデータレベルの前処理のみに依存しており、新しい言語を組み込むのと同様に、新しいモダリティのLLMへのシームレスな統合を促進することが可能。マルチモーダルアライメントの事前トレーニング用に、マルチモーダルテキスト中心のデータセットを構築することで、生成モデルを利用して大規模な「Any-to-Any」(任意のデータ形式から任意のデータ形式に出力できる)

akishin999 2024/02/26

LLM
ai

リンク

推定1000万円以下のコストで開発され、国内最大・最高性能を達成した日本語LLM, Karakuri-LMの秘密

推定1000万円以下のコストで開発され、国内最大・最高性能を達成した日本語LLM, Karakuri-LMの秘密 2024.02.18 Updated by Ryo Shimizu on February 18, 2024, 10:08 am JST 2024年1月。国内の生成AIコミュニティに激震が走った。コンタクトセンター向けのチャットボット開発のパイオニアとして知られるカラクリ社が商用利用可能のオープンソースモデルとして公開したKarakuri-ln-70bの性能が高すぎると話題になったのだ。多くの日本語LLMと同様に数学能力に関するスコアは低いが、物語を記述する能力、日本語の質問に日本語で答えたり、答えをプログラムで扱い易いJSON形式にしたりする能力がこれまでの国産LLMに比べて桁違いに高かったのである。物語を記述する能力に関しては、一説によればGPT-4を凌駕するとも言わ

akishin999 2024/02/26

リンク

はてなブックマーク

タグ

2024年2月26日のブックマーク (8件)

最新の Google Gemma モデルを MLX を使ってローカルでファインチューニング｜alexweberk

面倒で難しい「私はロボットではありません」をワンクリックで突破できるCAPTCHA自動回答ツール「Buster」レビュー

【ソフトウェア設計】モジュールをどう分割するのか？

日本語おしゃべり特化AIアプリが性能よすぎて論破しようと思ったら逆に論破されてしまった「人間いらんやん」

画像生成AI、安いPCでも高速に　衝撃の「Stable Diffusion WebUI Forge」 (1/4)

『面倒なことはChatGPTにやらせよう』を文系ゴリゴリおじさんが読んでみた。 - Everything you've ever Dreamed

音声・テキスト・画像・音楽の入出力に対応したマルチモーダル大規模言語モデル(LLM)「AnyGPT」が登場

推定1000万円以下のコストで開発され、国内最大・最高性能を達成した日本語LLM, Karakuri-LMの秘密

お知らせ

今週のはてなブックマーク数ランキング（2024年7月第4週）

今週のはてなブックマーク数ランキング（2024年7月第3週）

今週のはてなブックマーク数ランキング（2024年7月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス