タグ

sh19910711のブックマーク (29,245)

  • 余は如何にしてRubyKaigi 2025の資料を作りし乎 - ローファイ日記

    RubyKaigi 2025、お疲れ様でした。 今年も発表者の末席を務めさせていただきました。 rubykaigi.org 資料は以下です。 udzura.jp 今年も英語での発表をしたわけですが、英語での登壇準備は年を追うごとにツールのノウハウが積み重なっていくのを感じ、特に今年は英語化自体は*1楽になったなあと思っています。どういう感じのことをしたか後学のため記事を置いておこうと思います。 全体にMacOSのツールを使っています。真似する際は環境によって適宜置き換えてください。 全体のフロー 日語で箇条書きで資料を用意する 一度、その内容で日語で発表練習をする その内容を録音して文字起こしする 文字起こしした内容を英訳する 同時に、箇条書きの日語資料を英訳する あとは微調整 長さが適切になるようスクリプトを say コマンドに噛ませる スライドと資料がアラインするように相互の内容

    余は如何にしてRubyKaigi 2025の資料を作りし乎 - ローファイ日記
    sh19910711
    sh19910711 2025/05/01
    "Mac の say コマンド: 英語スクリプトを読ませて、その結果を音声ファイルに保存して活用 + 再生時間がスピーチ全体の長さの見積りに / 英語で発表しない言い訳がどんどんなくなっていく"
  • FastRTCを使って爆速でVoicebotを構築する | 株式会社AI Shift

    Cookbookに乗っているサンプルコードを参考に、レストラン予約を行うVoicebotを構築してみたいと思います。ロールプレイングでDB接続などは行いません。 import base64 import asyncio import numpy as np import openai from fastrtc import ( AdditionalOutputs, AsyncStreamHandler, Stream, get_twilio_turn_credentials, wait_for_item, ) from gradio.utils import get_space from openai.types.beta.realtime import ResponseAudioTranscriptDoneEvent, ResponseOutputItemDoneEvent SAMPLE

    FastRTCを使って爆速でVoicebotを構築する | 株式会社AI Shift
    sh19910711
    sh19910711 2025/05/01
    "FastRTC: Pythonでリアルタイムの音声およびビデオストリーミングアプリケーションを構築するためのライブラリ / 作成したアプリケーションはGradioのUIやTwilioのIP電話として簡単に公開することができ ~ "
  • ローカルで動かせる日本語TTSをいろいろ試す

    Kimi-Audioも試したけどメモリが足りなくて動かせなかった。 環境構築方法 冒頭にあげたスクラップに書いています。 「Bert」とか「Fish」とかで検索してください。 生成結果 Zennには音声をあげれないのでTwitterにあげたものを参照。 GPT-4oで画像生成→FramePackで動画化して適当に映像つけてます。 Style-Bert-VITS2 そこそこの自然さで結構早く動くし、トレーニングもGUIで出来てとても簡単。 GitHubも日語で親切。 Fish Speech そこそこの自然さで動きます。 サンプル通りだと毎回ランダムで話者が選ばれるので、リファレンスをつけて動かします。 末っ子の声をリファレンスにしたら可愛すぎて悶絶しました。 ただ、Fish Audioを見ると明らかに無許可の音声がアップされているので嫌な気持ちになる。 Kokoro-82M 日語はイマイ

    ローカルで動かせる日本語TTSをいろいろ試す
    sh19910711
    sh19910711 2025/05/01
    "OpenAIのTTSは「日本語を喋れる外国人」という感 / Style-Bert-VITS2: そこそこの自然さで結構早く動くし、トレーニングもGUI / Tsukasa_Speech: 主にゲームやノベルからのデータらしいのでアニメ感"
  • Rust製CLIファイラ「Yazi」を使う - 点と接線。

    ターミナル上からすべてを操作したいと願う者にとって、ファイラは是非とも備えておきたい代物の一つである。いかに我々が小洒落た種々のランチャやコマンドで日常の用を足せるとしても、ファイラの機能性に助けられる機会は少なくない。そのたびに任意のGUIファイラを起動してマウスをポチポチとやるのは少々惜しい。 CLIのファイラはすでに色々ある。古くにはrangerがあるし、Goで書かれたミニマルなlfというのもある。実際、後者の方をたまに使っていた。とはいえ、まあ、せっかくなので新しいものを試したい。そこで、今回はYaziを選んだ。それにしても自分がRustを書いているわけじゃないのにRust製って言われたら気になってしまうのはなんでだろうね。マイナー界のミーハーかな。 導入 Arch Linuxならpacman -S yaziで簡単に手に入る。macOSもbrewが使えるならbrew install

    Rust製CLIファイラ「Yazi」を使う - 点と接線。
    sh19910711
    sh19910711 2025/05/01
    2024 / "なんらかの作業効率を上げるという本来の目的は忘れ去られ、あたかも辺境の惑星に残置された自動機械のごとく我々はひたすら環境を改善し続ける"
  • Rust で自動微分ライブラリ作ってみた その2 ~応用編~

    前回は自動微分ライブラリを一から書き上げてみました。前提知識がほぼない状態で始めましたが、まずはその後いくらか調べた結果をまとめておきます。 コンピュータにおける微分の種類 コンピュータで行う微分とは、主に次の三つのどれかに分類できます。 記号微分/数式微分 (Symbolic differentiation) - 人間が紙の上でやるように、数式の変形で新たな式(導関数)を導く方法です。閉じた形式の式が求まるので計算は正確ですが、一つの式に多数の変数が現れる場合、それぞれに対して求めなければいけないので、効率は悪いです。代表的な製品には Pythonsympy ライブラリ、 Matlab の Symbolic Math Toolbox、Maxima 、Wolfram Alpha などがあります。 自動微分 (Automatic differentiation) - 記事の主題です。

    Rust で自動微分ライブラリ作ってみた その2 ~応用編~
    sh19910711
    sh19910711 2025/05/01
    2023 / "計算グラフはここまで来ると複雑すぎて手で偏微分を計算しようという意欲も湧いてきません / 自分で実装することで見えてくる知見は、ただライブラリを使うだけよりもはるかに大きい"
  • 今、ファミコン版ファイナルファンタジーⅢをやる - ゲームへたおじさんドットコム

    正月に実家に帰省する際の「移動時間暇つぶしゲー」として、ニンテンドーDS版『ファイナルファンタジーⅢ』を安いからという理由だけで特に何も考えずてきとうに買った。3Dリメイクのやつだ。ぼんやりした気持ちで10時間ほどプレイしてたのだが、これはファミコン版のほうをプレイし直したほうがいいんではないかなーという気分がムクムクと湧き上がり、途中でやめてしまった。 システム周りはファミコン版よりもちゃんとこなれて現代風にリメイクされているけど(といっても2006年のゲームだから、すでに18年も前の「現代風」になる……当然ながら2024年の観点からは古くさい)、やっぱDS当時の3Dモデルでは戦闘シーンの魅力が格段に落ちる。ファミコン末期ドット絵芸の極致のひとつであるFF3のモンスターを再現するにはこれはちょっとあまりにも力不足……。 そんなわけでやめてしまってしばらくたって、今はレトロフリークでファミ

    今、ファミコン版ファイナルファンタジーⅢをやる - ゲームへたおじさんドットコム
    sh19910711
    sh19910711 2025/05/01
    2024 / "1990年、ファミコン末期のスクウェア / 「A級」になろうとはしているけどギリ届かなくてはっちゃけている感じ / 同時期のドラクエ各作は明らかに「大人が作ったゲーム」としての手ざわり"
  • [Rust] 自作言語での TUI デバッガのススメ

    Rust で作るプログラミング言語シリーズです。 バイトコードコンパイラの難しさ 書籍での心残りの一つが、第6章のバイトコードの難易度です。書ではプログラミング言語を作るにあたってステップ・バイ・ステップで難易度を上げていくように構成を考えていますが、第6章のバイトコードの実装の時点で難易度が急激に上昇します。例えば、次のようなジャンプアドレスの計算を行う必要があるのですが、これはかなり込み入ったロジック計算が必要になります。 条件分岐では、下図のようにジャンプしますが、このアドレス計算が厄介です。 ループについても同じくジャンプ命令が必要ですが、こちらはループの先頭にアドレスを戻します。 この実装の難しさは、プログラムの意味を理解する(意味論)ロジックと、それをバイトコードへ変換するロジックを一つとしてデバッグしなくてはならないところにあります。どちらに問題があるかを切り分けるのは簡単

    [Rust] 自作言語での TUI デバッガのススメ
    sh19910711
    sh19910711 2025/05/01
    2024 / "タイムトラベルデバッガ: 実行状態を復元 + ネイティブコンパイル言語では rr などのツール / デバッガによるステップ実行を可能にするためには、まずプログラムを状態マシン化する必要"
  • 社会人大学院生のための研究成果報告書の書き方_v24040601 - しんどい思いをしている社会人大学院生たちに送る研究サバイバル術

    社会人大学院生のための 実務研究論文・研究成果報告書の書き方 (v4.x) コミュニケーションデザイン研究科 特任教授 高広伯彦 Ph.D

    sh19910711
    sh19910711 2025/05/01
    "先行研究レビュー: 研究範囲と限界の設定 + 自分の研究の範囲はどこかをとりあえず決める + 先行研究は読むものではなく整理するもの"
  • セカンドハウスを借りて二拠点生活を一年やってみた - らいむぎばたけ

    はじめに 夫と「いつか田舎に住みたいね〜」なんて話をしていたけれど、二人の中の "田舎" の定義が曖昧だったので、実際に自分たちが将来的に住みたいと思っている "田舎" とはどういう立地なのかを探ってみるために、セカンドハウスを借りることにした。引っ越しにしなかったのは、今の家 (not 立地) が気に入っているのと、いきなり引っ越してもし「だめだ、ここじゃ生活できない」となった時に戻れる家を残しておきたかったから。 セカンドハウスじゃないほうの家をなんと読んだらいいかわからないので、ここでは便宜上ファーストハウスとする。 セカンドハウスの条件 以下の条件で家探しをした。 2DK 以上 夫婦二人ともリモートワークなので、通話があることを考えると二部屋は必要 どうしても見つからない & 条件が良いところがあれば 1LDK でも良い 2h 程度でファーストハウスに帰れること 通院等もあるので、

    セカンドハウスを借りて二拠点生活を一年やってみた - らいむぎばたけ
    sh19910711
    sh19910711 2025/05/01
    2023 / "将来的に住みたいと思っている "田舎" とはどういう立地なのかを探ってみるために、セカンドハウスを借りる"
  • ロジスティック回帰 (勾配降下法 / 確率的勾配降下法) を可視化する - StatsFragments

    いつの間にかシリーズ化して、今回はロジスティック回帰をやる。自分は行列計算ができないクラスタ所属なので、入力が3次元以上 / 出力が多クラスになるとちょっときつい。教科書を読んでいるときはなんかわかった感じになるんだが、式とか字面を追ってるだけだからな、、、やっぱり自分で手を動かさないとダメだ。 また、ちょっとした事情により今回は Python でやりたい。Python のわかりやすい実装ないんかな?と探していたら 以下の ipyton notebook を見つけた。 http://nbviewer.ipython.org/gist/mitmul/9283713 こちらのリンク先に2クラス/多クラスのロジスティック回帰 (確率的勾配降下法) のサンプルがある。ありがたいことです。理論的な説明も書いてあるので ロジスティック回帰って何?という方は上を読んでください (放り投げ)。 この記事で

    ロジスティック回帰 (勾配降下法 / 確率的勾配降下法) を可視化する - StatsFragments
    sh19910711
    sh19910711 2025/05/01
    2014 / "SGD: 入力をランダムに (確率的に) 並べ替えて、データ一行ずつから勾配を求めて係数/バイアスを更新 / 各クラスを分割する位置に少しずつ回帰直線が寄っていく"
  • ちょうどよいビルドツールEarthlyの紹介

    ちょうどよいビルドツールEarthlyの紹介 ビルドツールと呼ばれるものは昔から現代まで使われているMake、JavaKotlinでは一般的なGradle、Googleで使われていたものをOSS化したBazelあたりが有名です。他にも様々なビルドツールが存在するのですが、知名度は低いものの最近自分が注目しているEarthlyというビルドツールを紹介します。 まずEarthlyの特徴をBazelやGradleといった他のビルドツールと比較して簡単に紹介します。 Dockerfile + Makefile風のDSL どんなビルドツールでも基的には独自DSLでビルド設定を書くことになりますが、EarthlyはDockerfileとMakefileを合体させたようなDSLとなっており、他のビルドツールと比較して分かりやすい方だと思います。このDSLについては後述しますが、このサンプルコードでも

    ちょうどよいビルドツールEarthlyの紹介
    sh19910711
    sh19910711 2025/05/01
    2022 / "Earthly: DockerfileとMakefileを合体させたようなDSL + コンテナの中でビルド / BazelやDockerのビルドと同様にどんな言語のビルドにも使うことが可能"
  • データエンジニア向け Snowflakeパフォーマンス最適化機能まとめ

    Snowflakeパフォーマンス最適化機能クラスタリングキー & Search Optimization & Query Acceleration はじめに SnowVillageのUnConference第五回イベントで、けびんさんのSOS検証記事の解説LTを聞いた事が、この記事を書くきっかけとなりました。 その際に紹介いただいた以下の記事とその際の質疑応答を通じて自分の不勉強さを痛感し、自分でもちゃんと学ぼうと思い、改めて仕様の理解と実際の検証結果と共にこの記事にしました。 各機能の詳細な説明はけびんさんや諸先輩方の記事を参考にいただく事でより深く理解が出来ると考えています。この記事ではそれらの各機能を理解しつつ、その全体像を自分なりの考え方で体系化し、またそれらについてTPC-Hのデータを用いたハンズオン形式にすることでステップバイステップで、どのような効果があるかを比較した結果を加

    データエンジニア向け Snowflakeパフォーマンス最適化機能まとめ
    sh19910711
    sh19910711 2025/05/01
    "カーディナリティが高い項目についてのクラスタリングキーは効果が薄いことが多い / クラスタリグキーを設定した上で、SOSを適用することで無地のテーブルに比べ、7倍以上速く"
  • データ基盤における管理の考え方 〜dbtの極意〜:LayerXにdbtを導入するときに意識したこと

    データ基盤における管理の考え方 〜dbtの極意〜 https://findy.connpass.com/event/291767/ [カジュアル面談リンク] 全員アナリストを実現するData Enablingを支えるData Engineeringについて語らいましょう〜〜!!! https:…

    データ基盤における管理の考え方 〜dbtの極意〜:LayerXにdbtを導入するときに意識したこと
    sh19910711
    sh19910711 2025/05/01
    2023 / "可搬性: materialized=viewを積極的に利用 + データ基盤の導入時に将来どのような要件が現れるか読めません + が、将来発生する要件の中にはかならず「データの移動」及び「データの削除が」が存在"
  • 高速化・並列化・標準化で スケールするML予測システムの開発

    3年でバックエンドエンジニアが5倍に増えても破綻しなかったアーキテクチャ そして、これから / Software architecture that scales even with a 5x increase in backend engineers in 3 years

    高速化・並列化・標準化で スケールするML予測システムの開発
    sh19910711
    sh19910711 2025/05/01
    2021 / "ML利用案件でよくある3課題: 属人化 + タイトな締切 + 並行して走る案件 / Yule: 多数モデルをアンサンブルして推論まで一気に実行 / 分散処理 + 学習監視 + 中間データをキャッシュ"
  • Snowflake Horizonで始めるデータガバナンス実践編

    はじめに Snowflake Horizonで始めるデータガバナンスの第一歩でデータ分析においてデータガバナンスの重要性をご紹介しました。 今回は実際にデータガバナンスに取り組むためのSnowflake Horizonの機能の紹介となります。 とは言え、Snowflake Horizonの機能は多岐に渡るため、今回は次の項目に絞ります。 データ品質監視 データ保護 データアクセスと監査 これらの項目は初めてデータガバナンスに取り組む場合でも比較的簡単に導入が可能です。 最大の理由としては、以下QuickSartで紹介されている機能だからです。 今回は機能紹介なので、セットアップの手順は含まれていません。 機能の導入方法について知りたい方は是非QuickStartをお試しください。 データ品質監視 データの品質を監視することはデータガバナンスにおけるデータの信頼性向上に繋がります。 Garb

    Snowflake Horizonで始めるデータガバナンス実践編
    sh19910711
    sh19910711 2025/05/01
    "データメトリック関数: データ品質を監視する機能 + 実行スケジュールを指定すると、 DMF の呼び出しが自動化"
  • The Web Conference2020 参加報告会

    https://connpass.com/event/174856/?utm_campaign=event_publish_to_follower&utm_source=notifications&utm_medium=twitter

    The Web Conference2020 参加報告会
    sh19910711
    sh19910711 2025/05/01
    2020 / "転移学習: サービス内で訓練データをあまり取得できない状況下でも性能を高めたい + サービスを立ち上げた直後や利用ユーザーが少ないような場合"
  • [CNDT2022] 実践!OpenTelemetry と OSS を使った Observability 基盤の構築

    Cloud Native Days Tokyo 2022 https://event.cloudnativedays.jp/cndt2022/talks/1571 デモ動画(Google Drive):https://drive.google.com/file/d/13nmdxek97arMzQa…

    [CNDT2022] 実践!OpenTelemetry と OSS を使った Observability 基盤の構築
    sh19910711
    sh19910711 2025/05/01
    2022 / "テレメトリー同士を関連付けることはObservabilityにおいて重要 / エラーログから関連するトレースへ + メトリクスを検知し関連するトレースへ遷移してみる"
  • TerraformとMotoでAWSリソースの作成をローカルで試そう - Ponz Dev Log

    この記事は terraform Advent Calendar 2024 の8日目の記事です。 昨日は @mitomito さんによる [terraform]S3とTransferFamilyでsftpサーバを作るでした。 Table of Contents はじめに Motoとは? いざ実践 使用するソフトウェア Motoを起動 Motoの動作確認 Terraformの設定 Terraformリソース定義の記述 terraformコマンドを実行 はじめに クラウドサービスのプロビジョニングにTerraformを使いたいものの、実環境に繋がずできるだけローカルで完結させたい場合ってありませんか? 例えば以下のようなケースです。 クラウドのアカウントの調達リードタイム、コスト調整の関係でアカウント利用にハードルが高い。 セキュリティポリシーの制約でインターネットの限られたサイトしか接続できな

    TerraformとMotoでAWSリソースの作成をローカルで試そう - Ponz Dev Log
    sh19910711
    sh19910711 2025/05/01
    2024 / "Moto: Bedrockも操作は限定的ながらサポート対象に入っている / Terraformでは \*\_override.tf というファイルを作ると設定をマージ"
  • Workforce Identity Federation を利用する

    はじめに アプリケーションモダナイゼーションスペシャリストの関と申します。 今回は、Google Cloud Japan Advent Calendar の 8 日目の投稿として、アプリケーションモダナイゼーションとあまり関係がない、Workforce Identity Federation についてご紹介します。 TL;DR Workforce Identity Federation を利用すると Cloud Identity を利用せずに他の IdP(Microsoft Entra ID などの外部 ID プロバイダー) の ID で Google Cloud を利用できます。 Workforce Identity Federation とは? Google Cloud の外部(他のクラウドや Kubernetes など)で実行されているアプリケーションが、Service Accou

    Workforce Identity Federation を利用する
    sh19910711
    sh19910711 2025/05/01
    2023 / "Cloud Identity にユーザーを作らずにコンソールへのログイン / ブラウザにログイン URL を入力すると、Okta の認証画面にリダイレクト / SAML アサーションを利用して複雑なログイン管理も可能"
  • 日本語 BERT RetroMAE モデルの公開と、後続検索タスクでの評価 - A Day in the Life

    結果として、ほぼ全てのスコアにおいて性能向上が確認されており、RetroMAEの有益性が確認された。また学習方法も、教師なしでテキストのみを与えれば良いという手軽さも実用性が高いであろう。 RetroMAE について RetroMAEの特徴は、Masked Auto-Encoderの手法を採用しながら、以下の3つの設計を取り入れた点である。 入力文に対して異なるマスクを適用する新しいワークフロー エンコーダーとデコーダーで非対称な構造を採用 エンコーダーとデコーダーで異なるマスク率を使用 これらの工夫により、文書の意味をより深く理解し、効果的な検索を可能にする表現学習を実現している。実際の評価においても、BEIRやMS MARCOなどのベンチマークで優れた性能を示している。また高性能のマルチリンガル密ベクトルモデルの BAAI/bge-m3 も RetroMAE を用いた事前学習を行なって

    日本語 BERT RetroMAE モデルの公開と、後続検索タスクでの評価 - A Day in the Life
    sh19910711
    sh19910711 2025/05/01
    2024 / "BERT: 主にトークンレベルのタスクで事前学習されており、文レベルの表現力が十分に発達していないという課題 / RetroMAE: 検索に特化した事前学習 + 入力文に対して2つの異なるマスクを適用"