はてなブックマークアプリ

サクサク読めて、
アプリ限定の機能も多数!

アプリで開く

はてなブックマーク

  • はてなブックマークって?
  • アプリ・拡張の紹介
  • ユーザー登録
  • ログイン
  • Hatena

はてなブックマーク

トップへ戻る

  • 総合
    • 人気
    • 新着
    • IT
    • 最新ガジェット
    • 自然科学
    • 経済・金融
    • おもしろ
    • マンガ
    • ゲーム
    • はてなブログ(総合)
  • 一般
    • 人気
    • 新着
    • 社会ニュース
    • 地域
    • 国際
    • 天気
    • グルメ
    • 映画・音楽
    • スポーツ
    • はてな匿名ダイアリー
    • はてなブログ(一般)
  • 世の中
    • 人気
    • 新着
    • 新型コロナウイルス
    • 働き方
    • 生き方
    • 地域
    • 医療・ヘルス
    • 教育
    • はてな匿名ダイアリー
    • はてなブログ(世の中)
  • 政治と経済
    • 人気
    • 新着
    • 政治
    • 経済・金融
    • 企業
    • 仕事・就職
    • マーケット
    • 国際
    • はてなブログ(政治と経済)
  • 暮らし
    • 人気
    • 新着
    • カルチャー・ライフスタイル
    • ファッション
    • 運動・エクササイズ
    • 結婚・子育て
    • 住まい
    • グルメ
    • 相続
    • はてなブログ(暮らし)
    • 掃除・整理整頓
    • 雑貨
    • 買ってよかったもの
    • 旅行
    • アウトドア
    • 趣味
  • 学び
    • 人気
    • 新着
    • 人文科学
    • 社会科学
    • 自然科学
    • 語学
    • ビジネス・経営学
    • デザイン
    • 法律
    • 本・書評
    • 将棋・囲碁
    • はてなブログ(学び)
  • テクノロジー
    • 人気
    • 新着
    • IT
    • セキュリティ技術
    • はてなブログ(テクノロジー)
    • AI・機械学習
    • プログラミング
    • エンジニア
  • おもしろ
    • 人気
    • 新着
    • まとめ
    • ネタ
    • おもしろ
    • これはすごい
    • かわいい
    • 雑学
    • 癒やし
    • はてなブログ(おもしろ)
  • エンタメ
    • 人気
    • 新着
    • スポーツ
    • 映画
    • 音楽
    • アイドル
    • 芸能
    • お笑い
    • サッカー
    • 話題の動画
    • はてなブログ(エンタメ)
  • アニメとゲーム
    • 人気
    • 新着
    • マンガ
    • Webマンガ
    • ゲーム
    • 任天堂
    • PlayStation
    • アニメ
    • バーチャルYouTuber
    • オタクカルチャー
    • はてなブログ(アニメとゲーム)
    • はてなブログ(ゲーム)
  • おすすめ

    参議院選挙2025

『zenn.dev』

  • 人気
  • 新着
  • すべて
  • 動画の無音部分を自動でカットする 〜 MLと波形解析のハイブリッド音声処理 〜

    3 users

    zenn.dev/shu223

    本記事では、ChopperというiOSアプリで実現している動画の無音部分を自動でカットする処理のiOSでの実装方法について解説します。 人の声だけを抽出して無音区間を除去するアプリ、Chopper 無音部分のカット? 人が話している部分「以外」をカットしたい いわゆるジェットカット さっそくデモ Chopper: AIで人の声を抽出して動画の無音を自動でカットするアプリ 2021年リリース 2023年に有料化 そこそこ売れている Before: 300秒 After: 145秒(52%カット) 動画の無音カット処理全体の流れ 入力 → 音声抽出 → 発話区間検出 → 入力動画の発話区間以外をカット → 出力 「発話区間検出」をどう実現するか? 「音のありなし」で判定すればいい? → 周りがガヤガヤしてたり車の音が入ってたりしてるだけでもう発話と区別できない → MLで「人の声」を判定する

    • テクノロジー
    • 2024/11/06 11:16
    • Apple Intelligence時代のApp Intents設計

      4 users

      zenn.dev/shu223

      はじめに 本記事は、WWDC24の "Design App Intents for system experiences" (システムエクスペリエンスのためのApp Intents設計) というセッションを記事形式にしたものです [1]。 App Intents power system experiences in controls, Spotlight, Siri, and more. Find out how to identify the functionality that’s best for App Intents, and how to use parameters to make these intents flexible. Learn how to use App Intents to allow people to take action outside your

      • テクノロジー
      • 2024/06/19 11:57
      • iOS
      • GPT-4oのマルチモーダル入力をiOSから試す

        4 users

        zenn.dev/shu223

        2024年5月21日に開催されたイベントで発表した内容です。GPT-4oのマルチモーダル機能を、iOSからAPIをたたいて試してみた、という話。 リアルタイムにGPT-4oに動画を理解してもらうアプリを実装し、デモも行いました: またデモ・各種サンプルコードは以下で公開しています。 スライド・発表動画 スライドはこちら: 発表動画 [1] がこちら: 以下、発表資料を記事として再構成したものになります。登壇後に調査した内容も追記しています。 GPT-4oと「マルチモーダル」 GPT-4oのモダリティ 2024.5.13 GPT-4o発表 Hello GPT-4o | OpenAI の1行目: We’re announcing GPT-4o, our new flagship model that can reason across audio, vision, and text in re

        • テクノロジー
        • 2024/05/24 15:16
        • ローカルLLMをCore MLモデルに変換する - 🤗 Exporters の使い方

          3 users

          zenn.dev/shu223

          Exporters とは Hugging Faceが公開している Exporters というツールがある。 TransformersのモデルをCore MLにエクスポートするためのツールで、coremltoolsをラップしたものではあるが、変換に伴う色々な問題をツール側で吸収してくれている。要はこのツールを使えばcoremltoolsをそのまま使うよりも簡単にTransformersモデルをCore MLモデルに変換できる。 モチベーション Exporters は以下の公式ブログで紹介されていたもので、 Llama 2などのLLMモデルもこれを用いて変換されたようだ(あるいは、その変換の過程で得られた知見がこのツールに盛り込まれている) 公開されている変換済みモデルは、試してみたもののまだモバイル端末には大きすぎたので、 もっと小さいモデルを自前で変換したらよいかもしれない、と思い本ツール

          • テクノロジー
          • 2024/05/12 00:37
          • ツール
          • mobile
          • ローカルLLM on iOS の現状まとめ

            41 users

            zenn.dev/shu223

            2024年3月5日に開催されたイベントで発表した内容です。 スライドはこちら: またLTで全然時間が足りなかったので、イベント終了後にひとりで撮ったプレゼン動画がこちら: サンプルコードはこちら: 以下、発表資料を記事として再構成したものになります。登壇後に調査した内容も追記しています。 「ローカルLLM on iOS」のデモ オンデバイスで [1]処理してます APIは叩いていません 倍速再生していません 8.6 tokens/sec iOSローカルでLLMを動かすメリット オフラインでも動く プライバシーが守られる(データがどこにもアップされない) どれだけ使っても無料 モバイル端末スタンドアローンで最先端の機能が動作することには常にロマンがある iOSでローカルLLMを動かす方法 大きく分けて2つ llama.cpp Core ML llama.cpp LLMが高速に動くランタイム

            • テクノロジー
            • 2024/04/25 22:03
            • LLM
            • iOS
            • 機械学習
            • Apple
            • あとで読む
            • エンジニアのための「労働集約からの脱却」入門

              228 users

              zenn.dev/shu223

              長年フリーランスエンジニアとしてごはんを食べてきた著者が、時給ベースの労働集約型「ではない」マネタイズ方法をいろいろと模索した内容をまとめました。(カバーイラスト by リルオッサ)

              • テクノロジー
              • 2023/11/27 09:36
              • エンジニア
              • あとで読む
              • マネタイズ
              • 労働
              • 仕事
              • フリーランス
              • プログラマ
              • Engineer
              • キャリア
              • book
              • iOSで文字認識(Text Recognition)

                22 users

                zenn.dev/shu223

                iOS 13以降で、待望だった「文字認識」機能が使えるようになりました。カメラなどで撮影した画像内にある文字を読み取る [1] ことができます。 「文字検出」との違い 文字認識は、Visionフレームワークの一機能として追加されました。 一方、Core ImageのCIDetectorというクラスでは、CIDetectorTypeTextというタイプを指定でき、テキストを検出することができます。 このCIDetectorTypeTextやCIFeatureTypeTextはiOS 9からあるものです。 しかしこちらは文字の「領域」を検出する機能です。何が書いてあるか、までは認識できませんでした。 またiOS 11で登場したVisionフレームワークでは VNDetectTextRectanglesRequest という文字領域を検出するクラスを当初から利用できましたが、これも文字の「領域」

                • テクノロジー
                • 2023/11/12 06:04
                • iOS
                • 言語
                • あとで読む
                • Programming
                • Core ML版Stable DiffusionをiOSで快適に動かす

                  3 users

                  zenn.dev/shu223

                  概要 Stable Diffusionとは 画像生成AI 入力テキストに応じて画像を自動生成するtext-to-imageモデル プロンプト: sadhu man in Rishikesh, India meditating near the Ganges river 2022.8 オープンソースとして公開 Core ML Stable Diffusion とは Core ML フォーマットに変換された Stable Diffusion のモデル 従来のモデルをAppleハードウェアで動かす => CPUのみ利用 Core MLモデル => CPU, GPU, Neural Engineを利用 → Appleのハードウェアを最大限活かせるのがCore MLモデル 詳細な最適化の解説: Core ML Stable Diffusion のリポジトリ Apple謹製 モデル変換コード、macO

                  • テクノロジー
                  • 2023/10/21 12:14
                  • 機械学習
                  • iOS
                  • 画像
                  • whisper.cppのCore ML版をM1 MacBook Proで動かす

                    53 users

                    zenn.dev/shu223

                    OpenAIの音声認識モデルであるWhisperの高速推論版であるwhisper.cppが、いつのまにか [1] Core ML対応していた。 Core ML対応したということは、macOS/iOSデバイス(Mac, iPhone, etc...)に搭載されているNeural Engine、GPUを利用して推論処理を行うようになった、ということを意味する。[2] さっそくREADMEの手順をなぞりつつ手元のMBPで動かしてみたメモ。 なお、実行環境は以下の通り: MacBook Pro M1 Max 64GB macOS Ventura 13.3.1 Core MLモデルの生成手順 依存パッケージのインストール whisper.cppのCore MLモデルの作成に必要なパッケージをインストールする。

                    • テクノロジー
                    • 2023/05/03 21:26
                    • Whisper
                    • AI
                    • GPU
                    • あとで読む
                    • Mac
                    • コンピュータ

                    このページはまだ
                    ブックマークされていません

                    このページを最初にブックマークしてみませんか?

                    『zenn.dev』の新着エントリーを見る

                    キーボードショートカット一覧

                    j次のブックマーク

                    k前のブックマーク

                    lあとで読む

                    eコメント一覧を開く

                    oページを開く

                    はてなブックマーク

                    • 総合
                    • 一般
                    • 世の中
                    • 政治と経済
                    • 暮らし
                    • 学び
                    • テクノロジー
                    • エンタメ
                    • アニメとゲーム
                    • おもしろ
                    • アプリ・拡張機能
                    • 開発ブログ
                    • ヘルプ
                    • お問い合わせ
                    • ガイドライン
                    • 利用規約
                    • プライバシーポリシー
                    • 利用者情報の外部送信について
                    • ガイドライン
                    • 利用規約
                    • プライバシーポリシー
                    • 利用者情報の外部送信について

                    公式Twitter

                    • 公式アカウント
                    • ホットエントリー

                    はてなのサービス

                    • はてなブログ
                    • はてなブログPro
                    • 人力検索はてな
                    • はてなブログ タグ
                    • はてなニュース
                    • ソレドコ
                    • App Storeからダウンロード
                    • Google Playで手に入れよう
                    Copyright © 2005-2025 Hatena. All Rights Reserved.
                    設定を変更しましたx