並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 12 件 / 12件

新着順 人気順

Audioの検索結果1 - 12 件 / 12件

  • 時間無制限、無料の文字起こしアプリを開発したので、アプリ紹介と学びまとめ。|にょす

    みなさん、こんにちは!9月は久しぶりに個人開発をしてました。 今回はGeminiを使って、ちょっと変わった文字起こしアプリを開発したので、その裏側をお話ししていきたいと思います。その名も「無限もじおこし」です! 「無限もじおこし」はその名の通り、時間無制限、無料で使える文字起こしアプリです。普通に考えたら「え?大丈夫なの?」って感じですよね笑 でも、ちゃんと収益的に成り立つ算段を立てています。この記事ではそこらへんの考えや、アプリ開発における技術的な学びについてまとめていきたいと思います! 「無限もじおこし」の紹介主な特徴音声の文字起こしが無制限に可能 (10時間でも100時間でも!)使いやすさにこだわった機能 (コピー、シェア、自動タイトル生成など)「よく使う単語帳」に登録すると、文字起こしの変換精度アップバックアップ機能があるので、機種変更などが発生しても簡単に引き継げます そして、無

      時間無制限、無料の文字起こしアプリを開発したので、アプリ紹介と学びまとめ。|にょす
    • ヨドバシでAirPods4を視聴したら店員さんが全否定してきて悲しかった→忖度なく新製品の悪いところを教えてくれる誠実で知識が深い良い店員さんなのでは

      岩手県産りんご @iPod4th2011 ヨドバシ仙台でAirPods 4を試聴させていただいたんだけど、ご対応いただいた店員さんが ・音が悪くなった ・何も良くなってない ・Appleはブランドだけで性能はイマイチ ・この値段なら他を買った方が良い とAirPods 4を全否定してきて、非常に悲しかった。 Apple頼む。仙台にStoreは必要だよ

        ヨドバシでAirPods4を視聴したら店員さんが全否定してきて悲しかった→忖度なく新製品の悪いところを教えてくれる誠実で知識が深い良い店員さんなのでは
      • 可愛すぎかよ! ハッカーの新しい相棒 コマンドラインからLLMを使えるgptme|shi3z

        こういうのが欲しかったんだよ。マジで。 コマンドラインからLLMを呼び出せるgptmeというツールがアツい これは、gptmeコマンドを追加するというもの。 環境変数としてOPENAI_API_KEYとかAnthropicのキーとかを設定しておくと勝手にAPIを呼び出してくれる。もちろん、クラウドに送信するとかけしからんという勢にはローカルLLMでも対応できる。 こいつはコマンドライン版ChatGPTのようなものなので、コマンドラインで動くのだが、その真価は例えばパイプで繋いだ時とかに発揮される。 $ du -d 1|gptme "一番容量を食ってるフォル ダは何Gバイト使ってんの?" Found OpenAI API key, using OpenAI provider [10:13:32] No model specified, using recommended model for

          可愛すぎかよ! ハッカーの新しい相棒 コマンドラインからLLMを使えるgptme|shi3z
        • 匿名ダイアリーのワイヤレスイヤホン記事でチューリングテストが行われていた - ARTIFACT@はてブロ

          anond.hatelabo.jp 最近、ワイヤレスイヤホンのレビュー記事を見てると、どうもAIに書かせたと思われる文章にたびたび遭遇していたのだが、匿名ダイアリーに、これはAIだと断定できる記事が上がっていた。しかも、それに対して、AIだと指摘する人は非常に少なくて驚いた。AIが書いた文章でもAIだと思う人が少ないのなら、そりゃAIに文章書かせるよね。AIの書いた製品紹介の文章の特徴として、書き手の主観の少なさがあるのだが、逆にそれを客観性と感じて、良いと感じる人が多いのかもしれない。 そして、花見川さんが指摘しているように、紹介している機種があまりに少ない。秋に出た新型TWSならB&W Pi6 / Pi8は必須のはずだが、紹介されていない。YouTubeでのレビュー動画はカジェログの人ぐらいだったので、おそらく学習元がなかったのだろう。 今秋のワイヤレスイヤホン収穫について[はてな匿名

            匿名ダイアリーのワイヤレスイヤホン記事でチューリングテストが行われていた - ARTIFACT@はてブロ
          • 今秋のワイヤレスイヤホン収穫について

            今年の秋はやや新商品が気持ち少なくもありますが、量的には豊作でしょう。 ヨドバシカメラでは、AirPods4(ANCあり)が多く売れている印象です。やはり濡れ耳の持ち主などイヤーチップが苦手な層の方にとっては、オープンでノイキャンが効く、Appleのイヤホンということで手が伸びやすいようです。音質としては前世代前々世代から指摘されている低音域の薄さはだいぶ解消され、バランス良く放ったものの、綺麗だけど勃たない女性のように、音楽を聴く楽しさの点でややまだダイナミックさや音質の向上が足りていないように感じられました。ノイズキャンセリングは非常によくできたもので、当初の想像を上回るキャンセリングを発揮してくれました。良いです。 その他、新発売の製品について、BOSEのQuiet Comfort EarBudsは、よくできたモデルです。価格は前述のAirPodsより3000円ほど安く、密閉されてい

              今秋のワイヤレスイヤホン収穫について
            • 「Winamp」のソースコードが公開 ~かつて一世を風靡した伝説的メディアプレイヤー/独自ライセンスで「GitHub」に

                「Winamp」のソースコードが公開 ~かつて一世を風靡した伝説的メディアプレイヤー/独自ライセンスで「GitHub」に
              • マリアナ海溝から聞こえる謎の音の正体が解明される

                2014年に北西太平洋・マリアナ海溝で実施した音響調査で収集された謎の音は約10年にわたって科学者を悩ませていました。しかし、アメリカ海洋大気庁(NOAA)の研究者らがAIを用いた分析を行った結果、この音の正体を突き止めることに成功しました。 Frontiers | Bryde’s whales produce Biotwang calls, which occur seasonally in long-term acoustic recordings from the central and western North Pacific https://www.frontiersin.org/journals/marine-science/articles/10.3389/fmars.2024.1394695/full Creepy 'biotwang' noises coming fro

                  マリアナ海溝から聞こえる謎の音の正体が解明される
                • 廃止が決まったStudio One Primeの受け皿になる!?プロ絶賛のUniversal Audioの無料DAW、LUNA入手法と基本操作ガイド|DTMステーション

                  先日Studio One 7が発表されると同時に、無料版のStudio One PrimeおよびミッドレンジのStudio One Artistが廃止され、Studio One Proのみになることが発表され、この界隈に大きな波紋を呼んでいます。そのStuido One 7 Proについては、また近いうちにレポートするつもりですが、その一方で、Universal AudioがLUNAという無料DAWをリリースし、どんどん進化させてきているのをご存じでしょうか?当初はMac版のみでスタートしたのですが、先日Windows版のパブリックベータが公開され、すでに問題なく使えるようになっています。そしてまもなくWindows版も正式リリースされる予定となっています。 そのLUNAは無料とはいえ、機能削減版とかエントリー版といった位置づけではありません。プロが快適に使えることを目指して開発されたDA

                    廃止が決まったStudio One Primeの受け皿になる!?プロ絶賛のUniversal Audioの無料DAW、LUNA入手法と基本操作ガイド|DTMステーション
                  • 1人ビートルズで全曲完コピを目指す、60歳からの宅録ライフ“日々を生きる”ためのDTM〜Akifumi Tamagawaさん(70)の場合〜 - Always Listening by Audio-Technica(オーディオテクニカ)

                    職業的な作業としてではなく、ただただ日常を満たすためだけの切実な営みとして音楽を作る人々にフォーカスしていく「 “日々を生きる” ためのDTM」。 音楽を「作る」ことが「聴く」ことよりも特別な行為だと考えている人は、現代では少数派かも知れない。 ラップトップ一台で誰でも手軽に楽曲制作ができる今、作曲や録音は特権的なことではなくなった。 例えば、その人にとって音楽を聴くということが、日常を潤したりエキサイティングなものにするためのものだったとしたら、より能動的な作曲という習慣は、その人が求める癒しや興奮をさらに手応えのあるものにしてくれるのかもしれない。 今回登場してもらったのは、埼玉県蕨市在住のAkifumi Tamagawaさん。 約10年間にわたって、宅録で制作したビートルズ(The Beatles)の「完コピ」音源をYouTubeなどのオンラインプラットフォーム上にアップし続けている

                      1人ビートルズで全曲完コピを目指す、60歳からの宅録ライフ“日々を生きる”ためのDTM〜Akifumi Tamagawaさん(70)の場合〜 - Always Listening by Audio-Technica(オーディオテクニカ)
                    • 歌詞と検閲:“Parental Advisory”が生まれる切っ掛け“汚らわしい15曲”とミュージシャンの反応

                      今から30年以上前、アメリカでは、15の曲が公序良俗を乱す曲として名指しされた。政治家の妻たちによる過激になっていった歌詞への反動的な運動の中で、これら15曲が「汚らわしい15曲 / Filthy 15」として槍玉に挙げられ、その結果、彼らの圧力によって「露骨な歌詞」が含まれていることを警告するステッカー「Parental Advisory」がレコードやCDのジャケットに貼られるようになったのだ。 それからかなり年月は過ぎたが、槍玉に挙げられた曲に関する議論は今でも語り草となっている。2018年には、作曲家のニコール・リジーがこの問題をテーマとした作品「汚らわしい15曲」を発表し、有名なバービカン・シアターを含む各地の演劇会場で上演されている。 「初めのころ、私は驚いて呆然としていた。けれど、じきに怒りが爆発した」 作品で発表する表現がどこまで許容されるのか……それをめぐる議論は昔からあっ

                        歌詞と検閲:“Parental Advisory”が生まれる切っ掛け“汚らわしい15曲”とミュージシャンの反応
                      • OpenAI の Realtime API の使い方|npaka

                        以下の記事が面白かったので、簡単にまとめました。 ・Realtime API 1. Realtime API「Realtime API」は、低遅延なマルチモーダル会話エクスペリエンスを構築するためのAPIです。現在、入出力の両方でテキスト・音声がサポートされており、Function Calling を利用することもできます。 特徴は次のとおりです。 ・ネイティブな音声合成 低遅延でニュアンスに富んだ出力が得られる ・自然で操作可能な音声 自然な抑揚を持ち、笑ったり、ささやいたり、トーンの指示に従うことができる ・同時マルチモーダル出力 テキストはモデレーションに役立ち、オーディオにより安定した再生が保証される 2. クイックスタート「Realtime API」は、「WebSocket」を介して通信するステートフルなイベントベースAPIです。 機能を紹介するデモアプリ「openai-real

                          OpenAI の Realtime API の使い方|npaka
                        • 西川善司の3DGE:PS5 Proの実像をテクニカルプレゼンテーションから考察してみる

                          西川善司の3DGE:PS5 Proの実像をテクニカルプレゼンテーションから考察してみる ライター:西川善司 Sony Interactive Entertainment(以下,SIE)は,2024年9月11日に,「PlayStation 5」の上位機にあたる「PlayStation 5 Pro」を2024年11月7日に発売すると発表した(関連記事)。 テクニカルプレゼンテーションの動画内で明かされた情報はそれほど多くはなかった。それでも重要なキーワードはいくつかあったので,そのあたりをヒントにして,筆者独自の考察も加えつつ,詳しく見ていくことにしたい。 Proモデルは「体験の進化」ではなく「映像のグレードアップ」 PlayStation 4を開発していた頃から,PSハードウェア仕様を監督する「リードアーキテクト」に就任したSIEのMark Cerny(マーク・サーニー)氏には,筆者も直接取

                            西川善司の3DGE:PS5 Proの実像をテクニカルプレゼンテーションから考察してみる
                          1