並び順

ブックマーク数

期間指定

  • から
  • まで

81 - 120 件 / 156件

新着順 人気順

Audioの検索結果81 - 120 件 / 156件

  • 2022年春開始の新作アニメ一覧

    年4回の番組改編期が近づき、また多くの新作アニメが始まります。2022年春の改編でスタートするアニメの本数は60本強。 オリジナルアニメとして、谷口悟朗原案の「エスタブライフ」、競馬学校が舞台の「群青のファンファーレ」、女子ゴルフが題材の「BIRDIE WING -Golf Girls' Story-」、おにっ子たちの物語「おにぱん!」などがある一方、続編モノでは「TIGER&BUNNY 2」「まちカドまぞく 2丁目」「攻殻機動隊SAC_2045 シーズン2」「かぐや様は告らせたい-ウルトラロマンティック-」「デート・ア・ライブⅣ」などがあり、どれを見るべきなのか大いに悩むことになりそうです。 以下、作品リストは放送・配信時期が早いものから順に並べています。作品名の頭に「◆」をつけているので、「◆」でページ内検索すると1作品ごとにどんどんジャンプしていけます。また、目次からも各作品部分へ移

      2022年春開始の新作アニメ一覧
    • 文字を入力するだけで「萌え声」を簡単一発生成してくれる「Moe TTS」

      萌(も)え声を出したくても出せない人でも簡単に簡単に萌え声を生成できる「Moe TTS」が公開されていたので利用してみました。Moe TTSは機械学習を用いて実際のゲームソフトの音声等を合成しており、機械学習でアプリケーションを開発するコミュニティ「Hugging Face」内で公開されています。 Moe TTS - a Hugging Face Space by skytnt https://huggingface.co/spaces/skytnt/moe-tts Moe TTSにアクセスするとこんな感じの画面が表示されます。 そのまま上にスクロールすると文字の入力ボックスが現れます。デフォルトで「こんにちは。」と入力されていたので、今回はこれに続けて「今日も寒いですね。」と入力。そして、「Generate」をクリックします。 すると、ページ下部に再生ボタンが現れます。そのまま再生ボタン

        文字を入力するだけで「萌え声」を簡単一発生成してくれる「Moe TTS」
      • BudouX: 読みやすい改行のための軽量な分かち書き器

        .app 1 .dev 1 #11WeeksOfAndroid 13 #11WeeksOfAndroid Android TV 1 #Android11 3 #DevFest16 1 #DevFest17 1 #DevFest18 1 #DevFest19 1 #DevFest20 1 #DevFest21 1 #DevFest22 1 #DevFest23 1 #hack4jp 3 11 weeks of Android 2 A MESSAGE FROM OUR CEO 1 A/B Testing 1 A4A 4 Accelerator 6 Accessibility 1 accuracy 1 Actions on Google 16 Activation Atlas 1 address validation API 1 Addy Osmani 1 ADK 2 AdMob 32 Ads

          BudouX: 読みやすい改行のための軽量な分かち書き器
        • ChatGPT APIとWhisper APIで議事録文字起こしアプリを作り、Hugging Face Spacesで公開する | gihyo.jp

          ChatGPT APIの使い方 実際にChatGPT APIを使ってみましょう。 openai-pythonのインストール 今回はOpenAIのPython用ライブラリであるopenai-pythonを使います。pipを用いて、openai-pythonをインストールしましょう。 pip install openai APIリクエスト ChatCompletion.createで対話を生成できます。たとえば、以下のようなコードになります。 import openai openai.api_key = "sk-..." # APIキー completion = openai.ChatCompletion.create( model="gpt-3.5-turbo", messages=[{"role": "user", "content": "こんにちは!"}] ) print(complet

            ChatGPT APIとWhisper APIで議事録文字起こしアプリを作り、Hugging Face Spacesで公開する | gihyo.jp
          • シン・エヴァンゲリオン劇場版𝄇──おとなになれないぼくたちと、第1世代オタクの悲哀 - 狐の王国

            3月8日、この日が憂鬱だった。映画館に向かう準備をしなければならないのについついグズグズとネットを見ていた。なんとかでかけても、このまま劇場につかなければいいのにという気分が俺の心を蝕んでいた。そう、今日はシン・エヴァンゲリオン劇場版𝄇の公開初日である。ネタバレが怖いから早めに見に行こうとは思ってたのだが、まあ初日のチケットが取れてしまうとは思わなかった。入場口であまりに緊張しすぎて1度引き返したくらいに、見るのが怖かった。 あのエヴァが終わる。1995年、夕方に放送していたアニメが、当時の水準からは考えられないほど高品質で、なおかつ話がわけのわからない、謎が謎を呼び、ついには社会現象とまで呼ばれたあのエヴァが、なんと2021年にもなって「完結」するんだという。 テレビ放送時には「は? これが最終回?」という感じだったし、何度劇場版を作っても「は? これが終わり?」としか言いようのなかっ

              シン・エヴァンゲリオン劇場版𝄇──おとなになれないぼくたちと、第1世代オタクの悲哀 - 狐の王国
            • 【HTML5】マリオのコインの音をブラウザで出そう【ファミコン】 - Qiita

              で、上記の通り「矩形波、三角波」って見たらアラフォー以上の人は「ファミコンじゃん」ってなったり、むしろ、コナミ矩形波倶楽部を思い出す方も多いかもしれません。 技術的なこと まぁ、ソースを見て貰えば特に難しいことはしていない(いつものように殴り書きだし…)のでコインであれば「♪シミー」という音を鳴らせばできるわけです。 const AudioContext = window.AudioContext || window.webkitAudioContext const audioContext = new AudioContext() const gainNode = audioContext.createGain() gainNode.connect(audioContext.destination) gainNode.gain.value = 0.1 const oscillator =

                【HTML5】マリオのコインの音をブラウザで出そう【ファミコン】 - Qiita
              • [電話予約の無人化]Amazon Connect + GPT-4 JSONモード + Whisperで、1回の発話から予約情報(日付,時間など)を抽出 | DevelopersIO

                [電話予約の無人化]Amazon Connect + GPT-4 JSONモード + Whisperで、1回の発話から予約情報(日付,時間など)を抽出 はじめに Amazon Connect + GPT-4 JSONモード + Whisperで、1回の発話から予約情報(電話番号,日時,名前,人数)を正しく抽出できるか検証しました。 コールセンターでは、有人対応から無人対応に変更したいニーズが増えているように思います。 電話予約の無人対応を想定し、1回の発話で、下記の5つの予約情報を抽出できるか確認します。 お名前 電話番号 予約日 予約時間 人数 発話で予約情報を抽出する方法として、GPT-4 Turbo のJSONモードを利用します。 JSONモードの詳細は、下記を参照ください。 例えば、「名前はクラスメソッドで、電話番号は09011111111。来週の火曜日の19時に4名で予約できます

                  [電話予約の無人化]Amazon Connect + GPT-4 JSONモード + Whisperで、1回の発話から予約情報(日付,時間など)を抽出 | DevelopersIO
                • ラズパイとWebRTCで動物の死活監視ができるようにした話 - ( ꒪⌓꒪) ゆるよろ日記

                  こんにちわ、しいたけです。 今は夏休みで奥さんと子どもたちが帰省しているので、動物と2人で暮らしています。 で、外出すると動物だけを家に残していくことになります。 ペットモニターとか市販でもあるんですが、せっかくなので、 夏休みの自由研究として、ラズパイ+カメラモジュールとWebRTCを使って、外出先からでも動物の状態を確認できるやつを作ってみました。 ↑ 死活監視される動物の様子です 用意したもの Pi3 B+ スターターキット V3 16GB 白 Piカメラ Official V2 for 3/2/1/0 Manfrotto ミニ三脚 PIXI ブラック MTPIXI-B カメラ用 Manfrotto スマートフォン用三脚アダプター MCLAMP HAKUBA 自由雲台 BH-1 ラズパイ3とケースのセットとカメラモジュールは Raspberry Pi Shop by KSY で購入。

                    ラズパイとWebRTCで動物の死活監視ができるようにした話 - ( ꒪⌓꒪) ゆるよろ日記
                  • 今、J-POPとは何か?「リズム」から見えてくる2010年代の変化(柴 那典) @gendai_biz

                    今、J-POPとは何か?「リズム」から見えてくる2010年代の変化 キーワードは「なまり」、その影響とは J-POPとは、果たして何か? それはどう変化してきたのか。 そういう問いに対して、音楽産業の構造や、メディアの変遷、聴き方の変化から論じる本は少なくない。また、ヒット曲の歌詞に描かれる情景や心象風景を分析するアプローチも一般的だ。 対して、気鋭の批評家であるimdkm(イミヂクモ)さんが初の著書として上梓した『リズムから考えるJ-POP史』は、そのタイトルの通り「リズム」を軸にJ-POPの変遷を辿る意欲的な一冊だ。小室哲哉、宇多田ヒカル、中田ヤスタカ、三浦大知など数々のアーティストの楽曲がどう新しかったのか、どう時代を変えたのかを、画期的な手法で論考し解き明かしている。 そこで本記事では、J-POPにおける「リズムの革新」について、音楽家、音楽プロデューサーであり『ナイトフライ 録音

                      今、J-POPとは何か?「リズム」から見えてくる2010年代の変化(柴 那典) @gendai_biz
                    • 「Arduino Uno」でシンセサイザを自作してみた。前編【藤本健のDigital Audio Laboratory】

                        「Arduino Uno」でシンセサイザを自作してみた。前編【藤本健のDigital Audio Laboratory】
                      • 【水星の魔女】英語版スレッタ役の声優発表にラウダ役の声優が反対声明、声優の人種を批難

                        機動戦士ガンダム 水星の魔女』第1話の英語吹き替え版は、今週2月5日(日)より配信開始! 🔥 スレッタ @JillHarrisVO ミオリネ @nvansistine Jill Harris @JillHarrisVO Words cannot describe how excited I am to voice Suletta in the new #gundam franchise! Check out the dub for Mobile Suit Gundam: The Witch from Mercury on @Crunchyroll this Sunday, 2/5! Thanks to @HEYSUEZO for trusting me with this bean and @NoahB0dy for the audio wizardry. 💖💫 pic.twitte

                          【水星の魔女】英語版スレッタ役の声優発表にラウダ役の声優が反対声明、声優の人種を批難
                        • Stability AI、無料で起承転結のある最大3分の音楽を生成可能な「Stable Audio 2.0」を公開/テキストだけでなくアップロードしたオーディオから音楽を生成可能に

                            Stability AI、無料で起承転結のある最大3分の音楽を生成可能な「Stable Audio 2.0」を公開/テキストだけでなくアップロードしたオーディオから音楽を生成可能に
                          • 伝統と最先端が融合するタイ音楽──地域に密接なレコード史と新型コロナの影響、YouTubeの爆発的な再生回数の理由を解説 - Always Listening by Audio-Technica(オーディオテクニカ)

                            リアル地球の歩き方 | 2021.07.28 Wed 伝統と最先端が融合するタイ音楽──地域に密接なレコード史と新型コロナの影響、YouTubeの爆発的な再生回数の理由を解説 膨大な7インチのリリース量から、世界中のDJやコレクターから愛されるタイのレコード。米人気バンド・クルアンビンが「タイ・ファンク」をカバーするなど、コアな音楽リスナーから認知度が高い。タイ音楽のメインのジャンルは「ルークトゥン」(田舎の子、田舎者の歌の意)、「モーラム」(歌・言葉の達人の意)など、音楽性に限らない区分が特徴的。今回はそんなタイの音楽の歴史や最新事情、レコードにまつわるトピックスをご紹介。 伝統と流行が融合していくタイの音楽 日本中にタイ料理屋があるように、じわじわとコアな音楽ファンの間に浸透してきたタイ音楽。映画『バンコクナイツ』公開時には坂本慎太郎&VIDEOTAPEMUSIC、井手健介と母船がトリ

                              伝統と最先端が融合するタイ音楽──地域に密接なレコード史と新型コロナの影響、YouTubeの爆発的な再生回数の理由を解説 - Always Listening by Audio-Technica(オーディオテクニカ)
                            • React で作るゆっくり解説 feat. Remotion

                              export const FirstVideoConfig: VideoConfig = { sections: [ { title: 'イントロダクション', bgmSrc: '/audio/bgm/honobono-wartz.wav', backgroundVideo: '/video/cyber-bg.mp4', afterMovie: '/video/yukkuri-opening.mp4', talks: [ { text: 'ねえねえ魔理沙', speaker: 'reimu', id: '59f8c2cd81334be5ab5cdc7899fad286', audioDurationFrames: 25, }, { text: 'なんだ霊夢', speaker: 'marisa', id: '0ba332a465c3404a870de15cad021407', audioD

                                React で作るゆっくり解説 feat. Remotion
                              • ロスレスとMP3ってどのくらい差があるんだ? 専門家に聞いてみた

                                ロスレスとMP3ってどのくらい差があるんだ? 専門家に聞いてみた2024.04.12 19:0059,149 Maxwell Zeff - Gizmodo US [原文] ( そうこ ) 「音楽聴くなら絶対ロスレス音源がいいよ? MP3より音がいいから」なんて、一度は聞いたことがあるようなセリフです。 データ容量をギュっと縮めた圧縮音源であるMP3。データ圧縮時の劣化を最小限に留めた、または圧縮していないロスレス音源。 なるべくロスがない方がサウンドクオリティがいいのは事実です。ロスレスがアーティストが意図する生の音に近いのも事実です。…事実なのですが、やっぱり言わずにはいられません。 その音、聴き分けられるの? 圧縮音源とロスレスの差って、フツーの人が聴いてもわかるのかい? 少々古い話で恐縮ですが、2014年に米Gizmodoが読者アンケートをとっていました。質問は「ロスレス音源とMP3

                                  ロスレスとMP3ってどのくらい差があるんだ? 専門家に聞いてみた
                                • インターネットの「無限の複製」能力を封じる可能性を秘めたコピー不可能なデジタルデータ「NFT」とは?

                                  by beeple 「非代替性トークン(NFT)」は、元は暗号通貨関連の用語であり、読んで字のごとく代替不可能なトークンを指します。このNFTの特性を利用し、アート作品や映像データを「コピー不可能なデジタル作品」として取引することが注目を集めています。そんなNFTは一体どこからやってきたのか、そして既存のNFTコンテンツが抱える問題点とは何なのか、暗号通貨関連メディアのDecryptがまとめています。 The NFT Craze Offers Easy Money—And Hard Copyright Questions - Decrypt https://decrypt.co/60394/nft-craze-easy-money-hard-copyright-questions デジタルコンテンツをNFTとして販売することが近年大きな注目を集めており、「2021年を象徴する単語を選ぶなら

                                    インターネットの「無限の複製」能力を封じる可能性を秘めたコピー不可能なデジタルデータ「NFT」とは?
                                  • 世界一受けたい授業「ホワイトハッカー」特集を見てみた - piyolog

                                    2020年2月8日夜、日本テレビ系列が放送している「世界一受けたい授業」で「ホワイトハッカー」の仕事紹介を特集したシーンがありました。ここでは放送内容からpiyokangoが気になった点を取り上げます。 番組該当パートの構成 www.ntv.co.jp 番組の該当パートは約23分。以下構成で放送されていた。 イントロ(サイバー犯罪、サイバー攻撃の概要紹介) 該当パート説明担当者の紹介 ホワイトハッカーの仕事紹介 設問①としてFBIのiPhoneロック解除を取り上げ 仮想通貨流出事件のIR支援事例紹介 設問②として逆SEOを取り上げ 無線Wifiのハッキング実験 ランチ合コン探偵の番宣 番組中取り上げられた数字 番組中ではいくつかの数字に触れられていた。 サイバー犯罪の被害予想額は660兆円 Cyber​​security Venturesが2016年に発表している数字より引用された予測値。

                                      世界一受けたい授業「ホワイトハッカー」特集を見てみた - piyolog
                                    • Bluetooth接続切り替えの歴史が変わった Appleの「自動切り替え」はどこが画期的なのか

                                      iOS 14/iPadOS 14の正式版が公開された。いきなりの公開は開発者にかなり負担が大きく、混乱を招いているのはちょっとどうかと思うのだが、それはそれとして、良い機能が多いのも事実だ。 特に、AirPods Proとのセットで実現する「空間オーディオ」と第2世代AirPods以降で使える「Bluetooth接続先の自動切り替え」は素晴らしい。素晴らしさを急いで伝えるべく、正式版発表に合わせて急いで記事も作ったくらいだ。 iOS 14でAirPodsの価値急上昇! 「空間オーディオ」と「自動切り替え」やってみた 日常的な部分で特に価値が大きいのは「自動切り替え」だろう。これは「複数のApple製品同士を使っている場合」という条件はあるものの、極めて便利だ。というよりも、ワイヤレスヘッドフォンの使い勝手を画期的に進化させる一歩といっても過言ではない。 Bluetoothヘッドフォンにはい

                                        Bluetooth接続切り替えの歴史が変わった Appleの「自動切り替え」はどこが画期的なのか
                                      • 次世代Bluetooth「LE Audio」で何が変わる? ソニーキーマンに聞いた【藤本健のDigital Audio Laboratory】

                                          次世代Bluetooth「LE Audio」で何が変わる? ソニーキーマンに聞いた【藤本健のDigital Audio Laboratory】
                                        • オーディオテクニカのワイヤレス軟骨伝導ヘッドホン (ATH-CC500BT) を買った - ナイスビア珍道記

                                          10月に発売されたばかりのオーディオテクニカのワイヤレスヘッドホンを半日使った感想を書いておきます。 まだ半日なので評価は変わるかもしれないけど、とりあえず今のとこの感想は、激しくオススメです。 オーディオテクニカ ATH-CC500BT 軟骨伝導イヤホン ワイヤレス / Bluetooth5.1 / aptx HD/マルチポイント/マイク付き/通話品質強化/ノイズキャンセリング/プリセットEQ / 最大約20時間再生 / 急速充電 / IPX4防水防塵 / ベージュ ATH-CC500BT BG Audio Technica(オーディオテクニカ)Amazon オーディオテクニカ ATH-CC500BT 軟骨伝導イヤホン ワイヤレス / Bluetooth5.1 / aptx HD/マルチポイント/マイク付き/通話品質強化/ノイズキャンセリング/プリセットEQ / 最大約20時間再生 /

                                            オーディオテクニカのワイヤレス軟骨伝導ヘッドホン (ATH-CC500BT) を買った - ナイスビア珍道記
                                          • 最終回:Apple Siliconがやってきた そのさらに先、「Apple ISA」への遠い道のり

                                            ご存じの通り、Apple Silicon「M1」を搭載したMacが発売された。この連載の担当編集である松尾氏も早速入手されたそうで何よりである。現状のM1は、ある意味「拡張性を犠牲にして性能を優先した」構成であり、今後拡張性が求められるようになっていくと、いろいろ厳しいシーンも出てくるとは思うが、それをどう(CPUコアのアーキテクチャだけでなく、SoCのアーキテクチャも含めて)解決しながら性能を上げていくかが楽しみである。 さてこの連載の最後に、そういうApple Siliconの先にあるものを少し考察してみたい。結論からいえば、Appleは既にApple ISA(Instruction Set Architecture)の策定作業にかかっていると思う。それが世の中に登場するのはまだだいぶ先だと思うし、動向次第では世に出ずに終わる可能性も多少はあるが、そうした作業をやってないというのは、ま

                                              最終回:Apple Siliconがやってきた そのさらに先、「Apple ISA」への遠い道のり
                                            • 【レビュー】 学生でも買える! 超コスパスピーカー「Polk Audio」聴き比べ

                                                【レビュー】 学生でも買える! 超コスパスピーカー「Polk Audio」聴き比べ
                                              • ソウルとファンクの1974年:50年前の時代を定義した7つの作品

                                                ヒップホップやR&Bなどを専門に扱う雑誌『ブラック・ミュージック・リヴュー』改めウェブサイト『bmr』を経て、現在は音楽・映画・ドラマ評論/編集/トークイベント(最新情報はこちら)など幅広く活躍されている丸屋九兵衛さんの連載コラム「丸屋九兵衛は常に借りを返す」の第46回。 今回は、今から50年前となる1974年のチャートで話題となったソウルとファンクの名盤について。 <関連記事> ・【動画付】1974年に発売されたアルバム・ベスト68 ・【動画付】1984年に発売されたアルバム・ベスト64 ・【動画付】1994年に発売されたアルバム・ベスト69 ・ベスト・アルバム・ランキング記事一覧 1970年代は米ブラック・ミュージックが最も熱かったディケイドの一つ。というわけで今から50年前にあたる1974年のブラック・ミュージック界を見てみよう。 取り上げる7作品とは、ビルボードの「Hot Soul

                                                • 毎年恒例! はてなブロガーの「買ってよかった2022」まとめ - 週刊はてなブログ

                                                  この話題で季節を感じているあなた、さては相当なブログ好きですね はてなブログでは毎週「今週のお題」を出題しています。今回は、2022年12月2日から2022年12月9日にかけて募集した、今週のお題「買ってよかった2022」に寄せられたエントリーから、週刊はてなブログ編集部がおすすめしたい記事をピックアップして紹介します。はてなブログでは、2022年12月2日から2022年12月9日にかけて、今週のお題「買ってよかった2022」として皆さんの投稿を募集しました。 例年数多くのエントリーが投稿されるこちらのお題ですが、2022年も同様に熱の入ったエントリーが非常にたくさん投稿されました! 慌ただしい年末年始の中で毎年ひっそり楽しみにしていることといえば、自分の一年を振り返って「今年買ってよかったもの」エントリーを書くことと、誰かのエントリーを読むこと……という人は、きっと私だけじゃないはず!

                                                    毎年恒例! はてなブロガーの「買ってよかった2022」まとめ - 週刊はてなブログ
                                                  • 空のdiv要素について - uhyo/blog

                                                    昨日はこちらの記事に端を発する形で、空のdiv要素やspan要素は妥当なのかといった話題が見られました。 中身のない空の div 要素や空の span 要素は HTML 仕様として妥当なのか? - dskdこの記事は空のdiv要素やspan要素が妥当かどうかという疑問にHTML仕様の観点から考察を加える大変面白い記事です。記事の結論としては、“僕の結論としては「否」である。”としています。 しかし、いくらHTML仕様を読んだといっても、こういった議論には解釈が入りがちです(こちらの記事でも結論の前に“ここからは完全に僕の解釈として書く。”と明記されています)。 仕様なのに解釈を入れる必要があるのはどうなのと思いつつ、実はこの記事でこれから紹介するように、HTML仕様もなかなか曖昧に書かれており解釈が必要なのは仕方のないことです。 筆者はどちらかというと空のdivを肯定する考えを持っていたの

                                                      空のdiv要素について - uhyo/blog
                                                    • 無観客アイドルライブ配信の現場から|Makoto Kaga (Project92.com)

                                                      現在の厳しい社会情勢のなかで、無観客ライブ配信、すごく増えていますよね(メジャー系は無観客ライブであってもリスクを考慮し自粛されているようですが……)。 僕らも多くの仕事がなくなっている一方で、ありがたいことに無観客ライブ配信のお声かけいただくことが多く、この3月〜4月で無観客のものだけで7案件やらせていただき、まだいくつか実施に向けて進行中のものがあります(いつ中止に転ぶかビクビクしながら準備を進めています)。 僕自身も有料のもの含めていろんな配信を観ているのですが、品質がもうちょっとよければいいのに……という配信も多くて、せっかくステージ上のパフォーマンスがよくて、ファンやたまたま興味を持ってくれた人が時間をつくって観てくれても、充分に魅力が伝えらえないものになってしまっているなぁ、もったいないなぁ、ということもしばしばです。 こうした状況なので、お客さまを入れられなくなったライブハウ

                                                        無観客アイドルライブ配信の現場から|Makoto Kaga (Project92.com)
                                                      • 2019-nCoVについてのメモとリンク

                                                        リンク集目次 国内外の状況 政府機関・国際機関等 学術情報 疫学論文 分子生物学/ウイルス学論文 臨床論文 インフォデミック関係 ワクチン関係 変異株関係 時系列メモ目次 新型コロナウイルス(2020年1月6日,11日) インペリグループによる患者数推定(2020年1月18日) 患者数急増,西浦さんたちの論文(2020年1月20日,23日) WHOはPHEIC宣言せず(2020年1月23-24日) 絶対リスクと相対リスク(2020年1月26日) 研究ラッシュが起こるかも(2020年1月27日) なぜ新感染症でなく指定感染症なのか? なぜ厚労省令でなく閣議決定なのか?(2020年1月27日) コロナウイルスに対する個人防御(2020年1月27日) 国内ヒト=ヒト感染発生(2020年1月28日) フォローアップセンター設置,緊急避難等(2020年1月29日) PHEICの宣言(2020年1月3

                                                        • ブラウザ上で3Dキャラクターと会話できる「ChatVRM」をオープンソースで公開しました - pixiv inside

                                                          こんにちは、VRoid部のkeshigomuです。 普段は主にVRoid Hubのフロントエンドエンジニアとして、3Dキャラクターを表示するビューワーの開発に携わっています。また@pixiv/three-vrmという、Web上で3Dモデルを使ったコンテンツを開発するためのOSSライブラリの運用も行っています。 今回、ブラウザで簡単に3Dキャラクターと会話できる技術デモ「ChatVRM」とそのコードをオープンソースで公開しました。 「ChatVRM」は、テキスト・口頭で話しかけた言葉にキャラクターがフルボイスで回答してくれる「キャラクターと会話できる」デモです。WEBブラウザ上で動作でき、3Dキャラクターのインポート・切り替え、キャラクターに併せて声を調整することもできます。 (2023/07/10追記) 読み上げ音声の生成に使用していたKoeiro APIの提供終了に伴い、以前のデモとコー

                                                            ブラウザ上で3Dキャラクターと会話できる「ChatVRM」をオープンソースで公開しました - pixiv inside
                                                          • 無料でMP3変換・動画変換・動画から音声抽出・動画と音声を結合・複数動画を1本に結合・最大音量調節・動画の解像度変更・動画回転・音ずれ修正・動画カットができるFirefoxアドオン「Media Converter and Muxer - Audio Tools」

                                                            動画や音声ファイルを無料のツールだけで編集しようとすると、目的に応じてたくさんのツールをインストールしなければならない場合がありますが、Firefoxの拡張機能「Media Converter and Muxer - Audio Tools」をインストールすれば動画や音声ファイルのフォーマットや、解像度の変更、音ずれ修正、動画ファイルのカット編集など10種類の機能を無料で使うことができます。 Media Converter and Muxer - Audio Tools – ? Firefox (ja) 向け拡張機能を入手 https://addons.mozilla.org/ja/firefox/addon/media-conversion-tool/ 目次: ◆インストール手順 ◆MP3 Converter:MP3変換 ◆Custom Converter:動画の変換 ◆Audio Ex

                                                              無料でMP3変換・動画変換・動画から音声抽出・動画と音声を結合・複数動画を1本に結合・最大音量調節・動画の解像度変更・動画回転・音ずれ修正・動画カットができるFirefoxアドオン「Media Converter and Muxer - Audio Tools」
                                                            • writeout.ai

                                                              Transcribe and translate any audio file. Upload your audio file and get a transcript in seconds. Writeout.ai is a free online transcription service.

                                                                writeout.ai
                                                              • 無料で複数の大容量動画ファイルを無劣化・爆速で「LosslessCut」を使い結合する方法レビュー、Windows・macOS・Linux対応で低スペックPCでもOK

                                                                GoProなどのカメラで長いムービーを撮影すると、一定の時間やファイル容量ごとにムービーが細かく分割されることがあります。分割されたムービーをムービー編集アプリでつなぎ合わせて出力しようとするとエンコードに長い時間がかかってしまいますが、無料で公開されている「LosslessCut」を使えば無劣化かつ爆速で結合できるとのことなので、実際に使ってみました。 GitHub - mifi/lossless-cut: The swiss army knife of lossless video/audio editing https://github.com/mifi/lossless-cut ◆容量の大きなムービーは分割されがち 容量の大きなムービーファイルが分割される実例が以下。GoPro HERO12 Blackのバッテリー性能検証のために1時間12分46秒の4K・60fpsムービーを撮影し

                                                                  無料で複数の大容量動画ファイルを無劣化・爆速で「LosslessCut」を使い結合する方法レビュー、Windows・macOS・Linux対応で低スペックPCでもOK
                                                                • IEのサポートが終了した現在、古いCSSリセットからもう卒業! 最近のデバイス・ブラウザの仕様に適した新しいCSSリセット -EllyLoel/reset.css

                                                                  *{margin:0;padding:0;line-height:calc(0.25rem + 1em + 0.25rem)}*,::before,::after{box-sizing:border-box}*:where(:not(fieldset,progress,meter)){border-width:0;border-style:solid;background-origin:border-box;background-repeat:no-repeat}html{block-size:100%;-webkit-text-size-adjust:none}@media (prefers-reduced-motion:no-preference){html:focus-within{scroll-behavior:smooth}}body{-webkit-font-smoothing

                                                                    IEのサポートが終了した現在、古いCSSリセットからもう卒業! 最近のデバイス・ブラウザの仕様に適した新しいCSSリセット -EllyLoel/reset.css
                                                                  • 1600以上のAPIを適切に呼び出してAIに付き物の「幻覚」を大幅に減らす言語モデル「Gorilla」が公開される

                                                                    近年はChatGPTやBardなどの対話型AIが相次いでリリースされ、人間の質問や呼びかけに対して非常に高精度な回答ができることで注目を浴びていますが、これらの対話型AIは時に真実ではないことを真実かのように話す「ハルシネーション(幻覚)」を起こすことがあります。そこで、膨大な数のAPIから適切なものを呼び出し、幻覚を大幅に減らすことができる言語モデル「Gorilla」を、アメリカ・カリフォルニア大学バークレー校とMicrosoft Researchの研究チームが公開しました。 Gorilla: Large Language Model Connected with Massive APIs https://arxiv.org/abs/2305.15334 Gorilla https://gorilla.cs.berkeley.edu/ GitHub - ShishirPatil/gori

                                                                      1600以上のAPIを適切に呼び出してAIに付き物の「幻覚」を大幅に減らす言語モデル「Gorilla」が公開される
                                                                    • Web Speed Hackathon 2021 miniでほぼ満点を出しました

                                                                      gzip圧縮だとあまり圧縮できていなく、スライディングウィンドウが小さいせいかなと思ったのですが、実際に大きさがかなり違うみたいなので、それが原因としてありえそうです。 Gzip uses a fixed size, 32KB window, and Brotli can use any window size from 1KB to 16MB, in powers of 2 (minus 16 bytes). This means that the Brotli window can be up to 512 times larger window than the deflate window. Results of experimenting with Brotli for dynamic web content - The Cloudflare Blog AudioContextの

                                                                        Web Speed Hackathon 2021 miniでほぼ満点を出しました
                                                                      • Time on Unix

                                                                        Sections What is time Representing time Where do we usually find time on Unix System time, hardware time, internal timers Syncing time with external sources What depends on time Human perception of time What is time Time is relative Measuring time and standards Coordinating time Time zones DST Time, a word that is entangled in everything in our lives, something we’re intimately familiar with. Keep

                                                                          Time on Unix
                                                                        • 俺が考える最強の「麻雀点数申告練習アプリケーション」を作ってみる ~ Pythonによる麻雀点数計算問題の自動生成と音声による点数申告 ~ - エムスリーテックブログ

                                                                          こちらはエムスリー Advent Calendar 2023 1日目の記事です。 Overview エムスリーエンジニアリンググループ AI・機械学習チームでソフトウェアエンジニアをしている中村(po3rin) です。趣味は麻雀でフリー雀荘で毎年200半荘以上打ちます。好きな麻雀プロは園田賢さんです。 麻雀を始めるときに一番の障壁になるのは点数計算ではないでしょうか? 特に符計算が初心者の関門のようです。一方私のような初中級者でも突然のレアな点数申告にまごつくことがあります。 そこで、今回はその人に合った麻雀の点数計算問題(主に符計算が焦点となる問題)を生成して、自分で点数計算&点数申告の練習をする方法を探求したのでその紹介をします。麻雀用語が少しだけ登場するので、対象読者は麻雀を少しでもかじったことのあるエンジニアの方です。 Overview 麻雀の点数計算の難しさ 現状の点数計算の練習

                                                                            俺が考える最強の「麻雀点数申告練習アプリケーション」を作ってみる ~ Pythonによる麻雀点数計算問題の自動生成と音声による点数申告 ~ - エムスリーテックブログ
                                                                          • AmazonやPayPalの「2段階認証」を突破するための音声ボットがハッカーに販売されている

                                                                            多くのネットサービスでは、アカウントに新たなデバイスからログインがあったり通常とは違う操作が行われたりした際に安全にアカウントを保つためのセキュリティ機能として、ワンタイムパスワードをスマートフォンなどに送信して本人確認する2段階認証が実装されています。「2段階認証を設定してあるから自分のアカウントは安全だ」と思っている人も多いかもしれませんが、オンラインの地下マーケットでは「2段階認証を突破するためのボット」が拡大していると海外メディアのMotherboardが報じています。 The Booming Underground Market for Bots That Steal Your 2FA Codes https://www.vice.com/en/article/y3vz5k/booming-underground-market-bots-2fa-otp-paypal-amazon

                                                                              AmazonやPayPalの「2段階認証」を突破するための音声ボットがハッカーに販売されている
                                                                            • PC買い替え失敗!? Core i9-12900HがRyzen9 5900HXにやられた話【藤本健のDigital Audio Laboratory】

                                                                                PC買い替え失敗!? Core i9-12900HがRyzen9 5900HXにやられた話【藤本健のDigital Audio Laboratory】
                                                                              • 三人称視点ゲームでの「弓矢」にはかなり工夫が必要と開発者らが明かす。『The Last of Us Part II』や『ティアキン』における“射線ズレ”防止策 - AUTOMATON

                                                                                三人称視点のゲームでは、エイム時にプレイヤーキャラの表示位置が横にズレることが多い。『The Last of Us Part II』などさまざまなゲームにおいて、このズレによって「弓」を射る際に生じる違和感や遊びにくさをなくすための工夫がほどこされているという。 三人称視点のゲームの弓にまつわる工夫が明かされるきっかけになったのは、開発者のWalaberことTimothy FitzRandolph氏の投稿だ。同氏はゼリー状の車が主役の2Dアクション『JellyCar』シリーズを手がける人物。同氏は7月16日、『ゼルダの伝説 ティアーズ オブ ザ キングダム』におけるカメラ視点について独自に分析し、ツイートにて紹介した。同氏いわく、『ゼルダの伝説 ティアーズ オブ ザ キングダム』では弓でエイムする際に特徴的なカメラ視点が採用されているそうだ。 Did a quick TOTK camera

                                                                                  三人称視点ゲームでの「弓矢」にはかなり工夫が必要と開発者らが明かす。『The Last of Us Part II』や『ティアキン』における“射線ズレ”防止策 - AUTOMATON
                                                                                • Gemini - Google DeepMind

                                                                                  The Gemini ecosystem represents Google's most capable AI.Our Gemini models are built from the ground up for multimodality — reasoning seamlessly across text, images, audio, video, and code.Latest updates

                                                                                    Gemini - Google DeepMind