並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 906件

新着順 人気順

音声ファイルの検索結果1 - 40 件 / 906件

  • 2022年、特に感動した・気に入った フリーソフト

    指定した音声ファイルを、楽器ごとのパートに分解してくれるソフトです。 音声ファイルをドラッグ&ドロップで放り込むと、該当のファイルを ボーカル ベース ドラム その他(キーボード、ギター 等) ボーカル以外のインストゥルメンタル といった 5 つのファイルに分解してくれます。 処理を GPU(CUDA)で実行することもできます。

      2022年、特に感動した・気に入った フリーソフト
    • 「面倒なことはChatGPTにやらせよう」の全プロンプトを実行した配信のリンクを整理しました|カレーちゃん

      Youtubeで配信しながら全プロンプトを実行しましたので、各節へのリンクを整理しました。時間のところにYoutubeへのリンクになっています。 もしずれていたら、その時間まで移動して視聴ください。 はじめに (4:00) 1章 ChatGPTの基礎知識 (5:50) 2章 ChatGPTの基本的な使い方 (6:28) 3章 ChatGPT Plusのセットアップ (7:32) 4章 ファイルのアップロードとダウンロード (12:40)4.1 アップロード・ダウンロード (13:03) 4.2 扱うことができるファイル (16:02) 5章 繰り返し作業を一瞬で (16:55)5.1 文字列操作 (17:20) 5.2 正規表現でのパターンマッチ (25:36) →54ページの正規表現でできることの例の説明 (29:09) 5.3 ファイルの一括操作 (46:20) 5.4 QRコード作成

        「面倒なことはChatGPTにやらせよう」の全プロンプトを実行した配信のリンクを整理しました|カレーちゃん
      • またも捜査機関の証拠改ざん事例

        【1】 某MLで話題沸騰(かどうかは知らないが少なくとも関心を集めた)の、名古屋地判2022年10月5日である。国賠事案ではあるものの、要するに一方当事者がパトカーであるという単なる交通事故事案であった。 判タ2023年7月号(通巻1508号)掲載。 【2】 さて件名であるが、この事案では、本訴被告である愛知県側のパトカーが赤信号進入にあたり、サイレンを鳴らしていたかが争点の一つであった。サイレンを鳴らしていなければ緊急自動車扱いされないからである。 被疑者でもあった運転手警察官は、事故翌日の実況見分でサイレンを鳴らしていたと主張した。また、パトカーのドラレコには音声ファイルが無かったが、愛知県側は、監察官室配属の警察官にして被告側指定代理人でもあった人物名義の報告書で、「録音機能は使用していなかったので最初から音声ファイルは無い」と主張した。 ところが、裁判所がバイナリデータを確認してデ

          またも捜査機関の証拠改ざん事例
        • 【2020年】AWS全サービスまとめ | DevelopersIO

          このエントリは、2018年、2019年に公開したAWS全サービスまとめの2020年版です。これまではいくつかに分割して公開していましたが、1エントリにまとめてほしいという要望をもらっていたため、今年は1エントリに集約してみました。 こんにちは。サービスグループの武田です。 このエントリは、2018年、2019年に公開した AWS全サービスまとめの2020年版 です。これまではいくつかに分割して公開していましたが、1エントリにまとめてほしいという要望をもらっていたため、今年は1エントリに集約してみました。どちらがいいのか正直わからないので、フィードバックなどあれば参考にさせていただきます。 2020-01-08 リクエストがあったためAmazon Mechanical Turkを追加。 2018年まとめ 【2018年】AWS全サービスまとめ その1(コンピューティング、ストレージ、データベー

            【2020年】AWS全サービスまとめ | DevelopersIO
          • ChatGPT プラグイン機能一覧|しおぱん

            こんにちは。しおぱんです。ChatGPTのプラグインがあまりに多すぎて大変だったので、プラグイン機能一覧を作りました。 【お知らせ】 プラグインの増加速度が早すぎるため、記事作成が追いついておりません🙇 お急ぎの方はこの記事作成でも利用しております、こちらのプロンプトを使ってみてください🙌 【カテゴリ検索の方法】 ブラウザの検索バーに [カテゴリ名] を入力すると絞り込みできます🙆 Mac: Command + F / Windows: Ctrl + F 【カテゴリ一覧】 [エンタメ] [音楽・音声] [画像・動画] [学習] [学術] [語学] [プログラミング] [ビジネス] [マーケティング] [ファイナンス] [ニュース] [ツール] [リサーチ] [ウェブアクセス] [天気] [旅行] [レストラン] [ショッピング] [医療・健康] [不動産] [求人] [ユーティリティ

              ChatGPT プラグイン機能一覧|しおぱん
            • BTS抑え世界1位!札幌JKバンド曲がSNS拡散 - 音楽 : 日刊スポーツ

              札幌の女子高生2人組ニューテクノバンドLAUSBUB(ラウスバブ)が世界から注目を集めている。昨年12月末に公開した楽曲「Telefon」が1月中旬にSNSを通じて爆発的に拡散。ドイツの音楽プラットフォーム「SoundCloud」では世界的人気の韓国男性音楽グループBTSを抑え週間チャート1位に。コロナ禍の昨年3月に結成した新世代のテクノサウンドに注目だ。 ◇   ◇   ◇ グラミー賞候補のBTSを抑え世界1位になったのは女子高生のサウンドだった。岩井莉子、高橋芽以(ともに17)からなるテクノバンドLAUSBUBが音楽ファンから注目を集めている。岩井は「不思議な気持ち。まさかこんなに聞かれるようになるとは。とにかくびっくりしているけど、聞いてもらってありがたい」と驚きを隠せない。 アナログシンセサイザーやサンプリングを多用した楽曲「Telefon」が先月中旬にSNSで火が付くと、「Sou

                BTS抑え世界1位!札幌JKバンド曲がSNS拡散 - 音楽 : 日刊スポーツ
              • 文字起こしAI「Whisper」を誰でも簡単に使えるようにした超高精度文字起こしアプリ「writeout.ai」使い方まとめ、オープンソースでローカルでも動作OK

                会議の議事録やムービーの作成など、文字起こしが必要な場面は多くありますが、手動での文字起こしは非常に面倒です。また、OpenAI製文字起こしAI「Whisper」を用いて文字起こしする方法もありますが、初期設定が難しいという問題も存在します。Whisperをメチャクチャ使いやすくした無料文字起こしサービス「writeout.ai」なら、超簡単かつ短時間で高精度な文字起こしを実現できるとのことなので、実際に使ってみました。 writeout.ai – Transcribe and translate any audio file https://writeout.ai/ 上記のリンクからwriteout.aiにアクセスすると、以下のような画面が表示されます。文字起こしを行うには「Transcribes for free」をクリック。 すると、GitHubアカウントでのサインインを求められます

                  文字起こしAI「Whisper」を誰でも簡単に使えるようにした超高精度文字起こしアプリ「writeout.ai」使い方まとめ、オープンソースでローカルでも動作OK
                • この無駄にゲームして過ごした時間を勉強に充てたら中国語もペラペラになるんじゃね~の!と思ったので1年間やった - どぶろくソロリティ血風録

                  いつも心に谢谢您……(葱抓餅の袋より) なんとなく中国語をやってみるか、と思い立ったのが確か2021冬ぐらいなんだけど、独学で勉強を始めて概ね1年でHSK3級(体感だと中学英語ぐらいのレベル)に合格したのでその話を書きま~す。 最初に書いちゃうと、合格までにメインで使った教材は主にNHK中国語講座「まいにち中国語(2022年の”言いたいことから中国語”)」で基礎の基礎~文法を覚えて、HSK対策にSPRIX社のHSK単語トレーニングアプリで単語を補強した感じです。 NHKのテキスト6か月分 3,180円とアプリの1級~3級あわせた課金 1,610円。合計5,000円ぐらいなのでかなりお得に勉強できたと思う。 ちなみにどんぐらいできるようになったかというと、ワイの残念なお脳では1年ではペラペラにはならなかったものの、台湾旅行で簡単な注文のやりとりをしたり「オデ、コレ、ハンブンダケ、ホシイダケド

                    この無駄にゲームして過ごした時間を勉強に充てたら中国語もペラペラになるんじゃね~の!と思ったので1年間やった - どぶろくソロリティ血風録
                  • 退屈なことはPythonにやらせよう 第2版

                    一歩先行くハイパフォーマンスなビジネスパーソンからの圧倒的な支持を獲得し、自作RPA本の草分けとして大ヒットしたベストセラー書の改訂版。劇的な「業務効率化」「コスト削減」「生産性向上」を達成するには、単純な繰り返し作業の自動化は必須です。本書ではWordやExcel、PDF文書の一括処理、Webサイトからのダウンロード、メールやSMSの送受信、画像処理、GUI操作といった日常業務でよく直面する面倒で退屈な作業を、Pythonと豊富なモジュールを使って自動化します。今回の改訂では、GmailやGoogleスプレッドシートの操作、Pythonと各種モジュールの最新版への対応、演習等を増補しています。日本語版では、PyInstallerによるEXEファイルの作成方法を巻末付録として収録しました。 訳者まえがき まえがき 第I部 Pythonプログラミングの基礎 1章 Pythonの基本 1.1 

                      退屈なことはPythonにやらせよう 第2版
                    • AIボイチェン「RVC」の精度と学習・変換速度が革命的。コナンの蝶ネクタイ的リアルタイムボイチェンも可能(CloseBox) | テクノエッジ TechnoEdge

                      おいおいまたかよ、驚き屋かお前はと言われそうですが、またゲームチェンジャーなんですよ。ほんとすいません。全部AIが悪いんです。 AI関連はちょっと目を離すと取り残されてしまいます。後から来たのに追い越され、泣くのが嫌なら歩いていくしかないのです。今回、それが再びAI音声合成で起きました。 筆者はAIアートグランプリを受賞したおかげでいろいろなところから取材を受けたり自分でも解説記事を書いたりしていますが、その中で、Diffusion(拡散)モデルを使ったDiff-SVCというAI声質変換によってリアルな元音声を再現できると説明してきました。ですが、これからは「実は今は新しいAI技術を使っているんですよ」と付け加えなければいけません。 妻の歌声を合成するのに使っていたDiff-SVCから別の新しい技術に乗り換えてしまったのです。 Diff-SVCが出た後に、So-VITS-SVC(SoftV

                        AIボイチェン「RVC」の精度と学習・変換速度が革命的。コナンの蝶ネクタイ的リアルタイムボイチェンも可能(CloseBox) | テクノエッジ TechnoEdge
                      • 知らなかった! ウェブブラウザ「Chrome」のこんな便利な機能12選

                        知らなかった! ウェブブラウザ「Chrome」のこんな便利な機能12選2021.03.05 19:30125,895 David Nield - Gizmodo US [原文] ( そうこ ) Chromeスキルが上がったぞ! ウェブブラウザ何使っていますか? 私がメイン使いしているのはGoogle Chromeです。長いことずっーっとChromeです。それでも、まだまだ知らないことはたくさんあります。Googleも常に新機能アップデートしてますからね。あまり知られていないChromeの便利機能をまとめました! 1:ゲストモードへ切り替え「ちょっとパソコン貸して?」と言われた時に便利なのがこれ。自分が普段使いしているブックマークはもちろん、開きっぱなしのタブや、ログイン状態のページをもし見られたらと思うとハラハラします。別に何もやましいことないけど、なんかソワソワします。そういう時はゲスト

                          知らなかった! ウェブブラウザ「Chrome」のこんな便利な機能12選
                        • ぷよぷよプログラミング(学校向け)特設ページ – Monaca Education

                          1.はじめに 『ぷよぷよプログラミング 』 は 2020 年 6 月に無償提供を開始し、全国の小学校~大学、 e スポーツ団体や企業が主催するイベントで活用いただき、一般の方々を含め 10 万人以上のみなさまにご利用いただいております。 セガではゲーム事業やジャパン・e スポーツ・プロライセンス認定タイトル 『 ぷよぷよ 』 の e スポーツ展開を通じて培ったノウハウや資産を活用し、今回のカリキュラム提供のようにプログラミング教育に関する企画・運営をサポートしています。 2022 年度から高等学校において情報 が必修化され、ますますプログラミング教育が重要となる中、教育活動の一助となればと考え 『 ぷよぷよプログラミング 』 の開発・公開、教材作りを行いました。今後も先生方からご意見などを頂戴し、適宜修正・改編を進めてまいりますので、ぜひご活用いただき、所感などご教示いただければ幸いでござ

                          • JP Contents Hub

                            AWS 日本語ハンズオン Amazon Web Services(AWS) の 日本語ハンズオンやワークショップを、カテゴリごとにまとめています。 右側の目次や、ヘッダー部分の検索ボックスから、各コンテンツにたどり着けます。 また、Ctrl + F や command + F を使ったページ内検索もご活用いただけます。 料金について ハンズオンで作成した AWS リソースは通常の料金が発生します。作成したリソースの削除を忘れずにお願いします。 もし忘れてしまうと、想定外の料金が発生する可能性があります。 画面の差異について ハンズオンで紹介されている手順と、実際の操作方法に差異がある場合があります。 AWS は随時アップデートされており、タイミングによってはハンズオンコンテンツが追いついていない事もあります。 差異がある場合、AWS Document などを活用しながら進めて頂けますと幸い

                              JP Contents Hub
                            • AI・Python活用レシピ100選 - Qiita

                              ※ 一部ガイドラインに反する内容がありましたので、該当箇所を修正のうえ再投稿しております。 はじめに Axross は、エンジニアの"教育"と"実務"のギャップに着目し、「学んだが活用できない人を減らしたい」という想いで、ソフトバンク社内起業制度にて立ち上げたサービスです。 現役エンジニアによる実践ノウハウが"レシピ"として教材化されており、実際に動くものを作りながら、具体的な目的・テーマをもってプログラミングを学ぶことができます。 今回は、Axross運営が厳選した『AI・Python活用レシピを100選』をご紹介します。是非、みなさまのAIやPython学習の参考にしてみてください。 Axross:https://axross-recipe.com 公式Twitter:https://twitter.com/Axross_SBiv 基礎 スクレイピング 01 . JUMPの掲載順をスク

                                AI・Python活用レシピ100選 - Qiita
                              • 【2021年】AWS全サービスまとめ | DevelopersIO

                                こんにちは。サービスグループの武田です。このエントリは、2018年から公開しているAWS全サービスまとめの2021年版です。 こんにちは。サービスグループの武田です。 このエントリは、2018年から毎年公開している AWS全サービスまとめの2021年版 です。昨年までのものは次のリンクからたどってください。 AWSにはたくさんのサービスがありますが、「結局このサービスってなんなの?」という疑問を自分なりに理解するためにまとめました。 今回もマネジメントコンソールを開き、「サービス」の一覧をもとに一覧化しました。そのため、プレビュー版など一覧に載っていないサービスは含まれていません。また2020年にまとめたもののアップデート版ということで、新しくカテゴリに追加されたサービスには[New]、文章を更新したものには[Update]を付けました。ちなみにサービス数は 205個 です。 まとめるにあ

                                  【2021年】AWS全サービスまとめ | DevelopersIO
                                • 大きなGitリポジトリをクローンするときの工夫を図解します - DeNA Testing Blog

                                  こんにちは、SWETでCI/CDチームの前田( @mad_p )です。 SWETではCI/CDチームの一員として、Jenkins運用のサポートや、CI/CD回りのノウハウ蓄積・研究をしています。 はじめに Gitリポジトリをクローンすると、ローカルフォルダにはそのリポジトリの全体がダウンロードされ .git というフォルダに格納されます。ブランチをチェックアウトすると、ブランチ内のファイルがワーキングツリーとして展開されます。この様子を図にするとこのようになります。 この .git とワーキングツリーの使うディスク容量を節約しようというのが今回のお話です。特にJenkinsにおいて、大きめのGitリポジトリをクローンしてくる場合に課題があり、いろいろ工夫してみたので、その結果を紹介します。同じCI/CDチームの加瀬による記事「大規模リポジトリで高速にgit cloneするテクニック」と内容

                                    大きなGitリポジトリをクローンするときの工夫を図解します - DeNA Testing Blog
                                  • 「音源分離」の最新手法を解説した、中級者以上向けの実践的な技術書『Pythonで学ぶ音源分離』を8月24日に発売

                                    「音源分離」の最新手法を解説した、中級者以上向けの実践的な技術書『Pythonで学ぶ音源分離』を8月24日に発売 インプレスグループでIT関連メディア事業を展開する株式会社インプレス(本社:東京都千代田区、代表取締役社長:小川 亨)は、「音源分離」技術の基礎から実装までを解説した書籍『Pythonで学ぶ音源分離 機械学習実践シリーズ』を2020年8月24日(月)に発売いたします。 ■身近なものにも活用される技術「音源分離」の基礎と実装を解説する一冊 近年、AIスピーカをはじめとした、人が話した音声を理解する音声認識システムがさまざまな場面で使われています。一般的に音声認識システムは、1人の声を聞き取ることを想定しており、聞きたい声以外の音が入ってきたときには、聞きたい声を正確に聞き取ることが難しくなります。「音源分離」とはこのようにさまざまな音が混ざった中から、欲しい音だけを抽出する技術で

                                      「音源分離」の最新手法を解説した、中級者以上向けの実践的な技術書『Pythonで学ぶ音源分離』を8月24日に発売
                                    • ChatGPTのコア技術「GPT」をざっくり理解する - Qiita

                                      ※本記事はOracleの下記Meetup「Oracle Big Data Jam Session」で実施予定の内容です。 ※セミナー実施済の動画に関しては以下をご参照ください。 本記事の対象者 これから機械学習を利用した開発をしていきたい方 機械学習のトレンド技術を知りたい方 なるべく初歩的な内容から学習したい方 はじめに Transformerの登場以降、著しい技術革新が続くここ数年、特にOpenAI社のChatGPTのサービス開始以降、おびただしい数の技術ブログや記事がインターネット上に存在する中、本記事に目を留めていただいてありがとうございます。 この勉強会では、専門用語や難解な公式を極力排除し、初学者の方々を対象に、「そもそも自然言語の機械学習ってどういうもの?」、「言語モデルって要するに何?」というところからGPTをざっくり理解することを目的としています。従って、本記事に記載のあ

                                        ChatGPTのコア技術「GPT」をざっくり理解する - Qiita
                                      • ITエンジニアに刺さる「ポッドキャスト6選」

                                        はじめに 皆さんは「ポッドキャスト」を聞いていますか? ポッドキャストは個人でも配信できる音声メディアのことです。特定のサービスを指すわけではなく、音声ファイルをWebサーバーに置き、RSSフィードで更新情報を配信すればポッドキャストとして認識されます。ポッドキャストのアプリでは、そのRSSフィードのURLを登録すると随時更新された音声データを聴くことができる、という仕組みです。専用のアプリをインストールしておくと番組が更新された時点でプッシュ通知されるため、常に最新の音声データをチェックできます。 ポッドキャストという名前の通り、「iPod」時代の遺物といったイメージもあるかもしれません。しかし昨今、ポッドキャストが見直されているようです。大きな流れとしては、2018年に「Anchor」というポッドキャスト配信サービスが広まったことに起因すると思われます。録音から配信までを1つのサービス

                                          ITエンジニアに刺さる「ポッドキャスト6選」
                                        • Spotifyが無料で音声ファイルからMIDIへ変換できるAI搭載ツール「Basic Pitch」を公開

                                          Spotifyが無料で使えるオープンソースのAI搭載ツール「Basic Pitch」を公開しています。 Basic Pitchは、SpotifyのAudio Intelligence LabとSpotify傘下のSoundtrapが共同で開発したオーディオをMIDIに変換してくれるツール。ユーザーが楽器や声といったオーディオファイルをBasic Pitchのサイト上にアップロードすると、そのオーディオファイルをAIに搭載された機械学習モデルが分析。MIDIファイルとして書き出してくれます。 例えば、ユーザーがギターのメロディーフレーズの音源をBasic Pitchにアップロードすると、Basic Pitchは、その音源を分析し、アップロードされたギターのメロディーフレーズをMIDIに変換。ユーザーはそのMIDIファイルを自由にDAWに取り込み、シンセなど別の音源に割り当てて再生することがで

                                            Spotifyが無料で音声ファイルからMIDIへ変換できるAI搭載ツール「Basic Pitch」を公開
                                          • 「逆に何ができないんだ」 ゲーム「ウマ娘」を支える“サイゲ専用シナリオ制作アプリ”が多機能過ぎる

                                            Cygamesはオンラインイベントで、ウマ娘のシナリオ作成に使った社内アプリ「こえぼん」を紹介した。同社の“こんな機能が欲しい”という要望が詰まった同アプリは実に多機能で、視聴者からは「逆に何ができないんだ」「金は出すから売ってくれ」といった声が上がった。 Cygamesは11月13日、同社がゲーム制作などを進めるうえでの理念や技術について語る一般向けオンラインイベント「Cygames Tech Conference」の中で、ゲーム「ウマ娘 プリティーダービー」のシナリオ作成に使った社内アプリケーション「こえぼん」を紹介した。Cygamesの“こんな機能が欲しい”という要望が詰まった同アプリは実に多機能で、視聴者からは「逆に何ができないんだ」「金は出すから売ってくれ」といった声が上がった。 こえぼんは、シナリオの執筆から音声収録、ゲーム場面作りまでの工程で必要な機能をまとめたWebアプリ。

                                              「逆に何ができないんだ」 ゲーム「ウマ娘」を支える“サイゲ専用シナリオ制作アプリ”が多機能過ぎる
                                            • 音を操るWeb技術 - Web Audio API入門 - ICS MEDIA

                                              Webにおける表現はどんどん進化しています。Webサイトには当然のように動画が埋め込まれるようになり、CSSやSVG、canvasでのさまざまな表現が頻繁に見られるようになりました。さらにAR、VRといった表現も台頭し筆者も毎日ワクワクしながらインターネットの海を泳いでいます。 その中であまりメジャーではないと感じるのは「音」による表現です。もちろん音を用いた素晴らしいWebサイトはたくさんありますが、環境の制約が視覚表現以上に大きいため多くは見られないのでしょう。 とはいえ、音と視覚表現を組み合わせることによって表現できる世界観、インタラクション、その他諸々は計り知れないと筆者は思っています。今後オーディオなどの技術の進歩によって上記で述べた制約も乗り越えられるようになるかもしれません。時代を先どりしたい読者に向けて、今回の記事ではWebで音を扱う技術Web Audio APIについてお

                                                音を操るWeb技術 - Web Audio API入門 - ICS MEDIA
                                              • 日本サッカーは英国人にどう見える?…ショーン・キャロルはなぜJリーグを追い続けるのか【サッカー、ときどきごはん】

                                                日本サッカーは英国人にどう見える?…ショーン・キャロルはなぜJリーグを追い続けるのか【サッカー、ときどきごはん】 2023年02月07日 7時00分 カテゴリ: ★無料記事 • インタビュー • サッカー、ときどきごはん タグ : pickup • targmar • カマタマーレ讃岐 • ガンバ大阪 • 浦和レッズ もう何年も前からJリーグの試合で見かけるイングランド人がいる タイトルがかかったビッグマッチだけではない どうしてこの試合に来ているのか分からないような マニアックとも言える試合でも記者席にいる サッカーを見る視点も独特だ いろいろな意見に傾聴すべき点がある こよなく日本と日本サッカーを愛する ショーン・キャロルに日本サッカーとオススメの店を聞いた ■日本に着いてから、急に日本が好きになった 日本に初めて来たときは、日本って絶対に行きたい国というわけじゃなかったね。来たのはそ

                                                  日本サッカーは英国人にどう見える?…ショーン・キャロルはなぜJリーグを追い続けるのか【サッカー、ときどきごはん】
                                                • Advanced Data Analysis(旧ChatGPT Code Interpreter)の活用方法を片っ端から試していく

                                                  Advanced Data Analysis(旧ChatGPT Code Interpreter)の活用方法を片っ端から試していく ChatGPT Code Interpreterをとにかく触ってみる 「Code Interpreterが凄い!」と、みんなが騒いでいるのでとりあえずネットで目についた活用方法を片っ端から試していきたいと思います。 試したら追記していきます。 Code Interpreterのセットアップ 以下3ステップです。簡単ですね。よく分からなかったら別のサイトみてください。 ChatGPT Plusに課金 Setting Beta featuresでCode interpreterのトグルをオン ChatGPTのGPT4でCode Interpreterを選択 以下参考のスクリーンショットです。 Code Interpreterの活用例 ここから活用例を載せていきます

                                                    Advanced Data Analysis(旧ChatGPT Code Interpreter)の活用方法を片っ端から試していく
                                                  • ドイツ大使館『実は発祥の地ではあまり口にしない』『日本に来て初めて食べたという職員が多い』と語る、日本独自の進化を遂げた“バウムクーヘン”の話

                                                    リンク Wikipedia バウムクーヘン バウムクーヘン(ドイツ語: Baumkuchen、バウム(木)ドイツ語発音: [baʊm] ( 音声ファイル)+クーヘン(ケーキの意)ドイツ語発音: [kuːxən] ( 音声ファイル))は、中心にドーナツ状の穴があり断面に樹木の年輪のような同心円状の模様が浮き出たドイツのケーキである。 「バームクーヘン」と表記されることもあるが、「バウムクーヘン」と表記するほうがドイツ語の発音に近い。 年輪のような形状から日本では目出度い贈答品のひとつとして慶事の贈り物として好まれ、結婚式や祝い事の引き出物として使われ 19 users 74

                                                      ドイツ大使館『実は発祥の地ではあまり口にしない』『日本に来て初めて食べたという職員が多い』と語る、日本独自の進化を遂げた“バウムクーヘン”の話
                                                    • 吉祥寺米騒動のこと|田山たかし

                                                      2022年7月18日 (月) ご承知の通り、私はしばき隊の動向チェックが日課となっています。単なる趣味なので一円にもなりませんが、支出もないのでお財布に優しい趣味です。 大体誰かがアホな発言をしてるのでネタには困りません。稀に何のネタもない日もあります。この日も危うくスルーするところでした。 これがスルーしそうになったツイート。私は7/19の早朝に気づく黒川巌さんが噛み付いたツイートはこれ 当初は「また吊し上げのターゲットを見つけたのか」程度だと思っていました。しかし、しばき隊が飛びつくネタとしては正直ショボい。「ま、2〜3日で忘れて次のネタに移行するだろうな」という印象でした。 しかしよく見たら「○○の店じゃん!」と気づく。実はここの店主は私とかなり近い関係にある人物です。ちょっとした顔見知り程度ではありません。 「オイオイオイ」とリアルに驚きの声が出つつも「マジかよwwww」と笑いに変

                                                        吉祥寺米騒動のこと|田山たかし
                                                      • 自分の行動を毎日24時間録音してWhisperで文字起こしする「全自動口述日記」を1週間つけつづけたエンジニアの報告

                                                        AI研究団体のOpenAIが開発した「Whisper」は非常に高い精度で録音から文字起こしを行うAIモデルで、オープンソースで無料公開されています。エンジニアのロバー・ダム氏が自身のブログで、毎日スマートフォンに行動を逐一吹き込み、その録音をWhisperで文字起こしすることで「全自動口述日記」を残すことができるシステムを試した結果について報告しています。 I record myself on audio 24x7 and use an AI to process the information. Is this the future? https://roberdam.com/en/wisper.html ダム氏が全自動口述日記を思いついたのは、以前から「1TB超えのストレージを内蔵したスマートフォンが登場すれば、24時間365日録音し続けることが可能なのではないか」と考えていたことから

                                                          自分の行動を毎日24時間録音してWhisperで文字起こしする「全自動口述日記」を1週間つけつづけたエンジニアの報告
                                                        • 政府支給の安価なノートPCがアルゼンチンのヒップホップ文化を花開かせた

                                                          デジタル化が進む近年では子どもたちへのIT教育に注力する国や自治体が増えており、生徒にノートPCやタブレット端末を与える取り組みが進んでいます。こうした取り組みは子どもたちのIT知識を育むことが目的かもしれませんが、2010年代に「公立の小中学生へ安価なノートPC(ネットブック)を支給する」という取り組みを行ったアルゼンチンでは、ノートPCを手にした子どもたちによって「ヒップホップ文化」が花開いたとのことです。 In Argentina, cheap government-issued netbooks sparked a musical renaissance - Rest of World https://restofworld.org/2021/argentina-netbooks-music/ アルゼンチン政府は2011年に「Conectar Igualdad」というプログラムを開

                                                            政府支給の安価なノートPCがアルゼンチンのヒップホップ文化を花開かせた
                                                          • 歴史・年表でみるAWS全サービス一覧 -アナウンス日、General Availability(GA)、AWSサービス概要のまとめ- - NRIネットコムBlog

                                                            小西秀和です。 Amazon Web Services(AWS)に関する情報や魅力を様々な観点から記事にしてみていますが、技術史が好きなこともあって今回はAWSサービスの発表の歴史を年表でまとめました。 AWSからもWhat's Newとして公式アナウンスは発表されていますが、アナウンス日、GA日(一般提供開始日)、サービス名、サービス概要といった情報に圧縮して時系列でAWSサービス一覧を一枚もので確認できる記事が今まで欲しかったので自分で作成してみることにしました。 AWS全サービスの歴史年表の作成方法 AWS全サービスの歴史年表の対象となるAWSサービスは次の手順で選定しました。 AWSサービス・製品一覧「Cloud Products(英語版)」にあるサービスのうち「~ on AWS」といったサードパーティー製品がメインとなるサービスを除いたリストを作成 AWSサービス・製品一覧に記載

                                                              歴史・年表でみるAWS全サービス一覧 -アナウンス日、General Availability(GA)、AWSサービス概要のまとめ- - NRIネットコムBlog
                                                            • 【訃報】ZIP圧縮やPNG・PDFなどファイルフォーマットの基礎を作ったジェイコブ・ジヴが死去

                                                              データ圧縮フォーマットのひとつであるZIP(ZIP圧縮)や、電子文書フォーマットのPDF、音声ファイルフォーマットのMP3の基礎となったデータ圧縮アルゴリズムのLZ77やLZ78などを開発したイスラエルのコンピューターサイエンティストであるジェイコブ・ジヴ氏が亡くなりました。91歳でした。 Israeli computer pioneer passes away just weeks after famed research partner https://www.ynetnews.com/business/article/bj2k2g0x3 Ziv and Lempel co-invented the famous Lempel-Ziv algorithm that is the basis of ZIP files. Prof. Abraham Lempel died 7 weeks

                                                                【訃報】ZIP圧縮やPNG・PDFなどファイルフォーマットの基礎を作ったジェイコブ・ジヴが死去
                                                              • PCで再生中の音声をWhisperでリアルタイムに文字起こしする - TadaoYamaokaの開発日記

                                                                PCで再生中の音声をリアルタイムで文字起こしできると、字幕機能がない動画の再生や、外国とのオンライン会議で便利である。 先日、OpenAIが公開したWhisperは、音声ファイルから文字起こしするするツールが提供されているが、リアルタイムで処理するツールは提供されていない。 そこで、Pythonスクリプトで、リアルタイムで文字起こしするツールを作成した。 ループバック録音 SoundCardを使うと、PCで再生されている音声を録音することができる。 pip install SoundCardでインストールする。 import soundcard as sc with sc.get_microphone(id=str(sc.default_speaker().name), include_loopback=True).recorder(samplerate=SAMPLE_RATE, chan

                                                                  PCで再生中の音声をWhisperでリアルタイムに文字起こしする - TadaoYamaokaの開発日記
                                                                • 採譜に役立つオーディオ解析ソフトたち(Mac用): 左近治の囈(たはごと)

                                                                  採譜。音を拾い上げて楽譜にして行く為の作業の事ですが、通俗的な意味では「耳コピ」という作業も採譜を必要とはしない前段階の作業過程に包摂される物のひとつと言えるでしょう。 更に言えば《私に続いて歌いましょう》と言われて「模倣」するというのも聴音の直後での歌唱という事になりますが、単音の模倣は概して間違えにくいものの、自身の音楽的習熟力や癖によって、完全な模倣とはならずに手前勝手に音高やリズムを変応させて歌ってしまう人もおります。 変応してしまうという癖が多発する人は、採譜をするにも臆断を辷り込ませてしまう可能性が高く、採譜という作業に於ける忠実度や完成度は低くなってしまう事でしょう。こうした変応が起きてしまうのは各人の音楽的素養の度合いに左右されるのは勿論ですが、変応と類推の双方が強化されてしまうと、自身の持つ癖がオリジナルのそれを大きく変化させてしまう事となるので注意すべき側面であろうと思

                                                                    採譜に役立つオーディオ解析ソフトたち(Mac用): 左近治の囈(たはごと)
                                                                  • GitHub、YouTube動画をダウンロードする「youtube-dl」プロジェクトを削除

                                                                    GitHubは米国時間10月23日、米レコード協会(RIAA)から法律に基づく要請を受け、18件のプロジェクトを削除した。 この日に削除されたコードリポジトリはすべて、「youtube-dl」プロジェクトに関連するものだ。 youtube-dlはPythonで書かれたライブラリーで、開発者はこれを利用して、YouTube動画で使われているソースの音声ファイルや映像ファイルをダウンロードできる。 RIAAは、GitHubに送付した書簡の中で、「このソースコード(youtube-dlライブラリー)の明確な目的は、(i)YouTubeなどの許可されたストリーミングサービスで用いられている技術的保護措置を回避し、(ii)許可なく(中略)ミュージックビデオや録音された音声を複製して配布」することだと主張している。 RIAAは同プロジェクトのソースコードについて、「著作権で保護された以下の作品の複製や

                                                                      GitHub、YouTube動画をダウンロードする「youtube-dl」プロジェクトを削除
                                                                    • 【2022年】AWS全サービスまとめ | DevelopersIO

                                                                      こんにちは。サービスグループの武田です。このエントリは、2018年から公開しているAWS全サービスまとめの2022年版です。 こんにちは。サービスグループの武田です。 このエントリは、2018年から毎年公開している AWS全サービスまとめの2022年版 です。昨年までのものは次のリンクからたどってください。 AWSにはたくさんのサービスがありますが、「結局このサービスってなんなの?」という疑問を自分なりに理解するためにまとめました。 今回もマネジメントコンソールを開き、「サービス」の一覧をもとに一覧化しました。そのため、プレビュー版など一覧に載っていないサービスは含まれていません。また2021年にまとめたもののアップデート版ということで、新しくカテゴリに追加されたサービスには[New]、文章を更新したものには[Update]を付けました。ちなみにサービス数は 223個 です。 まとめるにあ

                                                                        【2022年】AWS全サービスまとめ | DevelopersIO
                                                                      • ChatGPT×Whisperで履歴書と職務経歴書づくりを効率化 開発してみてわかった、生成AIの活かし方

                                                                        大規模言語モデル(LLM)を、実際にプロダクトや実務に役立つかたちで利用している各社が見た使いどころや、実践の上での工夫について学び合うためのイベント「ChatGPT IN ACTION 実践で使う大規模言語モデル」。株式会社ROXXからは、CTOの松本宏太氏が登壇。「ChatGPT×Whisper」で作ったプロトタイプを紹介しました。 ROXX社・CTO松本宏太氏 松本宏太氏:弊社は「ChatGPT×Whisper」でいろいろプロトタイプを作っているので、その中の事例を1つ紹介して、そこで学んだ内容をもとに、今後の展望をお話できればなと思っています。 (スライドを示して)今日は、こういう感じで話していこうかなと思っています。まず、自己紹介をさせていただきます。 あらためて、株式会社ROXXでCTOをやっている松本と申します。「kotamat」という名前でいろいろやっているのですが、もとも

                                                                          ChatGPT×Whisperで履歴書と職務経歴書づくりを効率化 開発してみてわかった、生成AIの活かし方
                                                                        • 高校時代、軽い気持ちで映画『ダンサー・イン・ザ・ダーク』見てみたら大変なことになった「さもありなん」

                                                                          リンク Wikipedia ダンサー・イン・ザ・ダーク 『ダンサー・イン・ザ・ダーク』(原題:Dancer in the Dark)は、ラース・フォン・トリアー監督、ビョーク主演の、2000年製作のミュージカル映画。『奇跡の海』と『イディオッツ』に次ぐ「黄金の心」3部作の3作目とされる。アイスランドの人気女性歌手ビョークを主役に据え、手持ち撮影主体のカメラワークやジャンプカットの多用によるスピーディーな画面展開、不遇な主人公の空想のシーンを明るい色調のミュージカル仕立てにした新奇な構成の作品である。 舞台はアメリカのある町。チェコからの移民セルマは、息子ジーン 30 users 93 リンク Wikipedia ビョーク ビョーク・グズムンズドッティル (Björk Guðmundsdóttir [ˈpjœr̥k ˈkvʏðmʏntsˌtoʊhtɪr] ( 音声ファイル))、1965年11

                                                                            高校時代、軽い気持ちで映画『ダンサー・イン・ザ・ダーク』見てみたら大変なことになった「さもありなん」
                                                                          • ChatGPT APIとWhisper APIで議事録文字起こしアプリを作り、Hugging Face Spacesで公開する | gihyo.jp

                                                                            ChatGPT APIの使い方 実際にChatGPT APIを使ってみましょう。 openai-pythonのインストール 今回はOpenAIのPython用ライブラリであるopenai-pythonを使います。pipを用いて、openai-pythonをインストールしましょう。 pip install openai APIリクエスト ChatCompletion.createで対話を生成できます。たとえば、以下のようなコードになります。 import openai openai.api_key = "sk-..." # APIキー completion = openai.ChatCompletion.create( model="gpt-3.5-turbo", messages=[{"role": "user", "content": "こんにちは!"}] ) print(complet

                                                                              ChatGPT APIとWhisper APIで議事録文字起こしアプリを作り、Hugging Face Spacesで公開する | gihyo.jp
                                                                            • 荷ほどきゲーム『Unpacking アンパッキング』の「音」のこだわりがすごい。1万4000種類ものサウンドを収録し、各アイテムの音を表現 - AUTOMATON

                                                                              パブリッシャーのHumble Gamesは11月2日、Witch Beamが手がけたパズルゲーム『Unpacking アンパッキング』を配信した。対応プラットフォームはPC/Nintendo Switch/Xbox One。 本作は、新居での荷ほどきをテーマにした作品だ。段ボール箱からアイテムを次々に取り出し、自室やリビング、キッチン、浴室などに配置していく。オモチャや文具、調理用品や家電、その他生活用品などが多数登場し、それらは自由に配置可能である。小規模な作品ながら、精緻なドット絵で表現されたアイテムからは、並々ならぬこだわりが見て取れる。ただ、本作のこだわりはそれだけではなく、「音」にもあるようだ。 『Everybody’s Gone to the Rapture -幸福な消失-』などで知られるデベロッパーThe Chinese RoomのシニアサウンドデザイナーFrancesco

                                                                                荷ほどきゲーム『Unpacking アンパッキング』の「音」のこだわりがすごい。1万4000種類ものサウンドを収録し、各アイテムの音を表現 - AUTOMATON
                                                                              • 自動文字起こしサービスである、OpenAIの「Whisper API」とAWSの「Amazon Transcribe」の精度を比較してみた | DevelopersIO

                                                                                自動文字起こしサービスである、OpenAIの「Whisper API」とAWSの「Amazon Transcribe」の精度を比較してみた はじめに 今回は、OpenAIのWhisper APIとAmazon Transcribeという2つの音声文字起こしサービスを試し、それぞれの精度を比較してみました。 Amazon Transcribeは、音声をテキストに変換する自動音声認識サービスです。 ストリーミングとバッチ処理のどちらでも文字起こしが可能です。 攻撃的な言葉を指定すると、Amazon Transcribeがそれらの言葉を文字起こしから自動的に削除する語彙フィルタリングなどの機能もあります。 Amazon Transcribeの詳細は、下記の記事をご参考ください。 OpenAIには音声をテキストに変換する「Whisper」という音声認識モデルがあり、WhisperをAPIの形で呼び

                                                                                  自動文字起こしサービスである、OpenAIの「Whisper API」とAWSの「Amazon Transcribe」の精度を比較してみた | DevelopersIO
                                                                                • 好きな人の声で歌える、破壊的でヤバい「Diff-SVC」はAI歌声合成を民主化するのか(CloseBox) | テクノエッジ TechnoEdge

                                                                                  それを、完全とは言えないまでも、かなり元の人に肉薄する品質で再現できる技術がDiff-SVCです。元になる音声データが1時間くらいあれば、与えた音声を、希望する声質に変換することが可能になるのです。 しかも、基本的にお金はかかりません。AI歌声合成が、ちょっとハードルは高いものの、無料で使えて、データさえ集めてくれば誰でも手が出せる。AI歌声合成の民主化と言っていいでしょう。 筆者は10年近く前に旅立った妻の歌声を、UTAU-Synthという、短く切り出した音素をピッチや長さを合わせながら組み合わせていくソフトウェアで再構成しています。1フレーズずつ音素を繋いで、できるだけ不自然にならないように調整していくため、短くて数日、長いと数カ月も時間をかけて完成させていきますが、もうその作業をしなくてもよくなります。 ただ、自分で歌って、もしくは他のボーカルシンセソフトでボーカルトラックをDiff

                                                                                    好きな人の声で歌える、破壊的でヤバい「Diff-SVC」はAI歌声合成を民主化するのか(CloseBox) | テクノエッジ TechnoEdge