並び順

ブックマーク数

期間指定

  • から
  • まで

201 - 240 件 / 2584件

新着順 人気順

文字起こし googleの検索結果201 - 240 件 / 2584件

  • 【 日本語 対応】 Amazon Transcribe で 文字起こし を早速試してみた

    薬機法・景品表示法・医療法 専門コピーライター・コンサルタントの江良公宏です。 ライターのシゴトにはインタビューがありますし、ランディングページ・チラシなどの制作においても打ち合わせをして詳細を詰めていく場面が多々あります。 打ち合わせであればその場でパソコン・ノートにメモをしていくことも可能ですが、インタビューとなるとなかなかそうもいかないケースがあります。 そういった場合、動画・音声から文字起こしをするのですが・・・ これが私にとってはとーーーーーっても苦痛なわけです・・・。 今回、機械学習で文字起こしをする『Amazon Transcribe』が日本語に対応したということなので早速試してみました。 現在は『Googleドキュメント』+『音声入力』 Amazon Transcribeの説明に入る前に、現在はどうしているのかというと『Googleドキュメント』+『音声入力』を使っています

      【 日本語 対応】 Amazon Transcribe で 文字起こし を早速試してみた
    • 【AI&システム開発系】おすすめAdventCalendarと記事まとめ(19年12月後半編) - Qiita

      前記事「【AI&システム開発系】おすすめAdventCalendarと記事まとめ(19年12月前半編)」の続編です。 12月後半の Advent Calendarから 本記事では、 ・私が読んでいるAdventCalendar ・12月15日から31日に投稿された、個人的におすすめの記事 を紹介します。 私のなかで、一番凄いと思った記事は うちのおかんがやってた開発手法があるらしいんですよ(※オマージュです) です。 それでは以下。 機械学習入門系 カレンダー 機械学習をどう学んだか by 日経 xTECH 機械学習ツールを掘り下げる おすすめ記事 文系学生が機械学習を学んだ半年間の軌跡 機械学習の勉強をはじめるきっかけ、実施した勉強方法、そして実際に「コーヒー豆の欠点豆の検出システム構築」までの流れが丁寧に紹介されていてます。 この記事の方のような、「何かを作りたい!」というアウトプット

        【AI&システム開発系】おすすめAdventCalendarと記事まとめ(19年12月後半編) - Qiita
      • 【WhisperSpeech】Whisperがさらに高性能になった音声モデルを使ってエミネムにゆっくり喋らせてみた | WEEL

        WEELメディア事業部LLMリサーチャーの中田です。 1月18日、Whisperを利用したText-to-Speechモデル「WhisperSpeech」のアップデート版を、Collaboraが公開しました。 このAIモデルを用いることで、テキストを入力するだけで、簡単にそのテキストを(AIが)読み上げることができるんです、、、! 参考:https://github.com/collabora/WhisperSpeech GitHubでのスター数は、すでに1700を超えており、期待度が高いことを示しています。 この記事ではWhisperSpeechの使い方や、有効性の検証まで行います。本記事を熟読することで、WhisperSpeechの凄さを実感し、そこら辺のTTSには戻れなくなるでしょう。 ぜひ、最後までご覧ください。 WhisperSpeechの概要 WhisperSpeechはCol

        • オープンソースAI(Whisper、BERT、VOICEVOX)を用いた音声対話ロボットの作成 - Qiita

          はじめに どうもこんにちは。ヤフー株式会社のkunishouです。気づけば2022年も残り3週間、皆様いかがお過ごしでしょうか? 今年の機械学習のトレンドと言えば、海外のAI企業から次々とオープンソースのAIが発表されたことが非常に印象的でした。画像生成分野ではStability AI社の「Stable Diffusion」、音声認識分野ではOpenAI社の「Whisper」などが発表されました。発表されたこれらのAIは非常に高機能であるにも関わらず、オープンソースのAIとして、自由に利用することができます。 今回、 クリスマスも近いということなのでこれらの高機能なAIを活用して何か面白い物を作ることはできないか と考え、物理的に言葉を投げかけると返事が返ってくるような音声対話ロボットを作ってみることにしました( クリスマスにしゃべる相手がいないからというわけでは決してありません )。 目

            オープンソースAI(Whisper、BERT、VOICEVOX)を用いた音声対話ロボットの作成 - Qiita
          • ページスピードをGoogleはどのようにしてランキング要因に組み込んだのか?

            [レベル: 中級] Google 検索チームの社員が検索に関するトピックをポッドキャストで配信する Search Off the Record の新しいエピソードが公開されました。 語り手として出演するのはいつもの 3 人です。 John Mueller(ジョン・ミューラー) Gary Illyes(ゲイリー・イリェーシュ) Martin Splitt(マーティン・スプリット) 3 人が今回テーマにしたトピックは、ランキング要因としてのページスピードです。 言い換えると、ページ エクスペリエンス シグナル/コア ウェブ バイタルの 1 つの要素でもあるページ表示の速さをランキング要因に組み込むことにした過程を語っています。 ページスピードの重み付けをどうするか? ページスピードをランキング要因に組み込む際に考慮する必要がったのは、その重み付けです。 つまり、どのくらい強い要因にするかです。

              ページスピードをGoogleはどのようにしてランキング要因に組み込んだのか?
            • iPhone 14の新機能のうちすでにAndroidには実装済みの機能一覧

              2022年度のApple最新機種「iPhone 14」シリーズの発表に合わせ、Appleは新しいOSである「iOS 16」のリリースを告知しています。iOS 16で新たに実装される機能のうち、すでにAndroid OSには実装済みの機能の一部を、IT系ニュースサイトのThe Vergeがまとめています。 Brand new iPhone features that Android already has - The Verge https://www.theverge.com/23319739/apple-iphone-ios-16-android-features-google-apps-comparison ◆「マップ」で経由地を追加する 出発地と目的地のほかに、寄り道したい「経由地」を設定する機能がようやくiOS 16で搭載されます。この機能のおかげでより複雑なルート検索が可能になり

                iPhone 14の新機能のうちすでにAndroidには実装済みの機能一覧
              • WEB+DB PRESS 22.9周年パーティ #wdpress_party 運営なにやったのか全部紹介 - 941::blog

                こんにちは!普段は仕事で技術系のイベントをやったり、個人の趣味の集まりでもイベントをやっています。少人数な飲み会から2000人が参加するイベントまで、世間では幹事・運営・オーガナイザーなど色々な呼び方をされる、要は「全体をまとめてグイグイ進める人」の役割をしています。 先日、WEB+DB PRESS 22.9周年パーティ #wdpress_party の様子を写真で振り返る完全版レポート というのを書いたんですが「あのイベントの運営とってもよかったよ」と色々な方に言ってもらえたので、運営で何をどうやったのか紹介してみようというのがこのエントリの主旨です。 「イベントの運営ってそんなかんじでやんのね」というのを感じてもらえたらよいし、コミュニティのイベントをもし運営する側になったときに参考にしてもらえるといいかもしれません。「すげー大変だったよ!」というよりは「すげー楽しかったよ!」なニュア

                  WEB+DB PRESS 22.9周年パーティ #wdpress_party 運営なにやったのか全部紹介 - 941::blog
                • Google謹製スマホ「Pixel」シリーズの最新モデル「Pixel 4」が発表

                  Googleの新製品発表会であるMade by Google ‘19の中で、Pixelシリーズの最新モデルとなる「Pixel 4」が発表されました。 A phone made the Google Way | Introducing Google Pixel 4 - YouTube 登壇したのはGoogleの製品ディレクター、サブリナ・エリス氏。 発表されたのはPixelシリーズの最新モデル「Pixel 4」。 本体カラーはホワイト・ブラック・オレンジの3色。 Pixel 4のデザインやカラーがよくわかるムービーも公開されています。 Google’s Most Helpful Phone | Pixel 4 - YouTube Googleが開発するレーダー技術を利用したモーションセンサーである「Soli」が、ディスプレイ上部に搭載されています。 これにより、モーションセンス(動体認識)や

                    Google謹製スマホ「Pixel」シリーズの最新モデル「Pixel 4」が発表
                  • OpenAIの音声認識Whisperがすごいので,Google Colabで試してみた - Qiita

                    はじめに 2022/09/22にOpenAIが音声認識モデルWhisperを発表しました.Whisperは人間レベルのロバスト性と音声認識の精度を持ったニューラルネットワークであり,オープンソース化されているので誰でも利用可能です! [参考文献] 公式サイト:https://openai.com/blog/whisper 論文   :https://cdn.openai.com/papers/whisper.pdf Github  :https://github.com/openai/whisper Whisperの概要 Whisperは68万時間分の大規模なデータセットで学習された自動音声認識モデルであり,アクセントやバックグラウンドノイズ,および専門用語に対する堅牢性が向上しています.アーキテクチャは,encoder/decoder Transformerとして実装されており,30秒ご

                      OpenAIの音声認識Whisperがすごいので,Google Colabで試してみた - Qiita
                    • 命の値段、医療経済学からパンデミックを見る - HPO機密日誌

                      「パンデミック・シミュレーション」という本を拝読した。国立感染症研究所の研究者の方が書かれたと認識している。当初、数理シミュレーションを期待して読み始めたが、医療経済学に関する見解が興味深く、今回なぜ議論されないのか不思議に感じた。 パンデミック・シミュレーション―感染症数理モデルの応用― (tanQブックス) 作者:大日 康史,菅原 民枝技術評論社Amazon 著者のお二人。前書きによるとお二人は09年の新型インフルエンザの時は最前線で「戦って」いらしたと。今回の新型コロナウィルスで国立感染症研究所の名前が出てこないのはなぜなのだろうと想っている。ゲノム情報を持っていると考えられている国立感染症研究所が感染状況の把握、推測をした方がはるかに正確な将来像が描けると思うのだが不思議でならない。*1 nrid.nii.ac.jp nrid.nii.ac.jp 新型インフルエンザの日本上陸前まで

                        命の値段、医療経済学からパンデミックを見る - HPO機密日誌
                      • 音声認識を使ってAdobe Premiere Proの動画テロップを光速で作成する方法 - ICS MEDIA

                        動画を作るときに、テロップや字幕をつけることがあると思います。音声に視覚情報を加えることで情報の伝達力を強くしたり緩急をつけたり、また電車の中や音が出せない場所での視聴や、難聴の方への配慮にもなります。 しかし、音声を聞いてテキスト入力を何度も繰り返して・・・とても時間がかかりますし、楽しい作業でもありません。そこで今回は、音声の文字起こしソフトを使って、さくっとテロップや字幕作成の方法を紹介します。 こちらが作成する動画イメージです。この手法はFinal Cut Proでも適用できますが、今回はAdobe Premiere Pro向けに説明します。 Vrewを使って文字起こし Vrewは人工知能を活用した動画編集プログラムです。一般的なタイムラインを用いた動画編集とは異なり、文字起こしされた音声を元に、文章を編集するように動画を作成できるのが特徴です。ユーザー登録をすれば無料で利用でき、

                          音声認識を使ってAdobe Premiere Proの動画テロップを光速で作成する方法 - ICS MEDIA
                        • 竹鼻別院@岐阜県羽島市と市民の森公園の藤棚のフジが満開だった - 🍉しいたげられたしいたけ

                          実家でとっている中日新聞の地方版に、竹鼻別院のフジが満開だという記事が載ったそうだ。伝聞形なのは私自身は実物を見ていないから。4月20日付とのこと。間違っているかも知れない。 竹鼻別院というのは真宗大谷派の寺院で、実家のある市内ではたぶん一番大きなお寺である。 たしかフジ満開の時季はGW期間中かそこらで、「ふじまつり」というのがそのあたりに設定されていたんじゃなかったっけ? いくらなんでも早すぎないかと不安になった。 自ブログ過去記事を検索したら、4年前の5月5日付拙記事に「葉桜ならぬ葉フジとなっていた」と書いていた。 www.watto.nagoya 市の観光協会HPには、見ごろは4月の中頃からのようなことが書いてあったから、格段に早すぎるということはなかったかも知れない。だが今年はいろんな花の開花に限らず、季節の推移が早いような気がする。 hashimakanko.jp そゆえば20日

                            竹鼻別院@岐阜県羽島市と市民の森公園の藤棚のフジが満開だった - 🍉しいたげられたしいたけ
                          • 2020/05 W3C 活動概要 (日本語版)

                            このレポートは、2020/05に行われたW3C 諮問委員会総会 (W3C 会員限定ページ) 向けに用意されました。 同時に公開された2020/05 W3C 現状 (翻訳はありません) も参照ください。前回のバージョンは2019/09 版活動概要 (英語版)になります。 このレポートの更新版は最新版をご参照ください。 (訳注: 一般向けに原版にはない説明のリンクや追記を入れている部分があります。) オリジナルの英語版に加え、簡体字中国語翻訳も低提供されています。 概要 このレポートはすでにウェブで実現されている領域についての拡張や、 ウェブ技術の拡張・強化のための技術革新に関する最近の活動の概要です。 インターネットについてのコア技術の上に構築されたウェブが、科学的な協働や発見を加速しつづける、家族・友人をつなぐ場になる、オンラインで学習し技術を高める手段になる、活発なビジネスを行う、などの

                            • UXリサーチでAIが使えるか検証してみた

                              AI はリサーチに使える?ここ数年、インタビューをはじめとした定性調査のデータベース化やインサイトの整理の支援をしています。データベースはプロジェクト単位では見え難い、横断的な傾向が見える場合があるものの、運用コストがかかります。 短期的なメリットが見え難いだけでなく、運用負荷がかかるので片手間では続きません。インタビューのように文字起こしや要点をまとめるなど時間がかかる作業が多いのも長続きしない理由です。 こうした課題を解決するための自動化をいろいろ試していますが、昨年から AI(人工知能)をリサーチ分析に使えないか検証を始めています。例えば Google の Cloud Natural Language でテキストマイニングをし、ユーザーが使っている言葉の頻度を視覚化できないか試していました。ユーザーフィードバックをマイニングするだけでも、どの機能への要望があるのか見えて興味深い結果に

                                UXリサーチでAIが使えるか検証してみた
                              • CGへの扉 Vol.17:描画を進化させるTensorFlow Graphicsの真価 | モリカトロンAIラボ

                                そもそも画像認識の元となる学習データは正しいのか?先日オンラインで開催された「画像の認識・理解シンポジウム MIRU2020」で発表されたセッション「大規模画像データセットが含む“疑わしい画像”の専門家のワークショップを通した収集と分析」が大変話題になりました。 MIRU 2020 プログラム一覧 これは人工知能を活用した画像解析の学習データとして一般的に使われている ImageNet という巨大データセットの正確性を疑うものです。近年「Are we done with ImageNet?」という2020年の論文から ImageNet の正確性への疑問が注目されました。 論文「Are we done with ImageNet?」は 、2009年頃から画像認識の大規模データセットとして使われてきた ImageNet の正確性、評価に疑いをもって調べ、またその正当性をあげるための提言を述べた

                                  CGへの扉 Vol.17:描画を進化させるTensorFlow Graphicsの真価 | モリカトロンAIラボ
                                • ChatGPTでどんなリモート会議でもクリアに録音&自動テキスト化で文字起こし&要約作成できる「HiDock H1」を最大6人の会話で使ってみたレビュー

                                  ChatGPTと連携した会話の録音・自動文字起こし・要約が可能な11in1オーディオドック「HiDock H1」は、クラウドファンディングでの目標金額50万円に対して記事作成時点で4270万円もの応援購入が殺到している大注目プロジェクトです。HDMIやUSB Type-Cなど合計11個のポートが搭載されたボディに、10m離れても通話できるワイヤレスイヤホンやノイズキャンセリング、そして面倒な議事録作成を丸投げできるAI機能がてんこ盛りになったドッキングステーションを実際に使い倒して、生産性を爆上げしてみました。 ChatGPT連携AI要約作成+11in1オーディオドック|HiDock H1|マクアケ - アタラシイものや体験の応援購入サービス https://www.makuake.com/project/hidock_h1/ ・目次 ◆1:HiDock H1の内容物はこんな感じ ◆2:H

                                    ChatGPTでどんなリモート会議でもクリアに録音&自動テキスト化で文字起こし&要約作成できる「HiDock H1」を最大6人の会話で使ってみたレビュー
                                  • Pixelに「代わりに待ってて」機能 電話保留中、Googleアシスタントが待機

                                    Googleは3月14日、スマートフォン「Pixel」シリーズのアップデート「Feature Drop」として、電話保留中に、ユーザーに代わってGoogleアシスタントが待ってくれる「代わりに待ってて」機能などを発表した。 Pixel 4aから、最新のPixel 7シリーズまで対応。今後数週間をかけて、順次利用できるようになる。 「代わりに待ってて」機能は、店舗などに電話をかけ、保留になって長い時間待つ必要がある時、Googleアシスタントが代わりに待機する機能。保留が解除されて相手先の担当者が出ると、音、振動、画面上のプロンプトで通知する。利用には設定が必要。 Pixel 7/7 Pro向けの夜景モードは高速化。Tensorチップの新しいアルゴリズムにより、Pixel 6/6 Proでも、低光量の写真をさらに短時間で撮影できるようになったという。 写真に写り込んだ不要なものを消去できる「

                                      Pixelに「代わりに待ってて」機能 電話保留中、Googleアシスタントが待機
                                    • Googleが「相手の話す言葉を字幕化&自動翻訳してくれるスマートグラス」の存在を明らかに

                                      Googleの最新技術や新製品、新サービスが発表されるデベロッパー向けイベント「Google I/O 2022」が2022年5月11日・12日の2日間にわけて行われました。その中で、拡張現実(AR)を体験できるメガネ型デバイスの存在が明らかとなりました。 Augmented reality can break down communication barriers – and help us better understand each other by making language visible. Watch what happens when we bring technologies like transcription and translation to your line of sight. #GoogleIO ↓ pic.twitter.com/ZLhd4BWPGh— G

                                        Googleが「相手の話す言葉を字幕化&自動翻訳してくれるスマートグラス」の存在を明らかに
                                      • いま音声配信(ポッドキャスト/ラジオ)をはじめる方法|narumi

                                        こんにちは。narumiと申します。じつは2015年半ばくらいから「ドングリFM」というポッドキャスト番組をやっています。 Apple PodcastやSpotifyなどいろんなところで聴けますのでぜひ。 さて最近、聴いてくれてる友人・知人から、「あれ、どうやってやるの?」とよく質問されるようになったので、「2023年に音声配信をはじめるならどんな方法があるのか」「どうやればいいのか」「何を揃えればいいのか」をまとめておこうと思います。 大きく分けると「ポッドキャスト」と「独立系サービス」があるまず音声配信の方法を乱暴に分けると、ポッドキャストとそれ以外の独立系サービスという区分になります。 ポッドキャストとは、どこかに音声コンテンツをアップするとRSSで更新情報が飛んでいって、ポッドキャストアプリ(AppleやSpotify、Google、その他いろんなポッドキャスト聴取アプリがある)で

                                          いま音声配信(ポッドキャスト/ラジオ)をはじめる方法|narumi
                                        • 実家の仕掛け時計と拙宅アパートのシンプルな掛時計を交換した、それから今年の実家庭ドウダンツツジが鮮やかだった - 🍉しいたげられたしいたけ

                                          週一か二週に一度、実家の様子を見に行っている。春秋の気候のいい時季には高齢の身内を車で近場に連れ出していたが、いきなり寒くなったので今シーズンは先週でおひらきの様相だ。 www.watto.nagoya しかし、実家に行けば何かネタはある。先週のことだが、その身内が居間に掛かっている掛時計がよく見えないと言い出した。 確かめてみると、デタラメな時間を指していた。 電池がなくなったのだろうと思った。百均で買って置いてあるテスターで計ったところ、案の定だった。 電波時計なので、買い置きと交換してリセットボタンを押したら、針がくるくる回ってほどなく正しい時刻で止まった。 解決めでたしめでたしと言いたいところだが、身内によると実はこれまでも天井の照明が反射して文字盤がよく読めていなかったとのことだった。 身内の視力低下は、本人によると「眼科医に行くたび手術を勧められるが手術は嫌だから断っている」と

                                            実家の仕掛け時計と拙宅アパートのシンプルな掛時計を交換した、それから今年の実家庭ドウダンツツジが鮮やかだった - 🍉しいたげられたしいたけ
                                          • Google Pixel 8 Proを使った感想。先代7 Proから買い替えの価値はある? 細かく試して出した結論(Google Tales) | テクノエッジ TechnoEdge

                                            IT系海外速報を書いたり、翻訳を請け負ったりしています。初めてのスマートフォンはHTC Desire。その後はNexus 5からずっとGoogleさんオリジナルモデルを使っています。 今年も10月に「Made by Google」イベントで新しいPixelスマートフォンが発表されました。 今回の「Google Tales」は、先代の「Pixel 7 Pro」ユーザーが「Pixel 8 Pro」を数日触ってみての感想です。なお、「Pixel 8」は持っていないので、ここではほぼ触れません。 ▲Pixel 8 Pro(左)とPixel 7 Pro パッと見は変わらないけど神は細部に宿る(見た目について)Pixel 8 Proのカラーバリエーションは、先代と同じ3色で、Obsidian(黒)はそのままですが、Hazel(グレイ)とSnow(白)がなくなって、Porcelain(クリーム)とBay

                                              Google Pixel 8 Proを使った感想。先代7 Proから買い替えの価値はある? 細かく試して出した結論(Google Tales) | テクノエッジ TechnoEdge
                                            • オンライン空間の文化とその実践に関する人類学的考察―「淫夢」を事例として―|えすの

                                              0 noteでの公開に際しての前書き ご無沙汰しておりました、もしくは初めまして、Ethnoです。 筆者は現在、大学院の博士課程で文化人類学を専攻しています。日本語圏のオンライン空間(≒インターネット)をフィールドとして調査をしており、「淫夢」という文化における人々の実践を対象に研究を進めています。「文化圏の研究はその文化圏に還元すべき」がモットーなので、筆者が2022年に執筆・提出した修士論文を公開してみることにしました。 本論はTwitter(現:X)をフィールドに「淫夢」を人類学的なアプローチから調査・解釈を試みた論文となっています。淫夢に関するテキストとしては「学術的な視座から真面目に取り扱う」という事が、人類学研究としては「ネットの文化をネットの文脈で解釈する」という事が、それぞれアピールポイントになるかと思います。執筆から1年経った現在見返すと正直ガバガバな部分も多いのですが、

                                                オンライン空間の文化とその実践に関する人類学的考察―「淫夢」を事例として―|えすの
                                              • 【書評】ずるい検索 江尻俊章 クロスメディアパブリッシング - 京都のリーマンメモリーズ

                                                お題「自慢のコレクション」 私の自慢のコレクションは本ですが、最近では、検索先のコレクションも増えています。なぜなら、検索先を教えてくれる本があるからです。今回は、調べ方で差をつけるというすんごい本を紹介します。(笑) 【1.本書の紹介】 【2.本書のポイント】 【3.本書の感想】 【4.関連書籍】 【5.なんと著者より】 【1.本書の紹介】 普段、検索する時は、何を使ってますか? Google1択ですね! だからと言って、Googleだけで調べものを終わらせていませんか? 実は、Googleに出てこなくても、そのサイトで調べると、もっと詳しいことがわかる検索先があるようです。 さて、私たちが知っておいた方が良いという検索先とはどこでしょうか? 【2.本書のポイント】 ■ウェブサイトにメモをつけて記録する。 便利なメモツールとして、無料で使える「Google Keep」があります。 ■音声

                                                  【書評】ずるい検索 江尻俊章 クロスメディアパブリッシング - 京都のリーマンメモリーズ
                                                • toB 向け E ラーニングシステムに ChatGPT を導入して業務効率化を達成した事例について語ってもらいました | MEDLEY Developer Portal

                                                  2023-11-30toB 向け E ラーニングシステムに ChatGPT を導入して業務効率化を達成した事例について語ってもらいましたはじめにエンジニアの山田です。 弊社のニュースリリースにあるのですが、ジョブメドレーアカデミー(以下、アカデミー)では Azure OpenAI Service の GPT モデルを駆使した新機能「研修作成アシスタント」をリリースしています。 この生成 AI を活用した機能により研修作成担当者の作業時間を 75%軽減し、業務効率化に寄与するものになっています。 今回はこの研修作成アシスタントの開発について、担当した二人に話を聞きました。 インタビュイー紹介岸田さんSES 企業で業務システム開発、オフショア開発をしている会社でブリッジエンジニアという経験を経て、2019 年メドレー入社。 その後ジョブメドレーで開発をリード。現在はアカデミーのプロダクト責任者

                                                    toB 向け E ラーニングシステムに ChatGPT を導入して業務効率化を達成した事例について語ってもらいました | MEDLEY Developer Portal
                                                  • 「AI文字起こし妖精さん」について - Leverages データ戦略ブログ

                                                    レバレジーズのデータ戦略室で室長をしている阪上です。今回はレバレジーズの運営するメディアの取材における課題について紹介したいと思います。 課題 レバレジーズが運営しているメディアで取材が数多く行われているのですが、取材音声の文字起こしをこれまで人手のみで行なっていました。1時間の取材の場合、1時間以上に文字起こしに時間がかかったりするため、記事を書く上での重要な情報資源ながら、人に対する負担が大きい状態でした。そこで、現場の悩みを解決したいと思いました。 仕組みの説明 まず、求められる要件を以下の通りです。 求められる要件 文字起こしをして欲しい。 Googleドライブにアップロードしたら自動で文字起こしされ、結果もGoogleドライブに返して欲しい。 文字起こし結果を一定の文字数で改行して欲しい 朝の8時から夜の21時までは処理を受け付けて欲しい、1~2時間以内に処理結果が欲しい 様々な

                                                      「AI文字起こし妖精さん」について - Leverages データ戦略ブログ
                                                    • Whisperで文字起こしをした文章をChatGPTでいい感じにする

                                                      Whisperで文字起こしした文章をいい感じにしたい 注:あくまで個人的な使用を前提とした文字起こしの方法の紹介です。許可なく、他人のコンテンツを全部文字起こしして公開すると、著作物の改変などの問題になる可能性があると思います タイトル通りです。 Whisperで文字起こしをしました。 ただ、以下のように句読点がない文章になってしまい、読みづらいです。 樋口 世界の歴史キュレーションプログラム コテンラジオ樋口 世界の歴史キュレーションプログラム コテンラジオパーソナリティーの株式会社ブック代表樋口清則 です深井 そして株式会社コテンの深井 隆之介です樋口 そして株式会社コテンの楊 英史です樋口 このラジオは歴史を愛し歴史 の面白さを知りすぎてしまった深井さんを代表とする株式会社 コテンのお二人と一緒に学校の授業ではなかなか学べない国内外 の歴史の面白さを学んじゃおうという番組ですよろしく

                                                        Whisperで文字起こしをした文章をChatGPTでいい感じにする
                                                      • 主婦が副業で月5万円稼げる在宅ワークおすすめ10選!初心者が成功するコツ - ソロ活@自由人

                                                        副業を始めたい! 月に5万円稼げる 在宅ワークはどれ? ここ数年で、一気に広まった副業ブーム。リモートワークが浸透したことで、副業をしたい人は増える一方です。ところが選択肢が多すぎて、何をしたら良いか分からない!という主婦も、多いのではありませんか? こんな主婦のみなさんへ! ✔在宅で稼げる副業を知りたい ✔初心者主婦が月5万円稼ぐコツは? ✔在宅ワークで成功する方法は? ✔副業で注意することは何? このような悩みを解決します。 副業で成功するためには、仕事選びがとても大事です。在宅ワークの中には、恐ろしく効率が悪いものもあります。稼げない仕事を必死にやっても、月5万円には絶対に届きません。本当に稼げるおすすめ仕事を、10厳選して解説します。 稼げない仕事が あったなんて... 気合入れて頑張っても、稼げない仕事じゃ意味ないです。 時間がもったいない! ところで、あなたが副業したい理由って

                                                          主婦が副業で月5万円稼げる在宅ワークおすすめ10選!初心者が成功するコツ - ソロ活@自由人
                                                        • ドイツのタクシーは、はだか色~ドイツ ベルリン・ほりべのぞみさん地元案内

                                                          ストリートビューを見ながら地元の人しか知らないささいな話を聞くシリーズ。今回はほりべのぞみさんにドイツのベルリンを案内してもらいます。 案内してもらった動画の文字起こしです。もとの動画はこちら。 イラストレーターのほりべさんが住んでいる ドイツベルリン周辺をストリートビューを利用して紹介してもらいます。 ■ドイツのベルリンを案内してもらいます 林:今日の地元案内なんですけど。生まれた場所じゃなくて、今住んでる場所の近くを紹介してもらいます。 西垣:はい 林:なぜなら、紹介してもらう人がドイツに住んでいるからです 西垣:わー、初海外ですね。フランスかイギリスかドイツの景色って言われてもわからないですね 林:そうですね、それはおれもわかんないですね。千葉ってって言われたら、千葉って思っちゃうかもしれない 西垣:はははは 林:案内してくれるのはほりべのぞみさんで、編集担当の古賀さんと、ドイツが見

                                                            ドイツのタクシーは、はだか色~ドイツ ベルリン・ほりべのぞみさん地元案内
                                                          • 能登半島地震ボランティア食事写真集 - 🍉しいたげられたしいたけ

                                                            昨日付(2/25)拙エントリー に書き足したいことができた。追記してもよかったが、どうせ新しくエントリーを起こすついでがあるので、ここに書いてしまう。 今回のボランティアで、依頼者さんたちにわりと喜んでもらえたと思われる作業の一つに「雑巾がけ」があった。 何のことないただの雑巾がけだけど、依頼者さんのご家族だけでやろうとしたら大変な手間だろう。ボランティアが大勢でやったら短時間で終わる。 ただし今次の被災地の事情として、断水が長く続いているということがある。タンクの水を極力有効利用して、縫われていないタオルの雑巾をできるだけ広く使って拭き上げる必要があった。タオルは数があった。 今さらながら改めて、なんで雑巾って縫うんだろうね? 自分ちでは縫ってるけど。 www.watto.nagoya 以降、今日の本題。愛知ボランティアセンターさん主催の能登半島行きボランティアバスに乗ったことは、これま

                                                              能登半島地震ボランティア食事写真集 - 🍉しいたげられたしいたけ
                                                            • Gemini API でラジオ番組の音声からの文字起こしを試す|npaka

                                                              「Gemini API」でラジオ番組の音声からの文字起こしを試したので、まとめました。 1. Gemini 1.5 Pro の 音声データ入力「Gemini 1.5 Pro」で音声データでの入力が可能になりました。 サポートしているファイル形式は、次のとおりです。 ・MIMEタイプの制限 ・WAV - audio/wav ・MP3 - audio/mp3 ・AIFF - audio/aiff ・AAC - audio/aac ・OGG Vorbis - audio/ogg ・FLAC - audio/flac ・1プロンプトでの音声データの最大長は 9.5 時間。 ・1プロンプト内の音声ファイルの数には制限ない。 ・音声ファイルは16Kbpsのデータ解像度までリサンプリングされ、複数のオーディオ チャネルは1チャネルに結合される。 2. ラジオ番組の音声の準備今回は、「Claude 3」と

                                                                Gemini API でラジオ番組の音声からの文字起こしを試す|npaka
                                                              • Youtube戦略ー動画は積み上げ型のコンテンツ。資産として戦略を構築しよう!

                                                                はじめに Youtubeってスゴイですよね! YoutubeってGoogleが提供する1サービスなのに「ユーチューバー」っていう職業を生み出しています。 「テレビ」っていろんな放送局が存在するのにYoutubeって一つのメディアとして数えられています。 それほどまでにYoutubeは巨大化しています。 そりゃ、Youtubeに関わるビジネスに参入したくなるのもわかるってもんです。 Youtube戦略ーYoutubeいつやるの? よく聞かれるのが「YouTubeってやるべきですか?」というやつです。 しっかりビジネスとして取り組んでいけるならやった方がいいと思います。 YouTubeの最大のメリットは「資産」になるということですよね。 集客に繋がる資産になるのはブログとYouTubeだけです。 たとえばFacebookの場合どれだけ投稿を繰り返しても流れ去ってしまうので投稿し続ける必要があり

                                                                  Youtube戦略ー動画は積み上げ型のコンテンツ。資産として戦略を構築しよう!
                                                                • 2019年図書館系はてなブックマーク ベスト100 - やわらか図書館学

                                                                  どうやって校閲記者は調べているか | 毎日ことば https://note.mu/sick4989hack/n/n928f78d3d33f 『本を読んで内容を説明して面白かったらお小遣い』というルールを子ども達に実践したら驚異的な成果があった話「win-winな子育て法、スゴイ」 - Togetter https://this.kiji.is/459642838872769633 AIで日本史研究者やマニアが狂喜乱舞する「くずし字」の翻訳ツールが開発 - PC Watch 文系の学問において資料の実在を証明するものとは何か 「スゴ本」の中の人が「読書猿」に聞く ―― 問題解決としての『知』とは? - はてなニュース 無名の新人が書いた地味な分野の本に、ありえないほど長いタイトルをつけて売ろうとした人文書出版社の話 « マガジン航[kɔː] 【なぜ?】アメリカ人が日本の本屋にブチキレ! その

                                                                    2019年図書館系はてなブックマーク ベスト100 - やわらか図書館学
                                                                  • スコ個展からの帰途阪堺電車に乗って住吉大社に参詣した - 🍉しいたげられたしいたけ

                                                                    往路に大阪城を見に行くことは出発前に決めていたが、それ以外のスケジュールは未定だった。行き当たりばったりでいいやと思っていた。 スコ個展会場の「あべのま」さんに向かう道すがら、路面を走る阪堺電車が目に留まった。 そうそう、阪堺はまだ乗ったことがなかったのだった! ということで、乗ろうと決めた。乗ってどこへ行く? 普通に考えると住吉大社だよな、てなわけで後半のスケジュールが確定した。 私の中ではごく自然な思考回路だったつもりだが、他人の目にどう映るかは知らない。 「あべのま」さんからの阪堺最寄駅は阿倍野駅のようだが、一駅くらい歩くことにした。 なんなんだよ「消費税完納推進の街」って? 松虫駅というところから乗車した。 車内風景。路面電車に乗るのは久しぶりだったからシステムがわかりにくかったけど、下車するときに現金を料金箱に入れるという、昔ながらの方法を選択した。 乗車するときに交通系ICカー

                                                                      スコ個展からの帰途阪堺電車に乗って住吉大社に参詣した - 🍉しいたげられたしいたけ
                                                                    • 3大クラウド×日米両リージョンでハニーポットを動かしてみる【後編】 | gihyo.jp

                                                                      前編の振りかえり 前編ではOSSのハニーポットであるT-PotをAWS、Azure、Google Cloudの3大クラウドサービスの日米両リージョンにデプロイしました。後編となる本記事ではT-Potを24時間程動かした結果をご紹介していきます。 T-Potの実行結果について 各クラウドサービスの日米両リージョンで収集したデータをT-Potのダッシュボードに表示した様子のスクリーンショットを以下に掲載します。なお表示期間はデータ収集を行った2024年6月12日17時から翌日の2024年6月13日17時までの24時間に揃えています。 24時間という比較的短時間かつ各リージョンで1インスタンスのみでしかデータ収集していないため統計学的な考察というよりは一参考情報としてお読み頂けますと幸いです。 図1 AWS東京リージョン(ap-northeast-1) 図2 AWS米国東部リージョン(us-ea

                                                                        3大クラウド×日米両リージョンでハニーポットを動かしてみる【後編】 | gihyo.jp
                                                                      • リモートワーク・テレワークでのユーザーインタビュー・ユーザビリティテスト実践方法|Goodpatch Blog グッドパッチブログ

                                                                        はじめに 昨今コロナウィルスの影響で、外出自粛等の措置が導入されています。そんな中、リモートワーク(テレワーク)での在宅勤務となっている企業も多く見受けられるようになりました。弊社Goodpatchでも、2/17よりリモートワーク推奨、3/30より原則出社禁止の措置をとっています。 そんな中でも、前向きに社会に価値を届けたいという思いから、今回は遠隔でのユーザビリティテストやインタビューの方法についてまとめたいと思います! リモートワークになった直後にGoodpatch Anywhereからコミュニケーションに関するナレッジをお届けしましたが、今回はより実務に寄った記事になっております。 ※今回は被験者のリクルーティングに関する内容は含まれません。事前準備→実施→分析における方法を記載していますので、ご注意ください リモート活用で得られるメリット もちろん、ウイルス感染リスクを抑えられると

                                                                          リモートワーク・テレワークでのユーザーインタビュー・ユーザビリティテスト実践方法|Goodpatch Blog グッドパッチブログ
                                                                        • Google翻訳をリアルタイムで上手に使う方法

                                                                          Google翻訳をリアルタイムで上手に使う方法2024.01.12 08:0033,557 David Nield・Gizmodo US [原文] ( mayumine ) Google翻訳アプリ、ダウンロードしてあるけど、最近使ってないなあ… そんな人がいたらそれはもったいない! Google翻訳、思っていた以上に進化していて、実用度が素晴らしいことになっています。 話している2人の間にスマートフォンがあれば、リアルタイムでGoogle翻訳が通訳してくれます。音声認識の精度と翻訳スピードはかなりのもので、もう通訳要らず。翻訳してほしい内容をを毎回テキストで入力する必要なんてすでにありません。 英語圏はもちろん、その他の言語の国も余裕で旅行できそうです。 リアルタイム翻訳を使う方法Image: Google Translateお手持ちのスマートフォンにGoogle翻訳アプリがあれば、それだ

                                                                            Google翻訳をリアルタイムで上手に使う方法
                                                                          • 「Pixel 9」「Pixel 9 Pro」「Pixel 9 Pro XL」の海外レビューまとめ、発熱改善・指紋センサー高速化・ただしAI機能には課題ありとの評

                                                                            2024年8月22日にGoogleがリリースした「Pixel 9」「Pixel 9 Pro」「Pixel 9 Pro XL」は、最大6.8インチのディスプレイやAI処理に磨きをかけたチップセットのGoogle Tensor G4、刷新されたカメラバーを搭載したGoogleのフラッグシップスマートフォンです。そんな「Pixel 9」シリーズを実際に使用した海外レビューが出そろったので、主なものをピックアップしてみました。 ◆AIによる画像修正機能 Google Pixel 9 Pro and 9 Pro XL review: AI all over the place - The Verge https://www.theverge.com/24225221/google-pixel-9-pro-xl-review-ai-gemini-screen-battery-camera IT系ニュー

                                                                              「Pixel 9」「Pixel 9 Pro」「Pixel 9 Pro XL」の海外レビューまとめ、発熱改善・指紋センサー高速化・ただしAI機能には課題ありとの評
                                                                            • 劇場では観る予定のなかった『シン・仮面ライダー』を劇場で鑑賞した経緯 - 🍉しいたげられたしいたけ

                                                                              3月14日付の拙記事は「だが私は(『シン・仮面ライダー』を)劇場では観ない」という関係者に失礼なオチで締めくくった。一言言い訳をすると、私は滅多に映画館に足を運ばないタイプである。 だが「劇場で見ろよ」と言わんばかりの偶然が重なったため、けっきょく劇場で鑑賞した。今回のエントリーはその経緯を記す。一般性皆無で他人には関係のないことではあるが、日記として。 www.watto.nagoya きっかけは日雇い斡旋会社から(実はまだやってる)「朝4時集合、現地6時着、9時まで会場設営作業、16時から会場撤収作業、18時作業完了」というバイトを依頼されたことだ。 「若い人だったら大丈夫でしょうけど、このトシだとキツい」と断ろうとしたが、「どうしても」と押し切られて受けてしまった。頭数を余裕をもって集めたかったのだろうと想像する。 しかし、どうやって朝の4時に集合場所まで移動しろというのだ。担当者は

                                                                                劇場では観る予定のなかった『シン・仮面ライダー』を劇場で鑑賞した経緯 - 🍉しいたげられたしいたけ
                                                                              • GoogleのAIが延期なしに発表。「Gemini」の理解力は人を超えたらしい*

                                                                                GoogleのAIが延期なしに発表。「Gemini」の理解力は人を超えたらしい*2023.12.07 07:2526,925 西谷茂リチャード *出題方法の工夫ありの状況で、AIが専門家超え。 GoogleのAIといえば、無料で使えるチャットAI「Bard(バード)」です。9月の大型アップデートで画像やGmailを読み込めるようになって、ちょっと話題になりました。 しかし、Bardはあくまでも表向きの名前=サービス名です。その裏方で動いているAIモデルは実はLaMDA → PaLM → PaLM 2とグイグイ置き換わりながら賢くなってきています。 今回発表されたのは、その「裏方AIモデル」の次世代版といえましょう。その名もGemini(ジェミニ)。 ふたご座の名を授かっているのでバランスの良さを期待させますが、性能にも期待して良さそうです。しかも、スマホ上で動かせるくらい軽いバージョンもあ

                                                                                  GoogleのAIが延期なしに発表。「Gemini」の理解力は人を超えたらしい*
                                                                                • 寝てる間にテキスト化!?Googleドキュメントで取材音源を自動で文字起こしをする方法

                                                                                  音声データからの文字起こし。専門の業者がいるほど、手間と時間がかかるものです。ICレコーダーなどで録音した音声を聞きながら、ちょっとずつテキスト入力をしていくのが伝統的な方法ですが、かなり時間がかかります。 しかし、人間は進化する生き物。なんとGoogleドキュメントを使って、音声データから自動で文字起こしをする方法が編み出されているのです! そこでこの記事では、その方法を解説していきます。 Windows 10で自動文字起こしをする方法 用意するものは、音声データ、PC(WindowsでもMacでも可)、Googleドキュメントです。あとは少々の設定。たったこれだけで、音声データから自動で文字起こしができるようになります。 最初に、Windows 10での自動文字起こし方法について解説します。 サウンドの入出力の設定を変更する まずは「サウンド」コントロールパネルを開き「録音」タブを開き

                                                                                    寝てる間にテキスト化!?Googleドキュメントで取材音源を自動で文字起こしをする方法