並び順

ブックマーク数

期間指定

  • から
  • まで

321 - 360 件 / 384件

新着順 人気順

文字起こしの検索結果321 - 360 件 / 384件

  • ますます「暗い森」になりつつあるインターネットの中で個人ブログを書くことの意味 - YAMDAS現更新履歴

    yamdas.hatenablog.com 昨年6月に公開した文章だが、先日「パブリッシングの主軸をはてなからnoteに移した/移しつつある人たちをまとめてみた」で紹介したところ、初めて読んだ人が多かったようで、はてなブックマークが増えていた。 この「暗い森」になりつつあるインターネットというトレンドは、これを書いたおよそ一年半前より(Twitter の荒れ度合い、可燃性の高まりと呼応して)はっきりしてきたように思う。 ここで「暗い森」の代表として挙げられていたのはニュースレターやポッドキャストである。 アメリカにおけるニュースレターの盛り上がりについては、以下の市川裕康さんの文章が参考になるだろう。 ニュースレター配信サービス「サブスタック」と静かに広がるパッション・エコノミー|市川裕康 (メディアコンサルタント) 情報収集手段として注目のニュースレターと管理アプリ『Stoop(ストゥー

      ますます「暗い森」になりつつあるインターネットの中で個人ブログを書くことの意味 - YAMDAS現更新履歴
    • れいわ新選組・プリティ宮城ちえ市議のマルチ商法及びポンジ・スキーム遍歴に関する記録 - OCEP第五電算室

      要約 プリティちえこと宮城千恵氏は、2020年から"プロトン水"やJENCO(ジュビリーエース)などのマルチ商法に手を出していた 宮城市議から勧誘を受けた彼女の教え子が被害を訴えるも、宮城市議は返金に応じなかったという告発が浮上 これらの訴えに対して、宮城市議やれいわ新選組は沈黙している→山本代表が調査中と回答(9/23)→沖縄タイムスで報道(9/28 朝刊)→この件に関して宮城市議初ツイート(9/28 20:21)→れいわ新選組、違法性なしと判断し処分せず(9/30) 宮城市議のブログやSNSから、宮城市議のマルチ商法履歴を追跡する はじめに 先日の宜野湾市議選において第二位で初当選を果たしたプリティちえこと宮城千恵市議(以下、宮城市議)が、以前に"プロトン水"や"プロトン洗剤"を宣伝・販売、及び会員勧誘を行なっていたことは筆者のTwitterアカウントで指摘を行った通り。 プリティ宮城

        れいわ新選組・プリティ宮城ちえ市議のマルチ商法及びポンジ・スキーム遍歴に関する記録 - OCEP第五電算室
      • 話題の文字起こしAI「Whisper」、ニュース記事を読み上げて試したら驚きの精度だった

        インタビューや会議の際に発言内容をメモしながら、後で間違えないよう録音もする人は少なくないだろう。だが、録音した音声を聞いてテキストに起こす作業はかなりの手間がかかる。筆者の場合は聞き取りづらい箇所を繰り返し再生したり、パソコンに文字を打ち込む操作が遅れて音声の再生を一時停止したりしているうちに、実際の録音時間の何倍もかかってしまう。作業が終わるころには疲れてうんざりしていることもある。 筆者と同じように「骨の折れる文字起こし作業を何とか楽にこなしたい」と考える人は、洋の東西を問わず多いのかもしれない。最近はAI(人工知能)によって音声を解析して自動的に文字起こしするツールが国内外で増えてきた。中でも大きな注目を集めているのは、米OpenAI(オープンAI)の音声認識AI「Whisper」だ。 同社は米テスラ創業者のイーロン・マスク氏らが設立したAIの研究開発企業で、2020年に発表した言

          話題の文字起こしAI「Whisper」、ニュース記事を読み上げて試したら驚きの精度だった
        • 【外資系企業でノンネイティブが生き残るために使っている英語関連ツール(最新)】英語に少しでも困っている方向けに、外資系で生き残るために使いまくっている英語関連のお勧めツールを下記スレッドにて紹介します。

          じゅじゅ @jujulife7 【外資系企業でノンネイティブが生き残るために使っている英語関連ツール(最新)】 英語に少しでも困っている方向けに、 外資系で生き残るために使いまくっている英語関連のお勧めツールを下記スレッドにて紹介します。 じゅじゅ @jujulife7 【Otter】 ・高精度な英語のリアルタイム文字起こしアプリ(体感で精度80~90%)でマジで使い倒しています ・英語会議時に喋っている内容が即座に文字化されるので、このアプリがあると英語苦手でも安心して会議に望めます otter.ai/jp じゅじゅ @jujulife7 【grammarly】 ・スペルや文法ミスを校正してくれる校正ツール ・英語でメールを書くとき、レポート・資料作成する時に重宝しています ・DeepL+grammarly有料版を活用することでネイティブ並みの文章が作れる時代になっていきている感じも g

            【外資系企業でノンネイティブが生き残るために使っている英語関連ツール(最新)】英語に少しでも困っている方向けに、外資系で生き残るために使いまくっている英語関連のお勧めツールを下記スレッドにて紹介します。
          • 内容をメモる必要なし! 電話の内容を録音&文字起こしするAIアプリ「コネクト」

            内容をメモる必要なし! 電話の内容を録音&文字起こしするAIアプリ「コネクト」2021.05.10 10:0026,541 岡本玄介 後になって「アレ何だっけ?」がなくなりそう。 電話で喋ったやり取りが、テキスト・メッセージのような文字の吹き出しで表示され、その音声も録音されるので後から内容を確認しやすい、AI通話アプリ「コネクト」が開発されました。 作ったのは、ソフト開発を行なう株式会社アトラスコネクト。これがあれば、上司や取引先と話した内容など、大事な情報を失念することがなくなります。 Video: Jay Jang/YouTubeタグ付けもできて管理がラクテキストはAIによりリアルタイムで文字起こしされ、終了後すぐに見返すことができます。そして通話データはタグも付けられ、後から検索や管理ができるというスグレモノ。「電話業務が難しい理由は通話内容が記録されないから」…という原因をこれで

              内容をメモる必要なし! 電話の内容を録音&文字起こしするAIアプリ「コネクト」
            • 『Engineers in VOYAGE ― 事業をエンジニアリングする技術者たち』ができるまで #voyagebook - t-wadaのブログ

              昨日(2020年8月7日)、書籍『Engineers in VOYAGE ― 事業をエンジニアリングする技術者たち』(ハッシュタグ #voyagebook)が出版されました。この本は私(@t_wada)がVOYAGE GROUPに在籍する主要なソフトウェアエンジニアにインタビューし、その内容をラムダノートの編集者鹿野さん(@golden_lucky)が本としてまとめたものです。2020年代のウェブにおけるビジネスとソフトウェア開発の在り方を濃縮した1冊に仕上がっています。 書名:Engineers in VOYAGE 事業をエンジニアリングする技術者たち 著者:株式会社VOYAGE GROUP 監修、和田卓人 編 (A5判、224ページ、ISBN:978-4-908686-09-2、本体価格1,800(+税)円、電子版のみ1,000(+税)円) 発行:2020年8月7日 メインタイトルが『

                『Engineers in VOYAGE ― 事業をエンジニアリングする技術者たち』ができるまで #voyagebook - t-wadaのブログ
              • Claude3を使って人間が読むようにパワポ資料を読み込んでみる | DevelopersIO

                はじめに 新規事業部 生成AIチーム 山本です。 ChatGPT(OpenAI API)をはじめとしたAIの言語モデル(Large Language Model:以下、LLM)を使用して、チャットボットを構築するケースが増えています。通常、LLMが学習したときのデータに含まれている内容以外に関する質問には回答ができません。そのため、例えば社内システムに関するチャットボットを作成しようとしても、素のLLMでは質問に対してわからないという回答や異なる知識に基づいた回答が(当然ながら)得られてしまいます。 この問題を解決する方法として、Retrieval Augmented Generation(以下、RAG)という手法がよく使用されます。RAGでは、ユーザからの質問に回答するために必要そうな内容が書かれた文章を検索し、その文章をLLMへの入力(プロンプト)に付け加えて渡すことで、ユーザが欲しい

                  Claude3を使って人間が読むようにパワポ資料を読み込んでみる | DevelopersIO
                • OpenAI の Realtime API の使い方|npaka

                  以下の記事が面白かったので、簡単にまとめました。 ・Realtime API 1. Realtime API「Realtime API」は、低遅延なマルチモーダル会話エクスペリエンスを構築するためのAPIです。現在、入出力の両方でテキスト・音声がサポートされており、Function Calling を利用することもできます。 特徴は次のとおりです。 ・ネイティブな音声合成 低遅延でニュアンスに富んだ出力が得られる ・自然で操作可能な音声 自然な抑揚を持ち、笑ったり、ささやいたり、トーンの指示に従うことができる ・同時マルチモーダル出力 テキストはモデレーションに役立ち、オーディオにより安定した再生が保証される 2. クイックスタート「Realtime API」は、「WebSocket」を介して通信するステートフルなイベントベースAPIです。 機能を紹介するデモアプリ「openai-real

                    OpenAI の Realtime API の使い方|npaka
                  • Whisperで文字起こしをした議事録の発話者の名前を自動的に判定する! - Qiita

                    こんにちは!逆瀬川 ( @gyakuse ) です! 今日は最近作った議事録文字起こしアプリに話者分離機能をくっつけたものを作っていきたいと思います。 ChatGPT APIの使い方、Whisper APIの使い方、Hugging Face Spacesへのデプロイ方法等を知りたい場合は以下の記事をぜひ! できたもの openai_keyにOpenAIのAPIキーを入れる メイン音声ファイルに会話音声 (wav, 25MB以内) を入れる 話者 (1) 参考音声ファイルに話者 (1) の参考音声 (wav) を入れる 話者 (1) の名前を入れる 話者 (2) 参考音声ファイルに話者 (1) の参考音声 (wav) を入れる 話者 (2) の名前を入れる 上記を行って送信ボタンを押すと処理が開始されます。なお、参考音声は10秒程度で大丈夫です。実装全体は以下で確認できます。 話者分離 (S

                      Whisperで文字起こしをした議事録の発話者の名前を自動的に判定する! - Qiita
                    • DeepLearningについて、最近作ったもの、書いたもの、勉強したこと

                      こんにちは!逆瀬川 ( @gyakuse ) です。 今日は最近作ったもの、書いたもの、勉強したことを備忘録的にまとめていきたいと思います。 なぜ書くのか、なぜ学ぶのか DeepLearningの普及以降、Attention Is All You Need以降、Hugging Faceでの民主化以降、そしてStable DiffusionやChatGPTの登場以降、どんどんAGIへの距離が短くなってきています。未来は想定より大きく変わりそうです。どったんばったん大騒ぎのときはみんなが分かっておくべきことは効率的に共有すべきで、そのために書いています。書くためには論文等を読む必要があります。そしてそのためには基礎からしっかり学ぶことが大事です。次の一歩をみんなで歩んでいくために、学び、書いています。 間違ったことを言うかもしれませんが、それでも誰かのためになれば嬉しいです。あと、個人的にはこ

                        DeepLearningについて、最近作ったもの、書いたもの、勉強したこと
                      • ChatGPT, Python, Whisper APIを活用し、動画ファイルから議事録を自動生成 - Qiita

                        はじめに 現在のデジタル社会では、Teamsなどのオンライン会議が日常的に行われています。 しかし、その議事録を取るのは容易ではありません。そこで、OpenAIのChatGPTとWhisperを使って、動画ファイルから議事録を自動生成する方法をご紹介します。 補足説明:ChatGPTについて ChatGPTは、OpenAIが開発した自然言語処理AIで、人間と自然に会話することが可能です。GPT-3、GPT-4という大規模な言語モデルをベースにしており、様々な文脈での文章生成が得意です。 補足説明:Whisperについて Whisperは、OpenAIが開発した自動音声認識(ASR)システムです。大量の音声とテキストデータで訓練されており、音声をテキストに変換するタスクを効率的に行います。 処理の流れ ここから、具体的に動画ファイルから議事録を生成するための具体的な手順を説明します。 1.

                          ChatGPT, Python, Whisper APIを活用し、動画ファイルから議事録を自動生成 - Qiita
                        • 無償入手可能な音声コーパス/音声データベースの一覧 - Qiita

                          無償かつ入手しやすい音声データセットをメモしています。 ライセンス・利用規約は「商用利用可能」「研究用途のみ」ともに紹介します。 コーパスを探すときに有用なサイト コーパス配布元サイト 音声資源コンソーシアム : 日本語コーパスが豊富、無償または有償で利用可能 緩いライセンスのコーパスでなくても良いときはここ 自発的発話の日本語音声コーパスはだいたいここにある 入手は要申請 所属や責任者を記入する必要があるため、研究者や企業でないと厳しい? (この記事では音声資源コンソーシアムのコーパスは未掲載) Shinnosuke Takamichi: コーパス一覧 : 日本語中心。高道先生が携わっている音声コーパス 大量の日本語音声コーパスが配布されている 音声合成のコーパスをつくろう (Slideshare) : 2021年6月時点の音声コーパス事情 あなたにどうしても伝えたい30の音声コーパス

                            無償入手可能な音声コーパス/音声データベースの一覧 - Qiita
                          • オタク世界の◯◯図で見るVTuber【配信書き起こし】 - izumino’s note

                            前回のエントリでは、 VTuberの岸嶺ミミムさん(Twitter)、思惟かねさん(Twitter)との3人で行った座談会の書き起こしを公開しました。 2021年1月の時点でVTuber業界について語る、全3回の配信でしたが、前回のエントリが「第2回」の配信内容にあたります。 そのエントリも好評だったということで、今度は第3回から長めに書き起こしたいと思います(なお、前回も含めて他のお2人に確認していただいた上で、読みやすく加筆・再構成したテキストになっています)。 どちらも座談会というより、泉がこの配信のために準備した初出のアイディア(他では未発表)をプレゼンしていたパートを切り取っており、「VTuber論」に興味のある人に広まればいいなと思います。 プレゼンのお時間 ~オタクの「好みの構造」とVTuber~ キャラクター論の虚構とリアル VTuber語りと「ぼくら語り」の話 外見と内面

                              オタク世界の◯◯図で見るVTuber【配信書き起こし】 - izumino’s note
                            • 日本「報道の自由度ランキング」70位 ハンガリーやコンゴ共和国より低い理由は?(木村正人) - エキスパート - Yahoo!ニュース

                              ■G7の中で最下位[ロンドン発]国際NGO「国境なき記者団」(本部・パリ)英国支部は5月3日、ロンドンで2024年の「報道の自由度ランキング」を発表した。調査対象の180カ国・地域のうち日本は70位と前年68位から2つランクを落とした。主要7カ国(G7)の中で最下位だ。 (1)ノルウェー(昨年同)(2)デンマーク(同3位)(3)スウェーデン(同4位)と上位3カ国は北欧諸国が占めた。 G7ではドイツ10位(同21位)、カナダ14位(同15位)、フランス21位(同24位)、英国23位(同26位)、イタリア46位(同41位)、米国55位(同45位)だった。 欧州連合(EU)内部からロシアのウラジーミル・プーチン大統領を援護するオルバン・ビクトル首相が強権主義を強めるハンガリーでさえ67位(同72位)。アフリカのコンゴ共和国は日本よりランクが1つの上の69位である。 ■特定のテーマについて報道する

                                日本「報道の自由度ランキング」70位 ハンガリーやコンゴ共和国より低い理由は?(木村正人) - エキスパート - Yahoo!ニュース
                              • はてな民の樹脂サッシ信仰は異常

                                日本の家はどれだけ暖房を効かせても肝心な部分の断熱がダメで暖かくならない→海外では使用禁止の国もある代物らしい https://togetter.com/li/2053113 Vol.9 大手はなぜ樹脂サッシを使わないのか? https://www.kosodate-sekkei.co.jp/blog/matsuo-2-vol9/ この2つの記事がトップに来てて、ブコメはほとんどが 「日本は樹脂サッシを義務化しろ」 みたいなことばっかりで朝から本当にバカしかいないのか?と憂鬱になる 1件目のToggetter記事なんかは最後のまとめで 「ガラスを二重→低輻射コーティング→サッシ」 の順でしか効果薄いよ、としっかり書かれてるのに「樹脂サッシにしろ」の大合唱 しかもこの計算はだいぶサッシ寄りで最近はやりの窓が大きめで開放感重視の家だとほとんどガラスの性能になる ガラスを三重とかにすると樹脂部分

                                  はてな民の樹脂サッシ信仰は異常
                                • 平均的な人間の能力を超えた―、常識や知識を獲得した大規模言語モデルが開く新ビジネス領域 | Coral Capital

                                  月間10万人が読んでいるCoral Insightsのニュースレターにご登録いただくと、Coral Capitalメンバーによる国内外のスタートアップ業界の最新動向に関するブログや、特別イベントの情報等について、定期的にお送りさせていただきます。ぜひ、ご登録ください! Coral Capitalのポッドキャストでは、かなりAIに編集作業を頼っています。英語でインタビューしていることから、日本語では未実現の最新技術を使ったサービスに触れる機会があるのですが、ここ1、2年は、その進化には目を見張るものがあります。 収録した音声を文字(テキスト)に変換する「文字起こし」の精度が上がった結果、もはや人間に依頼する意味はなくなりましたし、音声編集についても画期的な機能が登場しています。それは音声から文字起こしされたテキストを編集することで、それに対応する元の音声データも同時に編集可能である、という機

                                    平均的な人間の能力を超えた―、常識や知識を獲得した大規模言語モデルが開く新ビジネス領域 | Coral Capital
                                  • 記録文書で見る”黒人侍”弥助|STST

                                    最近話題の”黒人侍”弥助に関して、少なくとも原文は同時代に描かれた記録に残っている内容と、最近誰かの想像したフィクションとが混ざって語られていることが多い為、「記録」に関して備忘録としてまとめます。 (2024/7/2 家忠日記の原本に関する説明追加) 弥助に関する記録の比較弥助に関する記録一覧弥助に関する記録一覧上記表のとおり、弥助に関する記録が残っているのは「信長公記」「家忠日記」それぞれ1か所ずつと、イエズス会宣教師による記録3か所の計5か所のみです。 内容は信長と弥助の初対面の際の記録、信長の甲州征伐からの帰路における記録、本能寺の変の際の記録の3通りのみとなります。 逆に言えば、これらのタイミング以外の記録はありませんので、安土での弥助の生活や弥助が甲州征伐や伊賀攻めで戦ったといった物語、信長の元で功を上げて出世したといった物語を時折見かけますが、これらは特に記録には基づかない作

                                      記録文書で見る”黒人侍”弥助|STST
                                    • 「テックブログを書くハードルを少しでも下げたい」 OpenAIのAPIを使った「技術記事作成アプリ」の構想と実装

                                      毎回1つのテーマに絞り、テーマに対してのLTを行うTechDLT。「ChatGPT」をテーマにした「ChatGPTについてLT! TechDLT Vol.10」に登壇したのは、ほりゆう氏。OpenAI APIを用いた、技術ブログ記事作成アプリの開発について発表しました。 登壇者の自己紹介 ほりゆう氏(以下、ほりゆう):みなさま、本日はお時間をいただき、ありがとうございます。主催者のみなさま、参加者のみなさま、どうぞよろしくお願いします。「OpenAI APIを用いた技術ブログ記事作成アプリを開発した話」を紹介いたします。 まずは自己紹介からさせてください。私はエンジニアをしている堀越優希、ほりゆうと申します。もともと文系で、高等学校の国語科の教員をしていました。現在27歳です。エンジニアになったのは2020年の7月なので、今3年目くらいです。 ふだんはRailsやReactで開発をしていま

                                        「テックブログを書くハードルを少しでも下げたい」 OpenAIのAPIを使った「技術記事作成アプリ」の構想と実装
                                      • 「永年保存」したデータも書き換え後のもの 統計不正、検証は困難に:朝日新聞デジタル

                                        ","naka5":"<!-- BFF501 PC記事下(中⑤企画)パーツ=1541 --><!--株価検索 中⑤企画-->","naka6":"<!-- BFF486 PC記事下(中⑥デジ編)パーツ=8826 --><!-- /news/esi/ichikiji/c6/default.htm -->","naka6Sp":"<!-- BFF3053 SP記事下(中⑥デジ編)パーツ=8826 -->","adcreative72":"<!-- BFF920 広告枠)ADCREATIVE-72 こんな特集も -->\n<!-- Ad BGN -->\n<!-- dfptag PC誘導枠5行 ★ここから -->\n<div class=\"p_infeed_list_wrapper\" id=\"p_infeed_list1\">\n <div class=\"p_infeed_list\">

                                          「永年保存」したデータも書き換え後のもの 統計不正、検証は困難に:朝日新聞デジタル
                                        • アニヲタWiki(仮) 閉鎖・新管理人選挙騒動の記録 エピソード項目凍結事件

                                          管理人中心のスレを拾っただけだのでユーザー間の議論部分は見てません。あしからず。 ルール作成議論スレも拾い読み。増田は熱心な利用者でも内情に詳しい人でもないです。 5chのスレ読めばもう少し背景わかるかもしれないがしんどいので。。 まとめ管理人の最終的な考えはwikiトップページだけ読んでもらえればよいと思う。 w.atwiki.jp/aniwotawiki/ 「エピソード項目」という作品の、ある1話を解説する都合上、引用の範囲を超える翻案・盗作のような内容の説明を行う記事が多数あった・ある恐れがあった(管理人が一部盗用認定済み) 管理人がファスト映画、膨大なページ数wikiなどの権利者による摘発・停止による危機感と昇進・結婚の私事からリスク回避的に働き、タイミングよく議案も出たことから予防的な活動(修正or削除)を始める(促す)ことになった したらばでの議論・策定に大きな騒動はおそらくな

                                            アニヲタWiki(仮) 閉鎖・新管理人選挙騒動の記録 エピソード項目凍結事件
                                          • Google Cloud Speech API vs. Amazon Transcribe - Qiita

                                            文字起こしAPIガチンコバトル ググってざっと見れた範囲の「文字起こしAPI比較してみた」系記事では、数行(もしくは数分)レベルの非常に短い文字起こしを行いgood/badを述べているものが多いです。もしくはニュース動画のような"クリアすぎる音源"に対して行っているものも多いです。Amazon Transcribeについてバズっていたブログでも、英語での文字起こしで精度が高い話をしています。自然言語処理分野では英語の精度が高いのは知られているところですが日本語だとどうかというところが気になるところです。 自分が知りたいのは、 - 日本語の音源 - Podcastのように素人収録されたある程度ノイズが含まれた音源 - 1hくらいの長尺音源 - 複数人がクロストークしている音源 というような特徴を持った音声データに対してAPIだけでどこまで戦えるか(文字起こしできるか)だったので、いろいろ検証

                                              Google Cloud Speech API vs. Amazon Transcribe - Qiita
                                            • 無料で自動文字起こししてくれるMicrosoft製アプリ「Group Transcribe」を使ってみた

                                              Microsoftが、誰が何を話したのかリアルタイムで文字化して記録してくれる、無料の文字起こしアプリ「Group Transcribe」を公開していたので、実際に使ってみました。 「Group Transcribe」をApp Storeで https://apps.apple.com/jp/app/group-transcribe/id1527145885 iOS端末でApp Storeにアクセスして「Group Transcribe」を入手します。 インストールするとアプリの説明画面が4枚表示されます。「次へ」をタップするか、右へスワイプして進めていきます。 最後の説明画面で「始めましょう。」をタップ。 利用規約が表示されるので「承認」をタップ。 表示名と言語を入力します。 言語はプルダウン式メニューになっていて、かなり多数の言語が用意されています。ここで設定された言語をベースに文字起

                                                無料で自動文字起こししてくれるMicrosoft製アプリ「Group Transcribe」を使ってみた
                                              • PDFから超簡単文字起こし!Googleドライブが優秀すぎた | 株式会社LIG(リグ)|DX支援・システム開発・Web制作

                                                こんにちは! オフショア開発チームで通訳/翻訳をしているゆまです。 今回は長年の悩みだった「PDFの文字起こし」について、感動する出来事があったのでシェアさせてください。 ※手っ取り早く方法だけ知りたい方は、「Googleドライブで文字起こしする方法」からご覧ください! ある日の出来事 翻訳依頼が入りました。 しかし、原本がPDF…… しかもWordなどから生成されたものではなく、スキャンされた画像…… わかります……最終的に保管したい文書ってサイン済、捺印済の書類ですよね……。 これ、翻訳担当あるあるじゃないですか? 翻訳に限らず、コーポレートあるあるな気がするのですが、皆さんどうですか? けっこう前に締結した契約書をベースにしたい、でもWordファイルどっか行っちゃった、とか……。 原文、どうやって文字起こしする?手打ちする? さて、こういった状況の場合、どうやって文字起こししますか?

                                                  PDFから超簡単文字起こし!Googleドライブが優秀すぎた | 株式会社LIG(リグ)|DX支援・システム開発・Web制作
                                                • 生成AIの活用事例 10選|masa_kazama

                                                  「テクノロジーで人々を適切な医療に案内する」をミッションに、医療プラットフォームを提供しているUbie株式会社の@masa_kazamaです。 この記事は#Ubieアドベントカレンダー5日目にエントリーしています。 今年は生成AI一色の1年でした。Ubieでは、生成AIをプロダクト活用と社内生産性向上の観点で取り組んでいます。(取り組みの詳細は、こちらの記事で紹介しています。) この記事では、社内生産性向上観点で、社内の業務プロセスに溶け込んでいて、なくてはならない使い方になっている事例を10個ご紹介します。その中のいくつかは、実際に生産性が倍以上になっていたり、外部委託のコストが半分になったりしています。この記事が、生成AIを活用している人や活用していきたい人のご参考になれば幸いです。 プロダクト活用にもいくつか事例が出ており、問診の内容を大規模言語モデル(LLM)を活用して要約する機能

                                                    生成AIの活用事例 10選|masa_kazama
                                                  • NiziUを開花させたプロデュ―サーJ.Y. Park氏の“イマドキの若者を育てる言葉学”「Goodが先、Mottoが後」 | 文春オンライン

                                                    今秋にデビューを控えているガールズグループ「NiziU(ニジュー)」が人気だ。プレデビュー曲である「Make you happy」のMVは公開後2カ月ほどで1億回再生を突破し、デビュー前にもかかわらず、大きな話題となっている。 彼女たち9名のデビューに至るまでのプロジェクトの軌跡を描いたオーディション番組が「Nizi Project」 だ。日本テレビやHuluでその軌跡が放送され、一人ひとりが夢に向かう懸命な姿がは多くの視聴者たちの心を捉えた。現在も「Nizi Project」は全20話がHuluおよびYouTube公式チャンネルにて無料で視聴できるので、まだ観ていないという方はぜひご視聴いただきたい。 Nizi Projectがここまで人気となった理由はいくつかあるが、そのうちの一つがプロジェクトを統括する「J.Y. Park氏の言葉」である。彼は番組内で参加者たちのパフォーマンスに対す

                                                      NiziUを開花させたプロデュ―サーJ.Y. Park氏の“イマドキの若者を育てる言葉学”「Goodが先、Mottoが後」 | 文春オンライン
                                                    • しずおかハートNet

                                                      文字起こししました。 絶対観て! *シェア、コピペ歓迎 岩田健太郎 神戸大学医学研究科感染症内科教授 ↓ツイート https://twitter.com/georgebest1969/status/1229742057746419713?s=21 以下文字起こし 岩田健太郎です、...

                                                        しずおかハートNet
                                                      • ポッドキャストをAIで文字起こししてくれるサービス「LISTEN」登場 「はてな」創業者の近藤淳也氏が立ち上げ。その狙いをポッドキャスターが聞いてきた

                                                          ポッドキャストをAIで文字起こししてくれるサービス「LISTEN」登場 「はてな」創業者の近藤淳也氏が立ち上げ。その狙いをポッドキャスターが聞いてきた
                                                        • ChatGPT・Whisper・Otter・DeepLのすごい「英語力」、海外取材で効果絶大だった

                                                          米OpenAI(オープンAI)の「ChatGPT」をはじめとする高度な言語AI(人工知能)が国内外で大きな話題となっている。英語、日本語、中国語など多言語を操り、人が話した言葉を聞き取ったり、こなれた文章を書いたり、翻訳したりする。近ごろは毎日のようにテレビやインターネットでニュースを見かけるほどだ。様々な言語AIを試しながら、自分なりの活用法を探っている読者の方は少なくないだろう。 筆者も最近、取材活動にChatGPTなどの言語AIがどれだけ役立つのかを検証する機会があった。スペイン・バルセロナで2023年2月27日から3月2日まで開催されたモバイル業界最大級の展示会「MWC Barcelona 2023」に初めて参加した。世界202の国と地域から8万8500人以上が参加したという同イベントは、基本的に英語が使われる。カンファレンス、メディア向けの展示ブースツアー、1対1のインタビューの

                                                            ChatGPT・Whisper・Otter・DeepLのすごい「英語力」、海外取材で効果絶大だった
                                                          • VTuberさんの配信内発言をテキスト検索するシステムの試作について - はげあたま.org

                                                            解決方法の天啓が降りてきてゴリゴリと実装した結果、「通常より塩辛く炒めた豚肉」回がいつなのかを検索できるシステムが完成! 42分頃から20分ぐらいずっとその話題。 副産物で推しの発言.sqlが爆誕しており、UI整えたらWEBサービス公開できそうな勢い😆 #獅堂リオhttps://t.co/RzdL6Ct7Fe — はげあたま (@hageatama) 2020年7月24日 VTuberさんの配信って長いうえに取り留めのない雑談なので、特定の話題をしゃべった時のアーカイブ発掘はかなり難易度高いんですよね。 しかし、「あ、YouTubeくん自身が自動で字幕生成してくれているんだから、それ検索すりゃいいんじゃん」と気付いたのでジェバンニやりました。そんだけです。 経緯 リオぴが通常より塩辛く炒めた豚肉の話してたのってどこじゃったけ…… — きなこおもち (@omochi88v4) 2020年7

                                                              VTuberさんの配信内発言をテキスト検索するシステムの試作について - はげあたま.org
                                                            • 文字起こしと日本語入力の未来

                                                              現在日本語を文字化するという手段は、キーボード入力を変換するためのIM(Input Method)が主力だが、開発できるのはOS提供会社と、ごく少数のサードパーティに限られる。 だが昨今、AI音声認識によるテキスト変換サービスが次々と登場し、テキスト作成にイノベーションをもたらしつつある。IM開発と違い、AI音声認識ではプレイヤーががらりと変わるというのが面白い。特にスマートスピーカーを展開している企業は常に音声データを解析しまくっているため、有利なのだろう。 Googleは直接コンシューマーユーザーにサービス提供しているが、AmazonはAWSの組み込みエンジンとして「Amazon Transcribe」を提供している。Appleは個人情報を持ちたくないだろうから、今のところ直接ビジネスをやるつもりはなさそうだ。 またベンチャーが多く参入しているのも、この世界の特徴である。国外企業もワー

                                                                文字起こしと日本語入力の未来
                                                              • 趣味Rustから業務Rustへ

                                                                こんにちは!プロダクト開発部の熊谷です。 Fairy Devices(フェアリーデバイセズ) の 入社エントリ を書きます!! 背景 私が Rust に出会ったのが2019年。それまでは C, C# をよく書いていましたが、 Rust の型システムやメモリ安全性、パフォーマンスに魅了され、ますます没頭していきました。 当時学生だったわけですが、新卒時は Rust にこだわらず仕事の安定性を求めて、 SIer 業界に就職しました。 そこで働きつつ、こんなことを思っていました 業務でも Rust を書きたい! 自社製品を開発したい! 5000兆円欲しい! 業務経験も乏しい上に Rust の求人はまだ少なく狭き門になると考え、個人開発や勉強会への参加など頑張っていました。 そんなとき、 Rust.Tokyo で当社の存在を知り、入社に至りました。 何をやっているか mimi®クラウドAI のサー

                                                                  趣味Rustから業務Rustへ
                                                                • 構成のやり方|せしも

                                                                  はじめに構成に取り組むようになったのはいつからだろう。 アマチュアというか同人誌に載せるための作業は2012年から、少しお金をもらうセミプロでの仕事は2014年から、年間で安定して案件をこなすようになったのは2018年からになる。継続してお願いしてくれている人がいるので、一応問題ないクオリティでつくれているのではないかと思う。 ただし、いわゆる専業ライターみたいなキャリアはない。要するに、必要に応じてやる感じで、毎日やっているわけではない。イメージとしては、本業がありながら熱心に同人活動をやってる人と同じくらいの頻度ではないかと思う──実際、そういう感覚の延長で仕事をしている。 そういうわけで、この文書のターゲットは、歴戦の専業ライターではない。もちろん、そういう人が読んでためになるならそれはそれでよいけれども。メインターゲットは、これまで構成の仕事をやったことがない人、駆け出しのライター

                                                                    構成のやり方|せしも
                                                                  • 自己資金のみでSaaSを立ち上げて、メンバー5名でARR2億円を突破した話 | selfree

                                                                    こんにちは、小俣です。 クリスマスも終わって一気に年末ムードですね。 ふとこれまでの振り返りブログを書いてみたくなったので、自社サービス(SaaS)の運営スタンス、ARR 2億円を突破するまでの過程で学んだことなどを簡単にまとめました。 年末年始のお時間ある時に読んでいただけると嬉しいです。 目次 ・selfree LLCとCallConnectについて ・CallConnectはハッカソンから始まった ・黒字化まで ・ARR1億、2億円を達成するまで ・失敗しながら学んだこと ・おわりに selfree LLCとCallConnectについて セルフリーは「愛される企業を増やす」を理念に、いわゆるスタートアップ的な成長志向ではなく、自分たちのペースで着実に成長することを志向している会社です。 経営のコントロール性の観点などから、これまで外部からの資金調達はしておらず、「ブートストラップ経

                                                                      自己資金のみでSaaSを立ち上げて、メンバー5名でARR2億円を突破した話 | selfree
                                                                    • 【対談】菅野完×小山(狂) ─「男性差別」は存在するのか?─|小山(狂)

                                                                      昨日、ベストセラー「日本会議の研究」の著者であり、立憲民主党の宣伝戦略に携わった経験もある菅野完さんと公開討論させて頂く機会に恵まれました。 より正確に言うと、Twitter上で「公開討論しよう。日程調整したいから電話してくれ」と菅野完さんから筆者が呼びかけられ、のこのこ電話したところ勝手にその通話を菅野氏のYouTube live上に放映されるという事態が発生しました。詳しい経緯はこちらのTogetterをご覧ください。 菅野氏はよく知られたリベラル派の作家・活動家であり、立憲民主党のブレーンとしても現実政治にも携わっています。方や筆者である小山はどちらかと言うと右派寄りの著述家とみられており、ジェンダー問題などの分野で悪名が知られているような気がします。 そんな二人が公開討論(という名の不意打ち)で論を戦わせたら、どんな事態が発生するのでしょうか。結論からいうと、地獄でした。本記事では

                                                                        【対談】菅野完×小山(狂) ─「男性差別」は存在するのか?─|小山(狂)
                                                                      • コードでデザインをするということ|Hiroki Tani

                                                                        この記事は2022年12月10日開催のSpectrum Tokyo Design Fest 2022で話したセッションの内容を文字起こししたものです。 僕は15年ほどWebに関する業界で働いています。はじめは小さなベンチャーでWebデザイナーとして仕事をはじめ、自分でデザインして自分でコーディングするというキャリアからはじまりました。それからフロントエンドデベロッパー、UXエンジニア、デザインエンジニアと肩書を変えてきています。 その中で、CSS設計の書籍の執筆や、Figmaのプラグイン開発、デザインシステムのリードなどの活動をしてるんですが、基本的にはコードを書くことをメインにしつつも、デザインに近い領域で仕事をしてきています。 Code is a Material僕がデザインとコードの両方についての考えを巡らせるきっかけになったのは、2019年に観たデザインシステムのカンファレンスのい

                                                                          コードでデザインをするということ|Hiroki Tani
                                                                        • 文字起こし「Whisper」の高速化モデル「Distil-Whisper」、スマホで別人の声になりきる「LLVC」、感情付きプロンプトなど重要論文5本を解説(生成AIウィークリー) | テクノエッジ TechnoEdge

                                                                          2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第19回目は、人気の文字起こしソフト「Whisper」の高速化版、スマホでできるAIボイチェン、プレッシャーをかける感情付きプロンプトをはじめとする、生成AI最新論文の概要5つをお届けします。 生成AI論文ピックアップOpenAIの文字起こしAI「Whisper」を軽量かつ高速にするモデル「Distil-Whisper」 Hugging Faceが開発 3.2兆以上のトークンで学習された、130億のパラメータを持つオープン大規模言語モデル「Skywork」 テキストや画像から高品質な動画を生成するオープンソースモデル「VideoCrafter1」 中国テンセント含む研

                                                                            文字起こし「Whisper」の高速化モデル「Distil-Whisper」、スマホで別人の声になりきる「LLVC」、感情付きプロンプトなど重要論文5本を解説(生成AIウィークリー) | テクノエッジ TechnoEdge
                                                                          • Twitterの音声チャットルーム「Spaces」を日本でいち早く体験--Clubhouse対抗になりうるか

                                                                            日本でも話題沸騰の音声SNS「Clubhouse(クラブハウス)」をご存じだろうか。何が起きるかわからないライブ感がユーザーを熱狂させ、多くのユーザーを睡眠不足に陥らせている。音声チャットの魅力に皆が気づくなか、筆者は新たな音声チャットサービスを体験する機会を得た。Twitterの音声チャットルーム「Spaces(スペース)」だ。 Twitterは2020年夏より音声ツイートのテストをしており、12月にSpacesのベータテストを開始した。音声による会話がストーリーの伝達や感情の共有に対して効果的であることを学んだため、音声で会話できるSpacesのベータテストを開始したという。現在は不特定多数の限定された人々にだけ提供されている。 Spacesの基本機能は、音声チャット、リアクション絵文字、ツイートの共有だ。音声の自動文字起こし機能(字幕機能)もテストされているが、現在は英語のみ。対応O

                                                                              Twitterの音声チャットルーム「Spaces」を日本でいち早く体験--Clubhouse対抗になりうるか
                                                                            • 文字起こし作業の大革命!?Amazon Transcribeの音声テキスト変換機能を使ってみたので、使い方と感想を共有します&#x1f4aa;

                                                                              Amazon Transcribeの使い方 Amazon Transcribeを利用するためにはAWS(Amazon Web Services/アマゾンウェブサービス)のアカウントを作成する必要があります。 これはAmazonでお買い物に使うアカウントとは別で、ほとんどの人は新規で取得することになるでしょう。 AWSというと多少、ハードルが高く感じるかもしれませんが、サーバー系にまったく見識のない僕でも30分程度で設定できたので、文字起こしに困ってる皆さんだったら、そのハードルも乗り越えられるはずです。さ、がんばるよ! AWSのアカウントを作成する まず Amazon Transcribe のページ(↑のリンク)にアクセスします。 右上の「無料サインアップ」をクリックして、AWSのアカウントを作成します。 メールアドレスやパスワード、氏名や住所(氏名・住所はローマ字入力)、決済情報を淡々と

                                                                                文字起こし作業の大革命!?Amazon Transcribeの音声テキスト変換機能を使ってみたので、使い方と感想を共有します&#x1f4aa;
                                                                              • 渡米3年たったので英語絡みの雑感アレコレ - normalian blog

                                                                                明けましておめでとうございます。渡米してそろそろ3年ほど経った&英語がらみのことを質問されることが非常に増えたので、所感を交えつつで自分の経験でも共有したら役に立つ人でもいるのかなと思ったのでちょっとまとめてみました。ご参考になれば幸いです。 あんた誰? この節が必要な人は多分見に来ない気がしますが、シアトル本社のソフトウェア会社に勤めてます。渡米して3年半弱が過ぎ、1年半程がロサンゼルス、2年程がシアトルで働いてます。近隣のチームには原則日本人は全くおらず、一緒に働いている別会社側にも話す相手に日本人は原則いないので、普段の仕事はほぼ 100% 英語です。Role Title はソリューションアーキテクトなので、ソフトウェアディベロッパーよりも技術的に求められるレベルは低いと思いますが、求められる英語力はかなり高めになると思います(最終的には個々人に依ると思いますが。 追記そこそこ読んで

                                                                                  渡米3年たったので英語絡みの雑感アレコレ - normalian blog
                                                                                • 音楽で、デモで、差別に抵抗する。思い出野郎Aチーム高橋一さんインタビュー - あしたメディア by BIGLOBE

                                                                                  8人組ソウルバンド・思い出野郎Aチーム。2021年からはサポートミュージシャンと手話通訳者をメンバーに迎えた編成でも活動している彼らの楽曲に、「フラットなフロア」がある。 フラットなフロア つまづくような段差はない フラットなフロア 何かを遮る壁はない フラットなフロアに向かう 君が誰でもいいぜ スポットライトに照らされて 僕らの肌はまだら模様 話す言葉は歌に溶けて 聞いたことのないラブソング 信仰よりもコード進行 右左よりも天井のミラーボール ♫ フラットなフロア/思い出野郎Aチーム この楽曲で歌われる「フロア」とは、パーティーのダンスフロアを意味しているのみならず、私たちが暮らすこの社会そのものをも表しているのではないだろうか。思い出野郎Aチームでボーカルとトランペットを担当する高橋一(通称マコイチ)さんが、楽曲で、ライブMCで、デモの場で、差別と暴力への反対意志を表明していることから

                                                                                    音楽で、デモで、差別に抵抗する。思い出野郎Aチーム高橋一さんインタビュー - あしたメディア by BIGLOBE