さいきん、青木理氏の記事がはてなブックマークにやたら出てるね https://headlines.yahoo.co.jp/hl?a=20190901-00000058-sph-sociheadlines.yahoo.co.jp www.huffingtonpost.jp headlines.yahoo.co.jp ちょっと本題前にいうけど、「テレビ番組のだれかの発言を、そのまま記事にする」というやりかた、登場し始めたころから注目していて、当初は著作権的な問題はないのか?や、そもそもそういう記事に価値はあるのか、という議論があったけど、まず2019年現在では、善悪を超えて当たり前の風景になっていますね。自分は積極的な評価をしているので、それを喜びたい。 青木氏といえば、各種の疑問もありつつも、内容的には面白いノンフィクションを書かれていたが、一般的な知名度がある人ではなかった。ただ、共同通信
この記事はfreee Developers Advent Calendar 2019の24日目です。こんにちは、freeeの@magi1125こと伊原です。あだ名は「アクセシビリティで一発当て太郎」です。いまはデザインリサーチチームのマネジャーをやっています。 この記事ではタイトル通り、2019年のfreeeにおけるアクセシビリティ関連の出来事をご紹介します。なお、2018以前の活動については「2018年、freeeのアクセシビリティを振り返る」をご覧ください。 developers.freee.co.jp ※アクセシビリティの向上とは、障害者高齢者を含めた幅広いユーザーに利用方法の選択肢を提供し、使える状況を広げる取り組みを指します。 12月26日追記: 本記事にインスパイアされたとのことで、@masup9が同様の振り返り記事をまとめています。こちらもぜひご覧ください。 develope
こんにちは、バックエンドエンジニアの近です! 4/24〜4/26にかけてアトランタで開催されたRailsConf 2023にWEARバックエンドブロックから近・小山・高久の3人が参加しました。 去年はコロナの影響もあってオンラインの開催だったのですが、今年はオフラインでの開催となり、大勢が参加していて大盛況でした。 我々が開発・運営しているファッションコーディネートアプリ「WEAR」のバックエンドはRuby on Railsで開発しています。現在では、新機能の開発やリプレイスなど、チームメンバーの全員がRuby on Railsに関わっているため、今回RailsConfにて様々なセッションを聞けたことはとても有意義な経験でした。 RailsConfとは 1年に1回開催されるRuby on Railsに関する世界最大のカンファレンスとなります。(公式サイト) 2020〜2022年はコロナの影
概要 GPT-4oが発表されました。 GPT-4oについては以下のツイートによくまとまっています。 使用している映像は以下でまとめられています。 非常に優秀でAI系のプロダクトがまた何個か死んだと思いますが、それはさておき使っていきましょう。 APIではすでに利用可能になっております。 今回は以下のcookbookにある動画要約をgradioに移植します。 https://cookbook.openai.com/examples/gpt4o/introduction_to_gpt4o デモ 以下の Huggingface Space を作りました。APIキーと動画を貼り付けて試用することができます。 1分間の動画で0.1ドル / 60秒くらいかかります。API使用料に注意してください。 現状のGPT-4o APIの制限 動画はそのままアップロードできません これは将来的にもできるとされてい
こんちには。 データアナリティクス事業本部 インテグレーション部 機械学習チームの中村です。 今回はシングルGPUで動作するTransformer相当のRNNモデル、という噂のRWKVについて試してみたいと思います。 RWKVとは TransformerベースのLLMと同等の性能を持つ、並列化可能なRNNモデルであり、Attentionフリー(Attention構造を持たない)なモデルです。 ライセンス形態がApache License 2.0かつ、シングルGPUでも動作する点が凄いところとなっています。 GitHub https://github.com/BlinkDL/RWKV-LM Huggin Face https://huggingface.co/BlinkDL Hugging Face側にモデルがいくつか公開されており、rwkv-4が付くものが最近よく話題で使用されているもので
2022年10月5日に『深掘りRubyKaigi 2022 with ko1 & kateinoigakukun ~ RubyKaigiどうでした&RubyのWASI/並列どうなるの? ~』を開催しました。イベントでお話した内容を3部作でお届けします。 自己紹介 fujimura:皆様、今日はお集まりいただきありがとうございます。今日はゲストにkateinoigakukunさんと、笹田さんをお迎えしております。プログラムとしては、前半でkateiさんにWasmの話を聞いて、後半に笹田さんに並列並行のところを聞くというようなコンテンツでやっていきます。 さっそく始めていこうと思うのですが、僕らの自己紹介と、kateiさんの自己紹介から始めようかな。僕は STORES でCTOをやってる藤村と申します。RubyKaigiもリアルで参加して、非常に楽しかったです。じゃあ、hogelogさん。 h
この度、日本のフロントエンド界隈をリードし続ける古川陽介さんとTechFeedがコラボして、フロントエンド技術の最新動向を月イチでお届けする連載企画が始まりました🎉 こんにちは、TechFeed CEOの白石です。 この度、日本のフロントエンド界隈をリードし続ける古川陽介さんとTechFeedがコラボして、フロントエンド技術の最新動向を月イチでお届けする連載企画が始まりました🎉 古川陽介さん(Japan Node.js Association代表理事) 聞き手: 白石俊平(TechFeed CEO) YouTubeのチャンネル登録はこちらから! 毎月3〜4つのトピックを取り上げ、TechFeed CEO 白石俊平とNode.js Association代表理事 古川陽介が縦横無尽に語ります。 フロントエンドエンジニア必見です😊 今回は、2022年1月、2月のトピックを取り上げた動画を
昨年の夏、Google は AI を活用したリサーチや執筆する際のアシスタントである NotebookLM を発表しました。そして本日より、 Google Labs で Gemini 1.5 Pro を搭載した更新版の NotebookLM を日本語を含む言語で 200 以上の国と地域に順次提供します。 私たちが NotebookLM で目指してきたのは、複雑な資料を理解して精査し、情報から新しい類似性を見つけ、下書きなどをすばやく作成するのに役立つツールの開発です。研究論文や取材記録、仕事でのドキュメントなどの参照文献(ソース)をアップロードすると、NotebookLM がそれらの重要な資料を理解し、必要なサポートを提供します。また、本日からお使いいただける NotebookLM では、英語で提供していたものから更新し、いくつかの新機能も導入します。 Google ドキュメント、PDF、
【在宅バイト】家でできるバイトを4つご紹介します! みなさん、こんにちは。なまけものです。 実家に帰省するための新幹線の中で記事を書いています笑 さて、今回は”家でできるバイト”、いわゆる”在宅バイト”を4つご紹介していきます。 【在宅バイト】には「自分のペースで働ける」、「家から出なくて済む」、「職場の人間関係に悩むことがない」などのメリットがあります。 一般的なバイトは準備や移動の時間に1~2時間はかかってしまいますが、在宅バイトはその時間も働くことができますね。 バイトをお探し中の「時間がない就活生」や「主婦さん」はぜひご参考にしてみてください! そもそも在宅バイトとは? 在宅バイト 1.採点・添削 2.文字起こし 3.ライティング 4.アンケートモニター まとめ おわりに そもそも在宅バイトとは? 本題に入る前に、「そもそも在宅バイトとは?」という疑問にお答えします。 在宅バイトと
生成AIの旅は続く 人工知能 機械学習 深層 学習 生成 AI 1956 人工知能 人間の知能を複製または超えることができるインテリジェントな機械の作成を 目指すコンピューターサイエンスの分野。 1997 機械学習 機械が既存のデータから学習し、そのデータを改善して意思決定や予測を行 うことを可能にするAIのサブセット。 2012 ディープラーニング ニューラルネットワークの層を使用してデータを処理し、決定。 2021 ジェネレーティブAI プロンプトまたは既存のデータに基づいて、新しい文字、視覚、および聴覚の コンテンツを作成します。 Microsoft と OpenAI のパートナーシップ Ensure that artificial general intelligence (AGI) benefits humanity 汎用人工知能(AGI)が人類に利益をもた らすようにする Em
2024年2月13日に『YAPC::Hiroshima 2024 非公式ふりかえり会』を開催しました。イベントでお話した内容を文字起こし形式で紹介します。 hey.connpass.com 登壇者紹介 STORES hogelog:YAPC初参加 ヨヨイ:YAPCは3、4回参加経験あり hiromu:YAPC初参加 藤村:YAPC初参加 えんじぇる:YAPC初参加 スマートバンク 三谷:YAPC初参加、YAPC::Hiroshima 2024でベストスピーカー賞を受賞 nyanco:YAPCスタッフ 前夜祭の感想 hogelog:『YAPC::Hiroshima 2024 非公式ふりかえり会』を始めていきます。ぜひYAPCのスタッフだった方や登壇してた方などなど、喋ってもいいですよという方はぜひ挙手をしていただけると嬉しいです。 本日の登壇者側で喋る人を紹介させていただきます。私はhoge
はじめに 今回はシャドーイングについて考えていきます。シャドーイングとはそもそもどのようなトレーニングなのか?英語学習への効果や、必要な時間も丁寧に解説していきます。シャドーイングをするには事前の準備が大切です。英語の音声規則や変化も知っておく必要があります。シャドーイングの効果的な正しいやり方をステップごとに丁寧に説明していきますので、ぜひ参考にしてください。おすすめの教材やYoutubeなどもご紹介していきます。 シャドーイングとは シャードーイングの歴史 シャドーイングの効果 自動化の促進 インプット効果 必要なトレーニング時間や到達度 ディクテーションとの違いは? シャドーイングは難しい? 初心者でも成功する方法とは? シャードイングをする前に必要なこと チャンク学習 スラッシュリーディング 発音規則のルール(フォニックス) 音声変化の規則 連結 同化 脱落 レベルに合った教材の準
いまどきスマホ内職のメリット 時間・場所に制限されない自由な働き方 手作業の内職と違って、材料を置くスペースは必要ありません。 単価の高めな単発の仕事もあるので、時間の都合が不定期な人でもできます。 仕事に対する熱意に応じて結果が出るから、スキルアップを目指せる 続けることでコツをつかむこともでき、能力を認められることで単価や報酬が上がることもあります。 自宅でできる内職の種類 アンケートサイトポイントサイト商品モニター写真販売買い物代行転売ブログアフィリエイトライティングデータ入力ハンドメイド販売イラスト制作 簡単作業でスキルいらず!今すぐはじめられる内職 レベル1 ☆☆☆☆★ アンケートサイト・ポイントサイト いつでもどこでも、移動中などコツコツ貯めることができます。 アンケートサイト・ポイントサイトは「お小遣いサイト」と呼ばれることもあります。 多くのサイトはポイント制になっていて、
一昨日、眼鏡検索をしまくったからでしょうね。 『こんな眼鏡もあるぞい!いかがっすか!?』と 楽天やら色々な眼鏡サイトの広告が出まくります。 あと数本欲しいので、ありがたいのですがね。 (度付き眼鏡)と見ると、 どうしても『どつく』の方を思い出してしまうのよ😅 『どついたろか!?』のほうね。。。 見る度に『ぷっ😂』と笑ってしまう。 脳内小学生www ところで、昨日の記事の (歳の差カップルについてどう思いますか?) に対し、コメント頂きまして、 ありがとうございます。 色々な意見を読んでいて、 (こればかりは、やはり 本人が決めるしかないんやろうな)と 思ってしまいました。 顔や性格がどんな人がいいかと同様に、 年齢も自分の好みですよね。 Aさん、まだ迷っているようだけど、 個人的には結婚できるんやったらしてほしい。 (結婚してないお前が言うな!)とか 言われそうやけど😅 逆に結婚して
インター・ラボ株式会社は12月15日、人工知能研究組織OpenAIが開発した音声認識モデル「Whisper」を利用した音声文字起こしAPIである「WhisperAPI」の無償提供を開始したことを発表した。OpenAIは、文章から画像を生成するAI「DALL・E2」や、自然で多彩な文章を生成するAI「GPT-3」などを開発している。 高い音声認識精度を持つWhisperを用いたAPIを無償提供し、外部サービスと連携するなど幅広いユーザーが利用できるようにする。また、プログラミングの知識を持たない人でもブラウザでかんたんに利用できるWebサービスも提供する。 画像はWhisper公式Githubより Whisperとは、OpenAIが開発した汎用的な音声認識モデルで、現在GitHubにおいて公開されている。教師あり学習で68万時間というデータを学習しており、高い音声認識精度を持つ。音声翻訳や言
2023年5月26日、ChatGPTのiOS版アプリの提供地域が拡大され、日本でもついに利用可能となっています。アプリから簡単にChatGPTが利用できるということで、さっそくインストールしてAIと会話してみました。 We expanded the ChatGPT iOS app to 30+ more countries today! Now serving users in Algeria, Argentina, Azerbaijan, Bolivia, Brazil, Canada, Chile, Costa Rica, Ecuador, Estonia, Ghana, India, Iraq, Israel, Japan, Jordan, Kazakhstan, Kuwait, Lebanon, Lithuania (????1/2)— OpenAI (@OpenAI) ChatG
現地時間2021年3月2日、Microsoftが技術者向け年次カンファレンス「Microsoft Ignite」の中で、リアルタイム翻訳&文字起こしが可能な会議用スマートスピーカー「Intelligent Speaker」を発表しました。 Microsoft’s new Intelligent Speakers deliver its promised meeting room of the future - The Verge https://www.theverge.com/2021/3/2/22308962/microsoft-intelligent-speaker-teams-translation-transcription-features Microsoft announces AI-powered Teams speakers with titanic transcript
HOME色々な在宅ワーク体験談などテープ起こし(文字起こし)の在宅ワークは初心者でもできる?どこで探す?実は狭き門で初心者は稼げない理由
この記事は NTTコミュニケーションズ Advent Calendar 2023 の15日目の記事です。 この記事では、ChatGPT と 音声認識モデルの Whisper を用いた発音練習アプリケーションをご紹介します。 ChatGPT に読み上げる文章を考えてもらい、その文章の読み上げた音声を Whisper で文字起こしします。 正確に発音できていれば、正確に文字起こしできる、という考えから、 原稿と文字起こし結果を比較すれば発音練習に使えるのではないかと考えました。 実際に使ってみた結果、発音のどこが悪かったのかといったフィードバックはもらえませんが、 自分の発話した音声に対して評価がつくだけでも、結構楽しく練習できると感じました。 音声認識を活用したアプリケーションは、一般に音声認識精度がネックになると思いますが、 このアプリケーションは音声認識精度が100%ではないことを逆手に
無料で自動文字起こしが可能な「CLOVA Note」を試して分かったこと:PCでもスマホでも使える!(1/2 ページ) 会議などの議事録を作成したり、プレゼンテーションの内容を後から確認したりするため、音声を録音したいこともあるだろう。そのような場合、数年前まではICレコーダーを利用するのが一般的だったように思うが、最近ではスマートフォン単体で録音できるアプリも増えてきた。 また、そうして録音した内容を文字起こしするのは、以前は人力で行うのが当たり前だったが、今では自動で文字起こしまで行ってくれるものも出てきている。そのような自動で文字起こしを行ってくれるLINEのアプリ「CLOVA Note」を実際に利用したので、どの程度使えるものなのか簡単に紹介しよう。 β版として無料提供 アプリでもファイルのアップロードでも利用可能 CLOVA Noteは、LINEがこの5月からβ版として無料で提供
OpenAIが発表した音声認識モデル「Whisper」は、日本語の音声でも精度高く文字起こしできるツールとして知られています。今回はAIsmiley編集部が「AIニュース原稿の読み上げ音声を素材にどのくらい精度高く文字起こしできるのか」や「生活騒音下における読み上げ音声でも結果は変わらないのか」について調べてみましたので是非やり方を真似して試してみてください。 ■音声認識モデルとは? 音声認識モデルとは、AIが人間の声を認識し、認識した音声をもとに何らかのデータをアウトプットする技術を指します。身近な音声認識モデルには、アレクサでお馴染みのAmazon Echoがあります。Amazon Echoなどのスマートスピーカーは、人間の声を認識し、その音声の意図を把握した後、情報検索を行ったり、接続されている電化製品の操作を行ったりします。 スマートスピーカーの他にも、入力された音声をリアルタイム
※募集終了しました。たくさんのご応募、ありがとうございました。 「はてなブログ」及び「はてなブックマーク」では、企画・編集のアルバイトスタッフを募集します。国内有数のユーザーコミュニティーを活用し、インターネットのトレンドを一緒に生み出していきませんか? 興味があればITスキルは問いません。学生の方も歓迎します! はてなブログでの仕事 週刊はてなブログで、実際にアルバイトスタッフが企画・編集に携わった記事 はてなブックマークでの仕事 はてなブックマークで、実際にお願いしたいところ はてなで働くとうれしいこと スタッフの声を聞きました オフィスランチや、フリードリンクの福利厚生もあります 募集要項 エントリーはこちら 社員や他職種でも募集しています はてなブログでの仕事 以下の業務のうち、スキルや経験、ご自身の意思に応じて担当する範囲を決定します。 週刊はてなブログに掲載する記事の執筆 ブロ
公金の私物化、公職選挙法違反の疑いなど安倍晋三首相(以降、安倍総理)が大きな批判にさらされている「桜を見る会」問題。安倍総理は11月15日、2度にわたって首相官邸でぶら下がり取材に応じ、記者からの質問に直接回答した。特に2度目のぶら下がり取材は実施が当日直前に決まったにもかかわらず、約20分もかけて約30問の質問を受け付け、ぶら下がり取材に滅多に応じない安倍総理としては異例の対応となった。 しかも、その回答内容の文字起こしは映像と共に速やかに首相官邸ホームページに掲載されるほど官邸側の対応は迅速であった。しかし、このリンク先に掲載されている文字起こしは安倍総理の回答のみであり、記者の質問は一切掲載されていない。当日の映像を見て質問と回答を紐付けて確認すれば、質問と回答が噛み合っていない場面が幾つかも見受けられる。 そこで本記事では、11月15日の2回目のぶら下がり取材について、約30問の質
生成AI専門メディア「PROMPTY」を運営する株式会社Bocek、国内外の生成AI関連サービス207社をまとめた「生成AI関連サービスカオスマップ 2023」を公開 生成AIメディア「PROMPTY」を運営し、生成AIの導入をワンストップで提供する生成AI特化戦略コンサルティングファームである株式会社Bocek(本社:東京都大田区、代表:沖村 昂志)は、生成AI基盤チャットボットや画像生成AIなど、生成AIに関連する企業やサービスをカテゴリ別にまとめた「生成AI関連サービスカオスマップ 2023」を発表しました。 カオスマップ公開の背景 東京都が生成AI ChatGPTのガイドラインを発表し、全局で業務利用を開始するなど、生成AIの急速な普及に伴い、企業における生成AI導入が加速していると言えます。 弊社で運営する生成AIメディア『PROMPTY』や弊社の主力事業である生成AI特化のコン
新生活に華を。 Google製のスマートフォン、Pixel 7 Proを使い始めて1年も経たないうちに何度も落としてしまい、最終的には壊してしまいました。海外にいたため修理不可能でした。 その後、日本へ帰ってきてすぐに表参道のアップルストアのきらびやかな照明に蛾のごとく引き寄せられ、iPhone 13を衝動買いしました。Pixel 7 Pro以前はiPhone 12 miniを使っていたので、出戻りしたとも言えます。 以下、iPhoneに回帰したメリットとデメリットについてお伝えします。 iPhone 13を買ってよかったことなぜiPhone 13を選んだのか。実は、当初狙っていたのはiPhone 13 miniでした。 しかし、ストア内に在庫はなく、すでに生産も終わっていて中古を探すしかないと店員さんに伺ったため、iPhone 13 miniの次に小さくて安いスマホを選んだ結果がiPho
2023年6月15日に『深掘りRubyKaigi 2023 with spikeolaf & makenowjust』を開催しました。イベントの内容をほぼ全文文字起こし形式でお届けします。この記事は第2部です。 hey.connpass.com 登場人物 ゲスト makenowjust/藤浪 大弥さん spikeolaf/金子 雄一郎さん STORES fujimura/藤村 大介 shyouhei/卜部 昌平 hogelog/小室 直 パーサとの出会い fujimura:金子さんのパートにいきます。簡単にどんな話をRubyKaigi 2023でしたか紹介していただけますでしょうか? spikeolaf:ここ2年ぐらい、主にAnd the WorldっていうRubyKaigiの名物コンテンツを見ていると、パーサへの関心というのは高まってきていて、ここ何年かで何が問題かはだいぶ整理されてきて
SOMEOFTHEMのメンバーであるカンノアキオ、オノウエソウ、YOU-SUCKで音楽にまつわる井戸端話の文字起こしを毎週アップします。 アニメ『ぼっち・ざ・ろっく!』について語るサムオブメンバー。後編では、現実世界での下北沢ギターロック界隈は存在するのにアニメ化されてしまうことの意味や、『ぼっち・ざ・ろっく!』評への違和感、あまりに古典的だった陰キャアプローチについて語りました。前編は下記リンクから。 カンノ:『ぼっち・ざ・ろっく!』に対して下北界隈の当事者としての気恥ずかしさがあるんです。きっと当事者性が薄ければ薄いほど、あのアニメは「良い作品だな」って思えるんだろうけど。 オノウエ:そうだろうね。 カンノ:僕は下北に近い距離にいる人間なので。そんな僕が思うのが、アニメの可愛いキャラクターが下北沢SHELTERがモデルとなっているライブハウスにいたり、あとアニメが最終回を迎えたあとに公
動画も字幕付きでYouTubeにあげていますので、iOSDCで観れなかった方、もう一度観たい方はよければみてください。(チャンネル登録、高評価もしてもらえると嬉しいです。) 文字起こしnoteのiOSアプリで実装したアクセシビリティのすべてというタイトルで発表します。 最初に自己紹介です。 note株式会社でiOSアプリエンジニアをしている植岡和哉と申します。 Twitter, GitHub, Qiita, noteなどはすべてfromkkというアカウントで活動してるのでよかったらフォローしてください。 最初にnote株式会社について説明させていただきます。 note株式会社は2011年12月8日に設立されたデジタルコンテンツの企画、制作、配信、デジタルメディア運営のためのシステム開発サービス提供を事業とする会社です。 2012年9月にスタートしたcakesは多数のクリエイターや出版社と提
今日も頑張って警察との会話を文字起こししているのですが、 いちいち警察官の言葉にイラついて、 『ごるあぁぁぁあぁぁあl!!!』とやくざ化してしまい、 気がついたら、もう深夜0時半ですよ。。。 始めたのは19時46分。 この間、薬の仕分けをして、お湯沸かして、 食器洗って。。。って、 たいして何もしてないな(;'∀') ほぼ、 『んだ!?てめぇ!ごらぁぁ!!!!』と 今日も大声上げて怒鳴り散らしていました。 元気っすね。。。 というか、怒鳴りすぎて、眠い(笑) (私も結構あほなことを言っているな)と思った、 警察官との会話。 ------------------------------------------------------------------------------- 警察:会社の前で待っていましたよね。 私 :他の人を待っていたんです。 警察:それはあなたの言い分です。 私
戦争を止めるために表現者として何ができるのか 2022年3月10日、日本ペンクラブ、日本文藝家協会、日本推理作家協会の3団体が「ロシアによるウクライナ侵攻に関する共同声明」を発表し、3団体の代表が会見を行った。 新聞・テレビでも報じられてはいるが、会見内容は要約されたものしか紹介されていないので、ここでその詳細を報告しよう。会場で録音したものを文字起こししたものだ。多忙のあいまをぬってテープ起こしをしたのは、質疑応答を含めたその会見が、表現者としての思いが伝わるとても良い内容だったからだ。 私は月刊『創』(つくる)編集部として会見に参加したのだが、個人として日本ペンクラブに属してもいる。会見終了後、桐野夏生会長と話をした。会場を出る時は前々会長の浅田次郎さんと一緒になって少し話した。浅田さんも今回のウクライナ侵攻とその後の事態には憤りを感じているようで、わざわざ駆け付けたという。 連日、テ
昨日、弁護士になんだかんだで期待していただけに、 電話を切った後、 結構呆然としてしまっていたのですよ。 でも、自分で被害届を提出しないといけない以上、 ぼーっともしていられない。 (何かしないと!)と自分にむち打ち 判例を見る方法など調べていたのですが、 今日、コメントを読み、励まされました。 本当に本当にありがとうございます!!! そして、 『肩がぶつかっただけで公務執行妨害だと 逮捕する』って本当なんですね😱 弁護士が言っていたので、嘘なわけはないのですが、 【「警察が来て揉めている時、被害者側の人が 警官の手を振り払っただけで 公務執行妨害になった」と聞きました。】 というコメントを頂き、驚きました。 警察は、本当に横暴ですね。 弁護士に聞いたところ、 警察が間違えたことをした場合に訴える 第三者機関がないそうなんです。 これっておかしくないですか? 警察はやりたい放題ってことで
","naka5":"<!-- BFF501 PC記事下(中⑤企画)パーツ=1541 -->","naka6":"<!-- BFF486 PC記事下(中⑥デジ編)パーツ=8826 --><!-- /news/esi/ichikiji/c6/default.htm -->","naka6Sp":"<!-- BFF3053 SP記事下(中⑥デジ編)パーツ=8826 -->","adcreative72":"<!-- BFF920 広告枠)ADCREATIVE-72 こんな特集も -->\n<!-- Ad BGN -->\n<!-- dfptag PC誘導枠5行 ★ここから -->\n<div class=\"p_infeed_list_wrapper\" id=\"p_infeed_list1\">\n <div class=\"p_infeed_list\">\n <div class=\"
LLM開発のためのデータエンジニアリング MLOps Advent Calendar 2023の24日目です。 Stability AIでデータ系のソフトウェアエンジニアをやっているcvuskです。主な仕事は日本語LLMのためのデータ開発です。Stability AIでは日本語LLMも各種開発しています。LLMの学習というと大量のGPUを用意して巨大なデータでモデルを学習する、というキラキラしたイメージ(?)が強いかもしれませんが、データが重要かつ苦労が耐えない課題であることは他の機械学習やディープラーニングモデルと違いありません。日本語のテキストデータは英語ほど入手しやすいわけではないのと同時に、データエンジニアリングや品質面でもいろいろと大変なことが多々あります。今回はLLMのためのテキストデータの用途やエンジニアリングについて整理します。 LLMの学習 LLMの学習は大きく分けて事前
こんにちは、2020年新卒入社予定の山口です!修論と引越し準備とアルバイトで慌ただしい日々を過ごしています。今日は業務で触った、Google製API Google Cloud Speech-to-Text API について皆さんと共有できればと思います。 Google Cloud Speech-to-Text API とは APIを導入していく GCP側 PC側 実際に試してみる 認識モデルを変更してみる マルチチャンネルで試してみる ファイル形式・サンプリング周波数を比較してみる ナレーション音声(「本日は〜」の音声です。) 走れメロス_朗読 おわりに Google Cloud Speech-to-Text API とは Google Cloud Speech-to-Text API は名前の通り、音声データから文字起こしをするAPIです。この音声データは私たちが日頃聞いているような音声
朝日新聞ポッドキャスト“【ヨッピーさんと語ろう】#2 「SNSで大炎上」の土佐市移住者カフェに行ってきました”を文字起こしした 今でも月に1、2回「土佐 カフェ」をTwitterやGoogleで検索してるんだけど、そしたらたまたま見つけたコンテンツ。かなり興味深い内容で、お、ヨッピーが発信してるぞって。で、カフェの部分だけ文字起こし。 人生で初めて文字起こししたけど、めちゃくちゃ時間かかるね、これ。昼飯ないなった。 文字起こしサイトもめちゃ助かりました。 https://youtubetranscript.com/?v=NcjKaBrBL84&t=400 ソース:朝日新聞ポッドキャストより https://www.youtube.com/watch?v=NcjKaBrBL84&t=400 6分40秒ごろから15分35秒くらいまで。 朝:朝日新聞神田大介記者(前から注目してる、かなり好きな記
イソジン以来となる珍説を大阪府の吉村知事が採用しようとしています。 「感染を抑えすぎたから変異株が急拡大した」という、下手をすれば「感染は抑えすぎないほうがよい」と誤解される可能性もあるこの発言、ファクトチェックしてみます。 ◆吉村知事の問題のツイート まず、問題となっている吉村知事のツイートがこちら。 「緊急事態宣言で大阪は感染を抑えすぎた、結果、変異株が既存株にとって変わる速度が早まり、変異株が急拡大してる」という謎の説について、「逆説的でえっ?と思うが真実をついてるかもしれない」脇田説がストンとくる。要注意だ」とツイートしています。 大阪では現在「まん防」が適用されるほど感染が急拡大しており、4月1日には過去4番麺となる616人が新規感染。2度目の緊急事態宣言が2月末に解除されてからでは最多です。 そうした中で、大阪府の首長が急拡大の原因を「感染を抑えすぎた」とする説に飛びついた構図
今年2019年の『AWS re:Invent』も先日全ての日程を終了し、数多くの新機能新サービスが発表されました。その詳細については当ブログでもポータルサイトを展開し、 また、例年通り参加レポートや技術検証ブログ等を書きまくっております。 AWS re:Invent 2019 | シリーズ | Developers.IO ですが、今年は(今年も?)『AWS re:Invent 2019』本編開始前にも数多くの新機能、または幾つかの新サービスも発表されていました。その数がこれまた非常に多く、『本編開始前にこれだけ出てくるってことはこの後(re:Invent 2019は)どうなるんだ...?』と思った方も多かったのではないでしょうか。 本編開始前の内容についてはAWSJ公式ブログでまとめられたエントリが計5本あり、また本編に関しても計5日分の日毎まとめとして、AWSJ公式ブログでその内容がまと
現時点でMicrosoft Teams、Skype、Zoom、Google Meet、WebExで動作確認しているという。 無料プランの記録可能時間は合計3時間まで。有料プランは記録時間が10時間まで。以降の超過分は1分当たり2円の従量制となる。 リコーは「さらなるニーズの探索に取り組み、音声認識精度の向上や新機能の追加を図りながら、法人向けサービスとしての展開も視野に入れて開発を進める」としている。 関連記事 日本語特化のAI文字起こしサービス 1時間の音声を5分で文字化、句読点も自動で調整 AIを活用し、日本語の音声データを文字起こしするWebサービスが登場。1時間の音声データを5分程度で文字起こしでき、句読点の位置も自動で調整できるという。料金プランは30秒20円(税別、以下同)、40時間まで10万円。 Microsoft、「Word for Web」にトランスクリプト(文字起こし)
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く