並び順

ブックマーク数

期間指定

  • から
  • まで

321 - 360 件 / 800件

新着順 人気順

文字起こし googleの検索結果321 - 360 件 / 800件

  • 【保存版】さまざまな自然言語処理の手法を学べるレシピ40選(2022年9月版) - Qiita

    はじめに AxrossRecipeを運営している松田です。 AxrossRecipe は、エンジニアの"教育"と"実務"のギャップに着目し、「学んだが活用できない人を減らしたい」という想いで、ソフトバンク社内起業制度にて立ち上げたサービスです。 現役エンジニアによる実践ノウハウが"レシピ"として教材化されており、実際の業務に近いテーマで、プラグラミングで動くものを作りながらAI開発やデータ分析を学べます。 Axross: https://axross-recipe.com Twitter: https://twitter.com/Axross_SBiv 自然言語を処理するとは 自然言語処理(Natural Language Processing、略称:NLP)は、人間が日常的に使っている話し言葉や書き言葉(自然言語)を、コンピュータに処理させる一連の技術のことです。 自然言語とよく対比され

      【保存版】さまざまな自然言語処理の手法を学べるレシピ40選(2022年9月版) - Qiita
    • 【レビュー】Google Pixel 7も「Proがオススメ!」仕事にも使える機能が洗練! (1/4)

      グーグルのスマートフォン「Google Pixel 7」(左)のLemongrass、「Googl Pixel 7 Pro」(右)のObsidian グーグル、ならびに通信キャリアはauとソフトバンクが、Android 13を搭載する最新スマートフォン「Google Pixel 7 Pro」「Google Pixel 7」を発売します。今回、筆者は発売の少し前から実機を試すことができました。とても気になっている写真の「ボケ補正」や、「レコーダー」アプリによる自動文字起こしなど「Pixelならでは」と言える機能の進化を中心に試しました。 そして上位モデルである「Pixel 7 Pro」の方がオススメという結論に至った理由も解説したいと思います。 仕事に使える「ボイスレコーダー」は賢くなった? グーグルは2021年秋に発売したPixel 6/Pixel 6 Proから、自社で設計・開発するシス

        【レビュー】Google Pixel 7も「Proがオススメ!」仕事にも使える機能が洗練! (1/4)
      • クラウド時代の製品・サービス選定の考え方 - Qiita

        注: クラウドサービスは、いわゆる パブリック クラウド を指します。 見えてくるもの 特にオンプレミスとクラウドの違いという観点で列挙してみます。 クラウドサービス と オープンソース の変化は速い もはや、機能比較 は、殆ど意味がない! どうせ半年もすれば、AWS, Azure, GCP は、ほぼ同じサービスを出す 強いて言うなら、現時点で、GCPに PaaSの 動画配信 と(YouTubeがある?)、全文検索(Google Searchがある?) が無いくらい 値段もほぼ一緒 機能追加の要望は出しやすい 例えば、議事録作成のために、Speech to Text にて文字起こし機能を実装するのは構いませんが。いずれ、Office 365 に実装されるのでしょう。実際に議事録ソフトウェアとして OneNoteがあり、Web会議機能をもった Teams がありますからね サービス利用期間は

          クラウド時代の製品・サービス選定の考え方 - Qiita
        • 【超便利】画像やPDFの文章をテキスト化(文字起こし)できるアプリ・サイト17選

          れ紙の書類や画像の中の文字をテキストデータとして取り出したい! そんなときに便利なのがOCR(文字認識)機能を搭載したツールですよね。 というわけで、この記事では画像・PDF内の文書をテキスト化(文字起こし)できるアプリやサイトをまとめてみました。 ※音声・動画ファイルの文字起こしやリアルタイムで音声をテキスト化するアプリに関しては別記事で紹介していますので、興味がある方はあわせてどうぞ。 画像・PDF文字起こしが1分0.5円〜! 今ならライターによる画像・PDF・写真の文字起こしが1分0.5円から頼める『WITH TEAM』がおすすめ。手書き文字でもOK! » WITH TEAM 画像・写真・PDFのテキスト化代行サービスはこちら 画像・PDF⇢テキスト化(文字起こし)が役立つシーン ノートやメモのデジタル保存 手書きのノートやメモをいちいち手でパソコン入力するのは非常に面倒ですよねぇ。

            【超便利】画像やPDFの文章をテキスト化(文字起こし)できるアプリ・サイト17選
          • 超話題の「ChatGPT」! ブログ界隈への影響は!? ポジティブに考えてみる。 - 食品開発男子のゆる〜いマナビブログ

            いかがお過ごしでしょうか? 三寒四温、春に向かってあと2歩くらい!!という気候ですねー。。 さてさて、最近話題になっている「ChatGPT」というサービスはご存じでしょうか? これはですね、ここ数年話題になっているAIを活用したサービスでして、「生成系のAI」なんて呼ばれたりしています。今までのAIとは、違っているんですね。これが今世間をにぎわせているんです!! なんで?AIなんて、ここ数年話聞くけど、今回は何が違うのよ? 【初心者向け】ChatGPTとは何か アカウント作成から使い方まで解説! | AI Academy Media ↑このサイトとか、わかりやすいっす。 どういうことかと言いますと。例えばですね、「こんな主人公のこんな小説書いて!」っていうテーマを指定すると、なんとすぐに書いてくれちゃいます!! AIが、小説を!! すごくないですか? これは画像でも同じ技術が使われていまし

              超話題の「ChatGPT」! ブログ界隈への影響は!? ポジティブに考えてみる。 - 食品開発男子のゆる〜いマナビブログ
            • 大垣市武道館東「ふづきの池」の花ハスを見てきた&ウナギ料理専門店「なまずや」で鰻丼の昼食 - 🍉しいたげられたしいたけ

              意図せずしてハスネタの連投になった。先週、実家にいたとき身内から中日新聞地方面の、こんな記事を見せられた。連れていけ、ということである。スキャンする余裕がなかったので、スマホ写真で示す。 中日新聞2024年7月4日付朝刊より 見出しと最後のほうに「午前中が(観賞に)おすすめ」と書いてあるが、すでに午後だったので「来週でいいですか?」と尋ねてみた。「いい」とのことだった。 ぐぐった。「ふづきの池」と言うらしい。「文月(7月)」の意かな。大垣市武道館の場所、知らなかったが実家から近いじゃないか。 四季の花 開花状況 | 大垣市公式ホームページ/水の都おおがき その来週すなわち今日(7/12)は、朝から本降りの雨だった。だが「車の中から見られるかも知れない。車の中から見られたらいい」とのことだったので、ダメモトで行ってみた。 幸いなことに、本当に車の中から観賞可能だった。 一般公道からハス池の外

                大垣市武道館東「ふづきの池」の花ハスを見てきた&ウナギ料理専門店「なまずや」で鰻丼の昼食 - 🍉しいたげられたしいたけ
              • 「涼感ハスまつり」2024年7月 - 🍉しいたげられたしいたけ

                最寄り駅前のテラス状スペースで、今年も「涼感ハスまつり」という展示をやっていた。 毎年ブログネタにしているから今年はもういいかなと思ったが、看板左側にこんな張り紙があったので今年もネタにする気になった。なにか変わったことがあると、記録したくなる。 弊ブログ勝手に恒例、Googleレンズによる文字起こし。改行位置、変更しています。 今季は連日の高温により、開花がすでに終わったものや、反して開花が遅れているものが少なくなく、遺憾ながら予定に対して展示品種数、鉢数ともに少なくなってしまったことを、お詫び申し上げます。 とよあけ花マルシェプロジェクト いえいえ毎年タダで見せていただいていることですし、お詫びには及びません、と私一人が言うべきことではない。 去年の拙過去記事はこちら。それ以前の何年分かの記事も、ここから辿れるはず。 www.watto.nagoya 弊ブログはアフィリエイト広告を利用

                  「涼感ハスまつり」2024年7月 - 🍉しいたげられたしいたけ
                • 日本語の音声認識はなぜ難しい? 精度向上のカギは、「辞書」と「文脈」にあった

                  スマホの音声入力では、マイクに向かってしゃべった声が、リアルタイムに文章として入力されます。その裏側を支えているのが「音声認識」。声を分析し、文字のデータに変換する技術です。「Alexa、電気消して」も「Hey Siri、明日の天気は?」も、音声認識なしには実現しません。 最近では、会議の音声から議事録を作ったり、音声で作業記録を付けたりなど、音声認識の用途は拡がりを見せているそう。一方で、「インタビューの文字起こしがうまくいかない」など、思うように認識されないという声も耳にします。 そもそも、音声認識はどうやって人間の声を認識しているのか? 日本語の音声認識はどこが難しいのか? 音声認識ソリューションを手がける株式会社アドバンスト・メディアの安藤さんに、音声認識の気になる裏側を聞きました。 株式会社アドバンスト・メディア 1997年に創業し、音声認識技術「AmiVoice」をコアとした各

                    日本語の音声認識はなぜ難しい? 精度向上のカギは、「辞書」と「文脈」にあった
                  • ツイキャスを始めた話。 - sun_ek2の雑記。

                    目次。 目次。 動画。 はじめに。 ブログで書こうと思っているネタ。 英語学習で得たネタ。 ツイキャスを始めた理由。 新たな収入源が欲しい。 ブログを土台に挑戦できる。 ブログの宣伝になる。 文章を書くのが捗る。 喋る練習になる。 発信力を持ちたい。 なぜYouTubeではない? 編集技術は研究活動には役に立たない。 一生懸命、身に着けた編集技術は将来、機械に取って代わられそう。 編集が使えないライブ配信の方が研究活動の観点から見ると実践的。 さいごに。 この文章を読んで、面白い!役に立った!...と思った分だけ、投げ銭していただけると嬉しいです。 ofuse.me 【宣伝】ギターも歌も下手だけど、弾き語りをやっているので、よければ聴いてください。 www.youtube.com 動画。 喋りが下手くそです。ごめんなさい。 twitcasting.tv はじめに。 ちょっと前から始めようと

                      ツイキャスを始めた話。 - sun_ek2の雑記。
                    • 「Google翻訳」、音声をリアルタイムで翻訳しテキスト表示する機能が追加

                      印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます Googleは米国時間3月17日、発話された内容をほぼリアルタイムで翻訳して文字にする機能を「Google翻訳」に追加すると発表した。 同社は、人工知能(AI)を活用するこの新機能を1月に発表していた。今回、英語、フランス語、ドイツ語、ヒンディー語、ポルトガル語、ロシア語、スペイン語、タイ語の8言語を対象に、「Android」搭載端末向けに今後数日かけて提供していく。 この機能は、連続して話される音声をその場で翻訳し、その結果をテキストとして表示していくというもの。 Googleの説明によると同アプリはこれまで、長い時間の発話、例えば会議の場での議論や、講義、話の語りに対応していなかったという。 この機能を利用するには、まずAndroi

                        「Google翻訳」、音声をリアルタイムで翻訳しテキスト表示する機能が追加
                      • 文字起こしAIの新顔「ReazonSpeech」、テレビで鍛えた音声認識の精度を試した

                        AI(人工知能)の研究開発ベンチャーである米OpenAI(オープンAI)が複数の高性能なAIを2022年秋に相次ぎ公開し、世界の技術者から注目を集めている。その1つはチャットで様々な質問に答える対話型AI「ChatGPT」。もう1つは、音声を解析して自動的に文字起こしする音声認識AI「Whisper」だ。筆者もWhisperを使った日本語での文字起こしに挑戦したところ、その精度の高さには舌を巻いた。 こうした中、国産の音声認識AIにも日本語の文字起こしの正確さを売りにする新顔が登場した。スマートフォンゲームや広告、フードデリバリーなどの事業を手掛けるレアゾン・ホールディングスが2023年1月18日に公開した「ReazonSpeech」だ。 ReazonSpeechは3種類のプロダクトで構成されている。1つめは、テレビ放送の録画データなどから音声コーパスを自動抽出する「ReazonSpeec

                          文字起こしAIの新顔「ReazonSpeech」、テレビで鍛えた音声認識の精度を試した
                        • 【サイトマップ】初心者のための「はてなブログ」の始め方| 「redoブログ」運営 - redoブログ

                          はじめまして、redo(れど)です。 本記事では運営者情報及びサイトマップを紹介しています。 また、これからはてなブログを始める方へ向けたブログ運営についてもまとめていますので、参考にしていただけると幸いです。 ちなみに、レドという名前は「redo(リドゥ)」は直訳すると「再びやりなおす、何度も繰り返す」ですが”粘り強さ・力強さ”を意味も込めて命名しております。 Googleでのキーワード検索時には”redo”では英語訳が出てきてしまうので、「redoブログ」と検索して頂けるとすぐに見つかります。 後付けですが、音楽が好きなのでローマ字変換でドレミファソラシドの”レド(redo)”とかぶせています。 本ブログではブログ初心者だった私が「redoブログ」の運営を通じて得た知識や経験、興味のあることなどお役立ち情報を幅広く紹介しています。 今回は改めて自己紹介も兼ねて、プロフィールや経歴もまと

                            【サイトマップ】初心者のための「はてなブログ」の始め方| 「redoブログ」運営 - redoブログ
                          • 英語学習を1年半続けてみた所感 - ゲームエフェクトデザイナーのブログ | A Real-Time VFX Artist's Blog

                            スミオさんが英語学習の取り組みについてとても素敵な記事をアップされています! そして私も現状について記事を書きたくなりました! 英語の学習を始めて約1年半になりますが、その間にどんなことを感じて・どれくらい力が上がった実感があるのかなどについてまとめたいと思います。 開始時点での英語スキル まず、英語学習を始めた当初に書いた記事がこちら。 英語の学習をはじめてみた1(アラジン編) - ゲームエフェクトデザイナーのブログ (新) 当時ディズニーアニメのアラジンを観て分からなかった単語を大量にメモっていますが、いやあ‥今見ると「こんな単語も分からなかったのか‥」というものが結構あります。。1年半経った今リストアップしていた単語をチェックしてみたら丁度半分くらいは分かったので、ポジティブに捉えればそれなりに成長しているのかなと(でも半分は今も分からない)。 ●学生時代 自分の場合、高校時代の英語

                              英語学習を1年半続けてみた所感 - ゲームエフェクトデザイナーのブログ | A Real-Time VFX Artist's Blog
                            • Android 神アプリ 集 野良アプリ おすすめ - kdroidwinの日記

                              Android 野良アプリ おすすめ 一覧になります。 RevancedやAdGuard等はもちろん 様々なアプリ(一部野良アプリでない)をまとめています。 グレーゾーンなおすすめアプリを多く含むので苦手な方はブラウザバック推奨 随時更新します。 更新履歴 動画 ファイル関連 音楽 ブラウザ 5ch SNS &メール 本 画像関連 APK関連 自動化 System Life 通信 For Developer kirikiriroid2などのエミュレーター系やゲームアプリ系は別記事にしています。 Android ゲームアプリ 関連 エミュレーターなど - kdroidwinの日記 動画 YouTube ReVanced extended Premium限定の機能が無料で使えると思っていただけたら良い(厳密には違う クライアント側のみにしか改造されない) またVP9や 再生速度2倍以上や低評価

                                Android 神アプリ 集 野良アプリ おすすめ - kdroidwinの日記 
                              • 最新コアアップデートはE-E-A-Tの「Experience」を重視するようになったかも?【SEO情報まとめ】 | 海外&国内SEO情報ウォッチ

                                グーグルの「コアアップデート」「ヘルプフル コンテンツ アップデート」に関する2つの情報をピックアップしてお届けする。 アップデートでE-E-A-Tの「E」を高く評価するようになったのではないかという意見と、アップデート関連のドキュメントで「寄生サイト」を明確に非推奨とするようになったという話題だ。 ほかにも、海外のGoogle SEOオフィスアワーを日本語で読めるコンテンツ、古いコンテンツの大量削除、ECサイトのSEOなどなど、あなたのSEO力とWeb力(と生成AI活用力)をアップさせる情報を、まとめてお届けする。 最新コアアップデートはE-E-A-Tの「Experience」を高く評価するようになったかも?ヘルプフル コンテンツ アップデートをグーグルが実施、寄生サイト対策に本腰か?英語版Google SEOオフィスアワーの日本語文字起こし(2023年8月): ARIA属性のSEO効果

                                  最新コアアップデートはE-E-A-Tの「Experience」を重視するようになったかも?【SEO情報まとめ】 | 海外&国内SEO情報ウォッチ
                                • 社長のボヤキ 第1期 まずは様子見

                                  社長のボヤキ 第1期 まずは様子見 編集長:Kazuhisa カメラマン:永山 亘 右:株式会社Yostar 代表取締役社長 李 衡達 左:Aetas株式会社 代表取締役社長兼4Gamer編集長 Kazuhisa(岡田和久) 2022年初頭,いつもどおりYostarに新年の挨拶がてら訪れて,李社長となんということのない話をダラダラとしていたら,脇にいたYostar社員が急に思い付いたらしい。「このくだらないダラダラした話を誌面に載せても面白いのでは?」 あれよあれよと話が進み,Yostarと4Gamerの社長二人が好き勝手にボヤくだけという謎の企画がスタートした。誌面になるので当社比50%減くらいでお届けしますが,手始めに様子見……ということで第一回をどうぞ。 Kazuhisa: ……いやもう,前振りもなくいきなり始めちゃいますけど,今回のこれって,いつもの李さんと私の会話を記事にしましょ

                                    社長のボヤキ 第1期 まずは様子見
                                  • 日本で「Pixel 6a」「Pixel Buds Pro」予約開始 6a購入でPixel Buds廉価モデル付属キャンペーンも

                                    Google Japanは7月21日、5月に発表した新型スマートフォン「Pixel 6a」と、アクティブノイズキャンセリング(ANC)対応ワイヤレスイヤホン「Pixel Buds Pro」の予約を公式ストアで開始した。7月28日の発売を予定しており、Pixel 6aが5万3900円、Pixel Buds Proは2万3800円。KDDIとソフトバンクでも予約を受け付ける。 Pixel 6aは、Pixel 6/6 Proの廉価版にあたるモデルで、5万円台の価格ながら上位モデルと同じ独自開発のSoC「Google Tensor」を採用しているのが特徴。カメラは、一部Pixel 6シリーズと同じものを採用しており、「消しゴム」や「リアルトーン」といったカメラ機能、文字起こし機能、リアルタイム翻訳機能など、GoogleのAI技術を格安で体験できる。 Pixel Buds Proは、同社初のANC対

                                      日本で「Pixel 6a」「Pixel Buds Pro」予約開始 6a購入でPixel Buds廉価モデル付属キャンペーンも
                                    • 動画を理解するためにGoogleが利用する4つの方法

                                      [レベル: 上級] Google の Gary Illyes(ゲイリー・イリェーシュ)氏と Lizzi Sassman(リッツィ・サスマン)氏がホストする Search Off the Record ポッドキャストの最新エピソードのトピックは「動画と検索」です。 このトピックについて、ゲスト出演した Danielle Marshak(ダニエル・マーシャク)氏が語りました。 この記事では、ダニエル氏が説明した、動画の内容を Google がどのようにして理解しているかの部分を取りあげます。 4 つの方法で動画を理解する 動画を理解するために Google が利用する方法としてダニエル氏が言及したのは次の 4 つです。 テキスト 音声 動画内の見出し 映っている物体 構造化データ テキスト: 音声 まず、Google が利用するのはテキスト情報です。 動画の音声を抜き出してテキスト化します。

                                        動画を理解するためにGoogleが利用する4つの方法
                                      • 津屋川堤防のヒガンバナを対岸の海津市北部浄水公園から見てきた - 🍉しいたげられたしいたけ

                                        東海地方のヒガンバナの名所といえばどこだろうと思って検索し、次のサイトがヒットした。 87spot.com どこでもよかったが、現住所と実家の往還の途上からちょっと寄り道すれば行けそうだったので、津屋川堤防というところへ行ってみようと考えた。 津屋川というのは、木曽三川の一つである揖斐川の支流だ。 上掲サイトから一部引用します。 津屋川の堤防沿い3kmにわたり彼岸花が群生。 見頃は9月中旬から下旬ごろ。その数は10万本ともいわれています。 だが Googleマップに見える駐車場に入ろうとしたところ、警備員から止められた。休日のため満車だったのだろう。 どこか車を停められるところはないかと行き当たりばったりで少し走ってみたら、運よく海津市北部浄水公園というところの駐車場が見つかった。以下、北部浄水公園と記す。 北部浄水公園は南濃梅園と隣接している。その名の通り春にはウメの名所として、地元では

                                          津屋川堤防のヒガンバナを対岸の海津市北部浄水公園から見てきた - 🍉しいたげられたしいたけ
                                        • ChatGPT, Bing AI, BardはWeb制作者を助けてくれるAIとなるか?

                                          ChatGPT, Bing AI, Bardは大規模言語モデルと呼ばれ、一般的には「チャットAI」や「会話AI」などと呼ばれます。 これらは様々な調べごとや、ちょっとした作業をするのにも適してるということは既にご存じだと思います。 Web制作者はもちろん、Web制作やプログラミングなどを勉強中の方も、ChatGPTなどの大規模言語モデルを使いこなすことで学習や仕事をスムーズに進めたり、あるいは手助けになりそうな予感がしたので、色々と試してみました。 これはAIをイメージしたAI生成画像です。この記事からメルマガ登録 すると、このような画像素材をプレゼントします。 今回試した大規模言語モデル ChatGPT(3.5 turbo): 無料で利用できるChatGPTの基本モデルです。2021年9月までの情報をもとに学習しています。 GPT-4: ChatGPT Plusに加入し、月額20ドル支払

                                            ChatGPT, Bing AI, BardはWeb制作者を助けてくれるAIとなるか?
                                          • Whisperとゲームバーで会議議事録作成を自動化する - TadaoYamaokaの開発日記

                                            先日、OpenAIが公開したオープンソースの音声認識ソフトウェアのWhisperを使って、会議議事録を自動作成する方法について記載する。 昨今、オンライン会議が主流になっているため、会議を録画/録音することが容易になっている。 Windows 10/11には、Xbox Game Barという機能が標準で備わっており、ZoomやGoogle Meets、Teamsなどでの会議が録画が可能である。 ループバック録音も可能で、再生している音声と、マイクからの音声をミックスして録音できる。 Xbox Game Barで録画した音声と、Whisperを組み合わせることで、無料で手軽に会議議事録を自動作成できる。 以下、手順について記載する。 事前準備 Xbox Game Barの設定 Windowsキー+Gで、Xbox Game Barを起動する。 歯車アイコンをクリックして、設定ウィンドウを開く。

                                              Whisperとゲームバーで会議議事録作成を自動化する - TadaoYamaokaの開発日記
                                            • 便利な単機能Windowsフリーソフトを5つ挙げる

                                              情報管理LOGの@yoshinonです。 Windowsを使っていると機能なアプリが多く、一つ一つは便利なんだけど、「この機能だけ使えるとなぁ」という場面があります。今回は、私が便利に使っている多機能ではないのだけど、単機能で便利!というフリーソフトをご紹介いたします。 サクッと軽くて無駄がないソフトばかりですので、良かったら使ってみてください。 まずは、毎日どころか四六時中ずっと使いまくっているクリップボード管理ソフトですね。単機能と書いてしまいましたが、究めようとすれば、実に奥の深いソフトです。 ダウンロード | 千草ウェブ 今まで、 コピー→貼り付け→コピー→貼り付け→コピー→以下省略 とやっていた作業が、 コピー→コピー→コピー→貼り付け→貼り付け→貼り付け と、動作をひとまとめにできるだけでも快適極まりないのに、さらに定型文やら、クリップボードの中身を自動整形できたりと、素晴らし

                                                便利な単機能Windowsフリーソフトを5つ挙げる
                                              • 究極のAIアシスタントに進化したグーグル「Pixel 4」の衝撃 | Forbes JAPAN 公式サイト(フォーブス ジャパン)

                                                筆者は、グーグルの新型スマホ「Pixel 4 XL」を使い始めてまだ日が浅いが、素晴らしいデバイスであることを痛感している。ユーザーインターフェースはよく考えられており、通知のアニメーションはきめ細かい。また、ロックを解除する際は手が近づくのを検知して、画面に触れる前から待機状態になる。 これまでグーグルのデバイスとは異なり、Pixel 4は間違いなく先進的なデバイスだと言える。Pixel 3はメモリ管理に問題があったため、動作が遅くて使い勝手が悪かった。それに比べるとPixel 4は大幅に機能がアップグレードされている。 その最たるものがアシスタント機能だ。例えば、ボイスレコーダーアプリは音声を自動的に文字起こしし、テキスト化された言葉を検索することができる。また、データはデバイスのみに保存されるので安全だ。このように、ユーザーがAIに指示しなくても便利で安全な機能が使えることこそが、筆

                                                  究極のAIアシスタントに進化したグーグル「Pixel 4」の衝撃 | Forbes JAPAN 公式サイト(フォーブス ジャパン)
                                                • Microsoft Wordウェブ版|音声文字起こし機能の使い方 | ライフハッカー・ジャパン

                                                  1.6万円台で買えるXiaomiの新作小型タブレット「Redmi Pad SE 8.7」。正直コスパ良すぎです

                                                    Microsoft Wordウェブ版|音声文字起こし機能の使い方 | ライフハッカー・ジャパン
                                                  • Googleアシスタントが、42言語で読みあげ対応。Googleさんは音声系が強い! #CES2020

                                                    Googleアシスタントが、42言語で読みあげ対応。Googleさんは音声系が強い! #CES20202020.01.09 12:456,703 中川真知子 Pixelスマホが欲しくなる理由がまた増えた…。 今年のCESで、GoogleがAndroid携帯のGoogleアシスタント読みあげ機能「Read It」をプレビューしてみせました。The Vergeによると、「Hey Google, read this(これ読んで)」というと、ウェブページの記事の本文を読みあげてくれるそうです。 これまでのスクリーンリーダー機能とは一味違う読みあげ機能自体は目新しいものではありませんが、今回Googleが紹介したのは、人が話しているような自然なリズムで読みあげてくれるものなのだそうです。しかも、アシスタントはリアルタイムで別の言語で読みあげることも可能。最大42か国語対応なんだそうです。だから、英語

                                                      Googleアシスタントが、42言語で読みあげ対応。Googleさんは音声系が強い! #CES2020
                                                    • Pocketalkを使った字幕付き配信|NUMAGUCHI, Shigeru

                                                      昨年の JAWS SONIC & MIDNIGHT JAWS に続き、JAWS-UG  (Japan AWS User Group)  の今年の秋のイベントは JAWS PANKRATION 2021 と称して24時間オンラインイベントを JAWS-UG が開催してくれました。今回の新しいチャレンジとして世界の AWS ユーザーに登壇してもらって、日本国外のデベロッパーやエンジニアの知見を共有してもらう、さらに日本のユーザーの知見も海外に発信しよう、というコンセプトでした。たとえば、今年の春の JAWS DAYS では AWS VP チーフエバンジェリストの Jeff Barr さんのセッションに同時通訳を入れて、リアルタイムに彼のセッション内容を通訳し、彼の知見の共有を試みました。しかし、この仕組みを他の登壇者全員にまで広げるには、正直なところ、予算と、事前準備の問題から難しいのは容易に

                                                        Pocketalkを使った字幕付き配信|NUMAGUCHI, Shigeru
                                                      • OpenAI API の Whisper API の使い方|npaka

                                                        「OpenAI」の 記事「Speech to text」が面白かったので、軽くまとめました。 1. Whisper API「OpenAI API」の「Whisper API」 (Speech to Text API) は、最先端のオープンソース「whisper-large-v2」をベースに、文字起こしと翻訳の2つのエンドポイントを提供します。 ・音声を文字起こし ・音声を英語に翻訳して文字起こし ファイルサイズは最大25MBで、以下のファイル形式をサポートしています。 mp3, mp4, mpeg, mpga, m4a, wav, webm 2. 使用料金使用料金は、以下で確認できます。 3. 音声を文字起こしGoogle Colabでの実行手順は、次のとおりです。 (1) パッケージのインストール。 # パッケージのインストール !pip install openai(2) 環境変数の準

                                                          OpenAI API の Whisper API の使い方|npaka
                                                        • 体力少な目の社会人大学院生が、睡眠時間を増やすために使ったツール集|Miki Kobari|小針 美紀

                                                          社会人大学院生になり早半年。 学校は楽しいのですが、課題と研究に常に追われていて、体力がしんどい…。 このnoteでは、同じように体力がつらい人に向けて、自分がどうにか日々を乗り越えていくために使っているツール類を共有します。 ※2023/12/10 生成AIによる研究DXが進んでおり、「7.生成AIによる論文検索と読み込み」を追記しました。 1.ノート、レポート作成1-1.notion:メインのノート基本、授業のノートはNotionにとっています。 学生だとNotionのプラスプランが無料になるため、利用しています。 ダッシュボードをどう設計するかは結構悩み、丸1日かけて作成しました。ダッシュボードの構成は以下です。 ①テーブル:レクチャーノート(講義内容をメモしたもの) ②テーブル:雑多なメモ(講義以外のメモ) ③テーブル:読書ノート(読んだ本のメモ) ④テーブル:経営学者一覧 ⑤表:

                                                            体力少な目の社会人大学院生が、睡眠時間を増やすために使ったツール集|Miki Kobari|小針 美紀
                                                          • ANDPAD TECH TALK 第13回 - 企業所属のRubyコミッター対談!後編 Ruby開発の裏話と今後の取り組み - ANDPAD Tech Blog

                                                            こんにちは!アンドパッドの鳩です。 アンドパッド開発本部がお届けするPodcast「ANDPAD TECH TALK」第13回が配信されました! 今回は、社外ゲストをお招きしたスペシャリスト対談回となっており、前編・後編と2回に渡ってお届けしています! ※ Podcast収録時が2022年末だったため、トーク内での「来年」は2023年を指しています。 出演 モデレーター: 櫻井 (エンジニアリングマネージャー) 社内ゲスト: 柴田(フェロー) 社外スペシャルゲスト: 遠藤侑介さん(クックパッド株式会社) Show Notes 第13回は、「Ruby開発の裏話と今後の取り組み」と題して、 アンドパッドからはフェローの柴田(@hsbt)、クックパッドさんからはRubyコミッターのmameさんこと遠藤さん(@mametter)に引き続きRuby開発の裏話と今後予定している取り組みを聞いてきました

                                                              ANDPAD TECH TALK 第13回 - 企業所属のRubyコミッター対談!後編 Ruby開発の裏話と今後の取り組み - ANDPAD Tech Blog
                                                            • 論より動くもの.fmを支える技術 〜Podcast初心者が使っているツール紹介〜 - STORES Product Blog

                                                              こんにちは、技術広報のえんじぇるです。 社内のLT大会にて「論より動くもの.fmの作り方」という発表をしました。本記事は、その発表内容をブログ向けに編集したものです。どのようなツールを使って論より動くもの.fmを運営しているのか紹介します。 社内LT大会についてはこちらをご覧ください ▼ 社内LT大会を始めてよかったこと - hey Product Blog 論より動くもの.fmとは 論より動くもの.fmは、CTOの藤村さんがホストとして、技術や技術にまつわるさまざなことを話すPodcastです。社外に向けても、社内に向けても、CTOがどんな人で、どんなことを考えているのかを知ってもらいたいという思いで、2022年4月から始めました。 実はCTOの発信を増やしたいプロジェクトは2021年下半期から始まっていました。 ほぼ毎週、藤村さんとネタ出し会をし「その話、ブログに書きませんか?」と提案

                                                                論より動くもの.fmを支える技術 〜Podcast初心者が使っているツール紹介〜 - STORES Product Blog
                                                              • 知らなきゃ大損!ボイスメモを超えた最新最強「無料アプリ」はこれ!

                                                                Google 認定トレーナー/イーディーエル株式会社代表取締役 「Google 認定トレーナー」および「Google Cloud Partner Specialization Education」の2つを保有する国内唯一の女性トレーナー経営者。 数時間でITスキルを劇的に引き上げる指導に定評があり、ITビギナーから絶大な信頼を得ている。早稲田大学第一文学部(教育学専修)卒。筑波大学大学院教育研究科修了(教育学修士)。筑波大学大学院非常勤講師。アルマ・クリエイション株式会社主催「クロスセクター・リーダーズサミット」2年連続最優秀MVP(2019年、2020年)。常陽銀行主催第3回常陽ビジネスアワード「ウーマノミクス賞」379プラン中第2位(2015年)。出版社勤務を経て専業主婦になるも、学習欲が高じて大学院に進学。在学中に事業欲が高まり、IT教育会社を起業し、現在に至る。「日本に最高のIT

                                                                  知らなきゃ大損!ボイスメモを超えた最新最強「無料アプリ」はこれ!
                                                                • Pixel 7限定の機能:このためだけにPixel 7買う価値あり?

                                                                  Pixel 7限定の機能:このためだけにPixel 7買う価値あり?2022.10.29 12:0079,835 Florence Ion - Gizmodo US [原文] ( そうこ ) Googleが提供するモバイルOS、Android。このAndroidを最大限享受できるのは、やっぱりGoogleが提供するモバイル端末Pixelシリーズ。ただ、最新Android端末ならPixel以外にもSmasungやOnePlusの端末もあります。 しかし、今年リリースされたPixel 7/ Pixel 7 Proでしか使えない機能というものがあって、これはPixel 7シリーズに搭載されているGoogle印のチップTensoe第2世代が鍵。そこで、Pixel 7シリーズ限定機能を試して、5点満点で採点してみました。限定機能って、Pixel 7シリーズを選ぶ理由になりますか? 咳・いびき検出機能

                                                                    Pixel 7限定の機能:このためだけにPixel 7買う価値あり?
                                                                  • ChromeがGoogleのAI「Gemini Nano」内蔵へ、2024年6月リリースのバージョン126から

                                                                    Googleが「Gemini Nano」モデルをChromeデスクトップクライアントに直接組み込むことを明らかにしました。これにより、製品レビューやSNS投稿といった短い文章を作成できる「Help me write」などの機能が強化されます。実装はChrome 126から始まります。 Developer Keynote (Google I/O '24) - YouTube Starting in Chrome 126, Gemini Nano will be built into the Chrome Desktop client itself. So you'll be able to deliver powerful AI features to Chrome’s billions of users without worrying about prompt engineering,

                                                                      ChromeがGoogleのAI「Gemini Nano」内蔵へ、2024年6月リリースのバージョン126から
                                                                    • 「非正規労働者の安定した雇用を支援する会」メールニュース(No.011., 2023.2.10)の転載拡散です - 🍉しいたげられたしいたけ

                                                                      私が加入している地域労組が原告側を全面支援し、また私も個人的立場から原告側を全力応援している鈴鹿大学裁判関連の記事です。前回はこちら。 www.watto.nagoya 今回転載するメールニュースの冒頭には、鈴鹿大学裁判の第2回期日が3月16日と約1ヶ月後であることが書かれている。思えば第1回期日が12月1日だったから、中間の期間の約3分の2が経過したことになる。 長いな… 裁判と並行して、三重県労働基準監督署への申し立ても行っている。 こちらは2月の初めに第5回目の委員調査というのが開催された。第4回目が去年の10月の末だったから、やはり裁判と同様のスローペースとしか言いようがない。 繰り返し書いているが、私は鈴鹿大学による非常勤講師の解雇は違法だと考えている。 そう考える根拠は多数あるが、今回は一件だけ、原告支援団体のツイッターアカウントによるツイートのブログカードを貼る。 【鈴鹿大学

                                                                        「非正規労働者の安定した雇用を支援する会」メールニュース(No.011., 2023.2.10)の転載拡散です - 🍉しいたげられたしいたけ
                                                                      • よく見る食品パッケージ、よく読むと知らないことが書いてある

                                                                        僕らは日々、多くの商品を目にしており、それらの多くはパッケージに包まれている。よく買う商品は、それこそ何十回、何百回も見てきたはずなんだけど、果たしてパッケージをよく見てきただろうか? マルシンハンバーグのパッケージに書かれたキャラクターの名前が「みみちゃん」で、今年60歳だなんて知っていただろうか?僕は知らなかった。 あばよ涙、よろしく勇気、こんにちは松本です。 1976年千葉県鴨川市(内浦)生まれ。システムエンジニアなどやってましたが、2010年にライター兼アプリ作家として自由業化。iPhoneアプリはDIY GPS、速攻乗換案内、立体録音部、Here.info、雨かしら?などを開発しました。著書は「チェーン店B級グルメ メニュー別ガチンコ食べ比べ」「30日間マクドナルド生活」の2冊。買ってくだされ。(動画インタビュー) 前の記事:チョコミントアイスは歯磨き粉で作れるか?(デジタルリマ

                                                                          よく見る食品パッケージ、よく読むと知らないことが書いてある
                                                                        • 画面の表示内容を文字起こし! 「Microsoft PowerToys」向けOCR機能の開発が進行中

                                                                          MicrosoftがWindows 11向けにリリースしている公式ユーティリティーアプリ「PowerToys」に、画面の表示内容や画像ファイルに含まれる文字を読み取る「OCR機能」が追加される予定だ。現在、実装に向けた作業がGitHub上で進められている。 PowerToysは、ディスプレイの指定した位置にウィンドウをスナップ配置できる「FancyZones」や複数のファイル名を一括で変更できる「PowerRename」、右クリックメニューから画像サイズを変更できる「Image Resizer」など、複数のユーティリティーを内包している。 開発が進められているOCR機能もユーティリティーの1つとして開発が進んでおり、画面内の指定された領域または画像ファイルに含まれる文字を認識してテキストとして取り込めるという。 画像ファイルのOCR機能は、GoogleのWebブラウザ「Chrome」でも「

                                                                            画面の表示内容を文字起こし! 「Microsoft PowerToys」向けOCR機能の開発が進行中
                                                                          • Education for Tomorrow - 緊急投稿「『新型コロナウイルス感染症の影響による学生等の学生生活に関する調査』について」

                                                                            本日2021年4月24日、ある公文書が私の手元に届きました。 「新型コロナウイルス感染症の影響による学生等の学生生活に関する調査」です(上記リンクよりダウンロード可能)。 この公文書については3月10日に、 コロナ禍における授業形態に関して大学生の意向及び各種メディアによる報道等、世論の状況について文科省内での議論・調査・レクチャーによって作成・共有された一切の資料・記録(文科省内での検討及び調査資料、また政務三役に行われたレクチャー資料及び録音データ、文字起こし、政治家から文科省職員に宛てて送られた大学の授業形態に関しての大学生の意向及び世論の状況に関連するメール、FAX、手紙等を含む一切の資料・記録) として請求したもので、結果的に開示された書類一式を指します。 正確には、 ・新型コロナウイルス感染症の影響による学生等の学生生活に関する調査概要 ・新型コロナウイルス感染症の影響による学

                                                                              Education for Tomorrow - 緊急投稿「『新型コロナウイルス感染症の影響による学生等の学生生活に関する調査』について」
                                                                            • ChromeのSpeechRecognitionで使って、音声ファイルの自動文字起こしをするアプリを書いた

                                                                              ChromeのSpeechRecognitionで使って、音声ファイルの自動文字起こしをするアプリを書いた SpeechRecognition APIを使って、wavやmp3などの音声ファイルを再生しながら文字起こしをするウェブアプリを書きました。音声ファイルをざっくりと文字に起こして、内容をざっくりと把握して聞きたい位置にジャンプする目的で作りました。 「Chromeの」としているのは、現時点(2020-12-31)ではSpeechRecognitionを実装しているのがChrome系のブラウザのみだからです。 SpeechRecognition APIを使って音声ファイルの文字起こしをするアプリを書いた。https://t.co/GSI1gOvLVE *Chrome + BlackHoleが必要 かなり無理矢理な方法でInputとOutputにBlackholeを設定して、loopba

                                                                                ChromeのSpeechRecognitionで使って、音声ファイルの自動文字起こしをするアプリを書いた
                                                                              • 【T2D3】T2の壁は、こうやって超える──RevCommに学ぶ、ARR1〜10億円を2年で達成する方法

                                                                                ALL STAR SAAS FUNDのメールマガジン「ALL STAR SAAS NEWSLETTER」購読登録受付中ALL STAR SAAS FUNDがお届けする 最新SaaSニュース、ブログ記事情報を配信するSaaS業界にいる方は必見のメールマガジン! SaaS起業家の“圧倒的な成長”を支援するべく、ALL STAR SAAS FUNDでは全5回からなる短期集中型の連続セッション&オフィスアワーを開催しました。その名も「ALL STAR SAAS BOOT CAMP」です! ARR 0〜1億円のシード企業、あるいは起業準備中のSaaS起業家にとって、ARR10億円を達成するまでに築く基盤こそがT2D3達成のコアになります。数多くのSaaS起業家へ支援を続けているVCとしての経験、そして学びを、また新たな起業家たちへ伝えていきたいと、私たちはそう考えています。 そこで、課題を乗り越えて

                                                                                  【T2D3】T2の壁は、こうやって超える──RevCommに学ぶ、ARR1〜10億円を2年で達成する方法
                                                                                • MEO対策(ローカルSEO)で簡単に店舗に集客する方法

                                                                                  こんにちは大木です。 今日は店舗集客が上手く行ってない方や、MEO対策が上手く行ってない方向けに、MEOの極意を解説します。再現性あるやり方だと思うのでできる所から実践して行って欲しいと思います。 MEO対策は海外では正しくは「ローカルSEO」と言うんですけど、Googleマップで検索された時に検索上位に表示される様にするためのものです。 ※MEOとは、Map Engine Optimizationの略で、和製英語です。SEO業界にいた2010年頃には既にこの言い方がSEO業者には広まっており、2020年現在定着している様に見受けられるため、敢えて「ローカルSEO」ではなく伝わりやすい「MEO」を使用しております。個人的には言い方はどちらでもいいです。 ※以下、ほぼ文字起こし MEO対策(ローカルSEO)は店舗集客にかなり効果的MEOのメリットは凄くでかくて、店舗集客に1番使える上に無料で