アプリや専用デバイスを使った、日本語の「自動文字起こし」に関連するサービスには、近年多くの関心が集まっている。背景にはスマホやAIを活用する音声認識のテクノロジーが飛躍を遂げたことや、コロナ禍の影響を受けてリモートワークが普及したことなどがある。iPhoneに対応する「UDトーク」も自動文字起こしに対応する注目のアプリだ。開発者に特徴を聞いた。 iPhone/iPadでも使える日本語対応の自動文字起こしアプリ コミュニケーション支援・会話の見える化アプリをうたう「UDトーク」は、Shamrock Records(シャムロック・レコード)の代表兼エンジニアである青木秀仁氏が開発を手がけている。 モバイル版アプリはiOS/Android/Fire OSの各プラットフォームに対応する。ほかにも音声認識の結果を修正したり、事前に作成した原稿をスマホやタブレットに送信する一部機能を搭載するMac版/
Mantra Engineは、日本語の漫画の画像を1ページ最短30秒で英語に翻訳反映できる、Mantra(東京都港区)製翻訳エンジン。訳文は手動修正できる他、せりふのフォントやサイズ、色の変更など、レイアウト作業をサービス上で実行可能。他にも訳文を再度日本語に翻訳し直し、内容が正しいか確認できる逆翻訳機能を搭載する。 出力形式は、jpgやpdfなど。翻訳した作品は、pixivや通販サイト、ダウンロード販売サイトなど、FANBOX以外でも自由に利用、販売できる。サービス退会後も、翻訳作品の著作権や知的財産権はクリエイターに帰属する。 ピクシブは「FANBOXへのアクセスの約4割は海外からで、海外における日本のコンテンツのファンは日々増加している。クリエイターのみなさまが、気軽に翻訳作品を届けられる環境を作るため、自動翻訳エンジンの提供を実現した」とサービス提供の経緯を説明している。 Mant
ビジュアルクリエイティブディレクターのMuRo氏が発表した「Shoost」はユニークなツールだ。「いい感じの雰囲気の絵を簡単に作りたい! キャラクターをきれいに魅せたい!」という思いから生まれた本ツールは、3つのレイヤーを重ね合わせ、その上から撮影効果を付与することで、画面・映像を作るという今までにない立ち位置のツールと言える。しかしながら、独特なツールゆえに、どのようなものかイメージがわかない人も多いかもしれない。 本記事では、「Shoost」を実際に動かし、簡単な作品を作りながら、機能や優れている点を紹介していく。 人物画像+背景画像 まず、公式にも紹介されている、人物画像と背景画像を組み合わせた使い方を試す。 「Layer 2」 に人物画像を配置 まずは、主役となる人物画像から配置する。「Layer 2」を「Import Item」に設定し、画像アイコンをクリック。今回は「いらすとや
筆者のように、「Mac」をメインの作業用マシンとして使用している場合、マシンを生活と仕事のあらゆる問題に対応できる状態にしておく必要がある。つまり、適切なパフォーマンス向上アプリ、セキュリティアプリ、生産性アプリをそろえておかなければならない。 「CleanMyMac X」 Macをスキャンして、不要なファイルやマルウェアを削除 CleanMyMac Xは、Macに蓄積される不要なデジタルデータを取り除く最良の手段である。このアプリを使えば、ストレージスペースを解放できるだけでなく、マシンの動作を高速化することも可能だ。Macをスキャンして、マルウェアや大きな隠しファイル、古いアーカイブ、未使用のアプリを削除する機能を備える。何もしなければOSの奥深くに埋もれてしまう不要なデジタルデータを見つけ出す能力が非常に優れており、筆者はいつも驚嘆させられる。 「Authy」 ほぼすべてのデバイスと
ソニーコンピュータサイエンス研究所(ソニーCSL)が開発した楽曲製作アプリ「Flow Machines」のモバイル版「Flow Machines Mobile」の配信が、2021年9月9日から開始されました。ユーザーが打ち込んだメロディーを基に、AIがユーザーの望むスタイルに合わせたメロディーを自動生成してくれるとのことで、どんなものなのか実際に触れてみました。 Flow Machines – AI assisted music production https://www.flow-machines.com/ Flow Machines mobileはiOS向けに提供されているとのことですが、記事作成時点でiPadにのみインストールが可能とのことでした。そのため、iPadでApp Storeにアクセスし、アプリをインストールします。 Flow Machines mobileを開くと、SN
多くの人が学習しているビジネス英語。海外企業とやり取りをする部署や外資系企業のビジネスパーソンは、どのような学習方法で英語力を身に付けたのか。書籍、アプリ、LINEなど、今すぐ参考になる様々な学習法が見つかった。 <前回(第8回)はこちら> アマゾンジャパンで、コミュニティキャンペーンのプロジェクトリーダーとして15人のチームを引っ張る山本薫氏。メンバーの中でただ1人の日本人だ。当然、コミュニケーションは英語だが、実は「学生時代は再履修で4年次にようやく必修の単位を取り終えたほどだった」。 留学経験も海外出張の経験も無く、英語学習を始めたのは40歳を過ぎてから。外資系IT企業に2年間在籍したが、英語は苦手なまま。43歳で転職したアマゾンジャパンの面接でも、英語は苦手だと宣言したという。すると、レベルに応じたレッスンプログラムがあるから問題ないとの返答を得た。 入社後さっそく初級者向けコース
📕書籍化お知らせ📕 本書が翔泳社様から「動かして学ぶ!Flutter開発入門」として出版されることになりました!! https://www.shoeisha.co.jp/book/detail/9784798177731 書籍化できましたのは、読者の皆様のご高評のおかげです。いつもご利用本当にありがとうございます! 書籍の内容は、2023年4月15日の内容と概ね同じになっています。 ただし、書籍の方は、イラスト/手順の項番/キャプションなどが非常にわかりやすくなっており、プロジェクト形式でのサンプルソースコードも提供されます。 🚨有料化のお知らせ🚨 書籍化に伴う諸般の都合により、出版された部分の削除や非公開などはしないのですが、出版日に有料化をさせて頂く予定です。 今まで2年以上無料で公開をさせて頂いた状況もあり心苦しいのですが、ご理解頂けますと幸いです ⚠️⚠️⚠️翔泳社様の書籍
Microsoft、文字起こしアプリ「Group Transcribe」を公開 2021 3/16 Microsoftは3月上旬、対面での会議や会話のためのリアルタイムのテープ起こしと翻訳を提供する「Group Transcribe(グループ転写)」のiOSアプリをリリースしました。会議の参加者がそれぞれのデバイスで使用することができます。 メモを取らずに会議に集中できる優れもの 最先端のAI音声・言語技術を搭載したGroup Transcribeで、会話の参加者は共有セッションを開始し、それぞれが携帯電話のマイクを使用して、リアルタイムで誰が何を言ったかを示す、非常に正確なトランスクリプトをキャプチャできます。 会話の高品質な記録に自信を持つことで、ユーザーはメモを取る必要がなくなり、会話そのものに注意を集中させることができます。トランスクリプトは、共有したり、再配置も簡単に行う
※本記事はアフィリエイトプログラムによる収益を得ています TwitCasting(ツイキャス)で知られるモイが、1枚のキャラクター画像から顔アニメーションを生成できるアプリ「ツイキャス Vメイカー」をAndroid先行でリリースしました。誰でも簡単にバーチャル実況配信ができることを目的として開発されたスマートフォンアプリです。 画像を選択 同じ動きをします そのまま実況できる 動かす部位のパーツ分けやモデリング、専用の機材や専門的な知識などは不要。1枚のキャラクター画像をアプリに読み込ませるとAIが顔アニメーションを自動生成し、自分の顔の動きに合わせてリアルタイムで表情をトラッキングしながらキャラを動かせます。 ライブ配信アプリの「ツイキャス・ライブ」や「ツイキャス・ゲームズ」と組み合わせると、Vメイカーで作成した2Dキャラクターで簡単にVTuber実況配信を行えるとのこと。また、動きがつ
元Evernote CEOで、現在All Turtlesの代表をつとめているPhil Libinさんから、すごいアプリの発表がありました。 テレビカンファレンスから、ゲーム実況、プレゼンテーションのやり方さえも変えてしまう画期的なアプリなのですが、問題はその発音です。「mmhmm」(んーふー)という、英語であいづちを打つときに発する音がアプリ名になっています。 んーふー。なるほど。 mmhmm は、最も簡単に紹介するならば「Zoom や Google Meetなどのテレビ会議用のプレゼンアプリ」といえます。しかしその可能性は、はるかにそれを上回るものです。 その威力を見てみましょう。 Zoomを遥かにこえる自在の背景映像 まず、mmmhmm ではZoomのバーチャル背景のような画像をすぐに作り出すことができます。 たとえばこのように、テレビショーのホストのように、画像を後ろに呼び出すことが
新年、明けましておめでとうございます。2020年の元旦から歌声合成の世界での新サービスのニュースです。ちょうど1年前「VOCALOIDの競合となるのか?中国人天才少年が開発した歌声合成ソフト、Synthesizer Vの破壊力」という記事とともにデビューしたSynthesizer Vが、Webブラウザで動作するWeb Synthesizer Vとして新たに誕生しました。これはWindowsでもMacでもWebブラウザ(Google Chrome推奨)で動作する歌声合成ソフトで、ピアノロール画面でメロディーを打ち込み、歌詞を入力すれば歌わせることができるというもの。 Web Syntheseizer Vのページを開くだけですぐに使うことができ、インストールも不要。そして何より、無料で誰でも使うことができるというのが大きなポイントです。開発しているのは東京都内にあるスタートアップ企業、Drea
Pixel 4 シリーズの登場に併せてリリースされた Google 純正の録音アプリ「レコーダー」は音声を文字に起こす素晴らしい機能を搭載しており、今後、人々のライフスタイルを大きく変える可能性を秘めている思いますのでアプリを紹介します。 録音アプリやボイスレコーダーアプリは既に様々なものが Google Play ストアで配信されているので「レコーダー」は特段珍しいアプリではありませんが、録音データの活用の幅が広がるという意味において「レコーダー」は注目のアプリだと言えます。 注目のアプリと言っても基本的な機能や使い方は他の録音アプリ・ボイスレコーダーアプリと大体同じです。録音開始ボタンを押して録音を開始し、終了ボタンを押して停止します。「保存」を押せばデータとしてスマホに保存されます。 アプリの特徴が録音データの再生画面です。再生ボタンの上にあるタブでモードを選択できるようになっており
今年リリースされ話題いになったWebサービスやアプリを振り返る毎年恒例企画「2019年に話題になったWebサービスまとめ」。AppleのApple Arcadeを始め、サブスクリプションサービスやマッチングサービスが多く登場しました。 2019年はサブスクリプションサービスが多く誕生今年で9年目を迎え、1年を通してリリースされ話題になったWebサービスやアプリを振り返り企画。2019年はAppleが「Apple Arcade」「Apple TV+」を開始、Disneyは「Disney DELUXE」を開始するなど、サブスクリプションサービスが多数リリースされました。 変わったところでは、毎日1本ドリンクが選べる自動販売機のサブスクリプションサービス「everypass」、全国のホステルに泊まり放題になる「Hostel Life」、子どもの成長にあわせておもちゃを送ってくれる「IKUPLE」
2019年は、サブスク型、マッチング、AI関連のサービスが流行した一年になった。 また、時代背景から、副業・フリーランス向けのサービスも普及。 食・旅行・趣味など、様々な面で”無駄をなくす”サービスが多いことも特徴的だった。 今回まとめた、2019年話題のサービスは11項目・総勢50選。 フリーランス向け サブスク型 マッチング 仕事効率化 稼げる副業 ライフスタイル 「食」関連 趣味 旅行 女性向け 学生・学習者向け 開発者の想いがこもった普及すること間違いなしのサービスばかりだ。 50選という膨大な記事になってしまったため、ブックマークして暇な時に確認することを強くオススメする! フリーランスを助ける便利なサービス3選 1. フリラテ フリラテは、これから副業・フリーランスなど「個人で仕事を始めたい」と思っている方のための支援サービス。 フリーランス一歩目を間違わないために、個人での仕
このnoteは、プログラマでない方でも、下記のようなメルカリ風のサービスを簡単に1時間でつくる方法を書いています。 はじめに「メルカリみたいなサービス、どのくらいで作れる?」 プログラマを生業としている方なら一度はこう尋ねられたことがあるのではないでしょうか。メルカリでなくてもUberやAirbnbだったりするかもしれません。いずれにせよ、話題のサービスを引き合いにだして、少しコンセプトを変えたサービスを作りたいといった相談をされたことのある方は多いのではないかと思います。 この問いに対して 「いやいや、メルカリ作るなんてどのくらい費用がかかると思ってるんですかー」 と、かわすのもいいでしょう。まともに作るとしたら初期バージョンでも数百万〜の規模になる可能性があり、開発リソースを用意するのも大変ですし、一生懸命ヒアリングして見積もったとしても、そもそも相手にそれなりのやる気がないと企画倒れ
皆さんはどのような方法で最新の技術や、コードのTipsを収集していますか? はてなブックマークやTwitter, GitHubなど様々あると思います。 私はテックブログを使った情報収集をしています。今回はエンジニアが見るべきおすすめのテックブログをいっきにご紹介します。 テックブログとは? ご存知の方も多いと思いますが、テックブログとはWEBサービスやゲーム等を提供している企業が、自社で使っている技術や開発手法を紹介するブログです。デベロッパーブログとも呼ばれます。 エンジニアが持ち回りで書くことが多いので、そこで働いている人のこともわかっちゃいます。 普段使っているサービスがどのような言語でできていて、どのようなフレームワークを使っているか、どんなツールを利用して開発しているのかが載っているのでとても刺激的な内容ばかりです。 転職、新卒の会社選びにも役立つ!? 転職する際に気になるどんな
💡新記事の紹介 言語学習から一歩先に進んだ記事書きました →【保存版】個人開発の進め方 -全5ステップ- 良ければ見てみて下さい! はじめに 0からプログラミングが学べるおすすめのチャンネルまとめてみました。 IDEのショートカットやリファクタリングも学べます。 コメントを頂いたので、記事にしようと思いました。 → 新卒, Webサービスを作ってみた話 ---絶対に手を動かしながら、やってください!--- 動画を進めては止めて進めては止めて、です。 3倍以上時間はかかりますが、、 ディアルディスプレイ推奨です。 Android Android Instagram Clone App インスタグラム似のアプリを作ります。 1動画は短いのですが、100本の超超大作です。 中盤くらいから勝手に手が動くようになります。 動画と同じくらいのスピードでコーディングできるようになるので、ある意味すごく
Sizzyというツールがあります。 様々なサイズの画面を同時に表示し、レスポンシブレイアウトがどうなるかを一気に確認できるという便利なツールです。 スマホ向けWebサイトを開発している人なら、持っていると非常に便利でしょう。 参考:レスポンシブの確認ツール、後発だけに便利!スマホ・タブレットの主要なデバイスでの表示確認が同時にできる -Sizzy / 『Sizzy』様々なデバイスでのサイト表示を確認出来る便利サイト さてこのSizzy、元々無償のChromeエクステンションだったのですが、先日2019年7月に単独のアプリとして有償化されました。 一人あたり月5ドル(団体割引あり)のサブスクリプション制です。 以下は作者のKizte( Twitter、Medium、Webサイト )がその理由や経緯を綴った記事、GitHub stars won't pay your rentの日本語訳です。
紙の書類をスマートフォンのカメラで撮影し、「LINE」で画像を送ると、約3秒でテキスト化して返信する――。こんなAIアプリを、長崎県西海市のベンチャー企業「西海クリエイティブカンパニー」が7月3日からLINE上で公開している。ユーザーがOCR(光学文字認識)ソフトなどを用意しなくても、書類や帳票を簡単にデータ化できる点が特徴だ。 記者が試しに名刺を撮影して公式アカウントに送ったところ、すぐに氏名や企業名、所属部署、オフィスの住所、電話番号、メールアドレスなどを正確にテキスト化して返信してくれた。 このアプリの名前は「文字起こし ばりぐっどくん」。LINE上で友だち申請すると、誰でも利用できる。同社の本業はデザインやWebメディアの運営だが、西海市内の企業・役所から紙文書のスキャンやデータ入力作業を減らし、地域全体の業務効率を高める狙いで開発したという。 だが、リリースすると他の地域からも利
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く