Branewは様々な出版社の最新の技術書に出会えるサイトです。最新の技術やトレンドの情報を手に入れましましょう。 最新情報を取得するには、RSSフィードが便利です。RSSリーダーを活用して手軽に最新情報に出会いましょう。 https://branew.dev/feed
AIを使ってフォーカスの合っていない、または解像度が不足している写真を鮮明にする技術として、以前、GoogleがPixel 7に実装した「ボケ補整」を紹介しました。 関連記事:Pixel 7で昔の写真を鮮明に。AI「ボケ補整」を試してわかったその実力(CloseBox) 関連記事:iPhone 14 Proを買ったばかりなのにPixel 7を予約したただ一つの理由(CloseBox) うまくいくものも多く、少しずつ楽しむつもりでいたのですが、鮮明にしたい数百枚の写真は一気に補整を終えてしまい、実はそれ以降、Pixel 7を使うことはなくなってしまったのでした。 それというのも、Googleの技術は期待していた顔以外の部分の高精細化が判別できるレベルではなかったからです。以前から使っていたReminiというiOSアプリの方が写真全体の高精細化が可能なアルゴリズムを追加実装していたこともあり、
ネットや本などで文章を読んでいても、なかなかスラスラとテンポよく読み進められなかった経験をしたことがある人も多いはず。一般的に、日常で言葉を話すスピードに比べて文章を目で追って読むスピードは遅くなってしまうというのがその原因なのですが、逆転の発想で文字を次々に表示させ、まるで話すようなテンポで文章を読み進めていけるようにする技術が「Spritz」です。 Spritz http://www.spritzinc.com/ Spritzを使い、1分あたり250ワード(250wpm)というスピードで文章を表示させてみたイメージがこちら。もとの文章に沿って文字が次々に表示されていくために、読む側は視線をまったく動かすことなく読み進めることができます。 サイト内の各ページには以下のようなアイコンが設置されており、クリックするとページ内の文章をSpritz画面で表示させることが可能になっているので、いろ
ぼかりすが実現するもの 鍵盤楽器ができる人は、DTMソフト上でわざわざ音符を置いていくような手間はかけない。MIDIキーボードでさっと弾いて、それを編集して使う。ギタリストならば、自分で弾いたものを録音する。しかし、VOCALOIDは基本的に手入力。そこをショートカットしたいのだ。 「それなら自分で歌った方が早いよ」。そんな人にとって、Netぼかりすはきっと福音となるだろう。自分で歌ったボーカルを、初音ミクや鏡音リン・レン、巡音ルカ、がくっぽいどといったVOCALOIDの歌声に変え、細かい“調教”をしなくても、歌った通りに再現してくれるのだから。 「ぼかりす」(VocaListener)は、独立行政法人・産業総合研究所(産総研)の情報技術研究部門メディアインタラクション研究グループ 後藤真孝研究グループ長と、中野倫靖特別研究員らが開発した。歌声を聞き取って、その歌い方の特性をまねて歌声合成
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く