朝日新聞社は4月2日、指定した字数や割合に長文を要約する「長文要約生成API」を開発したと発表した。評価用途に限り、無償で利用できる。会議の議事録や、採用活動で受け付けるエントリーシートの速読などに役立てられるという。
ボーカルや複数の楽器で構成された音楽データを、機械学習を用いてそれぞれの音に分類したファイルとして出力する「spleeter」がGitHubで公開されています。ボーカルの声や伴奏の部分だけを抽出できるとのことで、実際に使ってみました。 deezer/spleeter: Deezer source separation library including pretrained models. https://github.com/deezer/spleeter 以下のURLにアクセスすれば、spleeterでサンプルの楽曲を分離することができます。 spleeter.ipynb - Colaboratory https://colab.research.google.com/github/deezer/spleeter/blob/master/spleeter.ipynb#scrollTo=
和白水処理センターに集められた下水から回収、抽出された再生リン。最終処理を経て肥料となり、8月下旬から農家への販売が始まった。博多湾の水質環境改善を目的に始まった処理は、市民生活と農業をつなぐ新たな可能性になろうとしている=福岡市東区で、津村豊和撮影 福岡市に七つある下水処理施設の一つ、東区の和白(わじろ)水処理センター。積み上がった白い結晶を職員に両手のひらですくってもらうと、指の間から砂のようにさらさらとこぼれ落ちた。臭いも全くない。 結晶の正体は「再生リン」。窒素、カリウムと並ぶ化学肥料の3要素の一つのリン酸を、市民生活で出た下水から回収、抽出したものだ。市は博多湾の水質汚濁を防ぐため、1996年にリンの回収事業をスタート。さらに、国土交通省が開発した回収技術を今年4月に導入したことで回収量が15倍になり、年間に最大で150トンを見込めるようになっ…
「Excelデータをプログラムで扱うのなら、VBA(Visual Basic for Applications)を使うべし」。多くの人はそう思っているでしょう。もちろんVBAはMicrosoft Officeのソフトを操るのにとても便利なプログラミング言語ですが、弱点もあります。 その1つが、Officeにしばられてしまうこと。業務に必要なデータ量がExcelや「Access」のカバーする範囲で収まらなくなったら、もう扱えません。 また互換性の問題から、Windows上で書かれたVBAのソースコードは基本的に、macOSやLinuxでは動かせません。VBAはプログラミング初心者にとって理解しやすい一方で、コードが冗長になりがちという側面もあります。 今からプログラミングを学んで業務を自動化したいなら、筆者はPythonをお薦めします。Pythonはシンプルで勉強しやすく、ライブラリーが豊富
対象読者 Excel/PowerPointなど、一般的なツールの操作を理解している人 RPAツールを用いて業務を自動化したい人 PDFアクション PDF(Portable Document Format)とは、Adobe社が開発したページ記述言語PostScriptをベースにしたドキュメント形式のこと。環境やプリンターによらずに保存・転送・閲覧・印刷が可能であり、電子ドキュメントにおける事実上の標準のファイル形式として広く使用されています。ファイルの中に、テキストデータと描画命令、画像などのコードが圧縮されて格納されています。 Power Automate for Desktopでも、これらのファイルを扱うアクションが用意されています。 PDFからテキストを抽出 PDFから画像を抽出 PDFからテーブルを抽出 新しい PDFファイルへのPDFファイルページの抽出 PDFファイルを統合 本稿
インターネットを利用していると「Googleマップの検索結果をスプレッドシートにまとめる」「Twitterのフォローを全て解除する」といった手動でポチポチ作業するのは面倒な作業が必要になることがあります。Google Chrome向け拡張機能「Browserflow」を使えばブラウザ上の面倒な作業をプログラミングの知識がなくとも簡単に自動化できるとのことなので、実際にBrowserflowを使って使い勝手や自動化の方法を確認してみました。 Browserflow - Automate your work on any website https://browserflow.app/ Browserflowの公式サイトにアクセスすると、拡張機能配布ページへリンクする「Add to Chrome」と記されたボタンが用意されているのでクリックします。 配布ページに移動したら「Chromeに追加」
ランキング参加中GPT 目次 ChatGPTの面白い使い方 この書き出しはChatGPTに書いてもらった。 テンプレートで出力フォーマットが指定できる アメリカ合衆国の大統領リスト 大統領リストの出力 固有表現を抽出させる 固有表現とは 固有表現抽出 ChatGPTの回答 ChatGPTは感情分析が出来る 次の分析対象文を感情分析して 分析対象文の感情分析結果 アメリカ国家の歌詞を感情分析して 日本の国歌「君が代」の歌詞を感情分析して ChatGPTにエッセイを書いて貰う ペットにするのに最適な蛇を教えて 「ボールパイソンはペットに最適」というエッセイを書いて ChatGPTが書いた「ボールパイソンはペットに最適」 まとめ ChatGPTの面白い使い方 こんにちは、私はブロガーのシロッコです。最近、人工知能の言語モデルChatGPTが大きな話題となっています。ChatGPTは、自然言語処理
以前DTMステーションで紹介したことのある、ソニー・ミュージックエンタテインメントのプロジェクトSoundmain(サウンドメイン)。ここでは、ソニーグループが研究・開発する最新の音楽関連テクノロジーがいち早く機能として実装され、クリエイターが利用できるようになっているのですが、今回ボーカル抽出という新機能が追加されました。これは、ブラウザ上で使える音楽制作プラットフォームSoundmain内の音楽制作サービスSoundmain Studio上で使える機能で、音源からボーカルのみを抜き出し、手軽に高品質なボーカル音源を作成することができます。 つまり楽器などの演奏も消せるわけなのですが、驚くべきはその精度。ボーカル抽出といえば、さまざまなソフトで行うことが可能ですが、声がシュワシュワになってしまったり、オケが残ってしまったりすることがありますよね。それに対し、Soundmain Studi
オーストラリアのニューサウスウェールズ大学は2024年5月7日、超音波を使って、味を損なうことなくコールドブリュー(低温抽出)コーヒーを3分以内で作る方法を開発したと発表した。この研究についての論文は『Ultrasonics Sonochemistry』に掲載されている。 ホットコーヒーと比べて、滑らかで酸味や苦みが少ないコールドブリューコーヒーを好む人は少なくない。しかし、冷水でゆっくりと風味を抽出するのには12時間から24時間かかるため、飲みたい時に手軽に用意できないのが難点だった。 研究チームは、コールドブリューの抽出プロセスをスピードアップすることを目指し、挽いたコーヒー豆の抽出を早めるために超音波リアクターを使用する手法を開発した。具体的には、既存のBrevilleのエスプレッソマシンに、研究チームが特許を持つ独自の音波伝達システムを搭載。ボルトで固定された変換器を、金属のホーン
[電話予約の無人化]Amazon Connect + GPT-4 JSONモード + Whisperで、1回の発話から予約情報(日付,時間など)を抽出 はじめに Amazon Connect + GPT-4 JSONモード + Whisperで、1回の発話から予約情報(電話番号,日時,名前,人数)を正しく抽出できるか検証しました。 コールセンターでは、有人対応から無人対応に変更したいニーズが増えているように思います。 電話予約の無人対応を想定し、1回の発話で、下記の5つの予約情報を抽出できるか確認します。 お名前 電話番号 予約日 予約時間 人数 発話で予約情報を抽出する方法として、GPT-4 Turbo のJSONモードを利用します。 JSONモードの詳細は、下記を参照ください。 例えば、「名前はクラスメソッドで、電話番号は09011111111。来週の火曜日の19時に4名で予約できます
このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 X: @shiropen2 米パデュー大学と米ノースカロライナ州立大学に所属する研究者らが発表した論文「Extracting and Storing Energy From a Quasi-Vacuum on a Quantum Computer」は、量子力学の性質を利用して、一見空っぽに見える空間からエネルギーを抽出し、瞬間移動させ、さらには貯蔵する方法を実証した研究報告である。 量子力学の世界では、完全に空の空間は存在しない。どんなに何もない場所でも、量子場の微小な揺らぎ(真空の量子揺らぎ)が常に存在する。これは、ハイゼンベルクの不確定性原理に基づく現象で、エネルギーと時間の
「PowerToys」という無料ツールをご存知でしょうか。Windowsをさらに使いやすくする十数個の機能をまとめた、Microsoftの公式ツールです。カユイところに手が届く数々の機能はいちど使うと手が放せなくなるほどで、どうしてこれがWindowsに最初から組み込まれていないのだろうと首をひねってしまうほどです。 そんな「PowerToys」は、今年9月に入って登場した最新版の「0.62.0」で、これまでなかった新機能がいくつか追加され、より充実したツールへと生まれ変わりました。 今回は最新の「0.62.0」で追加された機能も含め、筆者が「これは特に便利」と感じたPowerToysの便利機能を厳選して紹介します。ピンと来る機能があれば、ぜひこの機会にインストールして試してみてください。ダウンロードはMicrosoftストア、もしくはこちらから行えます。
画像ファイルからテキストを抽出したい場合、何らかのOCR(光学式文字認識)ソフトウェアを利用するのが一般的だ。しかし、BetaNewsは1月6日(米国時間)、「Windows 10 has a secret way to grab text from images」において、特定のソフトウェアを使わずに、Windows 10に付属する標準機能だけでテキストの抽出を行う方法を伝えた。なお、この方法は現在のところ英語のテキストにしか対応しておらず、残念ながら日本語は読み取ることができない。 Windowsの標準機能といっても、何らかのORCツールが標準でインストールされているというわけではない。したがって、スタートメニューのアプリケーション一覧を探しても該当する機能は見つからない。Betanewsで紹介されているのは、Windowsの検索ユーティリティとスクリーンショットを取得するための「切り
毎月勤労統計調査の抽出率逆数の扱いがおかしいことについて、10月に「毎月勤労統計調査の改善に関するワーキンググループ」参加者にあてて情報提供していた。その内容が、11月5日の第3回会議 で言及されたようである。 この件についてこれまで書いてきた記事は、つぎの5本。 毎月勤労統計調査、今後のベンチマーク更新で大きなギャップ発生のおそれ https://remcat.hatenadiary.jp/entry/20210911/gap (9月11日) 母集団労働者数推計の謎:毎月勤労統計調査とセンサスはなぜ乖離しているのか https://remcat.hatenadiary.jp/entry/20210920/workerpop (9月20日) 毎月勤労統計調査、2018年の集計方法変更で何か間違えた模様 https://remcat.hatenadiary.jp/entry/20211009
この話はフィクションだが、具体的な内容を書くと筆者を特定されてしまうので、自分の好きな「お茶」を比喩にして書く(お茶を悪く言う意図はない)。 自分の旧友に、(比喩として)出涸らしの茶葉から更にお茶を抽出する、といったようなことを、もう何十年も続けている奴が居る。 ===== 奴とは、お茶が好きという共通点から知り合った。 もともとそれなりにクリエイティビティはあって、普通にやれば独創的なお茶を作れるスキルや経験の持ち主ではあるのだが、過去なんとなく「出涸らしをアレンジしたお茶」を出したところ、それがちょっとお茶のコミュニティ内でウケたため、ライフステージが変わってからも、成功体験として強く印象に残ったその作業を、何十年と続けている、というような状況である。 奴が、出涸らしからお茶を抽出し続けるようになった原因として、ひとつだけ思い当たるものがある。 それは、お茶が好きというきっかけから、知
ボーカルをMIDIに変換し、歌詞も抽出 今回発表されたSynthesizer V Studioのバージョンは1.11.0 b1(β版)と、11番目のバージョンとなるのですが、今回も従来と同様にユーザーに対しては無償のアップデートとなっています。普通であればメジャーバージョンアップというか、新製品といってもいいほどの革新的なアップデートを繰り返してきているのに、「無償アップデートで大丈夫なの?」とこちらが心配になってしまうほどではありますが、その気前の良さがSynthesizer Vユーザーを飛躍的に増やしてきている大きな要素ともなっているのだと思います。 今回も、まさに革命といってもいい機能を実現しているので、まずは以下の動画をご覧ください。 何をしているかお分かりいただけたでしょうか?これは、声優・小岩井ことりさん歌唱による「ハレのち☆ことり♪」のボーカルのWAVをSynthesizer
いまからわかる!ChatGPT活用プログラミング ChatGPT APIのFunction callingを使って、請求書の構造化データを抽出する 先月、OpenAIからFunction calling(関数呼び出し)機能がリリースされました。これが何なのか、何のために使うべきなのか、ちょっと見ただけでは分かりづらいと思います。 今回は請求書から情報抽出をするというよくありがちなケースを題材に、Function callingの利便性を示してみます。 Function callingとは OpenAIが2023年6月13日にリリースしたChat APIの追加機能です。主にできることとして以下の3つが挙げられています。 外部ツールを呼び出して質問に答えるチャットボットを作成する 自然言語を内部APIの呼び出しやSQLに変換する テキストから構造化データを抽出する たとえば天気予報と血液型
「YAPC(Yet Another Perl Conference)」は、Perlを軸としたITに関わるすべての人のためのカンファレンスです。ライトニングトークにはPR TIMES インターンのShun氏が登壇。ChatGPTと文字コードについて話します。 ChatGPTは文字コードをどのように解釈しているか 土屋俊介氏:こんにちは。先ほど、発表が4分だと知った土屋です。PR TIMESというところで、機械学習のインターンをしています。 (スライドを示して)昨今、ChatGPTというものがメチャメチャはやっていますよね。私は使っていく中で、(ChatGPTが)文字コードをどのように解釈しているかが気になりました。なぜそんなニッチな話が気になるのかというと、自然言語処理とWebに関わっている以上、文字コードに関するプログラムをよく書くんです。その関係で気になったので調べてみました。 (スライ
低温でじっくりコーヒーを抽出する水出しコーヒーは、酸味や苦味が少ないまろやかな味わいが特徴ですが、作るのに12~24時間かかるという問題があります。そんな水出しコーヒーの抽出にかかる時間を超音波で劇的に短縮する技術を、オーストラリアの研究チームが発表しました。市販のエスプレッソマシンに超音波発生装置を取り付けるだけで実現したこの技術により、家庭でも手軽に水出しコーヒーが楽しめるようになると研究者らは語っています。 Coffee brewing sonoreactor for reducing the time of cold brew from several hours to minutes while maintaining sensory attributes - ScienceDirect https://www.sciencedirect.com/science/article/
特定の文字列がある行から、別の特定の文字列がある行までを抽出したいということがよくあります。 これgrep等を使うと苦労する話なんですが、flip-flop演算子を使ったPerlのone-linerで可能です。 例えば昨日の記事ではgit help commitの中から--no-edit/オプションの説明を抽出しました。 これは--no-editという文字列が出てくるところから空行までを抽出すれば良い。これは以下のようにすれば可能です。 $ git help commit | perl -nle 'print if /--no-edit/ ... /^\s*$/' 解説自体に空行が混じるケースでは以下のようにすれば良いでしょう。 この例では、--cleanupという文字列が出現してから、次のオプション(-文字列形式)が出るまでを抽出しています。 $ git help commit | pe
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く