タイトル「抽出」を検索 - はてなブックマーク

201 - 240 件 / 544件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

抽出の検索結果201 - 240 件 / 544件

Wikipediaを用いた日本語の固有表現抽出データセットの公開
- 7 users
- tech.stockmark.co.jp
- テクノロジー
- 2020/12/15
Wikipediaを用いた日本語の固有表現抽出データセットの公開
- NLP
- wikipedia
- dataset
- あとで読む
耳コピ/ボーカル抽出が捗る！Spleeterの使い方 - YTPMV.info
- 7 users
- ytpmv.info
- テクノロジー
- 2020/08/20
この記事はあるくおすし氏による寄稿記事です。感謝。 2021/08/06　本記事はあるくおすし先生に2020年に寄稿頂いた記事をもとに2021年8月時点の情報に更新した記事になります。はじめにはじめまして、あるくおすしというものです。去年（2019）の半ばあたりから主に音MAD等の映像作品を作っています。自分に興味があるという方は@walkingsushiboxなりuser/52842941を覗いてやってください。 Spleeterってなんぞ早速本題です。 Spleeterとはフランスの音楽配信サイトであるDeezerが開発したパート分離ソフトで、任意の楽曲をコイツに食わせるとドラム、ベース、伴奏、ボーカル、などのパート毎に分離された音声ファイルを出力してくれます。今流行りの機械学習の技術を使用しており、自分の手元にある曲を使ってアルゴリズムを「訓練」することもできるそうです（自分
- python
話者を区別できる文字起こしツール「CLOVA Note」、キーワードも自動抽出
- 7 users
- xtech.nikkei.com
- テクノロジー
- 2023/06/02
セミナーや会議の内容をテキスト化しておくと後から振り返りやすい。しかし、音声をテキスト化する、いわゆる文字起こしの作業は、長時間にわたるセミナーや参加者が複数いる会議などでは担当者の負担が大きい。そこで、文字起こしツールを利用する人も多いだろう。筆者も職業柄、インタビューや講演の文字起こしをする機会が多く、文字起こしツールをいくつか使ってきた。現在は、今回紹介する「CLOVA Note（クローバ・ノート）」を仕事の相棒として頼りにしている。 CLOVA Noteは、LINEのAIテクノロジーブランド「LINE CLOVA」によるAI音声認識アプリだ。音声認識エンジンはLINE CLOVAが開発した「CLOVA Speech」が使用されている。2022年5月からベータ版として無料提供が開始された。スマートフォンアプリ（iOS／Android）を起動し、アプリで録音した後に文字起こしするか
- コンピュータ
- ネット
GiNZAの固有表現抽出とElasticsearchを使って自動でタグ検索 - Taste of Tech Topics
- 7 users
- acro-engineer.hatenablog.com
- テクノロジー
- 2020/04/29
こんにちは。@Ssk1029Takashiです。最近は家でもどうにかラーメンを食べられないかと試行錯誤しています。タグ検索とは、キーワード検索とは違い、検索する前からユーザーが選択肢からキーワードをセレクトボックスなどで選んで、検索できる検索方法です。通常のキーワード検索と違って、ユーザーが0からキーワードを考える必要がないため、効率的に情報を絞り込めます。もしくは、キーワード検索と併用して使用することも可能です。ただ、コンテンツごとにタグを設定するのはとても手間がかかります。コンテンツ作成者も必ずしもタグを設定してくれるとは限りません。このような時に、自動でタグ付けをしてくれる仕組みがあると楽にタグ検索を実現できます。ただ、単純な形態素解析で名詞をタグとすると、ゴミが多くなってしまいます。そこで、今回は、日本語処理ライブラリであるGiNZAの固有表現抽出機能とElast
数量・時間表現抽出ツールをPythonでゼロから実装してみた【NormalizeNumexp】 - Qiita
- 7 users
- qiita.com/tkscode
- テクノロジー
- 2021/12/04
はじめに何をしたのか NormalizeNumexpと呼ばれる数量表現や時間表現の抽出・正規化を行うOSSの実装をすべてPythonで実装しました。 Python3.7～3.10で動きます。 GitHub：https://github.com/tkscode/pyNormalizeNumExp PyPI：https://pypi.org/project/pynormalizenumexp/ 何が嬉しいのか Pythonで使う際にpipコマンドで一発でインストールできるようになりました。本家はC++で実装されており、Pythonで利用する場合は依存ライブラリであるuxとpficommonをインストールする本家のNormalizeNumexpをインストールする SWIGによるPythonバインディングをインストールするといった手順を踏みますがコードが古いため1.～2.でエラーが頻発
- Python
- あとで読む
スクレイピング時に本文だけを抽出する最高精度ツールが優秀！【日本語版も公開】 - Qiita
- 7 users
- qiita.com/yusukesakata75
- テクノロジー
- 2020/12/03
n,pはそれぞれnegative(ノイズ),positive(本文)を基準とした時の評価を表します。例としてノイズ部分をN,本文をPとし,正解をT(True)、間違いをF(False)とした時にPresicionはそれぞれ以下の式です。 $$ Presicion_{[n]} = \frac{TN}{TN + FN} $$ $$ Presicion_{[p]} = \frac{TP}{TP + FP} $$ nのf値はどれだけ正確にノイズを除去できているかを、pのf値はどれだけ正確に本文を抽出できているかを評価していると考えればよいでしょう。元のデータでの再現学習も問題無く行えました。また日本語対応版もおおよそ元論文と同程度の精度が出ています。要点2:軽量でCPUでも1ページ0.02s程度の時間で予測できる Core i7,8コアのCPU環境でも1ページ0.02s程度の時間で予測が可能
（Gスプレッドシート）文字列から数字を抽出する - いきなり答える備忘録
- 7 users
- www.officeisyours.com
- テクノロジー
- 2020/08/16
Googleスプレッドシートで、文字列に含まれる数字だけを取り出す方法についてです。対象とするのは半角数字とします。数字は文字列として抽出し、0で始まる数字もそのまま抽出するものとします。取り出したい範囲に応じていくつかの方法を紹介します。 REGEXEXTRACT関数やREGEXREPLACE関数を使って、文字列から数字だけを取り出すことができます。手順サンプルデータと実行結果すべての数字を取り出してつなげる一連の数字ごとに抽出して記号で区切る一連の数字ごとに抽出して各セルに分割する数字のうち最初に現れる一連のものだけ抽出する数字のうち最後に現れる一連のものだけ抽出する数字のうち最初の1文字だけ抽出する数字のうち最後の1文字だけ抽出する全角数字やカンマ等の扱いについて手順サンプルデータと実行結果 B3:B9セルには全く同じ文字列が記録されています。これに対し、
- excel
キーフレーズを抽出して遊ぶ - エムスリーテックブログ
- 7 users
- www.m3tech.blog
- テクノロジー
- 2021/12/23
AI・機械学習チームで2021年新卒の氏家です。この記事はエムスリーAdvent Calendar 2021の23日目の記事です。最近チームでスタンディング&ステッパーが流行っているのでその流れに乗ろうと試みましたが、スタンディングの時点で挫折してしまいました。さて、今回のテーマは自然言語処理です! AI・機械学習チームでは普段から自然言語処理をはじめとした機械学習を用いてプロダクトの開発・運用を行っています。しかし、業務にあまり関係ない技術で遊びたい気持ちがあるのもまた事実。そこで今回は、キーフレーズ抽出と呼ばれる技術に着目して、弊社に関連するデータに適用して遊んでみたいと思います。キーフレーズ抽出とは使用した手法いざキーフレーズを抽出テックブログ AskDoctors キーフレーズを使った応用まとめ We are hiring! キーフレーズ抽出とはキーフレーズ抽
- NLP
- あとで読む
【重要】かな漢字変換・ルビ振り・校正支援・キーフレーズ抽出API V2 リリースのお知らせ - Yahoo!デベロッパーネットワーク
- 7 users
- developer.yahoo.co.jp
- テクノロジー
- 2021/09/10
いつもテキスト解析Web APIをご利用いただきありがとうございます。テキスト解析Web APIにおける一部APIの後継バージョン(V2)リリースと仕様変更についてお知らせいたします。 ■ 対象API かな漢字変換ルビ振り校正支援キーフレーズ抽出 ■ 変更箇所リクエストURLが変わります GETリクエストは廃止となり、POSTリクエストのみになりますリクエストパラメータが変わりますレスポンス形式・フィールドが共に変更になります V2の仕様の詳細につきましては以下のページをご覧ください。かな漢字変換（V2）ルビ振り（V2）校正支援（V2）キーフレーズ抽出（V2） V1終了予定時期につきましては2022年1月末を予定しております。ご迷惑をおかけしますが、なにとぞご了承ください。今後ともテキスト解析Web APIをよろしくお願いいたします。
- Yahoo!
- あとで読む
人事異動のデータ化の取り組み〜 CamelotによるPDFの表データ抽出 - Sansan Tech Blog
- 7 users
- buildersbox.corp-sansan.com
- テクノロジー
- 2021/06/10
DSOC サービス開発部 GEES/JES/COEグループの松本です。最近はコロナの影響で巣ごもりをしており、家の庭で芝生を育てています。色々と手抜きをしてしまったがために生え揃いがまばらで、かわいい反面、芝生の上を裸足で歩けるようになるにはまだまだ時間がかかりそうです。気長に待ってみようと思います。今日はSansanの機能の一つである、人事異動ニュースを支えるデータ化の取り組みについてご紹介したいと思います。 JES とは Sansanの機能の中に、人事異動ニュースと呼ばれる機能があります。 sin.sansan.com これは、所有する名刺に紐づく人物の人事異動が公開されたときにそれをニュースとして配信し、交換前に所有名刺の情報を最新情報に更新できるという機能です。ニュースとして提供するために人事異動情報のデータ化を行っていますが、そのシステムがJESと呼ばれるもので、DSOC
クレイジー砂糖はあるサトウキビを煮詰めて黒褐色の粘度のある塊を抽出し ..
- 7 users
- anond.hatelabo.jp
- 暮らし
- 2020/10/23
クレイジー砂糖はあるサトウキビを煮詰めて黒褐色の粘度のある塊を抽出し煮沸した清潔な綿で包み、その上に重石を載せて、不純物となる余分な蜜を排出する蜜を排出したら、水で練ってサラサラにする再び煮沸した清潔な綿で包み、その上に重石を載せて、不純物となる余分な蜜を排出するこれを合計5セット繰り返し、黒褐色だったものを真っ白な砂糖に昇華させたクレイジーな砂糖がある名前を和三盆というクレイジー味噌はある主原料がソテツの実で作られた味噌があるソテツの実には毒があり、本来は食べられない水溶性の毒であるため、麹による発酵熟成の効能によって無毒化されやっと食べられるようにしたクレイジーな味噌だ名前を蘇鉄味噌、別名なりみそという世界は広い探せばクレイジーな何かを見つけることは意外と可能である興味あれば色々調べて見聞を広めるといいだろう
スプレッドシートでハイパーリンクからURLを抽出する方法は結局これが一番簡単なんじゃないかな？ | 株式会社LIG(リグ)｜DX支援・システム開発・Web制作
- 7 users
- liginc.co.jp
- テクノロジー
- 2020/05/18
スプレッドシートでは一括抽出できない？ところがどっこい、Googleセンセによると、ExcelでVBA組む方法が一般的なようで、現状スプレッドシートだけでなんとかするのは難しい※みたいなんですよね。 LIGではG Suiteを導入しているので、残念ながらExcel含めMicrosoftのソフトはPCに入っていません。入っていたとしてもバックオフィスなど一部のメンバーだけなんです。「そんなんうそやん」とスプレッドシートの可能性を信じて、30分くらいあれこれ試してみたんですけど、だめでした。ちなみに無料で使えるExcel Online（エクセルオンライン）でやろうとしてログイン情報探してデータ作った挙げ句マクロが使えないことに気づいて諦めるまでに、さらに30分ほどかかっています。ここまできたら意地でも方法を見つけようと、追加で30分は無駄な時間を過ごしています。スプレッドシートのハイパー
- ツール
【Excel】目視とコピペでクロス表から特定条件のデータを抽出するのは非効率！【いまさら聞けないExcelの使い方講座】
- 7 users
- forest.watch.impress.co.jp
- テクノロジー
- 2023/05/31
- Excel
- tips
【Techの道も一歩から】第38回「Streamlit で固有表現抽出の結果を表示する」 - Sansan Tech Blog
- 7 users
- buildersbox.corp-sansan.com
- テクノロジー
- 2021/04/15
こんにちは。 DSOC R&D グループの高橋寛治です。最近、部内で Streamlit による可視化を見かけるようになってきました。 Streamlit は、インタラクティブなデータの可視化に特化した Web アプリケーションを少ないコードで素早く提供することができる Python ライブラリです。私自身は Web アプリケーションとしてデモ化する際に手慣れた Flask で書くことが多いです。慣れているとはいえ時間を要するため、同じ結果を爆速で実現できるなら使わないわけにはいきません。作業効率改善のために、固有表現抽出を題材にして使ってみることにしました。今回 Streamlit で実現したいことテキストエリアに入力されたテキストを解析し、解析結果を表に表示します。入力エリアを準備するまずは、Streamlit をインストールし、ファイルを準備します。 $ pip in
- Streamlit
- あとで読む
【Excel】エクセルで住所から都道府県名を一括抽出するテク【いまさら聞けないExcelの使い方講座】
- 7 users
- forest.watch.impress.co.jp
- テクノロジー
- 2021/10/27
- excel
- windows
- PC
- 仕事
『『めがねのあぶデカロケ地bot on Twitter: "つるの剛士が大坂なおみを叩いたってあったから彼のツイートから『大坂なおみ』『大坂』『なおみ』『blm』『黒人』『差別』など関連ワードで検索抽出したけど、んなもん無かったんだが(困惑 https://t.co/XHtsh3UqVv"』へのコメント』へのコメント
- 7 users
- b.hatena.ne.jp
- エンタメ
- 2020/09/09
世の中めがねのあぶデカロケ地bot on Twitter: "つるの剛士が大坂なおみを叩いたってあったから彼のツイートから『大坂なおみ』『大坂』『なおみ』『blm』『黒人』『差別』など関連ワードで検索抽出したけど、... 8 人がブックマーク・4 件のコメント
｢ちょっといい抽出器具｣でインスタントコーヒーやめました
- 7 users
- www.gizmodo.jp
- テクノロジー
- 2024/02/21
2022年12月31日の記事を編集して再掲載しています。きっかけはインスタントコーヒーを1日に5杯くらい飲むようになってたことでした。目が冴えてくるのがやっぱりよくて、仕事中にコーヒーを常飲する感じになってたんですが、頭痛がしたり気持ち悪くなってくることも。ちょっと減らしたほうがいいな、と。｢1杯の満足度を上げる｣｢分量を管理する｣これをやったら減らせるかな、と思い、やってみたのが事の始まりです。意識の低いコーヒーの飲み方をやめたそれまでは飲みたくなったら適当にインスタントコーヒーをタンブラーに入れ、適当にお湯を注いでがぶ飲み、みたいなスタイルでした。考え得る中でもトップクラスに意識の低いコーヒーの飲み方だったなと今では思います。ちょっといい珈琲抽出器具を買ってみたそんな雑なコーヒー習慣をやめ、｢ちゃんと淹れる｣ようにしてみたんです。｢アメリカンプレス｣という抽出器具を買い
HTML から本文のテキストだけを抽出する Python コード例（見出しタグと見出しに属するテキストを取得）
- 7 users
- srbrnote.work
- テクノロジー
- 2021/04/22
HTML から『本文だけ』をキレイにスクレイピングする簡単な Python コード例を書きました。 ※ 通常のテキスト取得方法はこちらに書きました。【Python】HTML からテキストを抽出するコード例【lxml.html】種々雑多しゅじゅざったな HTML から、本文だけをねらって抽出する、汎用的はんようてきなコード例です。 for 文と while 文を使用して、『見出しタグと同じ階層にあるタグ』を取得していくアプローチになります。『見出しタグ』と『見出しタグに属するテキスト』を対応づけて抽出していきます。このアプローチで本文抽出を行った結果、本文以外のノイズを含まない、キレイなテキストを取得することができました。サイドバーやフッターなど、本文とは関係ないテキストを、キレイに除去することができました。本文に『見出しタグ (h1-h6)』を使用している普通の HTML であ
- あとで読む
清原達郎式「小型成長株投資」の候補240銘柄を抽出！ネットキャッシュ比率で浮かぶ割安株リスト
- 6 users
- diamond.jp
- 政治と経済
- 2024/04/05
あなたも億り人に!? 凄腕シニア投資家が教える株式運用術 2024年から始動した「新NISA」を受け、投資熱が高まっている。より高いリターンを狙うなら、投資信託の積み立てだけでなく、個別株投資に挑むのも一手だ。その主役となりそうなのが、現役時代に蓄財した資産や退職金などで、投資の元手が豊富な50～80代個人。一方でどんな銘柄に投資すればよいのか、迷える人も多いだろう。同世代の歴戦の猛者たちが、「株式投資の極意」を直伝。87歳の現役トレーダーや、「伝説の投資家」清原達郎氏、退職金を200倍の40億円に増やした70代シニア、配当金＆優待でホクホク老後生活を送る60代個人など、各種各様のスタイルで、虎の子の資産を殖やす術を伝授してもらう。バックナンバー一覧日本株展望や投資の心得などを説いた「伝説のサラリーマン投資家」清原達郎氏のインタビューに続き、本稿では、清原氏が実践してきた小型成長株投
WinRE.wim の抽出手順 (Windows 10 Pro 22H2) - くろねこ自由気ままな日記
- 6 users
- www.kuronekofreedom.com
- テクノロジー
- 2024/01/28
こんにちはくろねこです。先日、投稿させていただいた Windows Update の KB5034441問題に関連するものとして、手順をシンプルにまとめてみました。この記事は、回復パーティションの再構築で必要となる WinRE.wim を取り出す手順を紹介するものです。 Windows 10 インストールメディア作成 Windows.isoを展開 install.wimの抽出 WinRE.wimの抽出おわりに（ご注意） ※ この手順は、Windows 10 Pro で作業を実施する手順です。（使用しているバージョンは 22H2 です）他のエディションの場合は、該当する部分（フォルダのパスなど）は異なる場合がありますので読み替えて実施してください。 ※ この手順で、抽出する WinRE.wim は Windows 10 Pro 用のものです。回復パーティションの再構築方法につ
形態素解析の結果を利用してTF法により特徴抽出をする - Qiita
- 6 users
- qiita.com/eiskry
- テクノロジー
- 2020/12/28
はじめに本記事では、文書分類器を実装するための特徴抽出方法としてのTF(Term Frequency method)法について解説する。 1. 形態素解析文書分類では、文書内の単語の情報を利用する。日本語は英語のように単語の区切りが明示された分かち書き言語ではなく、非分かち書き言語であり、そのため、文書内の各文を単語に分割する必要がある。文を単語に分割し、各単語の品詞を推定することを形態素解析という。ここでは、オープンソース形態素解析ソフトウェア MeCab(めかぶ)を使う. • http://taku910.github.io/mecab/ 2. 特徴抽出分類問題を扱う際、一般に、データ中の、分類に利用する情報のことを特徴量と呼び、この特徴量をデータから抽出する作業を特徴抽出と呼ぶ。文書の分類では、文書中の単語が特徴量として利用される。文書内の各単語の出現頻度は、しばしば、単
- 形態素解析
- mecab
- python
- qiita
NEDO、今後取り組むべき12のAI技術開発を抽出した「AIアクションプラン」を公表
- 6 users
- ascii.jp
- テクノロジー
- 2021/06/14
NEDO、今後取り組むべき12のAI技術開発を抽出した「AIアクションプラン」を公表抽出したAI技術の事業化へ向けた検討を推進 NEDOは、人工知能（AI）技術戦略の策定およびプロジェクトの早期開始に向けて「人工知能（AI）技術分野における大局的な研究開発のアクションプラン」（AIアクションプラン）を公表した。本プランは、AI技術や密接に関係する技術、さらにAIを含む新技術について開発の方向性などを大局的に検討・整理したもの。2016年に公開した「次世代人工知能技術社会実装ビジョン」を参考に、学術界・産業界の有識者で構成された「AIアクションプラン策定委員会」の議論により策定された。 NEDOによれば、AI技術はこれまで深層学習の隆盛を受けて大きく発展してきたが、今後10年は意味理解のAIの開発が求められているという。同様に、今後10年を見据えて「部分最適化から全体最適化／人とAIの関
- 人工知能
- AI
数千年もの間電力を供給できる世界初の炭素14ダイヤモンド電池を開発――炭素14を放射性廃棄物から抽出 - fabcross for エンジニア
- 6 users
- engineer.fabcross.jp
- テクノロジー
- 2025/01/17
英ブリストル大学と英国原子力公社（UKAEA）は、2024年12月4日、数千年もの間デバイスに電力を供給できる可能性がある、世界初の炭素14ダイヤモンド電池を開発したと発表した。この電池は、放射性炭素年代測定に使用することで知られている、「炭素14」という炭素の放射性同位体を利用するものだ。炭素14は、原子力発電所で減速材として使用されるグラファイト（黒鉛）ブロックで生成されるが、ブリストル大学の研究により、炭素14はグラファイトブロックの表面に集中していることが明らかになっている。英国が保有している大量のグラファイトブロックから炭素14を抽出することで、放射性物質の大部分を除去する処理が可能となり、放射性廃棄物を安全に保管するためのコスト削減が期待される。研究チームは、グラファイトブロックから抽出した炭素14をダイヤモンドに組み込んで原子力を利用した電池を製造した。この炭素14ダイ
- technology
- 科学
- science
- 技術
商用利用可能な個人情報抽出向けデータセットやAIモデルを公開、Nishika
- 6 users
- news.mynavi.jp
- テクノロジー
- 2022/08/01
AI（Artificial Intelligence：人工知能）に関するコンサルティングや開発サービスを提供するNishikaは8月1日、文章の中から氏名や組織名、地名などの個人情報を機械学習により自動で抽出するためのデータセット、学習済みAIモデル、ソースコードの提供を開始すると発表した。なお、公開期間は2022年10月31日までとのことだ。同社が今回公開するのは、約200の判例文に2万7000以上の個人情報（人名、組織名・施設名・役職名、地名、時間、商品名など）のラベルが付与された独自データセットだ。データは、同社が収集した判例文のpdfデータをテキスト化し、クレンジング後にテキストアノテーションツールdoccanoを用いて原文のマスキング箇所に対してアノテーションを行った後、架空の名称で置換することにより作成している。アノテーションを行ったのは、PERSON（人名）、ORGFAC
- あとで読む
LangChain `with_structured_output` メソッドによる構造化データ抽出
- 6 users
- zenn.dev/ml_bear
- テクノロジー
- 2024/05/24
これは何？昨日、ALGOMATIC社のerukitiさんの記事がバズっていました。スキーマを用いてプロンプト生成すると構造化データを取り出しやすいよと言うお話でした。便利ですよねぇ。 LangChainの比較的新しいメソッド(with_structured_output)を利用すると似たような内容を比較的簡単に行えます。あまり知られていないかもしれないので、備忘録がてら雑にまとめてみます。(備忘録なのでLangChainのことは詳細に説明しません、ｽﾐﾏｾﾝ🙇) with_structured_output メソッドとは with_structured_output メソッドは、LangChain で構造化データ抽出を行うための統一されたインターフェースです。以下の2ステップで利用できます。構造化データをPydanticで定義するその定義を.with_structured_outp
【検索雑談】Search Consoleでひらがな or カタカナ or 漢字のみのクエリを抽出する方法
- 6 users
- www.baka-ke.com
- 世の中
- 2024/08/06
時系列分析に新たな潮流 : 増分近傍法による頑強な時系列「連鎖」抽出 TSC22
- 6 users
- ai-scholar.tech
- テクノロジー
- 2023/02/09
3つの要点 ✔️ 時系列データから特徴的な「連鎖」を探すという比較的新しい手法が強力にアップデートされました ✔️ データが変化していく中で、正確に「連鎖」を見つけ、ノイズにも強い頑強なアルゴリズムになっています ✔️ 実世界のデータで定性評価、合成データで定量評価し、優れた性能を確認しています Robust Time Series Chain Discovery with Incremental Nearest Neighbors written by Li Zhang, Yan Zhu, Yifeng Gao, Jessica Lin (Submitted on 3 Nov 2022) Comments: ICDM 2022 Subjects: Machine Learning (cs.LG); Artificial Intelligence (cs.AI); Information
- 時系列分析
刻音（ときね）沈殿抽出式ティードリッパー
- 6 users
- tokineteadrip.jp
- 暮らし
- 2020/10/25
急須は、およそ300年前に誕生したと言われています。浮世絵にも登場し、その姿かたちはほぼ変化せずに現代に至ります。刻音(ときね)は現代のテクノロジーを用いて、急須を超える茶器を目指して開発しました。急須を超える茶器とは「お茶本来のおいしさ＝香り・旨み・渋みを、誰でも簡単に引き出せる茶器」「現代のライフスタイルに合う茶器」「お茶を淹れることが楽しみになる茶器」。この３つの要素を兼ね備えた茶器であると考えました。そして、たどり着いたひとつの答えが「沈殿抽出式」という方法です。（沈殿抽出式は特許及び商標出願中です。）クリアかつ深い味わいを引き出し、お茶を淹れるプロセスそのものが愛おしくなる茶器。刻音とともに、すてきなお茶の時間をお楽しみください。沈殿抽出式（ちんでんちゅうしゅつしき）は、2年の歳月と500回の試作を経て完成しました。ペーパーフィルターやステンレスの茶こしなどを使わずに、日本
- 食
- 生活
速習Linux – 文字列の置換・抽出・検索と正規表現【sed・awk・grep】｜Yuu's Memo
- 6 users
- www.yuus-program.com
- テクノロジー
- 2023/05/30
sedコマンド sed（Stream Editor）は、テキストストリームの編集に特化した強力なツールです。以下にsedコマンドの基本的な構文を示します。オプション: sedコマンドの挙動を制御するための指定です。例えば、置換を行う場合には-eオプションを使用します。スクリプト: 実行したいsedコマンドの操作を指定します。置換や削除、追加など、様々な編集操作が可能です。ファイル名: 処理を行いたいテキストファイルのパスを指定します。省略した場合は標準入力から読み込みます。以下でもう少し詳しく解説します。コマンドどういう処理をしたいかをコマンドで指定します。処理内容の出力、削除、文字列の追加、置換などの処理を行えるコマンドが用意されています。コマンド説明
- あとで読む
[アップデート] Amazon Data Firehose に CloudWatch Logs ログイベントからメッセージデータのみを抽出出来るオプションが追加されたので有効にしてみた | DevelopersIO
- 6 users
- dev.classmethod.jp
- テクノロジー
- 2024/02/29
[アップデート] Amazon Data Firehose に CloudWatch Logs ログイベントからメッセージデータのみを抽出出来るオプションが追加されたので有効にしてみたいわさです。今朝のアップデートで Kinesis Firehose、いや、Amazon Data Firehose で次のアップデートがアナウンスされました。なんと、CloudWatch Logs + Firehose でログ転送を行う時に、オプションでログのソースレコードを抽出してくれるようになります。通常特に指定しないと場合は CloudWatch Logs によって次のように構造化されたメッセージにソースメッセージを含める形になります。 { "messageType": "DATA_MESSAGE", "owner": "550669467088", "logGroup": "API-Gatew
- aws
- あとで読む
かぶせ茶の魅力、抽出温度で味が変わる、それはもう物語のよう♫ - けみかる、らじかる、ぷれすとリアクション
- 6 users
- rachmanist.hatenablog.com
- 学び
- 2022/05/02
夏も近づく八十八夜野にも山にも若葉が茂るあれに見えるは茶摘じゃないかあかねだすきに菅の笠この歌は、"茶摘みの歌"です。立春から数えて、88日目だからは八十八夜なんです。春が終わり、夏に向けて準備を開始するこの時期。まさにGW真っただ中なんです。そんな日に、茶摘みをしてきました。こちらは、茶畑です。綺麗な青い空の下、山から吹く風に育てられ、お茶は美味しい茶葉に生まれ変わります。黒いポリ袋で覆われていますが、これは敢えて被覆しているのです。茶葉には、テアニンという成分が含まれています。カタカナが登場すると、小難しそうな感じがしますが、うまみ成分の名前と憶えてください。このテアニンは、日光を浴びると、カテキンに変化します。カテキンが増えると、渋みや苦みになるんです。なので、この光による反応を抑えるために、黒いポリ袋で多い、テアニン＞カテキンの量を制御するんです。素晴らしい技術だと思いま
無料の3DCG統合環境「Blender」v4.4が公開～アニメーションデータ構造が一新／「グレア」ノードでグレア部分の抽出ができるように
- 6 users
- forest.watch.impress.co.jp
- テクノロジー
- 2025/03/19
初心者でもわかるExcelマクロ入門！オートフィルタを使って複数条件で項目を抽出する方法
- 6 users
- diamond.jp
- テクノロジー
- 2021/04/04
1976年、大阪府生まれ。灘高校、東京大学経済学部卒業後、日系メーカーで17年間勤務。経理や営業、マーケティング、経営企画などに携わり、独学で覚えたエクセルマクロを用いて様々な分析や業務改革を行う。 2017年、GAFAの日本法人のうちの1社へシニアマネージャー（部長）として転職。これまでエクセルマクロを用いた業務改善などで数多くの社内表彰を受けている。手作業では不可能なほど大量のデータを、短時間で分析しやすく加工したことが評価され、社内エクセルマクロ講習会の講師として延べ200人以上に講座を実施。エクセルマクロについて1から10まで教える詰込み型の学習ではなく、仕事に必要な部分だけを効率的に学べる講座として満足度98％の高い評価を受けている。 4時間のエクセル仕事は20秒で終わる「エクセルマクロ全体の1割程度を学べば会社の業務の9割以上はカバーできる」現役GAFA部長がエクセルマク
市民のスマホ情報、抽出　イスラエル製機器使い　露、反体制派抑圧に利用 | 毎日新聞
- 6 users
- mainichi.jp
- 世の中
- 2022/12/30
イスラエル企業が開発した、携帯電話から個人情報を抜き取る機器がロシアなどの強権的な国家や地域で使用されている。反体制派などの抑圧に利用されており、人権団体が強く非難している。この企業はIT機器メーカー「サン電子」（本社・名古屋市）の子会社で、イスラエル中部ペタクチクバに本社があるサイバー関連企業「セレブライト」。携帯電話などから全てのメッセージや写真などを抽出する機器「UFED」を開発、販売している。欧米の治安機関では通常、容疑者らの携帯から犯罪の証拠などを得るため、裁判所の許可を得てUFEDを使用する。だが法の支配が浸透していない国では、当局が恣意（しい）的に市民を拘束した上で、携帯から個人情報を抜き取るケースが出ている。
【R】edgeRを用いたRNA-seqデータの発現変動遺伝子抽出【RNA-seq】 - LabCode
- 6 users
- labo-code.com
- テクノロジー
- 2025/04/23
edgeRによる発現変動解析 edgeRはRNA-seqデータから差次的発現遺伝子（DEG）を同定するための効率的なツールです。DESeq2と同様にネガティブバイノミアル分布を使用しますが、異なる正規化手法と統計的アプローチを採用しています。edgeRの主な特徴は以下の通りです： TMM（Trimmed Mean of M-values）法による効果的なサンプル間の正規化タグワイズ分散推定による遺伝子ごとの生物学的変動の正確な評価少ないサンプル数でも信頼性の高い結果を得るための経験ベイズ法一般化線形モデル（GLM）を用いた複雑な実験デザインへの対応正確検定（exact test）やQLF検定など、状況に応じた統計的検定手法計算効率の良いアルゴリズムによる大規模データセットの迅速な処理この記事では、edgeRを使用して発現変動遺伝子を特定し、様々な手法による結果の違いや解釈方法に
バイドゥ、映像内の物体をそれぞれ抽出するセグメンテーション技術「CFBI」開発　背景も考慮しより精密に
- 6 users
- shiropen.com
- テクノロジー
- 2020/07/31
バイドゥ、映像内の物体をそれぞれ抽出するセグメンテーション技術「CFBI」開発　背景も考慮しより精密に 2020-07-31 Baidu Researchとシドニー工科大学の研究チームが開発した「Collaborative Video Object Segmentation by Foreground-Background Integration（ CFBI ）」[Yang et al. 2020]は、動画内において、オブジェクトごとに追跡しクラス分けする半教師あり学習のビデオオブジェクトセグメンテーション（Video Object Segmentation 、VOS）だ。ビデオオブジェクトセグメンテーション（ VOS ）とはビデオオブジェクトセグメンテーション（VOS）とは、動画内のオブジェクトに対して、そのオブジェクトが何なのかをピクセル単位で区別し認識するタスクを指す。ターゲット
長文から論点を抽出して、その論点を軸に文章の要約を試みる｜mah_lab / 西見公宏
- 6 users
- note.com/mahlab
- テクノロジー
- 2023/05/02
とある大きめの文章データを目の前にしたとき、とりあえずGPTに突っ込んで論点を抽出したいけど、データ的に大きすぎてトークン制限オーバーしちゃうし、どうしたものかなと思うことはないでしょうか。私はあります。 LangChainの要約系のチェーンを使っても良いのですが、仕組み上、かなりざっくりとした要約を作られてしまうので、何か大切なものを失ってしまう気がしてなりません。そんな中で何となく思ったのは、文章を何らかの形でクラスタリングしたときの集合が大きい部分が論点であり、その集合毎に要約を作ってあげれば論点っぽい文章が作れるのではないか？ということでした。というわけで早速試しにコードを書いてみたいと思います。 k-means法でクラスタリングする文章をある程度の長さでチャンクに分けた後で、埋め込みベクトルを求めてあげれば「意味の分布」を取ることができます。そこで今回はその「意味の分布」を
Hugging Face のポジネガ、言語モデル、固有表現抽出、要約、翻訳が行えるpipelineを試す | ゆるいDeep Learning
- 6 users
- www.yurui-deep-learning.com
- 世の中
- 2021/04/03
下記にHuggingFaceのパイプラインの情報があります。 https://huggingface.co/transformers/main_classes/pipelines.html パイプラインで実行可能なタスクは下記になります。 ConversationalPipelineFeatureExtractionPipelineFillMaskPipelineQuestionAnsweringPipelineSummarizationPipelineTextClassificationPipelineTextGenerationPipelineTokenClassificationPipelineTranslationPipelineZeroShotClassificationPipelineText2TextGenerationPipelineTableQuestionAnsweri
『『めがねのあぶデカロケ地bot on Twitter: "つるの剛士が大坂なおみを叩いたってあったから彼のツイートから『大坂なおみ』『大坂』『なおみ』『blm』『黒人』『差別』など関連ワードで検索抽出したけど、んなもん無かったんだが(困惑 https://t.co/XHtsh3UqVv"』へのコメント』へのコメント
- 6 users
- b.hatena.ne.jp
- エンタメ
- 2020/09/09
世の中めがねのあぶデカロケ地bot on Twitter: "つるの剛士が大坂なおみを叩いたってあったから彼のツイートから『大坂なおみ』『大坂』『なおみ』『blm』『黒人』『差別』など関連ワードで検索抽出したけど、... 8 人がブックマーク・4 件のコメント
「コーヒーの噴水」で抽出過程からワクワクが止まらない次世代サイフォン式コーヒーメーカー「Siphonysta」は初心者でもコーヒーの深みに至れる素敵マシンでした
- 6 users
- gigazine.net
- 暮らし
- 2023/03/29
タイガー魔法瓶から2023年2月に登場したコーヒーメーカー「Siphonysta」は、サイフォン式コーヒーの抽出過程自動化を実現しており、コーヒーの味だけでなく「お湯がシリンダー内を上下に移動する」という独特な抽出過程も楽しめます。そんなSiphonystaが編集部にやってきたので、外観の徹底チェックに続いて実際にコーヒーを作って抽出過程の詳細やコーヒーの完成度を確かめてみました。コーヒーメーカー ADS-A020 - タイガー魔法瓶 https://www.tiger-corporation.com/ja/jpn/product/coffee-machine/ads-a/ Siphonystaは、上下分割式のシリンダーユニットを搭載した独特な見た目が特徴のコーヒーメーカーです。Siphonystaの独特な外観は、以下の記事で詳しくチェックしています。今回は、Siphonystaを使って
- あとで読む