並び順

ブックマーク数

期間指定

  • から
  • まで

201 - 240 件 / 547件

新着順 人気順

抽出の検索結果201 - 240 件 / 547件

  • 話者を区別できる文字起こしツール「CLOVA Note」、キーワードも自動抽出

    セミナーや会議の内容をテキスト化しておくと後から振り返りやすい。しかし、音声をテキスト化する、いわゆる文字起こしの作業は、長時間にわたるセミナーや参加者が複数いる会議などでは担当者の負担が大きい。そこで、文字起こしツールを利用する人も多いだろう。 筆者も職業柄、インタビューや講演の文字起こしをする機会が多く、文字起こしツールをいくつか使ってきた。現在は、今回紹介する「CLOVA Note(クローバ・ノート)」を仕事の相棒として頼りにしている。 CLOVA Noteは、LINEのAIテクノロジーブランド「LINE CLOVA」によるAI音声認識アプリだ。音声認識エンジンはLINE CLOVAが開発した「CLOVA Speech」が使用されている。2022年5月からベータ版として無料提供が開始された。 スマートフォンアプリ(iOS/Android)を起動し、アプリで録音した後に文字起こしするか

      話者を区別できる文字起こしツール「CLOVA Note」、キーワードも自動抽出
    • GiNZAの固有表現抽出とElasticsearchを使って自動でタグ検索 - Taste of Tech Topics

      こんにちは。@Ssk1029Takashiです。 最近は家でもどうにかラーメンを食べられないかと試行錯誤しています。 タグ検索とは、キーワード検索とは違い、検索する前からユーザーが選択肢からキーワードをセレクトボックスなどで選んで、検索できる検索方法です。 通常のキーワード検索と違って、ユーザーが0からキーワードを考える必要がないため、効率的に情報を絞り込めます。 もしくは、キーワード検索と併用して使用することも可能です。 ただ、コンテンツごとにタグを設定するのはとても手間がかかります。 コンテンツ作成者も必ずしもタグを設定してくれるとは限りません。 このような時に、自動でタグ付けをしてくれる仕組みがあると楽にタグ検索を実現できます。 ただ、単純な形態素解析で名詞をタグとすると、ゴミが多くなってしまいます。 そこで、今回は、日本語処理ライブラリであるGiNZAの固有表現抽出機能とElast

        GiNZAの固有表現抽出とElasticsearchを使って自動でタグ検索 - Taste of Tech Topics
      • 数量・時間表現抽出ツールをPythonでゼロから実装してみた【NormalizeNumexp】 - Qiita

        はじめに 何をしたのか NormalizeNumexpと呼ばれる数量表現や時間表現の抽出・正規化を行うOSSの実装をすべてPythonで実装しました。 Python3.7~3.10で動きます。 GitHub:https://github.com/tkscode/pyNormalizeNumExp PyPI:https://pypi.org/project/pynormalizenumexp/ 何が嬉しいのか Pythonで使う際にpipコマンドで一発でインストールできるようになりました。 本家はC++で実装されており、Pythonで利用する場合は 依存ライブラリであるuxとpficommonをインストールする 本家のNormalizeNumexpをインストールする SWIGによるPythonバインディングをインストールする といった手順を踏みますが コードが古いため1.~2.でエラーが頻発

          数量・時間表現抽出ツールをPythonでゼロから実装してみた【NormalizeNumexp】 - Qiita
        • スクレイピング時に本文だけを抽出する最高精度ツールが優秀!【日本語版も公開】 - Qiita

          n,pはそれぞれnegative(ノイズ),positive(本文)を基準とした時の評価を表します。 例としてノイズ部分をN,本文をPとし,正解をT(True)、間違いをF(False)とした時にPresicionはそれぞれ以下の式です。 $$ Presicion_{[n]} = \frac{TN}{TN + FN} $$ $$ Presicion_{[p]} = \frac{TP}{TP + FP} $$ nのf値はどれだけ正確にノイズを除去できているかを、pのf値はどれだけ正確に本文を抽出できているかを評価していると考えればよいでしょう。 元のデータでの再現学習も問題無く行えました。また日本語対応版もおおよそ元論文と同程度の精度が出ています。 要点2:軽量でCPUでも1ページ0.02s程度の時間で予測できる Core i7,8コアのCPU環境でも1ページ0.02s程度の時間で予測が可能

            スクレイピング時に本文だけを抽出する最高精度ツールが優秀!【日本語版も公開】 - Qiita
          • (Gスプレッドシート)文字列から数字を抽出する - いきなり答える備忘録

            Googleスプレッドシートで、文字列に含まれる数字だけを取り出す方法についてです。 対象とするのは半角数字とします。数字は文字列として抽出し、0で始まる数字もそのまま抽出するものとします。取り出したい範囲に応じていくつかの方法を紹介します。 REGEXEXTRACT関数やREGEXREPLACE関数を使って、文字列から数字だけを取り出すことができます。 手順 サンプルデータと実行結果 すべての数字を取り出してつなげる 一連の数字ごとに抽出して記号で区切る 一連の数字ごとに抽出して各セルに分割する 数字のうち最初に現れる一連のものだけ抽出する 数字のうち最後に現れる一連のものだけ抽出する 数字のうち最初の1文字だけ抽出する 数字のうち最後の1文字だけ抽出する 全角数字やカンマ等の扱いについて 手順 サンプルデータと実行結果 B3:B9セルには全く同じ文字列が記録されています。 これに対し、

              (Gスプレッドシート)文字列から数字を抽出する - いきなり答える備忘録
            • キーフレーズを抽出して遊ぶ - エムスリーテックブログ

              AI・機械学習チームで2021年新卒の氏家です。 この記事はエムスリーAdvent Calendar 2021の23日目の記事です。 最近チームでスタンディング&ステッパーが流行っているのでその流れに乗ろうと試みましたが、スタンディングの時点で挫折してしまいました。 さて、今回のテーマは自然言語処理です! AI・機械学習チームでは普段から自然言語処理をはじめとした機械学習を用いてプロダクトの開発・運用を行っています。 しかし、業務にあまり関係ない技術で遊びたい気持ちがあるのもまた事実。 そこで今回は、キーフレーズ抽出と呼ばれる技術に着目して、弊社に関連するデータに適用して遊んでみたいと思います。 キーフレーズ抽出とは 使用した手法 いざキーフレーズを抽出 テックブログ AskDoctors キーフレーズを使った応用 まとめ We are hiring! キーフレーズ抽出とは キーフレーズ抽

                キーフレーズを抽出して遊ぶ - エムスリーテックブログ
              • 【重要】かな漢字変換・ルビ振り・校正支援・キーフレーズ抽出API V2 リリースのお知らせ - Yahoo!デベロッパーネットワーク

                いつもテキスト解析Web APIをご利用いただきありがとうございます。 テキスト解析Web APIにおける一部APIの後継バージョン(V2)リリースと仕様変更についてお知らせいたします。 ■ 対象API かな漢字変換 ルビ振り 校正支援 キーフレーズ抽出 ■ 変更箇所 リクエストURLが変わります GETリクエストは廃止となり、POSTリクエストのみになります リクエストパラメータが変わります レスポンス形式・フィールドが共に変更になります V2の仕様の詳細につきましては以下のページをご覧ください。 かな漢字変換(V2) ルビ振り(V2) 校正支援(V2) キーフレーズ抽出(V2) V1終了予定時期につきましては2022年1月末を予定しております。 ご迷惑をおかけしますが、なにとぞご了承ください。 今後ともテキスト解析Web APIをよろしくお願いいたします。

                  【重要】かな漢字変換・ルビ振り・校正支援・キーフレーズ抽出API V2 リリースのお知らせ - Yahoo!デベロッパーネットワーク
                • 人事異動のデータ化の取り組み 〜 CamelotによるPDFの表データ抽出 - Sansan Tech Blog

                  DSOC サービス開発部 GEES/JES/COEグループの松本です。 最近はコロナの影響で巣ごもりをしており、家の庭で芝生を育てています。 色々と手抜きをしてしまったがために生え揃いがまばらで、かわいい反面、芝生の上を裸足で歩けるようになるにはまだまだ時間がかかりそうです。気長に待ってみようと思います。 今日はSansanの機能の一つである、人事異動ニュースを支えるデータ化の取り組みについてご紹介したいと思います。 JES とは Sansanの機能の中に、人事異動ニュースと呼ばれる機能があります。 sin.sansan.com これは、所有する名刺に紐づく人物の人事異動が公開されたときにそれをニュースとして配信し、交換前に所有名刺の情報を最新情報に更新できるという機能です。 ニュースとして提供するために人事異動情報のデータ化を行っていますが、そのシステムがJESと呼ばれるもので、DSOC

                    人事異動のデータ化の取り組み 〜 CamelotによるPDFの表データ抽出 - Sansan Tech Blog
                  • スプレッドシートでハイパーリンクからURLを抽出する方法は結局これが一番簡単なんじゃないかな? | 株式会社LIG(リグ)|DX支援・システム開発・Web制作

                    スプレッドシートでは一括抽出できない? ところがどっこい、Googleセンセによると、ExcelでVBA組む方法が一般的なようで、現状スプレッドシートだけでなんとかするのは難しい※みたいなんですよね。 LIGではG Suiteを導入しているので、残念ながらExcel含めMicrosoftのソフトはPCに入っていません。入っていたとしてもバックオフィスなど一部のメンバーだけなんです。 「そんなんうそやん」とスプレッドシートの可能性を信じて、30分くらいあれこれ試してみたんですけど、だめでした。ちなみに無料で使えるExcel Online(エクセルオンライン)でやろうとしてログイン情報探してデータ作った挙げ句マクロが使えないことに気づいて諦めるまでに、さらに30分ほどかかっています。ここまできたら意地でも方法を見つけようと、追加で30分は無駄な時間を過ごしています。 スプレッドシートのハイパー

                      スプレッドシートでハイパーリンクからURLを抽出する方法は結局これが一番簡単なんじゃないかな? | 株式会社LIG(リグ)|DX支援・システム開発・Web制作
                    • クレイジー砂糖はある サトウキビを煮詰めて黒褐色の粘度のある塊を抽出し ..

                      クレイジー砂糖はあるサトウキビを煮詰めて黒褐色の粘度のある塊を抽出し 煮沸した清潔な綿で包み、その上に重石を載せて、不純物となる余分な蜜を排出する 蜜を排出したら、水で練ってサラサラにする 再び煮沸した清潔な綿で包み、その上に重石を載せて、不純物となる余分な蜜を排出する これを合計5セット繰り返し、黒褐色だったものを真っ白な砂糖に昇華させたクレイジーな砂糖がある 名前を和三盆という クレイジー味噌はある主原料がソテツの実で作られた味噌がある ソテツの実には毒があり、本来は食べられない 水溶性の毒であるため、麹による発酵熟成の効能によって無毒化されやっと食べられるようにしたクレイジーな味噌だ 名前を蘇鉄味噌、別名なりみそという 世界は広い探せばクレイジーな何かを見つけることは意外と可能である 興味あれば色々調べて見聞を広めるといいだろう

                        クレイジー砂糖はある サトウキビを煮詰めて黒褐色の粘度のある塊を抽出し ..
                      • 【Excel】目視とコピペでクロス表から特定条件のデータを抽出するのは非効率!【いまさら聞けないExcelの使い方講座】

                          【Excel】目視とコピペでクロス表から特定条件のデータを抽出するのは非効率!【いまさら聞けないExcelの使い方講座】
                        • 4歳娘「パパ、20歳以上のユーザーを抽出して?」 - Qiita

                          Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article?

                            4歳娘「パパ、20歳以上のユーザーを抽出して?」 - Qiita
                          • 【Techの道も一歩から】第38回「Streamlit で固有表現抽出の結果を表示する」 - Sansan Tech Blog

                            こんにちは。 DSOC R&D グループの高橋寛治です。 最近、部内で Streamlit による可視化を見かけるようになってきました。 Streamlit は、インタラクティブなデータの可視化に特化した Web アプリケーションを少ないコードで素早く提供することができる Python ライブラリです。 私自身は Web アプリケーションとしてデモ化する際に手慣れた Flask で書くことが多いです。 慣れているとはいえ時間を要するため、同じ結果を爆速で実現できるなら使わないわけにはいきません。 作業効率改善のために、固有表現抽出を題材にして使ってみることにしました。 今回 Streamlit で実現したいこと テキストエリアに入力されたテキストを解析し、解析結果を表に表示します。 入力エリアを準備する まずは、Streamlit をインストールし、ファイルを準備します。 $ pip in

                              【Techの道も一歩から】第38回「Streamlit で固有表現抽出の結果を表示する」 - Sansan Tech Blog
                            • 【Excel】エクセルで住所から都道府県名を一括抽出するテク【いまさら聞けないExcelの使い方講座】

                                【Excel】エクセルで住所から都道府県名を一括抽出するテク【いまさら聞けないExcelの使い方講座】
                              • 『『めがねのあぶデカロケ地bot on Twitter: "つるの剛士が大坂なおみを叩いたってあったから 彼のツイートから『大坂なおみ』『大坂』『なおみ』『blm』『黒人』『差別』など関連ワードで検索抽出したけど、んなもん無かったんだが(困惑 https://t.co/XHtsh3UqVv"』へのコメント』へのコメント

                                世の中 めがねのあぶデカロケ地bot on Twitter: "つるの剛士が大坂なおみを叩いたってあったから 彼のツイートから『大坂なおみ』『大坂』『なおみ』『blm』『黒人』『差別』など関連ワードで検索抽出したけど、... 8 人がブックマーク・4 件のコメント

                                  『『めがねのあぶデカロケ地bot on Twitter: "つるの剛士が大坂なおみを叩いたってあったから 彼のツイートから『大坂なおみ』『大坂』『なおみ』『blm』『黒人』『差別』など関連ワードで検索抽出したけど、んなもん無かったんだが(困惑 https://t.co/XHtsh3UqVv"』へのコメント』へのコメント
                                • 「ちょっといい抽出器具」でインスタントコーヒーやめました

                                  2022年12月31日の記事を編集して再掲載しています。 きっかけはインスタントコーヒーを1日に5杯くらい飲むようになってたことでした。 目が冴えてくるのがやっぱりよくて、仕事中にコーヒーを常飲する感じになってたんですが、頭痛がしたり気持ち悪くなってくることも。ちょっと減らしたほうがいいな、と。 「1杯の満足度を上げる」 「分量を管理する」 これをやったら減らせるかな、と思い、やってみたのが事の始まりです。 意識の低いコーヒーの飲み方をやめたそれまでは飲みたくなったら適当にインスタントコーヒーをタンブラーに入れ、適当にお湯を注いでがぶ飲み、みたいなスタイルでした。考え得る中でもトップクラスに意識の低いコーヒーの飲み方だったなと今では思います。 ちょっといい珈琲抽出器具を買ってみたそんな雑なコーヒー習慣をやめ、「ちゃんと淹れる」ようにしてみたんです。 「アメリカンプレス」という抽出器具を買い

                                    「ちょっといい抽出器具」でインスタントコーヒーやめました
                                  • HTML から本文のテキストだけを抽出する Python コード例(見出しタグと見出しに属するテキストを取得)

                                    HTML から『本文だけ』をキレイにスクレイピングする簡単な Python コード例を書きました。 ※ 通常のテキスト取得方法はこちらに書きました。 【Python】HTML からテキストを抽出するコード例【lxml.html】 種々雑多しゅじゅざったな HTML から、本文だけをねらって抽出する、汎用的はんようてきなコード例です。 for 文と while 文を使用して、『見出しタグと同じ階層にあるタグ』を取得していくアプローチになります。 『見出しタグ』と『見出しタグに属するテキスト』を対応づけて抽出していきます。 このアプローチで本文抽出を行った結果、本文以外のノイズを含まない、キレイなテキストを取得することができました。 サイドバーやフッターなど、本文とは関係ないテキストを、キレイに除去することができました。 本文に『見出しタグ (h1-h6)』を使用している普通の HTML であ

                                      HTML から本文のテキストだけを抽出する Python コード例(見出しタグと見出しに属するテキストを取得)
                                    • 清原達郎式「小型成長株投資」の候補240銘柄を抽出!ネットキャッシュ比率で浮かぶ割安株リスト

                                      あなたも億り人に!? 凄腕シニア投資家が教える 株式運用術 2024年から始動した「新NISA」を受け、投資熱が高まっている。より高いリターンを狙うなら、投資信託の積み立てだけでなく、個別株投資に挑むのも一手だ。その主役となりそうなのが、現役時代に蓄財した資産や退職金などで、投資の元手が豊富な50~80代個人。一方でどんな銘柄に投資すればよいのか、迷える人も多いだろう。同世代の歴戦の猛者たちが、「株式投資の極意」を直伝。87歳の現役トレーダーや、「伝説の投資家」清原達郎氏、退職金を200倍の40億円に増やした70代シニア、配当金&優待でホクホク老後生活を送る60代個人など、各種各様のスタイルで、虎の子の資産を殖やす術を伝授してもらう。 バックナンバー一覧 日本株展望や投資の心得などを説いた「伝説のサラリーマン投資家」清原達郎氏のインタビューに続き、本稿では、清原氏が実践してきた小型成長株投

                                        清原達郎式「小型成長株投資」の候補240銘柄を抽出!ネットキャッシュ比率で浮かぶ割安株リスト
                                      • WinRE.wim の抽出手順 (Windows 10 Pro 22H2) - くろねこ自由気ままな日記

                                        こんにちは くろねこです。 先日、投稿させていただいた Windows Update の KB5034441問題 に関連するものとして、手順をシンプルにまとめてみました。 この記事は、回復パーティションの再構築で必要となる WinRE.wim を取り出す手順を紹介するものです。 Windows 10 インストールメディア作成 Windows.isoを展開 install.wimの抽出 WinRE.wimの抽出 おわりに (ご注意) ※ この手順は、Windows 10 Pro で作業を実施する手順です。(使用しているバージョンは 22H2 です) 他のエディションの場合は、該当する部分(フォルダのパスなど)は異なる場合がありますので読み替えて実施してください。 ※ この手順で、抽出する WinRE.wim は Windows 10 Pro 用のものです。 回復パーティションの再構築方法につ

                                          WinRE.wim の抽出手順 (Windows 10 Pro 22H2) - くろねこ自由気ままな日記
                                        • 形態素解析の結果を利用してTF法により特徴抽出をする - Qiita

                                          はじめに 本記事では、文書分類器を実装するための特徴抽出方法としてのTF(Term Frequency method)法について解説する。 1. 形態素解析 文書分類では、文書内の単語の情報を利用する。日本語は英語のように単語の区切りが明示された分かち書き言語ではなく、非分かち書き言語であり、そのため、文書内の各文を単語に分割する必要がある。文を単語に分割し、各単語の品詞を推定することを形態素解析という。 ここでは、オープンソース形態素解析ソフトウェア MeCab(めかぶ)を使う. • http://taku910.github.io/mecab/ 2. 特徴抽出 分類問題を扱う際、一般に、データ中の、分類に利用する情報のことを特徴量と呼び、この特徴量をデータから抽出する作業を特徴抽出と呼ぶ。 文書の分類では、文書中の単語が特徴量として利用される。 文書内の各単語の出現頻度は、しばしば、単

                                            形態素解析の結果を利用してTF法により特徴抽出をする - Qiita
                                          • NEDO、今後取り組むべき12のAI技術開発を抽出した「AIアクションプラン」を公表

                                            NEDO、今後取り組むべき12のAI技術開発を抽出した「AIアクションプラン」を公表 抽出したAI技術の事業化へ向けた検討を推進 NEDOは、人工知能(AI)技術戦略の策定およびプロジェクトの早期開始に向けて「人工知能(AI)技術分野における大局的な研究開発のアクションプラン」(AIアクションプラン)を公表した。 本プランは、AI技術や密接に関係する技術、さらにAIを含む新技術について開発の方向性などを大局的に検討・整理したもの。2016年に公開した「次世代人工知能技術社会実装ビジョン」を参考に、学術界・産業界の有識者で構成された「AIアクションプラン策定委員会」の議論により策定された。 NEDOによれば、AI技術はこれまで深層学習の隆盛を受けて大きく発展してきたが、今後10年は意味理解のAIの開発が求められているという。同様に、今後10年を見据えて「部分最適化から全体最適化/人とAIの関

                                              NEDO、今後取り組むべき12のAI技術開発を抽出した「AIアクションプラン」を公表
                                            • 数千年もの間電力を供給できる世界初の炭素14ダイヤモンド電池を開発――炭素14を放射性廃棄物から抽出 - fabcross for エンジニア

                                              英ブリストル大学と英国原子力公社(UKAEA)は、2024年12月4日、数千年もの間デバイスに電力を供給できる可能性がある、世界初の炭素14ダイヤモンド電池を開発したと発表した。 この電池は、放射性炭素年代測定に使用することで知られている、「炭素14」という炭素の放射性同位体を利用するものだ。炭素14は、原子力発電所で減速材として使用されるグラファイト(黒鉛)ブロックで生成されるが、ブリストル大学の研究により、炭素14はグラファイトブロックの表面に集中していることが明らかになっている。 英国が保有している大量のグラファイトブロックから炭素14を抽出することで、放射性物質の大部分を除去する処理が可能となり、放射性廃棄物を安全に保管するためのコスト削減が期待される。 研究チームは、グラファイトブロックから抽出した炭素14をダイヤモンドに組み込んで原子力を利用した電池を製造した。この炭素14ダイ

                                                数千年もの間電力を供給できる世界初の炭素14ダイヤモンド電池を開発――炭素14を放射性廃棄物から抽出 - fabcross for エンジニア
                                              • 商用利用可能な個人情報抽出向けデータセットやAIモデルを公開、Nishika

                                                AI(Artificial Intelligence:人工知能)に関するコンサルティングや開発サービスを提供するNishikaは8月1日、文章の中から氏名や組織名、地名などの個人情報を機械学習により自動で抽出するためのデータセット、学習済みAIモデル、ソースコードの提供を開始すると発表した。なお、公開期間は2022年10月31日までとのことだ。 同社が今回公開するのは、約200の判例文に2万7000以上の個人情報(人名、組織名・施設名・役職名、地名、時間、商品名など)のラベルが付与された独自データセットだ。データは、同社が収集した判例文のpdfデータをテキスト化し、クレンジング後にテキストアノテーションツールdoccanoを用いて原文のマスキング箇所に対してアノテーションを行った後、架空の名称で置換することにより作成している。 アノテーションを行ったのは、PERSON(人名)、ORGFAC

                                                  商用利用可能な個人情報抽出向けデータセットやAIモデルを公開、Nishika
                                                • LangChain `with_structured_output` メソッドによる構造化データ抽出

                                                  これは何? 昨日、ALGOMATIC社のerukitiさんの記事がバズっていました。スキーマを用いてプロンプト生成すると構造化データを取り出しやすいよと言うお話でした。便利ですよねぇ。 LangChainの比較的新しいメソッド(with_structured_output)を利用すると似たような内容を比較的簡単に行えます。あまり知られていないかもしれないので、備忘録がてら雑にまとめてみます。(備忘録なのでLangChainのことは詳細に説明しません、スミマセン🙇) with_structured_output メソッドとは with_structured_output メソッドは、LangChain で構造化データ抽出を行うための統一されたインターフェースです。以下の2ステップで利用できます。 構造化データをPydanticで定義する その定義を.with_structured_outp

                                                    LangChain `with_structured_output` メソッドによる構造化データ抽出
                                                  • 【検索雑談】Search Consoleでひらがな or カタカナ or 漢字のみのクエリを抽出する方法

                                                      【検索雑談】Search Consoleでひらがな or カタカナ or 漢字のみのクエリを抽出する方法
                                                    • 時系列分析に新たな潮流 : 増分近傍法による頑強な時系列「連鎖」抽出 TSC22

                                                      3つの要点 ✔️ 時系列データから特徴的な「連鎖」を探すという比較的新しい手法が強力にアップデートされました ✔️ データが変化していく中で、正確に「連鎖」を見つけ、ノイズにも強い頑強なアルゴリズムになっています ✔️ 実世界のデータで定性評価、合成データで定量評価し、優れた性能を確認しています Robust Time Series Chain Discovery with Incremental Nearest Neighbors written by Li Zhang, Yan Zhu, Yifeng Gao, Jessica Lin (Submitted on 3 Nov 2022) Comments: ICDM 2022 Subjects: Machine Learning (cs.LG); Artificial Intelligence (cs.AI); Information

                                                        時系列分析に新たな潮流 : 増分近傍法による頑強な時系列「連鎖」抽出 TSC22
                                                      • 刻音(ときね) 沈殿抽出式ティードリッパー

                                                        急須は、およそ300年前に誕生したと言われています。浮世絵にも登場し、その姿かたちはほぼ変化せずに現代に至ります。刻音(ときね)は現代のテクノロジーを用いて、急須を超える茶器を目指して開発しました。 急須を超える茶器とは「お茶本来のおいしさ=香り・旨み・渋みを、誰でも簡単に引き出せる茶器」「現代のライフスタイルに合う茶器」「お茶を淹れることが楽しみになる茶器」。この3つの要素を兼ね備えた茶器であると考えました。そして、たどり着いたひとつの答えが「沈殿抽出式」という方法です。(沈殿抽出式は特許及び商標出願中です。) クリアかつ深い味わいを引き出し、お茶を淹れるプロセスそのものが愛おしくなる茶器。刻音とともに、すてきなお茶の時間をお楽しみください。 沈殿抽出式(ちんでんちゅうしゅつしき)は、2年の歳月と500回の試作を経て完成しました。ペーパーフィルターやステンレスの茶こしなどを使わずに、日本

                                                          刻音(ときね) 沈殿抽出式ティードリッパー
                                                        • 速習Linux – 文字列の置換・抽出・検索と正規表現【sed・awk・grep】|Yuu's Memo

                                                          sedコマンド sed(Stream Editor)は、テキストストリームの編集に特化した強力なツールです。以下にsedコマンドの基本的な構文を示します。 オプション: sedコマンドの挙動を制御するための指定です。例えば、置換を行う場合には-eオプションを使用します。 スクリプト: 実行したいsedコマンドの操作を指定します。置換や削除、追加など、様々な編集操作が可能です。 ファイル名: 処理を行いたいテキストファイルのパスを指定します。省略した場合は標準入力から読み込みます。 以下でもう少し詳しく解説します。 コマンド どういう処理をしたいかをコマンドで指定します。 処理内容の出力、削除、文字列の追加、置換などの処理を行えるコマンドが用意されています。 コマンド説明

                                                            速習Linux – 文字列の置換・抽出・検索と正規表現【sed・awk・grep】|Yuu's Memo
                                                          • [アップデート] Amazon Data Firehose に CloudWatch Logs ログイベントからメッセージデータのみを抽出出来るオプションが追加されたので有効にしてみた | DevelopersIO

                                                            [アップデート] Amazon Data Firehose に CloudWatch Logs ログイベントからメッセージデータのみを抽出出来るオプションが追加されたので有効にしてみた いわさです。 今朝のアップデートで Kinesis Firehose、いや、Amazon Data Firehose で次のアップデートがアナウンスされました。 なんと、CloudWatch Logs + Firehose でログ転送を行う時に、オプションでログのソースレコードを抽出してくれるようになります。 通常特に指定しないと場合は CloudWatch Logs によって次のように構造化されたメッセージにソースメッセージを含める形になります。 { "messageType": "DATA_MESSAGE", "owner": "550669467088", "logGroup": "API-Gatew

                                                              [アップデート] Amazon Data Firehose に CloudWatch Logs ログイベントからメッセージデータのみを抽出出来るオプションが追加されたので有効にしてみた | DevelopersIO
                                                            • かぶせ茶の魅力、抽出温度で味が変わる、それはもう物語のよう♫ - けみかる、らじかる、ぷれすとリアクション

                                                              夏も近づく八十八夜 野にも山にも若葉が茂る あれに見えるは茶摘じゃないか あかねだすきに菅の笠 この歌は、"茶摘みの歌"です。立春から数えて、88日目だからは八十八夜なんです。春が終わり、夏に向けて準備を開始するこの時期。まさにGW真っただ中なんです。そんな日に、茶摘みをしてきました。こちらは、茶畑です。 綺麗な青い空の下、山から吹く風に育てられ、お茶は美味しい茶葉に生まれ変わります。黒いポリ袋で覆われていますが、これは敢えて被覆しているのです。茶葉には、テアニンという成分が含まれています。カタカナが登場すると、小難しそうな感じがしますが、うまみ成分の名前と憶えてください。このテアニンは、日光を浴びると、カテキンに変化します。カテキンが増えると、渋みや苦みになるんです。なので、この光による反応を抑えるために、黒いポリ袋で多い、テアニン>カテキンの量を制御するんです。素晴らしい技術だと思いま

                                                                かぶせ茶の魅力、抽出温度で味が変わる、それはもう物語のよう♫ - けみかる、らじかる、ぷれすとリアクション
                                                              • 無料の3DCG統合環境「Blender」v4.4が公開 ~アニメーションデータ構造が一新/「グレア」ノードでグレア部分の抽出ができるように

                                                                  無料の3DCG統合環境「Blender」v4.4が公開 ~アニメーションデータ構造が一新/「グレア」ノードでグレア部分の抽出ができるように
                                                                • 初心者でもわかるExcelマクロ入門! オートフィルタを使って複数条件で項目を抽出する方法

                                                                  1976年、大阪府生まれ。灘高校、東京大学経済学部卒業後、日系メーカーで17年間勤務。経理や営業、マーケティング、経営企画などに携わり、独学で覚えたエクセルマクロを用いて様々な分析や業務改革を行う。 2017年、GAFAの日本法人のうちの1社へシニアマネージャー(部長)として転職。これまでエクセルマクロを用いた業務改善などで数多くの社内表彰を受けている。手作業では不可能なほど大量のデータを、短時間で分析しやすく加工したことが評価され、社内エクセルマクロ講習会の講師として延べ200人以上に講座を実施。 エクセルマクロについて1から10まで教える詰込み型の学習ではなく、仕事に必要な部分だけを効率的に学べる講座として満足度98%の高い評価を受けている。 4時間のエクセル仕事は20秒で終わる 「エクセルマクロ全体の1割程度を学べば会社の業務の9割以上はカバーできる」 現役GAFA部長がエクセルマク

                                                                    初心者でもわかるExcelマクロ入門! オートフィルタを使って複数条件で項目を抽出する方法
                                                                  • 市民のスマホ情報、抽出 イスラエル製機器使い 露、反体制派抑圧に利用 | 毎日新聞

                                                                    イスラエル企業が開発した、携帯電話から個人情報を抜き取る機器がロシアなどの強権的な国家や地域で使用されている。反体制派などの抑圧に利用されており、人権団体が強く非難している。 この企業はIT機器メーカー「サン電子」(本社・名古屋市)の子会社で、イスラエル中部ペタクチクバに本社があるサイバー関連企業「セレブライト」。携帯電話などから全てのメッセージや写真などを抽出する機器「UFED」を開発、販売している。 欧米の治安機関では通常、容疑者らの携帯から犯罪の証拠などを得るため、裁判所の許可を得てUFEDを使用する。だが法の支配が浸透していない国では、当局が恣意(しい)的に市民を拘束した上で、携帯から個人情報を抜き取るケースが出ている。

                                                                      市民のスマホ情報、抽出 イスラエル製機器使い 露、反体制派抑圧に利用 | 毎日新聞
                                                                    • バイドゥ、映像内の物体をそれぞれ抽出するセグメンテーション技術「CFBI」開発 背景も考慮しより精密に

                                                                      バイドゥ、映像内の物体をそれぞれ抽出するセグメンテーション技術「CFBI」開発 背景も考慮しより精密に 2020-07-31 Baidu Researchとシドニー工科大学の研究チームが開発した「Collaborative Video Object Segmentation by Foreground-Background Integration( CFBI )」[Yang et al. 2020]は、動画内において、オブジェクトごとに追跡しクラス分けする半教師あり学習のビデオオブジェクトセグメンテーション(Video Object Segmentation 、VOS)だ。 ビデオオブジェクトセグメンテーション( VOS )とは ビデオオブジェクトセグメンテーション(VOS)とは、動画内のオブジェクトに対して、そのオブジェクトが何なのかをピクセル単位で区別し認識するタスクを指す。ターゲット

                                                                      • 長文から論点を抽出して、その論点を軸に文章の要約を試みる|mah_lab / 西見 公宏

                                                                        とある大きめの文章データを目の前にしたとき、とりあえずGPTに突っ込んで論点を抽出したいけど、データ的に大きすぎてトークン制限オーバーしちゃうし、どうしたものかなと思うことはないでしょうか。私はあります。 LangChainの要約系のチェーンを使っても良いのですが、仕組み上、かなりざっくりとした要約を作られてしまうので、何か大切なものを失ってしまう気がしてなりません。 そんな中で何となく思ったのは、文章を何らかの形でクラスタリングしたときの集合が大きい部分が論点であり、その集合毎に要約を作ってあげれば論点っぽい文章が作れるのではないか?ということでした。 というわけで早速試しにコードを書いてみたいと思います。 k-means法でクラスタリングする文章をある程度の長さでチャンクに分けた後で、埋め込みベクトルを求めてあげれば「意味の分布」を取ることができます。 そこで今回はその「意味の分布」を

                                                                          長文から論点を抽出して、その論点を軸に文章の要約を試みる|mah_lab / 西見 公宏
                                                                        • Hugging Face のポジネガ、言語モデル、固有表現抽出、要約、翻訳が行えるpipelineを試す | ゆるいDeep Learning

                                                                          下記にHuggingFaceのパイプラインの情報があります。 https://huggingface.co/transformers/main_classes/pipelines.html パイプラインで実行可能なタスクは下記になります。 ConversationalPipelineFeatureExtractionPipelineFillMaskPipelineQuestionAnsweringPipelineSummarizationPipelineTextClassificationPipelineTextGenerationPipelineTokenClassificationPipelineTranslationPipelineZeroShotClassificationPipelineText2TextGenerationPipelineTableQuestionAnsweri

                                                                            Hugging Face のポジネガ、言語モデル、固有表現抽出、要約、翻訳が行えるpipelineを試す | ゆるいDeep Learning
                                                                          • 『『めがねのあぶデカロケ地bot on Twitter: "つるの剛士が大坂なおみを叩いたってあったから 彼のツイートから『大坂なおみ』『大坂』『なおみ』『blm』『黒人』『差別』など関連ワードで検索抽出したけど、んなもん無かったんだが(困惑 https://t.co/XHtsh3UqVv"』へのコメント』へのコメント

                                                                            世の中 めがねのあぶデカロケ地bot on Twitter: "つるの剛士が大坂なおみを叩いたってあったから 彼のツイートから『大坂なおみ』『大坂』『なおみ』『blm』『黒人』『差別』など関連ワードで検索抽出したけど、... 8 人がブックマーク・4 件のコメント

                                                                              『『めがねのあぶデカロケ地bot on Twitter: "つるの剛士が大坂なおみを叩いたってあったから 彼のツイートから『大坂なおみ』『大坂』『なおみ』『blm』『黒人』『差別』など関連ワードで検索抽出したけど、んなもん無かったんだが(困惑 https://t.co/XHtsh3UqVv"』へのコメント』へのコメント
                                                                            • 「コーヒーの噴水」で抽出過程からワクワクが止まらない次世代サイフォン式コーヒーメーカー「Siphonysta」は初心者でもコーヒーの深みに至れる素敵マシンでした

                                                                              タイガー魔法瓶から2023年2月に登場したコーヒーメーカー「Siphonysta」は、サイフォン式コーヒーの抽出過程自動化を実現しており、コーヒーの味だけでなく「お湯がシリンダー内を上下に移動する」という独特な抽出過程も楽しめます。そんなSiphonystaが編集部にやってきたので、外観の徹底チェックに続いて実際にコーヒーを作って抽出過程の詳細やコーヒーの完成度を確かめてみました。 コーヒーメーカー ADS-A020 - タイガー魔法瓶 https://www.tiger-corporation.com/ja/jpn/product/coffee-machine/ads-a/ Siphonystaは、上下分割式のシリンダーユニットを搭載した独特な見た目が特徴のコーヒーメーカーです。Siphonystaの独特な外観は、以下の記事で詳しくチェックしています。今回は、Siphonystaを使って

                                                                                「コーヒーの噴水」で抽出過程からワクワクが止まらない次世代サイフォン式コーヒーメーカー「Siphonysta」は初心者でもコーヒーの深みに至れる素敵マシンでした
                                                                              • spaCy + GiNZAを使って固有表現抽出とカスタムモデルの学習をしてみる - もふもふ技術部

                                                                                自然言語処理をするときはよくRasa NLUを使っているのですが、内部的にはspaCyが使われている模様です。どちらもパイプラインでモジュールをつなげていって自然言語処理をシンプルにするフレームワークだと理解しているのですが、spaCy単独で使うとどういう感じなのか把握したかったんで試してみます。 こちらのエントリを参考にspaCyの基本的な動きを確認。 https://qiita.com/moriyamanaoto/items/e98b8a6ff1c8fcf8e293 $ mkdir spacy-ner $ cd spacy-ner 必要なライブラリをインストール。GiNZAはspaCyフレームワークのっかった形で提供されている日本語の学習済みモデルを含むライブラリです。簡単にいえばspaCyを日本語で動かせるようにするものです。 $ pip install spacy $ pip in

                                                                                  spaCy + GiNZAを使って固有表現抽出とカスタムモデルの学習をしてみる - もふもふ技術部
                                                                                • Python 輪郭の検出とその座標の抽出「OpenCV」 - PythonとVBAで世の中を便利にする

                                                                                  本記事では、画像ファイルの物体の輪郭を抽出する雛形コードを載せました。検出手法を関数として4つ載せました。いずれも処理の大まかな流れは、2値化してしきい値で判別します。その2値化が画像に依っては難しいのです。 そのため、毛色の異なる次の2つのリンク先の画像とコードを参考にさせて頂きました。更に、自前で準備した画像2つを合わせた計4つに対して、処理の過程と共に結果例を順番に載せます。 ▼チューリップの花の輪郭を検出する (参考リンク)オブジェクト輪郭検出 | OpenCV / findContours を使用して画像中のオブジェクトの輪郭を検出する方法 画像の特徴1:花が沢山あって、それぞれの形状が複雑 画像の特徴2:花とそれ以外の葉っぱなどの背景との色度が明確にわかれている 処理1. 色調RGBをHSVへ変更 →茎と土の輪郭をぼかす 処理2. ガウシアンによるスムージング処理 →更に、茎や

                                                                                    Python 輪郭の検出とその座標の抽出「OpenCV」 - PythonとVBAで世の中を便利にする