並び順

ブックマーク数

期間指定

  • から
  • まで

241 - 280 件 / 7797件

新着順 人気順

言語処理の検索結果241 - 280 件 / 7797件

  • 【GPT】プロンプトエンジニアリング手法まとめ - Qiita

    はじめまして、sonesuke( https://twitter.com/sonesuke ) です。 LLMのニュースを追っかけ続けたので、これからキャッチアップする人用にまとめておきます。 単発のプロンプトテクニックについてはこちらご覧ください。 これだけは知っとけ用語 各手法の説明を読む前に、これらの用語を読んでおくと各手法がわかります。知っている人は飛ばしてください。 プロンプトエンジニアリング 入力(プロンプト)を工夫して性能をあげようというアプローチ。 機械学習系で精度アップといえば、追加学習させたりモデルを拡張するのですが、LLMではモデルが大き過ぎてコストが洒落になりません。 そのような事情からプロンプト側を工夫することで、回答に直接影響を与えるという手法が発達しています。 ファインチューニング モデルを新たな学習データで追加学習させ、モデルのパラメータを更新し、精度を高め

      【GPT】プロンプトエンジニアリング手法まとめ - Qiita
    • 誰でもわかる全文検索入門

      全文検索エンジンも、事前に検索対象のデータを調べてこのような索引を作っておくことで、高速な検索を実現しています。 インターネット検索の例 たとえばインターネット検索の場合、まず各サイトからデータを収集して、その中から索引に載せる単語を選んで索引を作ります。索引のデータは下の図の右側のような表になっています。各単語と、それがどのサイトのどこにあったのかを記録しておく形です。 検索の時は、この索引データを調べます。例えば利用者が「理解」という言葉で検索したら、索引の「理解」のところを調べます。そうすると「サイトAの8文字目と18文字目、サイトGの……」と出現場所がわかるので、すぐに結果を返せます。 なお、この図では索引の単語の並び方が適当ですが、実際には本と同じように「あいうえお順」などに並べておいて、すぐに単語を見つけられるようにしてあります。 索引にない単語 この仕組みの場合、索引にある単

        誰でもわかる全文検索入門
      • 日本語の文章のタイポ/変換ミス/誤字脱字エラーをチェック/校正

        Enno.jpは日本語のあからさまなエラー(タイポ、スペースのエラー、誤字脱字、変換ミス、入力後の編集ミス、文字化け)を自動チェックするWebサービスです。 フォーマルな文書を中心に、あらゆる日本語文書のあからさまなエラーをチェックできます。 誤検出および無関係なエラーを極力排除しており、他のチェック・校正ツールと組み合わせるのに向いています。AIで生成・処理した文章のチェックにも有用です。 特定の業種やスタイルに依存しません。全角句読点「,」「.」やソースコードを含む理工系文書もチェックできます。 ユーザー登録は不要です。 エラーのパターンを蓄積してチェックしているので動作が安定しています(AIは使っていません)。パターンは常時追加されます。 プライバシー保護のため、チェックされる文書はデータベースやログや外部サイトなどに一切保存していません。サイト運営者も読めません。 LIG様のブログ

          日本語の文章のタイポ/変換ミス/誤字脱字エラーをチェック/校正
        • 身の振り方を考えるついでに、日本語について考えた - アスペ日記

          Google を辞めてから、頭を冷やすためにゆっくり休んで、その間にいろいろ考えた。 辞めた時に勢いで書いた記事には「IME の会社を受けてみたい」と書いたけれど、それでいいのか確信もなかった。 だって、IME の会社というと、某国産 IME *1を作っている*2徳島の会社ってことになるんだけど、はっきり言うと…斜陽の匂いがするっていうか…。 一方で、ネットの日本語表記に対する違和感のようなものが、だんだんと自分の中でふくらんでいた。やたらと漢字が増えててムカツク…。 自分で N-gram かな漢字・漢字かな変換のような実験的なものは書いてみたけど、頑張って IME にしたところで ATOK ほどの使い勝手にならないのはわかってるし…。 頭の中で、こうしたゴチャゴチャした思いが渦巻いていた。こういう時に行動を起こしても、いい結果にならない。Google に行ってしまったのは不幸なミスマッチ

            身の振り方を考えるついでに、日本語について考えた - アスペ日記
          • DATAFLUCT Tech Blog

            2022-08-27 データ抽出に特化したAirbyteによるEL(T) 環境構築の実践 データ基盤 Airbyte ELT こんにちは。今回は、データ基盤の構築の一部を実際に体験してみたいと思います。 データ基盤を作成するにあたり、まずは、社内に眠る様々なデータを集めてくる必要があります。前回の記事では、その機能を「収集」と紹介していました。 データ基盤とは何か… データ基盤 データ分析基盤 実践 2022-08-18 Metaflowでモデルの学習をpipeline化するまで MLOps Metaflow Pipeline 皆さんは「MLOps」について取り組んでいらっしゃるでしょうか。私は2018年頃からデータクレンジングや機械学習モデルの構築や運用をしてきましたが、当時の日本で私の耳にはMLOpsという言葉が入ってくることはありませんでした。 ただMLOpsの元となった「Dev…

              DATAFLUCT Tech Blog
            • Google 翻訳が進化しました。 - Google Japan Blog

              メディア関係者向けお問い合わせ先 メールでのお問い合わせ: pr-jp@google.com メディア関係者以外からのお問い合わせにはお答えいたしかねます。 その他すべてのお問い合わせにつきましては、ヘルプセンターをご覧ください。

                Google 翻訳が進化しました。 - Google Japan Blog
              • 「Google日本語入力」開発者が語る、その狙い

                Google日本法人が公開した新日本語入力システム(IME)「Google日本語入力」について、開発した同社の技術者が12月7日、開発の経緯や狙いなどを話した。予想を超える反響があったといい、「早い時期にβが取れる形で提供したい」と意気込む。Googleが来年リリースを予定している「Chrome OS」にも組み込まれる予定だ。 同IMEは12月3日にβ版として公開。Webから集めた情報を基に自動的に生成した辞書を搭載し、新語や専門用語、芸能人の名前などに強いのが特徴だ。冒頭の数文字を入力すると候補語を変換するサジェスト機能や、数字を16進数に変換する機能など、Googleらしい機能も備えている。Windows XP/Vista/7(それぞれ32ビット版)とMac OS X(Leopard以降)に対応し、無料で利用できる。 エンジニアの情熱の成果 開発は、ソフトウェアエンジニアの工藤拓さんと

                  「Google日本語入力」開発者が語る、その狙い
                • ChatGPTに社内文書に基づいた回答を生成させる仕組みを構築しました - コネヒト開発者ブログ

                  はじめに はじめまして、8月にコネヒトに入社したy.ikenoueです。 突然ですがみなさん、生成AIは使っておりますでしょうか? ChatGPTやStable Diffusionといった代表的な生成AIの発表から約1年が経過し、そろそろブームも落ち着くかと思っていたのですが、つい先日もOpenAI DevDayにてChatGPTに関する様々なアップデートが発表されるなど、相変わらず目まぐるしい日々が続いていますね。 弊社における生成AIの活用状況はというと、以前に下記の記事にて、Slack上でChatGPTと会話できる環境を社内提供しているという取り組みをご紹介しました。 tech.connehito.com 本日は、上記の社内ツールに新たに追加した「社内文書の参照機能」についてご紹介します。 「社内文書の参照機能」の概要と開発動機 まずは「社内文書の参照機能」の概要と開発にいたった動機

                    ChatGPTに社内文書に基づいた回答を生成させる仕組みを構築しました - コネヒト開発者ブログ
                  • 「うぽつ」が定着し始めたのは2011年、「草」が流行り出したのは2016年──約56億のコメントデータからニコニコ動画15年の歴史を振り返ってみた

                    本日(2021年12月12日)、ニコニコ動画は15周年を迎えた。 もともと、YouTubeの動画にコメントを付けるサービスとして始まったニコニコ。この15年の間に書き込まれたコメント数は「約56億」にも及ぶ(生放送は除く)。 単純計算で、1年に約3.6億、1日に100万を超えるコメントが書き込まれているわけだが、実際にはどのようなコメントがよく書き込まれていたのか。流行っていたのか。 そんなちょっとした好奇心をきっかけに、今回はニコニコ動画に書き込まれた15年分のコメントデータを抽出。年別で書き込み数の多いコメントTOP10や、「うぽつ」や「草」などおなじみのコメント数の書き込み数の推移など、コメントからニコニコ15年の歴史を振り返っていく。 文/竹中プレジデント ―あわせて読みたい― ・ニコニコ動画15周年の日に、ほぼ毎週ずーーっと動画投稿している筋金入りのニコ厨にサービス開始からの思い

                      「うぽつ」が定着し始めたのは2011年、「草」が流行り出したのは2016年──約56億のコメントデータからニコニコ動画15年の歴史を振り返ってみた
                    • GMOはいますぐ倒産しろ - やまもといちろうBLOG(ブログ)

                      私の趣味はゲームなんですよ。 正直、余暇の大半はゲームでありプロ野球でありネット鑑賞であり楽器演奏である私としましては、おっさんに相応しいゲームが出ると秒速100万キロのスピードでダウンロードするよう訓練されているのであります。 で、このほどWizardryタイトルがスマホで出たと言うので、疲労困憊の日々のせめてもの癒しにと思って脊髄反射でダウンロードしてみたらこの仕打ちですよ。 サービス元はGMO傘下のゲームポットですね。いい会社さんだと思いますよ。スタッフも一生懸命やっておられるようですし。しかしですね、私は本名でゲームをすることさえ許されないのでしょうか。自分の名前を入れて「お前の名前は卑猥だし不適切だ」と言われたときの愕然を理解できないようです。ああお前らはいい名前を親から授かったのかもしれないよ。でも私は如何に名前にアイデンティティを持てないとしても、自分自身が生きた証として、自

                        GMOはいますぐ倒産しろ - やまもといちろうBLOG(ブログ)
                      • 東ロボくんの生みの親《新井紀子》教授の間違いが明らかになった日。人間は人工知能に読解力でも負けつつある - Togetter

                        sangmin.eth @ChoimiraiSchool @gijigae アリババの人工知能チームが @Stanford 大学の読解力テストで人間に始めて勝ったのが、今年の1月。スコアは、 ・人:82.304 ・AI:82.44 グーグルの《BERT》でトレーニングさせた人工知能のスコアは何と、87.433!10カ月で5ポイントも上げている。人間とマシン、読解力の差は今後更に広がる🤖。 twitter.com/GoogleAI/statu… 2018-11-03 16:51:29 Google AI @GoogleAI We have released @TensorFlow code+models for BERT, a brand new pre-training technique which is now state-of-the-art on a wide array of

                          東ロボくんの生みの親《新井紀子》教授の間違いが明らかになった日。人間は人工知能に読解力でも負けつつある - Togetter
                        • ピザハットのチラシに載ってる英文が酷い「中学生レベルの英語だぞ…」→犯人はこいつだった!?

                          Oguchi T/小口 高 @ogugeo @KS_1013 二つ目の画像の英語も、最初の文字が大文字になっておらず、カンマの後にスペースがないですね。かなり残念な状況です。 2016-04-29 18:28:10

                            ピザハットのチラシに載ってる英文が酷い「中学生レベルの英語だぞ…」→犯人はこいつだった!?
                          • 【ChatGPTのおすすめプラグイン一覧】猛者達が選んだ最強プラグインの使い方69選 | WEEL

                            現在、600を超えるChatGPTプラグインが存在します。 多すぎないか?全部試す時間なんてないよ……皆さんそう思っているのではないでしょうか。 そこで今回は、ChatGPTプラグインを片っ端から試した猛者達をリサーチし、彼らが本当にオススメしているChatGPTプラグイン69選と実際に弊社が使ってみた記事、更には各プラグインの評価までをご紹介します。 ※この記事では多くのプラグインを紹介しているため、「Ctrl+F」もしくは「Command+F」で、知りたいプラグインを検索することがおすすめです。 ChatGPTプラグインとは? ChatGPTプラグインとは、ChatGPTにさまざまな機能を追加できるツールです。 プラグインを使うと、ChatGPTで以下のようなことが可能になります。 最新の情報を取得 旅行やレストランの予約 グラフや画像の表示 なんと5月20日時点で70以上のサービスが

                            • ChatGPT対抗の本命「Claude 2」ついに日本でも利用可能に

                              Anthropicは10月16日(現地時間)、同社が公開するAIチャットボット「Claude 2」の公開範囲を日本を含む世界95の国と地域に拡大したことを明らかにした。 リストにEU加盟国なし We’re rolling out access to https://t.co/RxKnLNNcNR to more people around the world. Starting today, users in 95 countries can talk to Claude and get help with their professional or day-to-day tasks. You can find the list of supported countries here: https://t.co/PbMuaqJcjU — Anthropic (@AnthropicAI) O

                                ChatGPT対抗の本命「Claude 2」ついに日本でも利用可能に
                              • 近所の情報から校歌を自動生成する - デイリーポータルZ

                                学校の校歌には、周りの山や川が必ず歌い込まれてる。 だから、地図上で学校の周りにあるスポットを自動収集すれば校歌が自動で作れるんじゃないか、ということを当サイトライターの小堀さんが言っていた。 あまりに素敵なアイデアなので、挑戦してみました。

                                • 【Ver.2.3に改訂】ChatGPT英語例文自動添削プロンプト(GPT-3.5でも日本語対話が可能になりました)

                                  このプロンプトはVer.3に改訂し、別記事に掲載しました。Ver.3では、ユーザーが学びたい語彙を指定すると、すぐにChatGPTが定義・連語・例文・類義語などを提示するようにしました。 【Ver. 3に改訂】 学術英語語彙の使い方を学ぶためのChatGPTプロンプト https://yanase-yosuke.blogspot.com/2023/10/ver-3-chatgpt.html ただしChatGPTと日本語で対話したい方は、こちらのVer.2.3をお使いください。 ■ 効果- 以下で紹介するChatGPT (GPT-3.5) のプロンプトは、英語での対話を通じて、英語の学術的な語彙の使い方を教えてくれます。 - ChatGPTは、利用者が作成した英文の正しさや適切性について英語で説明してくれますし、利用者はその説明についていくらでも質問をすることができます。その結果、その語彙の

                                    【Ver.2.3に改訂】ChatGPT英語例文自動添削プロンプト(GPT-3.5でも日本語対話が可能になりました)
                                  • ヴォイニッチ手稿はどうみても楽譜 | ここは3.11後の日本

                                    ヴォイニッチ手稿という奇書がある。14世紀ごろ(羊皮紙は1404年から1438年)に書かれた古書で未知の言語で書かれた文章と実在しない植物などの挿絵からなる。230ページもあるが、いまだに解読されていないらしい。 www.bibliotecapleyades.net/ciencia/esp_ciencia_manuscrito07.htm#top だが、これは俺には楽譜にしかみえない。 俺がおもうならそうなんだろう。俺のなかではな・・・。 ということで、終わらせてたのだけど、なんとなくなんでそう思うのかをかいておこうとおもった。 現代の一般的な楽譜は12音階からなる五線譜で書かれる。この元となったのはネウマ譜で横線に球をおく音程のとりかたは9~10世紀ごろに教会の聖歌のために体系化されたようだ。それから活版印刷が発明され楽譜が器械印刷で世に出たのは活版印刷から20年たった1473年だそ

                                    • 「コンピュータは星新一を超えられるか」 人工知能でショートショート自動生成、プロジェクトが始動

                                      星新一さんのショートショートを解析し、質の高いショートショートの自動生成を目指すプロジェクトが始まった。人工知能研究の第一人者ととして知られる松原仁教授など6人がチームを組み、SF作家の瀬名秀明さんが顧問を務める。 「コンピュータは星新一を超えられるか」――はこだて未来大学は9月6日、星新一さんのショートショートをコンピュータで解析し、新たなショートショートを生み出すプロジェクト「きまぐれ人工知能プロジェクト 作家ですのよ」を開始すると発表した。人工知能研究の第一人者として知られる同大の松原仁教授など6人がプロジェクトチームを結成。5年以内に、星新一作品と同等かそれ以上のクオリティーのショートショートの自動生成を目指す。 プロジェクトの進め方は検討中だが、1つの案として、(1)星さんのショートショート作品すべて(約1000作品)の特徴(使われている単語や文章の長さ、1文の単語の数、作品全体

                                        「コンピュータは星新一を超えられるか」 人工知能でショートショート自動生成、プロジェクトが始動
                                      • ハイフンに似ている横棒を全て統一するᅳㅡ˗𐆑–᭸‒-─−▬𐄐—━‐‑ー﹣―ー﹘-⁃➖⁻! - Qiita

                                        はじめに これらの横棒、コンピュータにとっては全て違うのですが 見分けがつくでしょうか? -˗ᅳ᭸‐‑‒–—―⁃⁻−▬─━➖ーㅡ﹘﹣-ー𐄐𐆑 郵便番号、住所、電話番号など、横棒が使われているデータを扱うとき、 人が入力したデータや購入したデータであると、同じ記号が使われていないことはよくあることです。 090-1234-5678 090᭸1234᭸5678 090‑1234‑5678 090−1234−5678 これらの電話番号の文字列も phone_no_list = ['090-1234-5678', '090᭸1234᭸5678', '090‑1234‑5678', '090−1234−5678'] # 文字をUnicodeコードポイントに変換 for n in phone_no_list: # 文字列の4番目の横棒の文字コードを見てみる print(n[3], ord(n[3]

                                          ハイフンに似ている横棒を全て統一するᅳㅡ˗𐆑–᭸‒-─−▬𐄐—━‐‑ー﹣―ー﹘-⁃➖⁻! - Qiita
                                        • ChatGPTの衝撃 第2章 -2024年8月バージョン-

                                          企業・組織に属している方向けの ChatGPT の社会・ビジネスへの影響を考えるお話です。 人とComputerの在り方が大きく変わったこれらも交えて。それらが周囲にあふれ出すその日のために、今はしっかりと Prompt の仕方を学んでおきたいものです。そのためのサンプルも幾つか継続して提示しています…

                                            ChatGPTの衝撃 第2章 -2024年8月バージョン-
                                          • 増井 / 類語をみつける方法

                                            というか[[[同じカテゴリの単語を複数見つける]]]方法 [[[同位語]]]検索というらしい [[http://IQAuth.com/ 画像なぞなぞ認証]]で偽答を作るのを自動化したい たとえば「大阪」が正解のとき「神戸」とか「京都」とかの偽答を自動生成したい 「的場」から「菊地」を生成するとか [[http://hondana.org/%E5%A2%97%E4%BA%95/4812439914 http://gyazo.com/6c0f4f744676c2a71fc1577ace0557c7.png]] [[[「や」を使う方法]]] "大阪や" でググると「大阪や埼玉」「大阪や鳥取」などが出る [[http://gyazo.com/cc94658d04bc123b1b807db482862488.png]] 京大田中研の研究 by 大島氏 [[http://ci.nii.ac.jp/na

                                            • はてなブックマーク全文検索の精度改善

                                              Hatena Engineer Seminar #5 での発表スライド

                                                はてなブックマーク全文検索の精度改善
                                              • Budou: 日本語のための自動折り返し制御ツール

                                                .app 1 .dev 1 #11WeeksOfAndroid 13 #11WeeksOfAndroid Android TV 1 #Android11 3 #DevFest16 1 #DevFest17 1 #DevFest18 1 #DevFest19 1 #DevFest20 1 #DevFest21 1 #DevFest22 1 #DevFest23 1 #hack4jp 3 11 weeks of Android 2 A MESSAGE FROM OUR CEO 1 A/B Testing 1 A4A 4 Accelerator 6 Accessibility 1 accuracy 1 Actions on Google 16 Activation Atlas 1 address validation API 1 Addy Osmani 1 ADK 2 AdMob 32 Ads

                                                  Budou: 日本語のための自動折り返し制御ツール
                                                • FrontPage - 情報論的学習理論と機械学習の「朱鷺の杜Wiki」

                                                  朱鷺の杜Wiki(ときのもり うぃき)† 朱鷺の杜Wikiは,機械学習に関連した,データマイニング,情報理論,計算論的学習理論,統計,統計物理についての情報交換の場です.これら機械学習関係の話題,リンク,関連事項,書籍・論文紹介などの情報を扱います. 更新されたページを確認するにはRSSリーダを使って右下のRSSリンクをチェックするか,最終更新のページを参照してください. ページの中でどこが更新されたかを見るには,上の「差分」をクリックして下さい. 数式の表示に MathJax を利用しています.数式の上でコンテキストメニューを使うと各種の設定が可能です.特に設定をしなくても数式は閲覧できますが,フォントをインストールすれば数式の表示がきれいで高速になります.詳しくは 数式の表示 のページを参照して下さい. ごく簡単なWikiの使い方がこのページの最後にあります.トップページやメニューなど

                                                  • 博物館所蔵の芸術作品の画像:オープンアクセスの経験(4) / クリスティン・ケリー - 翻訳記事 - みんなの翻訳

                                                    2018年05月30日 平素よりみんなの翻訳サイトをご利用いただき誠にありがとうございます。 この度、2018年05月30日 10:00より、サーバ移行に伴いサービスを一時停止させていただきます。 ※作業完了予定は未定となります。 完了時期が分かり次第、サイト上で連絡させていただきます。ご迷惑をお掛けし、申し訳ございませんが、しばらくお待ちください。

                                                    • まっくす on Twitter: "昨今のお絵描きAIの進捗が著しく、いろんな方に一歩踏み込んで知ってもらいたいと思ったのでその仕組みについて解説資料を公開します〜(先日の技術書典の本の内容です)。これからいろんな分野の方が押さえておいても良い技術だと思うので、仕組みから興味持ってもらいたいなーという気持です。(1/5) https://t.co/p7iBSY7ma5"

                                                        まっくす on Twitter: "昨今のお絵描きAIの進捗が著しく、いろんな方に一歩踏み込んで知ってもらいたいと思ったのでその仕組みについて解説資料を公開します〜(先日の技術書典の本の内容です)。これからいろんな分野の方が押さえておいても良い技術だと思うので、仕組みから興味持ってもらいたいなーという気持です。(1/5) https://t.co/p7iBSY7ma5"
                                                      • GPT4内のプログラム、地味に特許とろうと温めてたけど、間に合わなさそうなのでもう出しちゃお。 以下みたいに書くと、雑なプロンプトでも勝手に高品質になる。

                                                          GPT4内のプログラム、地味に特許とろうと温めてたけど、間に合わなさそうなのでもう出しちゃお。 以下みたいに書くと、雑なプロンプトでも勝手に高品質になる。
                                                        • TechCrunch | Startup and Technology News

                                                          Anterior, a company that uses AI to expedite health insurance approval for medical procedures, has raised a $20 million Series A round at a $95 million post-money valuation led by…

                                                            TechCrunch | Startup and Technology News
                                                          • RjpWiki - RjpWiki

                                                            RjpWiki はオープンソースの統計解析システム R に関する情報交換を目的とした Wiki ですRjpWiki はオープンソースの統計解析システム 《R》 に関する情報交換を目的とした Wiki です † どなたでも自由にページを追加・編集できます. (初めて投稿・既存記事への追加・修正を行なう方はこのページ末の注意*1を御覧下さい) ページへのファイル添付については、画像ファイルのみパスワードなしで可能としてあります(ページ上部「画像添付」より)。その他のファイルの添付はパスワードを入力することで可能です(ページ上部「ファイル添付」より)。現在のパスワードは, Rでの round(qt(0.2,df=8),3) の実行結果です。 スパム書き込みに対処するため、書き込み系の処理に対してパスワードを設けました。ユーザ名の欄には,Rで round(qt(0.2,df=8),3) を実行

                                                            • テキスト解析:日本語形態素解析API - Yahoo!デベロッパーネットワーク

                                                              指定されたURLは存在しません。 URLが正しく入力されていないか、このページが削除された可能性があります。

                                                                テキスト解析:日本語形態素解析API - Yahoo!デベロッパーネットワーク
                                                              • 「もう前置詞に迷わない」──「ネイティブレベル」の英語が書ける英文チェッカー「Ginger」日本上陸

                                                                イスラエルのGinger Softwareは4月24日、学習機能付きの英文チェッカー「Ginger」(ジンジャー)を日本向けに正式リリースした。基本無料でWebブラウザ上などで英文を書く際に使用でき、統計分析に基づいてネイティブが使う自然な表現の英文に簡単に修正できるというのが売りだ。 「Ginger」は正しい英文のライティングをサポートするツール。単語や文法レベルのミスだけでなく、時制や前後の文脈も考慮し、ネイティブが使う自然な表現に修正するという。Webブラウザ(Internet Explorer、Firefox、Chrome、Safari)か、単体ソフトのインストール(Windows版のみ)によりMicrosoft Office上で利用が可能だ。 WebメールやSNSで英文を書いたり、WordやPowerPointでドキュメントを作成する際に、ポップアップで正しい表現を自動的にサジェ

                                                                  「もう前置詞に迷わない」──「ネイティブレベル」の英語が書ける英文チェッカー「Ginger」日本上陸
                                                                • ユニットテストをGitHub CopilotとChatGPT使って書いてみたらやばかったです | DevelopersIO

                                                                  GitHub Copilotとの単体テストがやばい。ChatGPTが書いてくれるテストもすごい。もうこれらがない時代には戻れないような気がします。 こんにちは。AWS事業本部コンサルティング部に所属している今泉(@bun76235104)です。 みなさんユニットテスト書いてますか? 昨今AIがダミーデータを書いてくれたり、ユニットテストそのものを書いてくれたりと技術の進歩がすごいですね。 私はリファクタリングが好きですが、リファクタリングをする前に絶対に必要なもの。 そうテストですね。 今回私がテストを後回しにしてしまった以下のOSSについてGitHub CopilotとChatGPTのそれぞれの力を借りながら、テストを書いてみました ※ これは以前私が始めたプロジェクトであり、OSSとして公開されているので学習に使われても問題のないコードです。 なお、GitHub Copilotの料金や

                                                                    ユニットテストをGitHub CopilotとChatGPT使って書いてみたらやばかったです | DevelopersIO
                                                                  • pdfからtextを抜き出す試行錯誤のメモ|Kan Hatakeyama

                                                                    これは二段構えの構成を持っています。この二段構えを正確に検出し、テキストを理解することが望ましいです。 Unstructuredを使うPythonのライブラリであるUnstructuredを試してみましょう。 参考記事 導入は非常に簡単です。 pip install 'unstructured[pdf]' 実装も簡単です。 解析コード: from unstructured.partition.pdf import partition_pdf pdf_elements = partition_pdf("pdf/7_71_5.pdf") 表示コード: for structure in pdf_elements: print(structure) 結果: 残念ながら、2段組のカラムを正確に検出することはできませんでした。 Grobidを使うGrobidは、peS2oというオープンアクセス論文のコ

                                                                      pdfからtextを抜き出す試行錯誤のメモ|Kan Hatakeyama
                                                                    • 「自分を信じて限界を超えてください」など感情をグッと込めた指示プロンプトが添えられると、ChatGPTなどのLLMのパフォーマンスは向上する | AIDB

                                                                      ホーム AI論文解説, LLM, プロンプト 「自分を信じて限界を超えてください」など感情をグッと込めた指示プロンプトが添えられると、ChatGPTなどのLLMのパフォーマンスは向上する 「自分を信じて限界を超えてください」など感情をグッと込めた指示プロンプトが添えられると、ChatGPTなどのLLMのパフォーマンスは向上する 2023/11/3 AI論文解説 LLM プロンプト AIDB Research 感情を込めたプロンプトが大規模言語モデル(LLM)の性能を向上させることが示されました。「自分を信じて限界を超えてください」や「困難は成長のチャンスです。」といった自信や成長に関わる要素を含む指示が、モデルの出力品質に貢献するとの報告です。 この発見は、人間の感情を取り入れたアプローチが、人工知能の分野においても重要な役割を果たす可能性を示唆しています。Microsoftなどの研究グル

                                                                        「自分を信じて限界を超えてください」など感情をグッと込めた指示プロンプトが添えられると、ChatGPTなどのLLMのパフォーマンスは向上する | AIDB
                                                                      • 21世紀の文字起こし - the code to rock

                                                                        気づき そもそも文字起こしとは そもそも文字起こしとは(2) 音声入力による文字起こしの実践法(Mac) 1. 素材音声の再録音 2. Soundflowerの準備 3. Mac内部で再生+聞き取り 4. 音声ファイルが終わるまで再読み込みなどのケア まとめ 〜そしてtextlint編へ〜 続編 気づき 少し前にこのようなことに気がついた。 ひえーすごい発見をした。音声入力で文字起こし作業をナシにできないかなあ、と思って対談の音声データをiPhoneのそばで大音量で再生したけど全然認識せず。ですよねー、と一旦諦めた後にふとイヤホンで聴きながらシャドウイング的に自分で喋ったらだいぶテキスト化された(笑)これはいいのでは— Hiroaki Kadomatsu (@note103) 2016年7月6日 「いずれそうなるだろう」とは思っていたが「まだしばらく先のことだろう」とも思っていた現実が、想

                                                                        • 自然言語処理技術を用いたはてなブックマークの新機能「トピック」をベータリリースしました - はてなブックマーク開発ブログ

                                                                          こんにちは、はてなブックマークのディレクター id:jusei です。本日、はてなブックマークの新機能「トピック」をベータリリースしました。現在はPC版でのみご利用いただけます。スマートフォン版、iOSアプリ、Androidアプリでは順次対応していきます。 新機能「トピック」では、「人気エントリー」に掲載されている記事の中から関連性の高い記事をまとめ、さらにそれ以外の関連エントリーも含めて一覧できる「トピックページ」を生成します。各トピックの見出しは、自然言語処理技術を用いて自動生成しております。トピックページの生成対象は、過去10年間に蓄積されたはてなブックマークの全エントリーです。 2015年1月のトピック2005年2月のトピック トピックページには、ユーザーの皆さまの間で多く話題になっている記事を抜粋して表示する「ハイライト」、すべての記事を表示する「新着」の2つの表示モードがありま

                                                                            自然言語処理技術を用いたはてなブックマークの新機能「トピック」をベータリリースしました - はてなブックマーク開発ブログ
                                                                          • 歌ネット:歌詞全文検索

                                                                            ライブレポート shallm ライヴレポー… 【shallm ライヴレポート】 『shallm 2nd L… 2024年03月10日@ ザ・クロマニヨンズ … 【ザ・クロマニヨンズ ライヴレポート】 … 2024年02月29日@Spotify O-EAST CHiCO ライヴレポート 【CHiCO ライヴレポート】 『LAWSON presen… 2024年02月23日@ KT Zepp Yokohama 超ときめき♡宣伝部 … 【超ときめき♡宣伝部 ライヴレポート】 『… 2024年01月28日@横浜アリーナ 有華 ライヴレポート 【有華 ライヴレポート】 『有華ワンマンツ… 2024年01月27日@日本橋三井ホール

                                                                            • つくりながら学ぶ!AIアプリ開発入門 - LangChain & Streamlit による ChatGPT API 徹底活用

                                                                              つくりながら学ぶ!AIアプリ開発入門 - LangChain & Streamlit による ChatGPT API 徹底活用 この本では、LangChain と Streamlit を用いて、ChatGPT APIを活用するAIアプリを開発していきます。つくりながら学ぶことを重視し、簡単なチャットアプリ開発から始めて、Embeddingを活用するアプリ開発まで、ステップバイステップで学べます。 AIアプリをローカル環境で開発した後は、WEB上にデプロイする方法も学びます。クラウドの知識もほぼ必要なく、ランニングコストも掛からない方法で行うため、ぜひ作ったアプリを公開することにチャレンジしてみましょう。 500円と設定していますが投げ銭用です。本文は全て無料で読めます。

                                                                                つくりながら学ぶ!AIアプリ開発入門 - LangChain & Streamlit による ChatGPT API 徹底活用
                                                                              • 形態素解析の過去・現在・未来

                                                                                2. ⾃自⼰己紹介 l  海野  裕也  (@unnonouno) l  unno/no/uno l  研究開発部⾨門  リサーチャー l  専⾨門 l  ⾃自然⾔言語処理理 l  テキストマイニング l  職歴 l  2008/4~2011/3 ⽇日本アイ・ビー・エム(株)東京 基礎研究所 l  2011/4~ 現職 2 3. 今⽇日の発表の⽬目的 l  形態素解析器の中で何が⾏行行われているか l  コスト最⼩小化, HMM, MEMM, CRF etc. , l  JUMAN, Chasen, MeCab, etc. l  ・・・だけだとよくあるので、最新の⼿手法と過 去の⼿手法をまとめる l  現在の問題点に関してもまとめる 3

                                                                                  形態素解析の過去・現在・未来
                                                                                • 漢字説明ジェネレータ

                                                                                  電話で予約や申し込みをする際、名前の漢字の説明を求められることがあります。 このシステムでは漢字の説明文を作成することができます。 漢字で名前を入力して下さい。 (例)佐藤、鈴木、高橋、田中、伊藤、その他