本文「テキスト処理」を検索 - はてなブックマーク

1 - 40 件 / 42件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

テキスト処理の検索結果1 - 40 件 / 42件

レベルアップしたい人必見　Qiita記事43選 - Qiita
- 381 users
- qiita.com/tadashiro_ninomiya
- テクノロジー
- 2024/04/22
はじめに本記事ではレベルアップしたいエンジニアが読んでおくべきQiita記事を紹介します。厳選に厳選を重ねた43記事です。全ての記事を読んでおく必要はありませんが、ちょっとでも「分からないな」「興味あるな」など思ったタイトルがあれば読んでみてください。次の4種類に分類して紹介しています。参考にしてください。フロントエンドバックエンドインフラ・Linux周りの知識その他それでは、早速紹介していきます！弊社Nucoでは、他にも様々なお役立ち記事を公開しています。よかったら、Organizationのページも覗いてみてください。また、Nucoでは一緒に働く仲間も募集しています！興味をお持ちいただける方は、こちらまで。フロントエンドまず最初はフロントエンドエンジニアに読んでおくべきとおすすめできるQiita記事を11個選びました！フロントエンドエンジニアとしての基礎が身に付く
- エンジニア
- あとで読む
- 開発
- プログラミング
- 学習
- Qiita
- 勉強
- 入門
- まとめ
- 知識
RAGの実装戦略まとめ - Qiita
- 284 users
- qiita.com/jw-automation
- テクノロジー
- 2024/03/19
それでは以下、簡単なデモを含めながら個別に説明していきます。 1. ハイブリッドサーチこちらは、性質の異なる複数の検索方式（例えばベクトル検索とキーワード検索）を組み合わせて検索精度を向上させる手法になります。各検索方式単体の場合に比べ、性質の異なる検索方式を組み合わせ、ある種いいとこ取りをする事で、検索性能の向上が期待できます。今回はBM25でのキーワードベースの類似度検索と通常のベクトル検索を組み合わせていきます。 BM25について簡単に説明しておくと、文脈や文章構造は完全に無視した上で、文書内の単語を全てバラバラに分割し、文書内の各単語の出現頻度と文書間におけるレア度を加味した特徴量を算出します。つまり、特定の文書内の各単語の数をカウントしてヒストグラムを作れば、似たような文書には同じような単語がよく出るはずなので(同じようなヒストグラムの形になるので)、類似度が高くなる性質
- RAG
- AI
- LLM
- あとで読む
- プログラミング
- 開発
- 自然言語処理
- 検索
- ChatGPT
- qiita
Udemyで夏のビッグセール開催！話題の生成系AIからプロダクトマネジメントまで、新たな得意分野を見つけよう - はてなニュース
- 241 users
- hatenanews.com
- テクノロジー
- 2023/08/22
※夏のビッグセール、およびキャンペーンは終了しました。ご応募ありがとうございました。なお、Udemyの講座修了者を対象とした「学習応援キャンペーン」は9月30日まで実施中です。オンライン学習プラットフォーム「Udemy」では、2023年8月22日（火）から夏のビッグセールを開催します。対象の講座が1,200円から購入可能と、なかなかチャレンジできなかった新しい領域を学習するにはとってもお得なチャンス。今回のセール対象講座から、ChatGPTやMidjourneyといった話題の生成系AI、その基礎となる大規模言語モデル（LLM）の入門や実装を扱う講座といった人気のトピックに加えて、アプリケーション開発やプロジェクトマネジメント、さらには英語学習など、ステップアップを目指すITエンジニアにオススメの中級から上級の講座もピックアップして紹介します。 Udemyで勉強を始めたいけれど、いろいろ
はじめに - 作って学ぶ正規表現エンジン
- 78 users
- makenowjust.github.io
- テクノロジー
- 2024/01/29
はじめに正規表現は様々なプログラミング言語で利用されている、テキスト処理のためのパターン言語です。正規表現はテキストエディタでの検索や置換、入力文字列のバリデーションなどプログラミングの様々な分野で実用されています。ある程度の規模のプログラムにおいて、正規表現を全く利用しない (利用していない) ということはほとんど無く、正規表現は今日のプログラミングにおいて非常に重要なパーツだと言えます。 JavaScriptやRubyといったプログラミング言語では正規表現はファーストクラスのリテラルとして実装されているため、とても簡単に利用できます。例えば次のRubyプログラミングでは変数fooに入った文字列の部分にfizzかbuzzが含まれるかどうかを、正規表現/fizz|buzz/を使ってチェックしています。 foo =~ /fizz|buzz/ さらに、計算機科学 (コンピューターサイエ
Dify のワークフローの概要｜npaka
- 63 users
- note.com/npaka
- テクノロジー
- 2024/05/04
以下の記事が面白かったので、簡単にまとめました。・Workflow - Dify 1. ワークフロー1-1. ワークフロー「ワークフロー」は、複雑なタスクを小さな「ノード」に分割することで、LLMアプリケーションのモデル推論への依存を減らし、システムの説明可能性、安定性、耐障害性を向上させます。「ワークフロー」の種類は、次のとおりです。・Chatflow : 顧客サービス、セマンティック検索など、応答作成に複数ステップのロジックを必要とする会話シナリオ用・Workflow : 高品質な翻訳、データ分析、コンテンツ作成、電子メールの自動化など、自動化・バッチ処理シナリオ用 1-2. Chatflow自然言語入力におけるユーザー意図認識の複雑さに対処するため、「質問分類」「質問書き換え」「サブ質問分割」などの問題理解ノードを提供します。さらに、LLMに外部環境との対話機能、すなわち「
- LLM
- AI
- あとで読む
- 人工知能
- ツール
丁寧なDeno+JSX - laiso
- 45 users
- laiso.hatenablog.com
- テクノロジー
- 2023/10/23
*1 サーバーレスFunctionsぐらいの気軽さでサーバーアリのWebアプリをデプロイしたいという時がある。主に自分たちだけが使うようなツール系のやつ。その時に今までのようにSPA+APIアーキテクチャではなく、モノリシックなサーバーサイドアーキテクチャにしつつもフロントエンド開発と同じツールチェインを使いたい、と前から思っていた。これは単にReactメタフレームワークでも一気通貫に時短で作れそうだけど、個人の楽しみのための活動なので、一旦世間のトレンドからは離れて自分が本当に必要だと思った要素技術のみを最小限に使って理解しながら試行錯誤したい。 ※ただ第三者に提供するシステムとかは安全に作られた既存フレームワークに乗るのがいいというのもあるしばらく考えてみたところ、私にとっては「TypeScriptでJSXをテンプレートエンジンに使ってHTMLを書けるだけでよい」という所に落ち着
- deno
- TypeScript
- React
- あとで読む
- FrontEnd
- Node.js
シングルバイナリで動くERBのテンプレートプロセッサーを作った - so what
- 38 users
- so-wh.at
- テクノロジー
- 2024/02/04
github.com 本体は ERB.new().result を呼ぶだけで、それをmrubyでdarwin/linuxのx86_64/aarch64向けにビルドした。以下のようにシングルバイナリプログラムを通してテンプレートファイルを処理できる。 <%- to = ENV["MAIL_TO"] priorities = ENV["PRIORITIES"].split(",").map(&:strip) -%> From: James <james@example.com> To: <%= to %> Subject: Addressing Needs <%= to[/\w+/] %>: Just wanted to send a quick note assuring that your needs are being addressed. I want you to know tha
- mruby
- ruby
- ERB
- あとで読む
- docker
【Claude 2.1】ChatGPTを超えるAIとなるか？Claude 2の最新モデルをGPT4と比較レビューしてみた | WEEL
- 34 users
- weel.co.jp
- テクノロジー
- 2023/11/24
このようにClaude 2.1は、読み込めるトークン数と回答の品質でChatGPTに圧勝しています。マルチモーダル対応等まだChatGPTに軍配があがる領域もあるのですが、それでもテキスト処理においてはClaude 2.1のほうがハイスペックだといえます。次の見出しからはより詳細に、Claude2.1の実力をみていきましょう！なお、API経由でデータベースを参照させる方法について詳しく知りたい方は、下記の記事を合わせてご確認ください。 →Llamaindexを使った開発とは？流れ、費用相場、開発事例を紹介 Claude 2.1の実力ここからは先代・Claude 2.0と比較して、Claude 2.1が進化している点を紹介していきます。部分的にはChatGPT Plus超えのその実力をみていきましょう！入力できるトークン数先代モデル・Claude 2.0の時点で、10万トークンもの
弊社で使っているAzureリソースのスルメ系命名規則を紹介します
- 29 users
- zenn.dev/aeonpeople
- テクノロジー
- 2023/12/09
上記を元に先ほどの整い例をご説明しますとステージング環境：s 認証会員基盤（Auth and Member）：am Azure Kubernetes Service：ak 東日本リージョン（Japan East）：je クーポン（coupon）：coupn 最初のリソース：001 となります。いや…やっぱ分かりにくいし普通にCloud Adoption Frameworkのベストプラクティスに従えばいいんじゃ…とほとんどの方が感じていると思うので次にこの初見殺しの命名規則の二大メリットをお話しますね。【その一】Azure リソースの名前付け規則と制限事項に抵触しないまず下記を確認してみましょう。嘔吐しそうになるほど盛り沢山のAzureリソースの名前付けの規則と制限事項が並んでいますね。で、細かく見ていくと下記のようなことがたま～にあるんです。ハイフン（-）が有効な文字に含まれ
- Azure
- あとで読む
YAPC::Hirosima 2024でコードゴルフコンテストを開催しました〜解説編〜 #yapcjapan - KAYAC engineers' blog
- 29 users
- techblog.kayac.com
- テクノロジー
- 2024/02/22
こんにちは、技術部の谷脇です。去る2月10日に行われたYAPC::Hiroshima2024ですが、みなさまはいかがだったでしょうか。私は参加して大満足であり、運営の方々に大感謝させていただきます。さて、カヤックではゴールドスポンサーと椅子スポンサーをしていたというのは開催直前に出した記事で述べさせていただきました。 techblog.kayac.com この記事では伏せられていた、椅子スポンサーのPerlbatrossですが、この記事ではPerlbatrossの内容紹介と問題解説をしようと思います。 Perlbatrossとは YAPC::Hiroshima2024の開催期間中にコードゴルフの問題を出していました。以下は椅子スポンサーで貼らせていただいた問題です。 Q1. Split of Graphemeの問題さて、これだけではなく、QRコードにアクセスすると実際に問題を解けるサ
- yapcjapan
- perl
- あとで読む
- 技術
画像分析機能を持つオープンソースLLM『LLaVA-1.5』登場。手持ちの画像を分析可能。GPT-4Vとの違い | AIDB
- 26 users
- ai-data-base.com
- テクノロジー
- 2023/10/11
関連研究（続きは記事末尾にあります） ■OpenAI、ChatGPTが画像を分析する『GPT-4V（ビジョン）』を発表。安全性、嗜好性、福祉機能を強化 ■Microsoftの画像セグメンテーション新技術「SEEM（Segment Everything Everywhere Model）」の凄さ、Meta AIのSAMとの違い従来の課題視覚情報の処理能力不足従来のLLMは、言語タスクに対する能力は優れていましたが、多モーダル（視覚と言語）のアップデートはあまり行われていませんでした。要するに、視覚的な情報を処理する能力には限界がありました。高性能な画像分析LLMの需要多くの開発者や研究者が高性能な画像分析LLMを求めていましたが、これまでのところそのようなモデルは一般に提供されていませんでした。これらの課題を解決するために、LLaVA-1.5が開発されました。このモデルは、視覚エ
- LLM
- GPT
- 分析
- AI
- 画像
- あとで読む
- モデル
未経験から年収600万円を超えるITエンジニアになった経歴
- 25 users
- zenn.dev/arapower
- テクノロジー
- 2024/04/04
この記事の目的 ITエンジニアに転職したが上手く行かないという人たちの話を見聞きする中、何か助けてあげられないだろうかと思っていました。ITエンジニアの経歴は様々で、詳しく語られないことも多いように感じます。そこで私の経験が参考になればと考えて書きました。冒頭のグラフは私の実際の年収の推移です。本文中に年収を記載していますので、一つの事例として読んでもらえたらと思います。特に以下のような人たちの参考になればと思っています。他職種からITエンジニアに転職した人東京が通勤圏外の地方在住者 ITエンジニアの中でもインフラエンジニアやSRE（Site Reliability Engineering）の人記事の内容は私の過去の経験であり、技術トレンドや転職市場の肌感は参考にならないかもしれません。ですが職種やポジションに対して求められるスキルの程度はあまり変わっていないように思います。ま
- 転職
- あとで読む
TextKit 2 時代の iOS のキーボードとテキスト入力と表示のすべて
- 22 users
- speakerdeck.com/niw
- テクノロジー
- 2023/09/02
iOS は一見、テキスト入力や表示のような基本的実装はとても簡単に思えますが、実際には一度はその動作に頭を悩ましたことがあるでしょう。 iOSDC 2020 では「iOS のキーボードと文字入力のすべて」と題してこれらの問題について詳細に検討しました。そして、この3年間で iOS は大きく変化し、SwiftUI が広く使われるようになり、全く新しいAPI、TextKit 2 が登場しました。 TextKit 2 は大きく変化しおり、互換性に関して注意すべき点が多くあります。このセッションでは、過去の事例と比較して、多くのユーザが使う iOS アプリにおけるリッチテキストの実装などを踏まえて、キーボードの挙動や SwiftUI、そして TextKit 2 によって変わったテキスト処理について実装例を用いて検討していきます。対象とする方: iOS アプリ開発の経験がある中・上級者
- iOS
- あとで読む
- API
- UI
- アプリ
プログラミング言語AWK 第2版
- 20 users
- www.oreilly.co.jp
- テクノロジー
- 2024/04/19
「AWK」という名前は開発者の頭文字Aho、Weinberger、Kernighanから来たもので、長い歴史を持つ、テキスト処理用のスクリプト言語です。Unix・Linuxにはデフォルトでインストールされており、多くの人に利用され、愛され続けています。改訂に伴い、計算/集計、データ分析といった話題の追加、CSV入力、Unicode対応など、時代に即したアップデートが行われています。『プログラミング言語AWK』第2版日本語版まえがきまえがき 1章　Awkチュートリアル 1.1　さあ始めよう 1.2　簡単な表示 1.3　書式付き表示 1.4　選択 1.5　計算 1.6　制御フロー文 1.7　配列 1.8　便利な一行プログラム 1.9　さて次は？ 2章　Awkの実践例 2.1　個人用ツール 2.2　選択 2.3　変換 2.4　データ要約 2.5　個人用データベース 2.6　個人用ライブラリ
- awk
- book
- tool
- programming
楽天グループが大規模言語モデルを公開　Mistralベースの70億パラメータ　商用利用も可能
- 19 users
- www.itmedia.co.jp
- テクノロジー
- 2024/03/21
楽天グループは3月21日、日本語に特化した大規模言語モデル（LLM）「Rakuten AI 7B」などを公開した。フランスのAIスタートアップ・Mistral AIのLLM「Mistral-7B-v0.1」をベースに開発した70億パラメータのLLM。ライセンスは「Apache 2.0」で、Hugging Faceからダウンロードできる。商用利用も可能。インストラクションチューニング（ファインチューニングの一種）済モデル「Rakuten AI 7B Instruct」と、このモデルを基にファインチューニングしたチャットモデル「Rakuten AI 7B Chat」も公開。いずれもライセンスは同じく、Apache 2.0。どのモデルも、Mistral-7B-v0.1を基に、ネット上に存在する日本語と英語のデータによって繰り返し事前学習したという。使ったデータは、内製のフィルタリング機能や、
- 人工知能
- techfeed
- 楽天
- AI
- IT
- あとで読む
rfコマンドの紹介: Rubyでテキスト処理を便利に - ぶていのログでぶログ
- 18 users
- tech.buty4649.net
- テクノロジー
- 2023/12/21
この記事はRuby Advent Calendar 2023の21日目の記事です。 Rubyでワンライナーでテキストの処理をしたいと思ったことはありませんか？ありますよね！そういったときに便利に使えるCLIツールのrfを作ったので紹介します。モチベーション具体例インストール方法 rfの仕様フィルタレコードとフィールドコマンドと評価結果特殊変数定義済みメソッド match / match? メソッド at_exitメソッド言語拡張 StringとInteger/Floatを直接計算、比較できる Hashのキーをメソッド名として扱える未定義の変数にInteger/Float/String、Arrayへの要素追加ができるおわりにモチベーション普段のオペレーションの中で、ファイルの特定の文字列を含む行を出力するにはgrepを使うと思います。 grepより複雑なことをやら
- ruby
- あとで読む
OpenAIが「GPT-4o」を発表、人間と同等の速さでテキスト・音声・カメラ入力を処理可能で「周囲を見渡して状況判断」「数学の解き方を教える」「AI同士で会話して作曲」など多様な操作を実行可能
- 18 users
- gigazine.net
- テクノロジー
- 2024/05/14
OpenAIが日本時間の2024年5月14日(火)にAIモデル「GPT-4o」を発表しました。GPT-4oは単一のモデルでテキスト、音声、視覚入力を非常に高速に処理可能で、リアルタイムに会話しながら「計算問題を解く」「画像の生成」「周囲の映像から状況を判断」といったタスクを実行可能です。 Hello GPT-4o | OpenAI https://openai.com/index/hello-gpt-4o/ Introducing GPT-4o and more tools to ChatGPT free users | OpenAI https://openai.com/index/gpt-4o-and-more-tools-to-chatgpt-free/ GPT-4oはテキスト、音声、視覚入力を高速処理できるマルチモーダルなAIモデルです。GPT-4oの応答時間は平均320ミリ秒で、
楽天、日本語に最適化したオープンかつ高性能なLLMを公開
- 17 users
- prtimes.jp
- テクノロジー
- 2024/03/21
楽天、日本語に最適化したオープンかつ高性能なLLMを公開- 「LM Evaluation Harness」の評価基準において、基盤モデルとインストラクションチューニング済モデルがオープンな日本語LLMにてトップを獲得 - 楽天グループ株式会社（以下「楽天」）は、日本語に最適化した高性能の大規模言語モデル（以下「LLM」）の基盤モデル（注1）「Rakuten AI 7B」（以下「本基盤モデル」）と、同モデルを基にしたインストラクションチューニング済モデル（注2）「Rakuten AI 7B Instruct」（以下「本インストラクションチューニング済モデル」）、インストラクションチューニング済モデルを基にファインチューニングを行ったチャットモデル（注3）「Rakuten AI 7B Chat」をオープンなモデルとして、3月21日（木）に公開しました。「Rakuten AI 7B」は、フラン
- あとで読む
RAG(Retrieval Augmented Generation)を用いたPostgreSQLアシスタントAIの試作 - Qiita
- 15 users
- qiita.com/comware_hiratsuka
- テクノロジー
- 2023/12/04
この記事はNTTコムウェア Advent Calendar 2023の4日目の記事です。こんにちは、NTTコムウェアの平塚です。今月は2023冬 Chill Seasonで手に馴染むブキを探しているところです。大規模言語モデルが持っていない最新情報や企業内情報を補うためのRAG(Retrieval Augmented Generation、検索拡張生成)というアーキテクチャーがあります。ごく簡単に説明すると、外部データベースを用意してそこで検索した結果を大規模言語モデルに説明させるというものです。以下はRAGのイメージ図です。現在多くの企業さまがRAGの検証に取り組んでいるところかと思います。今回RAGを用いてPostgreSQLに詳しいアシスタントAIを試作したので、気づいたところをいくつか共有いたします。まとめ PostgreSQLアシスタントAIはある程度使えるものになりそ
- postgresql
- AI
- 人工知能
- qiita
最近プログラム素人にAndroidアプリ開発を教えている
- 12 users
- karino2.github.io
- テクノロジー
- 2023/09/17
以前podcastなどでも言ったが、最近友人知人を集めてAndroidアプリ開発を教えている。最初は普段ダベってる友人が、今の仕事低賃金なのでAndroidのアプリ開発を覚えてプログラマになりたい、とか言ってきた。年齢的には自分と近い年齢なのでそれなりに探す必要はあるだろうが、まぁ探せばありそうだし、どのみちプログラムには興味あったのでやってみたい、との事。普段カフェやファミレスでダベってるのをプログラム教えるのに変えるのは別にいいよ、と思ったので、やってみた。で、共通の友人に「最近あいつにアプリ開発教えててさ〜」と言ったら「何それ、俺も習いたいんだけど？」とか言い出して、別に二人でも三人でもあんま変わらんしいいぜ、と言って、これだとどこか市の施設とかでやる方がいいか、と探したら無料で使えてホワイトボードもある所があったので、そこで教え始めた。で、そんな話を親族にしてて、小
- あとで読む
意外と知らないUnixコマンドの正式名称集 - Qiita
- 11 users
- qiita.com/kokiiii
- テクノロジー
- 2024/02/26
はじめに開発業務で必須級の知識であるUnixコマンド。全て覚えるのはなかなか難しいですが、正式名称や命名の由来を知っておくことでその意味を簡単に思い出すことができます。本記事では様々なUnixコマンドの正式名称や由来を紹介します。各コマンドの内容についてもまとめましたので復習やUnixコマンドの勉強としてもご活用いただけるかと思います。本記事の最後に、紹介したUnixコマンドと正式名称・コマンドの内容を表形式で一覧にまとめましたので、振り返りの際にご活用ください。弊社Nucoでは、他にも様々なお役立ち記事を公開しています。よかったら、Organizationのページも覗いてみてください。また、Nucoでは一緒に働く仲間も募集しています！興味をお持ちいただける方は、こちらまで。 Unixコマンドの正式名称ディレクトリ基本操作 ls 正式名称・由来：list | list seg
- Linux
GPT-4とClaude3で使い分けを！プロンプト作成のコツを解説 | 株式会社LIG(リグ)｜DX支援・システム開発・Web制作
- 9 users
- liginc.co.jp
- テクノロジー
- 2024/04/16
インハウスマーケティング部の井上です。 LIGでは部署を問わず生成AIの活用に注力しており、私も日々の業務効率化に活用しています。最近は3月に登場したAnthropic社の「Claude　3」（クロード）が話題になっていますね。個人的にもよく使用していますが、各モデルの性能を比較しているサイト「Chatbot Arena」でもGPT-4を抜き1位の座を獲得した経歴がある優秀なモデルです（※2024年4月11日現在は僅差でGPT-4が１位になっています）。そんなClaude 3ですが、公式ユーザーガイドを見るとGPT-4とは異なるプロンプト作成のコツがあるようです。今回はClaude公式ページで公開されているプロンプトエンジニアリングのポイントをまとめ、より効果的な結果を得るためのプロンプト作成のポイントを紹介します。コーディングにおけるGPT-4とClaude 3の性能を比較した記事
- ai
【Udemyメモ】もう絶対に忘れない Linux コマンド【Linux 100本ノック+名前の由来+丁寧な解説】 - Qiita
- 9 users
- qiita.com/kawahara_k
- テクノロジー
- 2024/01/20
もう絶対に忘れない Linux コマンド【Linux 100本ノック+名前の由来+丁寧な解説】というUdemyの講座があって、約2年前にキャッチアップ、学びなおしがてらやっていたメモをここにまとめます。セクション名、まとめという形で転記します。基礎的すぎて多くの記事などで言語化すらされていないことまで網羅されているので良かったです。 section2:シェルの基本【シェルとは】シェル・・・殻の意味 linuxカーネルを操作するためのインターフェース linuxカーネルとシェルを分離しておくと次のようなメリットがある・シェルを自分好みに取り換えることができる・異なるOSもシェルで操作できる・シェルにエラーが起きても、linuxカーネルへの影響が少ない。 UNIXの思想「１つのプログラムには１つのことをうまくやらせる」 bash・・・シェルの種類の一つ。最も主流で、linuxの
【LLM for NewsRec】大規模言語モデル(BERT)を活用したニュース推薦のPyTorchによる実装と評価
- 7 users
- zenn.dev/yukiyada
- テクノロジー
- 2023/09/26
1. はじめに世は大インターネット時代。「ニュースは紙ではなく、スマホで。」が当たり前。日々生み出される膨大なニュースの中から個人の嗜好に基づいた記事を抽出するニュース推薦システムの需要は高まり、Microsoft NewsやYahoo News、Smart Newsなど数多くのオンラインニュースメディアが、その分野に多大なる労力を割いています。そして、近年用いられる手法の多くは機械学習技術が用いられています。ニュース推薦における推薦アイテムは、いうまでもなく「ニュース記事」。そしてその大部分はテキスト情報から構成されます。機械学習 x テキスト処理となると、今最もホットなトピックといえば、やはり大規模言語モデルの応用です。大規模言語モデルは、膨大なコーパスによる事前学習を通して深い言語理解を獲得した大規模なニューラルネットです。文書分類や翻訳、対話応答など、様々な自然言語処理タスク
- モデル
- ニュース
楽天、日本語に最適化したオープンかつ高性能なLLMを公開 | 楽天グループ株式会社
- 6 users
- corp.rakuten.co.jp
- テクノロジー
- 2024/03/22
- 「LM Evaluation Harness」の評価基準において、基盤モデルとインストラクションチューニング済モデルがオープンな日本語LLMにてトップを獲得 - 楽天グループ株式会社（以下「楽天」）は、日本語に最適化した高性能の大規模言語モデル（以下「LLM」）の基盤モデル（注1）「Rakuten AI 7B」（以下「本基盤モデル」）と、同モデルを基にしたインストラクションチューニング済モデル（注2）「Rakuten AI 7B Instruct」（以下「本インストラクションチューニング済モデル」）、インストラクションチューニング済モデルを基にファインチューニングを行ったチャットモデル（注3）「Rakuten AI 7B Chat」をオープンなモデルとして、3月21日（木）に公開しました。「Rakuten AI 7B」は、フランスのAIスタートアップであるMistral AI社のオー
- 人工知能
ChatGPTをExcelの関数として利用できるアドイン『生成AIツール for Excel』が公開／分類専用の関数で、アンケート処理などExcelによるテキスト処理の実務を効率化
- 5 users
- forest.watch.impress.co.jp
- テクノロジー
- 2023/11/30
GPT-4oとは？ChatGPT最新AIモデル GPT-4o の使い方や料金を詳しく解説
- 5 users
- aismiley.co.jp
- テクノロジー
- 2024/05/20
※価格は全て100万トークン辺りの金額詳細な料金プランはOpenAIの公式サイト内で確認できます。 OpenAI API price OpenAI ChatGPT アップデートの新機能 GPT-4oでは、さまざまな新機能が追加され、ユーザーエクスペリエンスが大幅に向上しています。テキストはもちろん、音声・画像・映像をシームレスに扱い、自然なテンポでのリアルタイム音声会話が可能になりました。 Say hello to GPT-4o, our new flagship model which can reason across audio, vision, and text in real time: https://t.co/MYHZB79UqN Text and image input rolling out today in API and ChatGPT with voice an
Ruby: "uselessシンタックスシュガー"シリーズ「endレス（1行）メソッド」（翻訳）｜TechRacho by BPS株式会社
- 5 users
- techracho.bpsinc.jp
- テクノロジー
- 2024/03/05
概要原著者の許諾を得て翻訳・公開いたします。英語記事: “Useless Ruby sugar”: Endless (one-line) methods 原文公開日: 2023/12/01 原著者: zverok 日本語タイトルは内容に即したものにしました。 endlessは一部を除き「endレス」としました。本記事は、最近のRubyで出現した"無用な"（さもなければ物議を醸す）構文要素を扱うシリーズ記事の一環です。本シリーズの目的は、そうした機能を擁護することでも批判することでもなく、その機能が導入された理由、設計、そして新構文を使うコードに与える影響を分析するための一種の「思考のフレームワーク」を皆さんと共有することです。本シリーズのあらまし記事もご覧ください。今回は、コミュニティでも賛否が大きく分かれた（ともするとナンパラのときよりも著しかった）機能である1行メソッド定義（o
- ruby
はじめに - 作って学ぶ正規表現エンジン
- 5 users
- makenowjust.github.io
- テクノロジー
- 2024/01/29
はじめに正規表現は様々なプログラミング言語で利用されている、テキスト処理のためのパターン言語です。正規表現はテキストエディタでの検索や置換、入力文字列のバリデーションなどプログラミングの様々な分野で実用されています。ある程度の規模のプログラムにおいて、正規表現を全く利用しない (利用していない) ということはほとんど無く、正規表現は今日のプログラミングにおいて非常に重要なパーツだと言えます。 JavaScriptやRubyといったプログラミング言語では正規表現はファーストクラスのリテラルとして実装されているため、とても簡単に利用できます。例えば次のRubyプログラミングでは変数fooに入った文字列の部分にfizzかbuzzが含まれるかどうかを、正規表現/fizz|buzz/を使ってチェックしています。 foo =~ /fizz|buzz/ さらに、計算機科学 (コンピューターサイエ
- Ruby
- Programming
生成AIの動向と産業影響【総合編】～生成AIは産業をどのように変えるか～（2023年12月）
- 4 users
- www.mizuhobank.co.jp
- テクノロジー
- 2023/12/27
© 2023 Mizuho Bank, Ltd. All Rights Reserved. みずほフィナンシャルグループリサーチ＆コンサルティングユニットみずほ銀行産業調査部生成AIの動向と産業影響【総合編】～生成AIは産業をどのように変えるか～（2023年12月）アンケートにご協力をお願いします QR *日本産業の競争力強化や社会課題の解決に寄与しうる技術・イノベーション領域をとり上げるレポートバーコード未取得みずほ産業調査74号革新的技術シリーズ* 1 総合編目次はじめに P2 1. 生成AIの概要と社会動向 P6 （1）生成AIの概要～生成AIとは何か？ P6 （2）生成AIをめぐる社会・市場動向 P13 （3）主要国・地域の生成AI関連動向 P24 2. 生成AIが産業に及ぼす影響 P32 （1）仕事の在り方の変化とビジネスへの影響 P32 （2）
- AI
- あとで読む
ChatGPTがユーザーを“騙す”のはなぜ？　「プレッシャーに弱いから」説が登場
- 4 users
- www.itmedia.co.jp
- テクノロジー
- 2024/02/06
2023年11～12月にかけて、SNSであるうわさが流れた。OpenAIが提供する生成AI「ChatGPT」は「早めの休暇を取った」というのだ。ユーザーが投げかける質問に簡略化された回答を生成したり、一部のタスクを拒否したりしているといった報告が相次ぐ中、その理由を探る試みが続いている。 OpenAIも認めた“怠惰”説　ChatGPTは「冬休み」に入ったのか？ペンシルバニア大学ウォートンスクールのイーサン・モリック准教授は2023年11月28日（現地時間、以下同じ）、「ChatGPTが怠惰になったといううわさは、私が個人的に実施した検証によると、本当である可能性がある」と「X」（旧「Twitter」）に投稿した（注1）。モリック准教授はXに一連の検証結果を投稿した。同教授によると、ChatGPTはユーザーに指示されたタスクの内容は理解しているものの、ユーザー自身がその作業を実行するよう
【テキストマイニング】Pythonで行う12月のブログ分析【その2】 - 43号線を西へ東へ
- 4 users
- driveon43.com
- テクノロジー
- 2024/01/13
自分のブログ記事をテキストマイニングで分析し、過去の興味やトピックを言葉の出現頻度から探ります。12月のブログ記事の総文字数約4万字を分析し、どのようなキーワードが頻出しているかを調査しました。先日「叡智の三猿」ブログのスロトレ様が紹介されていた記事があまりにも興味深いものだったので、私もまねしてみました。テキストマイニングを用いたワードクラウドの作成です。スロトレ様のテキストデータは昨年1年分のブログ記事を読み込ませて作成されたとのこと。紹介されているのワードクラウドは、ブログのテーマである「情報セキュリティー」が大きく表示されていますが、その下に「韓流ドラマ」があります。韓国ドラマには情報セキュリティを題材にされたものが多く、取り上げることがあったからとのことです。私のブログではどんな結果が出るのでしょうか。ブログに打ち込んだ文章は、書きたいことについてそのときに頭に浮かんだ単語
ものづくり現場で使える軽量Rubyが熱い！ RAM使用量5KB強で動く「mruby/c」について聞いてみた - Qiita Zine
- 4 users
- zine.qiita.com
- テクノロジー
- 2024/03/30
労働力人口の減少に伴ってものづくりの現場でもDXの必要性が叫ばれている中、管理ソフトウェアならともかく、現場となる工場などでのハードウェアを動かすプログラムに関しては、モダンな環境にするのは至難の業でしょう。というのも、そのようなハードウェアは小さなマイコン（電気機器を制御するための電子部品）上にプログラムが組まれているわけですが、そこで使われている言語は非常にレガシーで、拡張性に乏しく可読性も低いためです。そのようなものづくり現場の課題を解決するアプローチとして開発されたのが、組込みシステム向けの軽量Rubyの開発言語「mruby/c」（読み方：エムルビー・スラッシュ・シー）です。mruby/cはRAM使用量わずか5KB強で動くことから、小さなマイコンであっても、Rubyのもつ生産性・表現力の高さを引き継ぐことができると言います。具体的にどのような形で実装が進められているのか。今回
- ruby
- あとで読む
【AI】無料で利用可能な革新的性能のAIモデル「GPT-4o」がリリース | EARLの医学ノート
- 4 users
- drmagician.exblog.jp
- テクノロジー
- 2024/05/15
■2024年5月14日にOpenAI社からGPT-4o（oはomni「全て」の略）がリリースされた．この日はGoogleが大規模アップデートを発表する日でもあったが，GPT-4oのその性能と無料開放されたことから完全に霞んでしまったようである（Googleアップデートもかなりのものなので後日別の記事でまとめる）．OpenAIは1ヵ月前にGPT-4-turbo-2024-04-09をリリースしてかなり精度アップしていたが，今回はそれを大きく上回るマルチモーダルな大幅アップデートである．Hello, GPT-4o. OpenAI 2024 May 13 https://openai.com/index/hello-gpt-4o/ ■実は，このGPT-4oは事前公開されていた．多数のAIチャットボットを比較できるChatBot Arenaに，4月30日に突然GPT2-chatbotなるものが1日
HEROZ ASKのGPT-4o対応について - HEROZ Tech Blog
- 3 users
- heroz-tech.hatenablog.jp
- テクノロジー
- 2024/06/06
はじめに GPT-4oとはテキストの性能日本語のRAGの性能 RAG（Retrieval-Augmented Generation）とはデータソース AIアシスタント作成モデルごとのRAGの性能確認 GPT-3.5 GPT-4 GPT-4o まとめはじめに当社では、ChatGPTのAPIを活用した「HEROZ ASK」というサービスを提供しています。この度、リリースされたばかりのGPT-4oに対応したことで、RAG（Retrieval-Augmented Generation）機能を大幅に強化しました。本記事では、GPT-4oの特徴や「HEROZ ASK」における具体的な活用方法、そして新しい機能がどのようにお客様の業務効率化に寄与するかについて解説します。 GPT-4oとは GPT-4oは、OpenAIが開発した最新の言語モデルであり、従来のGPT-4に比べて以下の点で改良さ
ターミナルで用いるコマンドの略称と正称リスト。grep,cat,chmodって何の略語？ - Qiita
- 3 users
- qiita.com/muranakar
- テクノロジー
- 2024/02/02
*1 @he451 さんにコメントいただき、一部追記いたしました。コメントありがとうございました🙇‍♂ 引用元書籍『Efficient Linuxコマンドライン ―開発と自分に磨きをかけるLinuxのテクノロジー』 *2 @isuke さんにコメントいただき、一部追記いたしました。コメントありがとうございました🙇‍♂ 詳細リスト ls List (一覧表示) カレントディレクトリ内のファイルとディレクトリの一覧を表示します。ディレクトリ内のファイルやサブディレクトリを確認するためによく使用されます。 cd Change Directory (ディレクトリを変更) カレントディレクトリを変更するために使用されます。指定したディレクトリに移動する際に使います。 pwd Print Working Directory (現在の作業ディレクトリを表示) 現在の作業ディレクトリのパスを表示しま
達人出版会
- 3 users
- tatsu-zine.com
- テクノロジー
- 2023/12/25
［令和6年度］基本情報技術者超効率の教科書＋よく出る問題集五十嵐順子徹底攻略データベーススペシャリスト教科書令和6年度株式会社わくわくスタディワールド瀬戸美月　著徹底攻略AWS認定SysOpsアドミニストレーター - アソシエイト教科書＆問題集［SOA-C02］対応鮒田文平, 長澤美波, 日暮拓也, 奥井務, 渡辺樹, 山下千紗, 伊藤翼世界標準MIT教科書　アルゴリズムイントロダクション第4版第2巻　高度な設計と解析の手法・高度なデータ構造・グラフアルゴリズム Thomas H. Cormen, Charles E. Leiserson, Ronald L. … 問題解決の教科書　 CITA式問題解決ワークブック市岡和之はじめてのType-C電子工作じがへるつスッキリわかるJava入門実践編第4版中山清喬(著), 株式会社フレアリ
CSS Text Level 4 を読む（抄訳）
- 3 users
- gist.github.com/MurakamiShinyu
- テクノロジー
- 2024/03/25
css-text-4-memo-ja.md CSS Text Level 4 を読む（抄訳） CSS Text Module Level 4 W3C Working Draft, 19 February 2024 This version: https://www.w3.org/TR/2024/WD-css-text-4-20240219/ Latest published version: https://www.w3.org/TR/css-text-4/ Editor's Draft: https://drafts.csswg.org/css-text-4/ この文書はCSS Text Level 4を読むための参考として部分的に訳した抄訳です。この仕様書全体の日本語訳は https://triple-underscore.github.io/css-text-ja.html に公開
- css
窓辺の小石(131) テキストの超弦理論
- 3 users
- news.mynavi.jp
- テクノロジー
- 2023/09/15
Windowsのコマンドのいくつかパイプ処理を想定しておらず、平気で1件のレコードを複数行で出力する。どちらかというと人が見て分かりやすい書式で出力されている。おそらく、cmd.exeでは満足なパイプ処理が行えなかったからだろう。これに対してUnix/Linux系のコマンドは1件1行とするものが多く、人間が見やすいようにするには別途オプション指定するなど、パイプ処理を基本にしている。 Windows XPで追加されたtasklist.exeのような一部のコマンドは少しまともである。1行1件の出力を行えるし、“/FO csv”オプションを付けることでCSV形式での出力ができる。しかし、同じXPから搭載されたサービス管理コマンドsc.exeなどは1件の情報を複数行に出力する。 PowerShellには、サービス関連のコマンドが用意されているのでsc.exeを使う必要はない。問題はPowerSh
トップページ
- 3 users
- karino2.github.io
- テクノロジー
- 2023/09/01
「karino2のあおぞらAndroid開発教室」のトップページです。以下の再生リストのコンテンツと連動しています。このコースは、基本的には以下の二つが交互に進む感じになっています。 Androidの勉強 kotlinというプログラム言語の勉強 Androidの方には「Android側」と記述してあります。区別が曖昧なものもありますが、目安にどうぞ。 AndroidStudioを触ってみる Android側最初の一歩、TextViewとButtonを使ってみよう！ Android側 EditText、チェックボックスなどを使ってみるこの辺まで終わったら、プログラム言語の方の勉強を少しする方が良い。プログラムをkotlinで学ぶ、前篇ここから少しプログラム言語の勉強をする。算数で挫折した人向けのJavaScript入門を6.3までやる「算数で挫折した人向けの、JavaScri