並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 42件

新着順 人気順

テキスト処理の検索結果1 - 40 件 / 42件

  • レベルアップしたい人必見 Qiita記事43選 - Qiita

    はじめに 本記事ではレベルアップしたいエンジニアが読んでおくべきQiita記事を紹介します。厳選に厳選を重ねた43記事です。全ての記事を読んでおく必要はありませんが、ちょっとでも「分からないな」「興味あるな」など思ったタイトルがあれば読んでみてください。 次の4種類に分類して紹介しています。参考にしてください。 フロントエンド バックエンド インフラ・Linux周りの知識 その他 それでは、早速紹介していきます! 弊社Nucoでは、他にも様々なお役立ち記事を公開しています。よかったら、Organizationのページも覗いてみてください。 また、Nucoでは一緒に働く仲間も募集しています!興味をお持ちいただける方は、こちらまで。 フロントエンド まず最初はフロントエンドエンジニアに読んでおくべきとおすすめできるQiita記事を11個選びました!フロントエンドエンジニアとしての基礎が身に付く

      レベルアップしたい人必見 Qiita記事43選 - Qiita
    • RAGの実装戦略まとめ - Qiita

      それでは以下、簡単なデモを含めながら個別に説明していきます。 1. ハイブリッドサーチ こちらは、性質の異なる複数の検索方式(例えばベクトル検索とキーワード検索)を組み合わせて検索精度を向上させる手法になります。 各検索方式単体の場合に比べ、性質の異なる検索方式を組み合わせ、ある種いいとこ取りをする事で、検索性能の向上が期待できます。 今回はBM25でのキーワードベースの類似度検索と通常のベクトル検索を組み合わせていきます。 BM25について簡単に説明しておくと、文脈や文章構造は完全に無視した上で、文書内の単語を全てバラバラに分割し、文書内の各単語の出現頻度と文書間におけるレア度を加味した特徴量を算出します。 つまり、特定の文書内の各単語の数をカウントしてヒストグラムを作れば、似たような文書には同じような単語がよく出るはずなので(同じようなヒストグラムの形になるので)、類似度が高くなる性質

        RAGの実装戦略まとめ - Qiita
      • Udemyで夏のビッグセール開催! 話題の生成系AIからプロダクトマネジメントまで、新たな得意分野を見つけよう - はてなニュース

        ※夏のビッグセール、およびキャンペーンは終了しました。ご応募ありがとうございました。なお、Udemyの講座修了者を対象とした「学習応援キャンペーン」は9月30日まで実施中です。 オンライン学習プラットフォーム「Udemy」では、2023年8月22日(火)から夏のビッグセールを開催します。対象の講座が1,200円から購入可能と、なかなかチャレンジできなかった新しい領域を学習するにはとってもお得なチャンス。 今回のセール対象講座から、ChatGPTやMidjourneyといった話題の生成系AI、その基礎となる大規模言語モデル(LLM)の入門や実装を扱う講座といった人気のトピックに加えて、アプリケーション開発やプロジェクトマネジメント、さらには英語学習など、ステップアップを目指すITエンジニアにオススメの中級から上級の講座もピックアップして紹介します。 Udemyで勉強を始めたいけれど、いろいろ

          Udemyで夏のビッグセール開催! 話題の生成系AIからプロダクトマネジメントまで、新たな得意分野を見つけよう - はてなニュース
        • はじめに - 作って学ぶ正規表現エンジン

          はじめに 正規表現は様々なプログラミング言語で利用されている、テキスト処理のためのパターン言語です。 正規表現はテキストエディタでの検索や置換、入力文字列のバリデーションなどプログラミングの様々な分野で実用されています。 ある程度の規模のプログラムにおいて、正規表現を全く利用しない (利用していない) ということはほとんど無く、正規表現は今日のプログラミングにおいて非常に重要なパーツだと言えます。 JavaScriptやRubyといったプログラミング言語では正規表現はファーストクラスのリテラルとして実装されているため、とても簡単に利用できます。 例えば次のRubyプログラミングでは変数fooに入った文字列の部分にfizzかbuzzが含まれるかどうかを、正規表現/fizz|buzz/を使ってチェックしています。 foo =~ /fizz|buzz/ さらに、計算機科学 (コンピューターサイエ

          • Dify の ワークフロー の概要|npaka

            以下の記事が面白かったので、簡単にまとめました。 ・Workflow - Dify 1. ワークフロー1-1. ワークフロー「ワークフロー」は、複雑なタスクを小さな「ノード」に分割することで、LLMアプリケーションのモデル推論への依存を減らし、システムの説明可能性、安定性、耐障害性を向上させます。 「ワークフロー」の種類は、次のとおりです。 ・Chatflow :  顧客サービス、セマンティック検索など、応答作成に複数ステップのロジックを必要とする会話シナリオ用 ・Workflow : 高品質な翻訳、データ分析、コンテンツ作成、電子メールの自動化など、自動化・バッチ処理シナリオ用 1-2. Chatflow自然言語入力におけるユーザー意図認識の複雑さに対処するため、「質問分類」「質問書き換え」「サブ質問分割」などの問題理解ノードを提供します。さらに、LLMに外部環境との対話機能、すなわち「

              Dify の ワークフロー の概要|npaka
            • 丁寧なDeno+JSX - laiso

              *1 サーバーレスFunctionsぐらいの気軽さでサーバーアリのWebアプリをデプロイしたいという時がある。主に自分たちだけが使うようなツール系のやつ。 その時に今までのようにSPA+APIアーキテクチャではなく、モノリシックなサーバーサイドアーキテクチャにしつつもフロントエンド開発と同じツールチェインを使いたい、と前から思っていた。 これは単にReactメタフレームワークでも一気通貫に時短で作れそうだけど、個人の楽しみのための活動なので、一旦世間のトレンドからは離れて自分が本当に必要だと思った要素技術のみを最小限に使って理解しながら試行錯誤したい。 ※ただ第三者に提供するシステムとかは安全に作られた既存フレームワークに乗るのがいいというのもある しばらく考えてみたところ、私にとっては「TypeScriptでJSXをテンプレートエンジンに使ってHTMLを書けるだけでよい」という所に落ち着

                丁寧なDeno+JSX - laiso
              • シングルバイナリで動くERBのテンプレートプロセッサーを作った - so what

                github.com 本体は ERB.new().result を呼ぶだけで、それをmrubyでdarwin/linuxのx86_64/aarch64向けにビルドした。 以下のようにシングルバイナリプログラムを通してテンプレートファイルを処理できる。 <%- to = ENV["MAIL_TO"] priorities = ENV["PRIORITIES"].split(",").map(&:strip) -%> From: James <james@example.com> To: <%= to %> Subject: Addressing Needs <%= to[/\w+/] %>: Just wanted to send a quick note assuring that your needs are being addressed. I want you to know tha

                  シングルバイナリで動くERBのテンプレートプロセッサーを作った - so what
                • 【Claude 2.1】ChatGPTを超えるAIとなるか?Claude 2の最新モデルをGPT4と比較レビューしてみた | WEEL

                  このようにClaude 2.1は、読み込めるトークン数と回答の品質でChatGPTに圧勝しています。マルチモーダル対応等まだChatGPTに軍配があがる領域もあるのですが、それでもテキスト処理においてはClaude 2.1のほうがハイスペックだといえます。 次の見出しからはより詳細に、Claude2.1の実力をみていきましょう! なお、API経由でデータベースを参照させる方法について詳しく知りたい方は、下記の記事を合わせてご確認ください。 →Llamaindexを使った開発とは?流れ、費用相場、開発事例を紹介 Claude 2.1の実力 ここからは先代・Claude 2.0と比較して、Claude 2.1が進化している点を紹介していきます。部分的にはChatGPT Plus超えのその実力をみていきましょう! 入力できるトークン数 先代モデル・Claude 2.0の時点で、10万トークンもの

                  • 弊社で使っているAzureリソースのスルメ系命名規則を紹介します

                    上記を元に先ほどの整い例 をご説明しますと ステージング環境:s 認証会員基盤(Auth and Member):am Azure Kubernetes Service:ak 東日本リージョン(Japan East):je クーポン(coupon):coupn 最初のリソース:001 となります。 いや…やっぱ分かりにくいし普通にCloud Adoption Frameworkのベストプラクティスに従えばいいんじゃ…とほとんどの方が感じていると思うので次にこの初見殺しの命名規則の二大メリットをお話しますね。 【その一】Azure リソースの名前付け規則と制限事項に抵触しない まず下記を確認してみましょう。 嘔吐しそうになるほど盛り沢山のAzureリソースの名前付けの規則と制限事項が並んでいますね。で、細かく見ていくと下記のようなことがたま~にあるんです。 ハイフン(-)が有効な文字に含まれ

                      弊社で使っているAzureリソースのスルメ系命名規則を紹介します
                    • YAPC::Hirosima 2024でコードゴルフコンテストを開催しました 〜解説編〜 #yapcjapan - KAYAC engineers' blog

                      こんにちは、技術部の谷脇です。 去る2月10日に行われたYAPC::Hiroshima2024ですが、みなさまはいかがだったでしょうか。私は参加して大満足であり、運営の方々に大感謝させていただきます。 さて、カヤックではゴールドスポンサーと椅子スポンサーをしていたというのは開催直前に出した記事で述べさせていただきました。 techblog.kayac.com この記事では伏せられていた、椅子スポンサーのPerlbatrossですが、この記事ではPerlbatrossの内容紹介と問題解説をしようと思います。 Perlbatrossとは YAPC::Hiroshima2024の開催期間中にコードゴルフの問題を出していました。以下は椅子スポンサーで貼らせていただいた問題です。 Q1. Split of Graphemeの問題 さて、これだけではなく、QRコードにアクセスすると実際に問題を解けるサ

                        YAPC::Hirosima 2024でコードゴルフコンテストを開催しました 〜解説編〜 #yapcjapan - KAYAC engineers' blog
                      • 画像分析機能を持つオープンソースLLM『LLaVA-1.5』登場。手持ちの画像を分析可能。GPT-4Vとの違い | AIDB

                        関連研究(続きは記事末尾にあります) ■OpenAI、ChatGPTが画像を分析する『GPT-4V(ビジョン)』を発表。安全性、嗜好性、福祉機能を強化 ■Microsoftの画像セグメンテーション新技術「SEEM(Segment Everything Everywhere Model)」の凄さ、Meta AIのSAMとの違い 従来の課題 視覚情報の処理能力不足 従来のLLMは、言語タスクに対する能力は優れていましたが、多モーダル(視覚と言語)のアップデートはあまり行われていませんでした。要するに、視覚的な情報を処理する能力には限界がありました。 高性能な画像分析LLMの需要 多くの開発者や研究者が高性能な画像分析LLMを求めていましたが、これまでのところそのようなモデルは一般に提供されていませんでした。 これらの課題を解決するために、LLaVA-1.5が開発されました。このモデルは、視覚エ

                          画像分析機能を持つオープンソースLLM『LLaVA-1.5』登場。手持ちの画像を分析可能。GPT-4Vとの違い | AIDB
                        • 未経験から年収600万円を超えるITエンジニアになった経歴

                          この記事の目的 ITエンジニアに転職したが上手く行かないという人たちの話を見聞きする中、何か助けてあげられないだろうかと思っていました。ITエンジニアの経歴は様々で、詳しく語られないことも多いように感じます。そこで私の経験が参考になればと考えて書きました。 冒頭のグラフは私の実際の年収の推移です。本文中に年収を記載していますので、一つの事例として読んでもらえたらと思います。 特に以下のような人たちの参考になればと思っています。 他職種からITエンジニアに転職した人 東京が通勤圏外の地方在住者 ITエンジニアの中でもインフラエンジニアやSRE(Site Reliability Engineering)の人 記事の内容は私の過去の経験であり、技術トレンドや転職市場の肌感は参考にならないかもしれません。ですが職種やポジションに対して求められるスキルの程度はあまり変わっていないように思います。 ま

                            未経験から年収600万円を超えるITエンジニアになった経歴
                          • TextKit 2 時代の iOS のキーボードとテキスト入力と表示のすべて

                            iOS は一見、テキスト入力や表示のような基本的実装はとても簡単に思えますが、実際には一度はその動作に頭を悩ましたことがあるでしょう。 iOSDC 2020 では「iOS のキーボードと文字入力のすべて」と題してこれらの問題について詳細に検討しました。 そして、この3年間で iOS は大きく変化し、SwiftUI が広く使われるようになり、全く新しいAPI、TextKit 2 が登場しました。 TextKit 2 は大きく変化しおり、互換性に関して注意すべき点が多くあります。 このセッションでは、過去の事例と比較して、多くのユーザが使う iOS アプリにおけるリッチテキストの実装などを踏まえて、 キーボードの挙動や SwiftUI、そして TextKit 2 によって変わったテキスト処理について実装例を用いて検討していきます。 対象とする方: iOS アプリ開発の経験がある中・上級者

                              TextKit 2 時代の iOS のキーボードとテキスト入力と表示のすべて
                            • プログラミング言語AWK 第2版

                              「AWK」という名前は開発者の頭文字Aho、Weinberger、Kernighanから来たもので、長い歴史を持つ、テキスト処理用のスクリプト言語です。Unix・Linuxにはデフォルトでインストールされており、多くの人に利用され、愛され続けています。改訂に伴い、計算/集計、データ分析といった話題の追加、CSV入力、Unicode対応など、時代に即したアップデートが行われています。 『プログラミング言語AWK』第2版 日本語版まえがき まえがき 1章 Awkチュートリアル 1.1 さあ始めよう 1.2 簡単な表示 1.3 書式付き表示 1.4 選択 1.5 計算 1.6 制御フロー文 1.7 配列 1.8 便利な一行プログラム 1.9 さて次は? 2章 Awkの実践例 2.1 個人用ツール 2.2 選択 2.3 変換 2.4 データ要約 2.5 個人用データベース 2.6 個人用ライブラリ

                                プログラミング言語AWK 第2版
                              • 楽天グループが大規模言語モデルを公開 Mistralベースの70億パラメータ 商用利用も可能

                                楽天グループは3月21日、日本語に特化した大規模言語モデル(LLM)「Rakuten AI 7B」などを公開した。フランスのAIスタートアップ・Mistral AIのLLM「Mistral-7B-v0.1」をベースに開発した70億パラメータのLLM。ライセンスは「Apache 2.0」で、Hugging Faceからダウンロードできる。商用利用も可能。 インストラクションチューニング(ファインチューニングの一種)済モデル「Rakuten AI 7B Instruct」と、このモデルを基にファインチューニングしたチャットモデル「Rakuten AI 7B Chat」も公開。いずれもライセンスは同じく、Apache 2.0。 どのモデルも、Mistral-7B-v0.1を基に、ネット上に存在する日本語と英語のデータによって繰り返し事前学習したという。使ったデータは、内製のフィルタリング機能や、

                                  楽天グループが大規模言語モデルを公開 Mistralベースの70億パラメータ 商用利用も可能
                                • rfコマンドの紹介: Rubyでテキスト処理を便利に - ぶていのログでぶログ

                                  この記事はRuby Advent Calendar 2023の21日目の記事です。 Rubyでワンライナーでテキストの処理をしたいと思ったことはありませんか?ありますよね! そういったときに便利に使えるCLIツールのrfを作ったので紹介します。 モチベーション 具体例 インストール方法 rfの仕様 フィルタ レコードとフィールド コマンドと評価結果 特殊変数 定義済みメソッド match / match? メソッド at_exitメソッド 言語拡張 StringとInteger/Floatを直接計算、比較できる Hashのキーをメソッド名として扱える 未定義の変数にInteger/Float/String、Arrayへの要素追加ができる おわりに モチベーション 普段のオペレーションの中で、ファイルの特定の文字列を含む行を出力するにはgrepを使うと思います。 grepより複雑なことをやら

                                    rfコマンドの紹介: Rubyでテキスト処理を便利に - ぶていのログでぶログ
                                  • OpenAIが「GPT-4o」を発表、人間と同等の速さでテキスト・音声・カメラ入力を処理可能で「周囲を見渡して状況判断」「数学の解き方を教える」「AI同士で会話して作曲」など多様な操作を実行可能

                                    OpenAIが日本時間の2024年5月14日(火)にAIモデル「GPT-4o」を発表しました。GPT-4oは単一のモデルでテキスト、音声、視覚入力を非常に高速に処理可能で、リアルタイムに会話しながら「計算問題を解く」「画像の生成」「周囲の映像から状況を判断」といったタスクを実行可能です。 Hello GPT-4o | OpenAI https://openai.com/index/hello-gpt-4o/ Introducing GPT-4o and more tools to ChatGPT free users | OpenAI https://openai.com/index/gpt-4o-and-more-tools-to-chatgpt-free/ GPT-4oはテキスト、音声、視覚入力を高速処理できるマルチモーダルなAIモデルです。GPT-4oの応答時間は平均320ミリ秒で、

                                      OpenAIが「GPT-4o」を発表、人間と同等の速さでテキスト・音声・カメラ入力を処理可能で「周囲を見渡して状況判断」「数学の解き方を教える」「AI同士で会話して作曲」など多様な操作を実行可能
                                    • 楽天、日本語に最適化したオープンかつ高性能なLLMを公開

                                      楽天、日本語に最適化したオープンかつ高性能なLLMを公開- 「LM Evaluation Harness」の評価基準において、基盤モデルとインストラクションチューニング済モデルがオープンな日本語LLMにてトップを獲得 - 楽天グループ株式会社(以下「楽天」)は、日本語に最適化した高性能の大規模言語モデル(以下「LLM」)の基盤モデル(注1)「Rakuten AI 7B」(以下「本基盤モデル」)と、同モデルを基にしたインストラクションチューニング済モデル(注2)「Rakuten AI 7B Instruct」(以下「本インストラクションチューニング済モデル」)、インストラクションチューニング済モデルを基にファインチューニングを行ったチャットモデル(注3)「Rakuten AI 7B Chat」をオープンなモデルとして、3月21日(木)に公開しました。 「Rakuten AI 7B」は、フラン

                                        楽天、日本語に最適化したオープンかつ高性能なLLMを公開
                                      • RAG(Retrieval Augmented Generation)を用いたPostgreSQLアシスタントAIの試作 - Qiita

                                        この記事はNTTコムウェア Advent Calendar 2023の4日目の記事です。 こんにちは、NTTコムウェアの平塚です。今月は2023冬 Chill Seasonで手に馴染むブキを探しているところです。 大規模言語モデルが持っていない最新情報や企業内情報を補うためのRAG(Retrieval Augmented Generation、検索拡張生成)というアーキテクチャーがあります。ごく簡単に説明すると、外部データベースを用意してそこで検索した結果を大規模言語モデルに説明させるというものです。以下はRAGのイメージ図です。 現在多くの企業さまがRAGの検証に取り組んでいるところかと思います。今回RAGを用いてPostgreSQLに詳しいアシスタントAIを試作したので、気づいたところをいくつ か共有いたします。 まとめ PostgreSQLアシスタントAIはある程度使えるものになりそ

                                          RAG(Retrieval Augmented Generation)を用いたPostgreSQLアシスタントAIの試作 - Qiita
                                        • 最近プログラム素人にAndroidアプリ開発を教えている

                                          以前podcastなどでも言ったが、最近友人知人を集めてAndroidアプリ開発を教えている。 最初は普段ダベってる友人が、今の仕事低賃金なのでAndroidのアプリ開発を覚えてプログラマになりたい、とか言ってきた。 年齢的には自分と近い年齢なのでそれなりに探す必要はあるだろうが、 まぁ探せばありそうだし、どのみちプログラムには興味あったのでやってみたい、との事。 普段カフェやファミレスでダベってるのをプログラム教えるのに変えるのは別にいいよ、と思ったので、やってみた。 で、共通の友人に「最近あいつにアプリ開発教えててさ〜」と言ったら「何それ、俺も習いたいんだけど?」とか言い出して、 別に二人でも三人でもあんま変わらんしいいぜ、と言って、これだとどこか市の施設とかでやる方がいいか、と探したら無料で使えてホワイトボードもある所があったので、 そこで教え始めた。 で、そんな話を親族にしてて、小

                                          • 意外と知らないUnixコマンドの正式名称集 - Qiita

                                            はじめに 開発業務で必須級の知識であるUnixコマンド。 全て覚えるのはなかなか難しいですが、正式名称や命名の由来を知っておくことでその意味を簡単に思い出すことができます。 本記事では様々なUnixコマンドの正式名称や由来を紹介します。各コマンドの内容についてもまとめましたので復習やUnixコマンドの勉強としてもご活用いただけるかと思います。 本記事の最後に、紹介したUnixコマンドと正式名称・コマンドの内容を表形式で一覧にまとめましたので、振り返りの際にご活用ください。 弊社Nucoでは、他にも様々なお役立ち記事を公開しています。よかったら、Organizationのページも覗いてみてください。 また、Nucoでは一緒に働く仲間も募集しています!興味をお持ちいただける方は、こちらまで。 Unixコマンドの正式名称 ディレクトリ基本操作 ls 正式名称・由来:list | list seg

                                              意外と知らないUnixコマンドの正式名称集 - Qiita
                                            • GPT-4とClaude3で使い分けを!プロンプト作成のコツを解説 | 株式会社LIG(リグ)|DX支援・システム開発・Web制作

                                              インハウスマーケティング部の井上です。 LIGでは部署を問わず生成AIの活用に注力しており、私も日々の業務効率化に活用しています。 最近は3月に登場したAnthropic社の「Claude 3」(クロード)が話題になっていますね。個人的にもよく使用していますが、各モデルの性能を比較しているサイト「Chatbot Arena」でもGPT-4を抜き1位の座を獲得した経歴がある優秀なモデルです(※2024年4月11日現在は僅差でGPT-4が1位になっています)。 そんなClaude 3ですが、公式ユーザーガイドを見るとGPT-4とは異なるプロンプト作成のコツがあるようです。今回はClaude公式ページで公開されているプロンプトエンジニアリングのポイントをまとめ、より効果的な結果を得るためのプロンプト作成のポイントを紹介します。 コーディングにおけるGPT-4とClaude 3の性能を比較した記事

                                                GPT-4とClaude3で使い分けを!プロンプト作成のコツを解説 | 株式会社LIG(リグ)|DX支援・システム開発・Web制作
                                              • 【Udemyメモ】 もう絶対に忘れない Linux コマンド【Linux 100本ノック+名前の由来+丁寧な解説】 - Qiita

                                                もう絶対に忘れない Linux コマンド【Linux 100本ノック+名前の由来+丁寧な解説】 というUdemyの講座があって、約2年前にキャッチアップ、学びなおしがてらやっていたメモをここにまとめます。 セクション名、まとめという形で転記します。 基礎的すぎて多くの記事などで言語化すらされていないことまで網羅されているので良かったです。 section2:シェルの基本 【シェルとは】 シェル・・・殻の意味 linuxカーネルを操作するためのインターフェース linuxカーネルとシェルを分離しておくと次のようなメリットがある ・シェルを自分好みに取り換えることができる ・異なるOSもシェルで操作できる ・シェルにエラーが起きても、linuxカーネルへの影響が少ない。 UNIXの思想「1つのプログラムには1つのことをうまくやらせる」 bash・・・シェルの種類の一つ。最も主流で、linuxの

                                                  【Udemyメモ】 もう絶対に忘れない Linux コマンド【Linux 100本ノック+名前の由来+丁寧な解説】 - Qiita
                                                • 【LLM for NewsRec】大規模言語モデル(BERT)を活用したニュース推薦のPyTorchによる実装と評価

                                                  1. はじめに 世は大インターネット時代。「ニュースは紙ではなく、スマホで。」が当たり前。日々生み出される膨大なニュースの中から個人の嗜好に基づいた記事を抽出するニュース推薦システムの需要は高まり、Microsoft NewsやYahoo News、Smart Newsなど数多くのオンラインニュースメディアが、その分野に多大なる労力を割いています。そして、近年用いられる手法の多くは機械学習技術が用いられています。 ニュース推薦における推薦アイテムは、いうまでもなく「ニュース記事」。そしてその大部分はテキスト情報から構成されます。機械学習 x テキスト処理となると、今最もホットなトピックといえば、やはり大規模言語モデルの応用です。 大規模言語モデルは、膨大なコーパスによる事前学習を通して深い言語理解を獲得した大規模なニューラルネットです。文書分類や翻訳、対話応答など、様々な自然言語処理タスク

                                                    【LLM for NewsRec】大規模言語モデル(BERT)を活用したニュース推薦のPyTorchによる実装と評価
                                                  • 楽天、日本語に最適化したオープンかつ高性能なLLMを公開 | 楽天グループ株式会社

                                                    - 「LM Evaluation Harness」の評価基準において、基盤モデルとインストラクションチューニング済モデルがオープンな日本語LLMにてトップを獲得 - 楽天グループ株式会社(以下「楽天」)は、日本語に最適化した高性能の大規模言語モデル(以下「LLM」)の基盤モデル(注1)「Rakuten AI 7B」(以下「本基盤モデル」)と、同モデルを基にしたインストラクションチューニング済モデル(注2)「Rakuten AI 7B Instruct」(以下「本インストラクションチューニング済モデル」)、インストラクションチューニング済モデルを基にファインチューニングを行ったチャットモデル(注3)「Rakuten AI 7B Chat」をオープンなモデルとして、3月21日(木)に公開しました。 「Rakuten AI 7B」は、フランスのAIスタートアップであるMistral AI社のオー

                                                      楽天、日本語に最適化したオープンかつ高性能なLLMを公開 | 楽天グループ株式会社
                                                    • ChatGPTをExcelの関数として利用できるアドイン『生成AIツール for Excel』が公開/分類専用の関数で、アンケート処理などExcelによるテキスト処理の実務を効率化

                                                        ChatGPTをExcelの関数として利用できるアドイン『生成AIツール for Excel』が公開/分類専用の関数で、アンケート処理などExcelによるテキスト処理の実務を効率化
                                                      • GPT-4oとは?ChatGPT最新AIモデル GPT-4o の使い方や料金を詳しく解説

                                                        ※価格は全て100万トークン辺りの金額 詳細な料金プランはOpenAIの公式サイト内で確認できます。 OpenAI API price OpenAI ChatGPT アップデートの新機能 GPT-4oでは、さまざまな新機能が追加され、ユーザーエクスペリエンスが大幅に向上しています。 テキストはもちろん、音声・画像・映像をシームレスに扱い、自然なテンポでのリアルタイム音声会話が可能になりました。 Say hello to GPT-4o, our new flagship model which can reason across audio, vision, and text in real time: https://t.co/MYHZB79UqN Text and image input rolling out today in API and ChatGPT with voice an

                                                          GPT-4oとは?ChatGPT最新AIモデル GPT-4o の使い方や料金を詳しく解説
                                                        • Ruby: "uselessシンタックスシュガー"シリーズ「endレス(1行)メソッド」(翻訳)|TechRacho by BPS株式会社

                                                          概要 原著者の許諾を得て翻訳・公開いたします。 英語記事: “Useless Ruby sugar”: Endless (one-line) methods 原文公開日: 2023/12/01 原著者: zverok 日本語タイトルは内容に即したものにしました。 endlessは一部を除き「endレス」としました。 本記事は、最近のRubyで出現した"無用な"(さもなければ物議を醸す)構文要素を扱うシリーズ記事の一環です。本シリーズの目的は、そうした機能を擁護することでも批判することでもなく、その機能が導入された理由、設計、そして新構文を使うコードに与える影響を分析するための一種の「思考のフレームワーク」を皆さんと共有することです。本シリーズのあらまし記事もご覧ください。 今回は、コミュニティでも賛否が大きく分かれた(ともするとナンパラのときよりも著しかった)機能である1行メソッド定義(o

                                                            Ruby: "uselessシンタックスシュガー"シリーズ「endレス(1行)メソッド」(翻訳)|TechRacho by BPS株式会社
                                                          • はじめに - 作って学ぶ正規表現エンジン

                                                            はじめに 正規表現は様々なプログラミング言語で利用されている、テキスト処理のためのパターン言語です。 正規表現はテキストエディタでの検索や置換、入力文字列のバリデーションなどプログラミングの様々な分野で実用されています。 ある程度の規模のプログラムにおいて、正規表現を全く利用しない (利用していない) ということはほとんど無く、正規表現は今日のプログラミングにおいて非常に重要なパーツだと言えます。 JavaScriptやRubyといったプログラミング言語では正規表現はファーストクラスのリテラルとして実装されているため、とても簡単に利用できます。 例えば次のRubyプログラミングでは変数fooに入った文字列の部分にfizzかbuzzが含まれるかどうかを、正規表現/fizz|buzz/を使ってチェックしています。 foo =~ /fizz|buzz/ さらに、計算機科学 (コンピューターサイエ

                                                            • 生成AIの動向と産業影響【総合編】~生成AIは産業をどのように変えるか~(2023年12月)

                                                              © 2023 Mizuho Bank, Ltd. All Rights Reserved. みずほフィナンシャルグループ リサーチ&コンサルティングユニット みずほ銀行 産業調査部 生成AIの動向と産業影響 【総合編】 ~生成AIは産業をどのように変えるか~ (2023年12月) アンケートに ご協力をお願いします QR *日本産業の競争力強化や社会課題の解決に寄与しうる技術・イノベーション領域をとり上げるレポート バーコード未取得 みずほ産業調査74号 革新的技術シリーズ* 1 総合編目次 はじめに P2 1. 生成AIの概要と社会動向 P6 (1) 生成AIの概要~生成AIとは何か? P6 (2) 生成AIをめぐる社会・市場動向 P13 (3) 主要国・地域の生成AI関連動向 P24 2. 生成AIが産業に及ぼす影響 P32 (1) 仕事の在り方の変化とビジネスへの影響 P32 (2)

                                                              • ChatGPTがユーザーを“騙す”のはなぜ? 「プレッシャーに弱いから」説が登場

                                                                2023年11~12月にかけて、SNSであるうわさが流れた。OpenAIが提供する生成AI「ChatGPT」は「早めの休暇を取った」というのだ。ユーザーが投げかける質問に簡略化された回答を生成したり、一部のタスクを拒否したりしているといった報告が相次ぐ中、その理由を探る試みが続いている。 OpenAIも認めた“怠惰”説 ChatGPTは「冬休み」に入ったのか? ペンシルバニア大学ウォートンスクールのイーサン・モリック准教授は2023年11月28日(現地時間、以下同じ)、「ChatGPTが怠惰になったといううわさは、私が個人的に実施した検証によると、本当である可能性がある」と「X」(旧「Twitter」)に投稿した(注1)。 モリック准教授はXに一連の検証結果を投稿した。同教授によると、ChatGPTはユーザーに指示されたタスクの内容は理解しているものの、ユーザー自身がその作業を実行するよう

                                                                  ChatGPTがユーザーを“騙す”のはなぜ? 「プレッシャーに弱いから」説が登場
                                                                • 【テキストマイニング】Pythonで行う12月のブログ分析【その2】 - 43号線を西へ東へ

                                                                  自分のブログ記事をテキストマイニングで分析し、過去の興味やトピックを言葉の出現頻度から探ります。12月のブログ記事の総文字数約4万字を分析し、どのようなキーワードが頻出しているかを調査しました。 先日「叡智の三猿」ブログのスロトレ様が紹介されていた記事があまりにも興味深いものだったので、私もまねしてみました。テキストマイニングを用いたワードクラウドの作成です。スロトレ様のテキストデータは昨年1年分のブログ記事を読み込ませて作成されたとのこと。 紹介されているのワードクラウドは、ブログのテーマである「情報セキュリティー」が大きく表示されていますが、その下に「韓流ドラマ」があります。韓国ドラマには情報セキュリティを題材にされたものが多く、取り上げることがあったからとのことです。 私のブログではどんな結果が出るのでしょうか。ブログに打ち込んだ文章は、書きたいことについてそのときに頭に浮かんだ単語

                                                                    【テキストマイニング】Pythonで行う12月のブログ分析【その2】 - 43号線を西へ東へ
                                                                  • ものづくり現場で使える軽量Rubyが熱い! RAM使用量5KB強で動く「mruby/c」について聞いてみた - Qiita Zine

                                                                    労働力人口の減少に伴ってものづくりの現場でもDXの必要性が叫ばれている中、管理ソフトウェアならともかく、現場となる工場などでのハードウェアを動かすプログラムに関しては、モダンな環境にするのは至難の業でしょう。 というのも、そのようなハードウェアは小さなマイコン(電気機器を制御するための電子部品)上にプログラムが組まれているわけですが、そこで使われている言語は非常にレガシーで、拡張性に乏しく可読性も低いためです。 そのようなものづくり現場の課題を解決するアプローチとして開発されたのが、組込みシステム向けの軽量Rubyの開発言語「mruby/c」(読み方:エムルビー・スラッシュ・シー)です。mruby/cはRAM使用量わずか5KB強で動くことから、小さなマイコンであっても、Rubyのもつ生産性・表現力の高さを引き継ぐことができると言います。 具体的にどのような形で実装が進められているのか。今回

                                                                      ものづくり現場で使える軽量Rubyが熱い! RAM使用量5KB強で動く「mruby/c」について聞いてみた - Qiita Zine
                                                                    • 【AI】無料で利用可能な革新的性能のAIモデル「GPT-4o」がリリース | EARLの医学ノート

                                                                      ■2024年5月14日にOpenAI社からGPT-4o(oはomni「全て」の略)がリリースされた.この日はGoogleが大規模アップデートを発表する日でもあったが,GPT-4oのその性能と無料開放されたことから完全に霞んでしまったようである(Googleアップデートもかなりのものなので後日別の記事でまとめる).OpenAIは1ヵ月前にGPT-4-turbo-2024-04-09をリリースしてかなり精度アップしていたが,今回はそれを大きく上回るマルチモーダルな大幅アップデートである.Hello, GPT-4o. OpenAI 2024 May 13 https://openai.com/index/hello-gpt-4o/ ■実は,このGPT-4oは事前公開されていた.多数のAIチャットボットを比較できるChatBot Arenaに,4月30日に突然GPT2-chatbotなるものが1日

                                                                        【AI】無料で利用可能な革新的性能のAIモデル「GPT-4o」がリリース | EARLの医学ノート
                                                                      • HEROZ ASKのGPT-4o対応について - HEROZ Tech Blog

                                                                        はじめに GPT-4oとは テキストの性能 日本語のRAGの性能 RAG(Retrieval-Augmented Generation)とは データソース AIアシスタント作成 モデルごとのRAGの性能確認 GPT-3.5 GPT-4 GPT-4o まとめ はじめに 当社では、ChatGPTのAPIを活用した「HEROZ ASK」というサービスを提供しています。この度、リリースされたばかりのGPT-4oに対応したことで、RAG(Retrieval-Augmented Generation)機能を大幅に強化しました。本記事では、GPT-4oの特徴や「HEROZ ASK」における具体的な活用方法、そして新しい機能がどのようにお客様の業務効率化に寄与するかについて解説します。 GPT-4oとは GPT-4oは、OpenAIが開発した最新の言語モデルであり、従来のGPT-4に比べて以下の点で改良さ

                                                                          HEROZ ASKのGPT-4o対応について - HEROZ Tech Blog
                                                                        • ターミナルで用いるコマンドの略称と正称リスト。grep,cat,chmodって何の略語? - Qiita

                                                                          *1 @he451 さんにコメントいただき、一部追記いたしました。コメントありがとうございました🙇‍♂ 引用元 書籍『Efficient Linuxコマンドライン ―開発と自分に磨きをかけるLinuxのテクノロジー』 *2 @isuke さんにコメントいただき、一部追記いたしました。コメントありがとうございました🙇‍♂ 詳細リスト ls List (一覧表示) カレントディレクトリ内のファイルとディレクトリの一覧を表示します。ディレクトリ内のファイルやサブディレクトリを確認するためによく使用されます。 cd Change Directory (ディレクトリを変更) カレントディレクトリを変更するために使用されます。指定したディレクトリに移動する際に使います。 pwd Print Working Directory (現在の作業ディレクトリを表示) 現在の作業ディレクトリのパスを表示しま

                                                                            ターミナルで用いるコマンドの略称と正称リスト。grep,cat,chmodって何の略語? - Qiita
                                                                          • 達人出版会

                                                                            [令和6年度]基本情報技術者 超効率の教科書+よく出る問題集 五十嵐 順子 徹底攻略 データベーススペシャリスト教科書 令和6年度 株式会社わくわくスタディワールド 瀬戸美月 著 徹底攻略AWS認定SysOpsアドミニストレーター - アソシエイト教科書&問題集[SOA-C02]対応 鮒田 文平, 長澤 美波, 日暮 拓也, 奥井 務, 渡辺 樹, 山下 千紗, 伊藤 翼 世界標準MIT教科書 アルゴリズムイントロダクション 第4版 第2巻 高度な設計と解析の手法・高度なデータ構造・グラフアルゴリズム Thomas H. Cormen, Charles E. Leiserson, Ronald L. … 問題解決の教科書  CITA式問題解決ワークブック 市岡 和之 はじめてのType-C電子工作 じがへるつ スッキリわかるJava入門 実践編 第4版 中山 清喬(著), 株式会社フレアリ

                                                                              達人出版会
                                                                            • CSS Text Level 4 を読む(抄訳)

                                                                              css-text-4-memo-ja.md CSS Text Level 4 を読む(抄訳) CSS Text Module Level 4 W3C Working Draft, 19 February 2024 This version: https://www.w3.org/TR/2024/WD-css-text-4-20240219/ Latest published version: https://www.w3.org/TR/css-text-4/ Editor's Draft: https://drafts.csswg.org/css-text-4/ この文書はCSS Text Level 4を読むための参考として部分的に訳した抄訳です。 この仕様書全体の日本語訳は https://triple-underscore.github.io/css-text-ja.html に公開

                                                                                CSS Text Level 4 を読む(抄訳)
                                                                              • 窓辺の小石(131) テキストの超弦理論

                                                                                Windowsのコマンドのいくつかパイプ処理を想定しておらず、平気で1件のレコードを複数行で出力する。どちらかというと人が見て分かりやすい書式で出力されている。おそらく、cmd.exeでは満足なパイプ処理が行えなかったからだろう。これに対してUnix/Linux系のコマンドは1件1行とするものが多く、人間が見やすいようにするには別途オプション指定するなど、パイプ処理を基本にしている。 Windows XPで追加されたtasklist.exeのような一部のコマンドは少しまともである。1行1件の出力を行えるし、“/FO csv”オプションを付けることでCSV形式での出力ができる。しかし、同じXPから搭載されたサービス管理コマンドsc.exeなどは1件の情報を複数行に出力する。 PowerShellには、サービス関連のコマンドが用意されているのでsc.exeを使う必要はない。問題はPowerSh

                                                                                  窓辺の小石(131) テキストの超弦理論
                                                                                • トップページ

                                                                                  「karino2のあおぞらAndroid開発教室」のトップページです。 以下の再生リストのコンテンツと連動しています。 このコースは、基本的には以下の二つが交互に進む感じになっています。 Androidの勉強 kotlinというプログラム言語の勉強 Androidの方には「Android側」と記述してあります。区別が曖昧なものもありますが、目安にどうぞ。 AndroidStudioを触ってみる Android側 最初の一歩、TextViewとButtonを使ってみよう! Android側 EditText、チェックボックスなどを使ってみる この辺まで終わったら、プログラム言語の方の勉強を少しする方が良い。 プログラムをkotlinで学ぶ、前篇 ここから少しプログラム言語の勉強をする。 算数で挫折した人向けのJavaScript入門を6.3までやる 「算数で挫折した人向けの、JavaScri