[8ページ] 言語処理の人気記事 7676件

281 - 320 件 / 7676件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

言語処理の検索結果281 - 320 件 / 7676件

【Day-17】DeepLearning系ライブラリ、『Keras』の使い方まとめ(2.x対応版) - プロクラシスト
- 456 users
- www.procrasist.com
- テクノロジー
- 2017/01/07
【最終更新 : 2017.12.17】 ※以前書いた記事がObsoleteになったため、2.xできちんと動くように書き直しました。データ分析ガチ勉強アドベントカレンダー 17日目。 16日目に、1からニューラルネットを書きました。それはそれでデータの流れだとか、活性化関数の働きだとか得るものは多かったのですが、Kerasと言うものを使ってみて、何て素晴らしいんだと感動してしまいました今まで苦労して数十行書いていたものが、わずか3行で書ける！正直、スクラッチで書く意味って、理解にはいいけど研究や分析には必要あんまないんですよね。車輪の再発明になるし。と言うわけで、使えるものはどんどん使っていこうスタンスで、今日はKerasの紹介です！ Tutorial+気になった引数を掘り下げて補足のような感じで書いています。ちなみに、各部のコード以下をつなぎ合わせるとmnistの分類器が動くよ
連想検索エンジン reflexa
- 455 users
- labs.preferred.jp
- 暮らし
- 2007/05/10
連想検索エンジンreflexa（リフレクサ）はコトバとコトバのつながりを元に未知の情報を探索していくための連想検索エンジンです。連想検索ならではの楽しい検索体験をお楽しみ下さい。
- search
- 検索エンジン
- 連想検索
- 検索
- reflexa
- webサービス
- api
- webservice
- web
- 連想
情報系修士にもわかるダブル配列 - アスペ日記
- 455 users
- takeda25.hatenablog.jp
- テクノロジー
- 2012/02/19
最近話題の「日本語入力を支える技術」を途中まで読んだ。 3章がものすごく気合いが入っている。 trie（トライ）というデータ構造の2つの実装、「ダブル配列」と「LOUDS」について詳しく説明がされている。ダブル配列については、ぼくは以前論文を読んで勉強しようとしたのだが、その時は難しくてあきらめた覚えがある。しかし、この本の説明を読むことで理解ができた。ありがたい。感銘を受けたので、この本を教材に友達と2人勉強会をした。この2人勉強会というのは、ぼくが復習を兼ねて友達に教えるというのがだいたいのスタイル。しかし、いざやってみるといろいろと難しい。次のようなところでひっかかるようだ。例のサイズが小さく、イメージを喚起するのが難しい。最初の図のノード番号と、最終的なダブル配列上の位置が異なるため、混乱する。単語終端について言及がないので、どのノードが単語を表しているかがわから
テキストマイニング技術の活用に向けて読んでおきたい12のプレゼン資料 - コーパスいぢり〜langstatの研究日誌〜
- 454 users
- hatena.blog
- テクノロジー
- 2012/05/04
中年以降の人生を考えるための５冊今までずっと、ひたすらラクなことや楽しいことだけをやって生きていきたいと思っていたのだけど、40歳を過ぎた頃から、今までのやり方ではいろいろと行き詰まってくるようになってきました。何をやってもそんなに楽しくない。これからの人生はずっと下り坂が続いてい…
Technobahn
- 454 users
- www.technobahn.com
- 暮らし
- 2005/07/21
MENU 記事が見つかりませんでした。
- ニュースサイト
- news
- ニュース
- technology
- science
- テクノロジー
- 科学
- 株
- 技術
- 情報
加熱するLLM開発競争に冷や水、オープンモデルの組み合わせだけでGPT-4o越えの事実
- 453 users
- wirelesswire.jp
- テクノロジー
- 2024/06/21
加熱するLLM開発競争に冷や水、オープンモデルの組み合わせだけでGPT-4o越えの事実 2024.06.21 Updated by Ryo Shimizu on June 21, 2024, 18:19 pm JST 世界中の企業や政府が狂ったようにNVIDIAのGPUを買い漁る流れはそろそろ潮時かもしれない。いくつかの興味深い事象が起きているからだ。昨日発表されたKarakuri社のLLM、「KARAKURI LM 8x7B Instruct v0.1」は、非常に高性能な日本語LLMだ。Karakuri社は今年の一月にも非常に高性能な70Bモデルを引っ提げて業界に旋風を巻き起こした。この最新のLLNは、日本語向けオープンLLMとしては初の「命令実行」チューニングを施されている。それだけでなく、RAGと呼ばれる、複数の知識を組み合わせてより正解に近い答えを導く技術や、Function
- LLM
- AI
- あとで読む
- 人工知能
- ChatGPT
- 生成AI
- GPU
- 開発
- IT
- GPT
新形態素解析器JUMAN++を触ってみたけど思ったより高精度でMeCabから乗り換えようかと思った話
- 453 users
- qiita.com/riverwell
- 学び
- 2016/10/13
JUMAN++は最近黒橋・河原研究室から発表された、JUMANの後継となる形態素解析器です。これまでの形態素解析器と比べて違うのは、RNN言語モデルを用いて意味的自然さを考慮する、ニューラルネットワークを利用した形態素解析器となっている点です。速度や語彙等の課題はあるものの、解析能力自体はMeCab以上なので、導入方法と共に触ってみた所感を述べてみます。導入方法前提 OS X Yosemite 10.10.5 VirtualBox 5.1.6 Vagrant 1.8.6 インストール vagrant boxは bento/ubuntu-16.04を使用します。推奨はCentOSですが、自分の環境ではCentOSではビルドに失敗しました。また、OSはubuntu16.04でもboxによっては上手くインストールすることができないため、bentoのboxがおすすめです。 $ vagr
Web開発におけるコンピュータサイエンス - 機械学習編2 - Hatena Developer Blog
- 453 users
- developer.hatenastaff.com
- テクノロジー
- 2016/10/05
この教科書は、はてなサマーインターンの講義資料として作成されたものです: https://github.com/hatena/Hatena-Textbook 機械学習編1（基礎編）では、最も初歩的な分類器である単純パーセプトロンを題材に、機械学習の基本について勉強しました。機械学習編2（実用編）では、実問題に機械学習を適用する上でのコツや、各種の機械学習アルゴリズムの使い分け、高次元データへの対処法、といったトピックについて解説していきます。実問題に機械学習を適用するタスクを定義するデータを特徴ベクトルに変換する評価方法を決める正解データの正例と負例は均等にベースラインとなる手法を実装する実データに向き合うときの心構え機械学習のワークフロー 1. 前処理データセット作成サンプリング特徴抽出欠損値・欠測値への対応値のスケーリング特徴選択次元削減 2. 学習モデ
(数式を使わない) Transformer の直感的な説明 / 真面目なプログラマのためのディープラーニング入門
- 451 users
- euske.github.io
- テクノロジー
- 2023/02/26
(数式を使わない) Transformer の直感的な説明 RNN の欠点 Transformer はこれをどう解決したか Transformer の動作原理複数の要素間の関係を考慮する (Self-Attention、自己注意) 要素の順序を考慮する (Positional Encoding、位置エンコーディング) まとめ概要: ChatGPT などで使われている Transformer モデルは、ニューラルネットワークの世界にいくつかの革新的なアイデアをもたらした。本記事では、プログラマに理解しやすい形でそれらのアイデアを解説する。実際に使われている数学の詳細には触れない。 (技術的解説については元論文 Attention is All You Need か、その注釈版である The Annotated Transformer を参照のこと。日本語ではこの解説がわかり
サイバーエージェント、最大68億パラメータの日本語LLM（大規模言語モデル）を一般公開 ―オープンなデータで学習した商用利用可能なモデルを提供―
- 451 users
- www.cyberagent.co.jp
- テクノロジー
- 2023/05/17
株式会社サイバーエージェント（本社：東京都渋谷区、代表取締役：藤田晋、東証プライム市場：証券コード4751）は、最大68億パラメータの日本語LLM（Large Language Model、大規模言語モデル）を一般公開したことをお知らせいたします。近年、OpenAI社が開発した「ChatGPT」※1 を始めとする生成AI・LLMは急速な進化を遂げており、世界中のあらゆる業界・ビジネスにおいて活用が進んでいます。一方、既存のLLMのほとんどは英語を中心に学習されているため、日本語および日本文化に強いLLMは少ない状況です。 ■最大68億パラメータの日本語LLM（大規模言語モデル）の公開についてこうした背景のもと、当社は日本語LLMの開発に取り組んでおり、このたび一部モデルをHugging Face Hubにて公開いたしました。公開されたモデルはオープンな日本語データ※2で学習したもので
- AI
- あとで読む
- LLM
- 日本語
- ChatGPT
- 学習
- 開発
- 人工知能
- 機械学習
- サイバーエージェント
超高精度で商用利用可能な純国産の日本語音声認識モデル「ReazonSpeech」を無償公開
- 450 users
- prtimes.jp
- テクノロジー
- 2023/01/19
株式会社レアゾン・ホールディングス(本社：東京都新宿区、代表取締役：渡邉真)は世界最高レベルの高精度日本語音声認識モデルおよび世界最大19,000時間の日本語音声コーパス※「ReazonSpeech」を公開いたしました。 2023年1月18日株式会社レアゾン・ホールディングス(本社：東京都新宿区、代表取締役：渡邉真)は世界最高レベルの高精度日本語音声認識モデルおよび世界最大19,000時間の日本語音声コーパス※「ReazonSpeech」を公開いたしました。 ※音声コーパス: 音声データとテキストデータを発話単位で対応付けて集めたもの。音声認識モデルを作成する材料として使用され、その規模と品質が音声認識の精度を大きく左右する。 ※2「ReazonSpeech」を用いた文字起こしサービスをプロジェクトwebサイトにて実際に試すことができます。プロジェクトwebサイト：https://
- AI
- あとで読む
- 日本語
- 音声認識
- 音声
- voice
- 技術
- フリーソフト
- コーパス
- 機械学習
第1回　機械学習ことはじめ | gihyo.jp
- 449 users
- gihyo.jp
- 暮らし
- 2010/06/25
次のサービスや製品はどれも身近にありますが、これらに共通していることはなんでしょう。 Amazonの「この商品を買った人はこんな商品も買っています」はてなブックマークの「関連エントリー」 Google 翻訳 Google 日本語入力メールクライアントのスパムフィルタデジタルカメラの自動顔認識ニンテンドーDSの手書き文字認識買い物履歴、ユーザが書いたコメントやタグ、Webに無数にあるページ、メール、画像や動画と対象はそれぞれ異なっていますが、どれも「データから有益な情報を取り出す」ということを行っています。これらは「機械学習」という技術を使って実現されているのです。機械学習の応用範囲機械学習は冒頭で挙げた以外にも、様々な分野で使われています。例えば、ノイズ除去や特徴の抽出を目的とした利用パターンがあります。音声認識や画像認識、文字認識（OCR）などはその代表格です。それらも
Ruby on Rails + MySQL で全文検索 - ドワンゴ研究開発ブログ
- 449 users
- info.dwango.co.jp
- 暮らし
- 2009/02/02
このエントリでは Ruby on Rails と MySQL を使って日本語の全文検索を行う方法を記述する。Ruby on Rails のバージョンは 2.0.2、MySQL のバージョンは 5.0.67、Tritonn のバージョンは 1.0.12、Hyper Estraier のバージョンは 1.4.10 を使用した。サンプルの文章データとして、あらゆる日本人にとって極めて身近な著作権切れ文章である『ドグラ・マグラ』と『黒死館殺人事件』を利用した。処理のために整形したデータは本エントリに添付しておく。またデータベースへアクセスするコードではマイグレーションを除きできるだけベンチマークを取るようにし、その結果は本エントリの最後に記載する。ページネーション Rails でページネーションを実現する will_paginate という plugin は ActiveRecord に標準でつ
- rails
- mysql
- 全文検索
- ruby
- ruby on rails
- search
- database
- programming
- db
- itkz
TinySegmenter: Javascriptだけで実装されたコンパクトな分かち書きソフトウェア
- 449 users
- chasen.org/~taku
- 暮らし
- 2008/02/08
TinySegmenterはJavascriptだけ書かれた極めてコンパクトな日本語分かち書きソフトウェアです。わずか25kバイトのソースコードで、日本語の新聞記事であれば文字単位で95%程度の精度で分かち書きが行えます。 Yahoo!の形態素解析のようにサーバーサイドで解析するのではなく、全てクライアントサイドで解析を行うため、セキュリティの観点から見ても安全です。分かち書きの単位はMeCab + ipadicと互換性があります。デモ日本語の文章を入力し、解析ボタンをクリックしてください。ダウンロード TinySegmenterはフリーソフトウェアです. 修正BSDライセンスに従って本ソフトウェアを使用,再配布することができます. Download TinySegmenter version 0.2 使い方 <script type="text/javascript" src
- javascript
- 形態素解析
- 自然言語処理
- 分かち書き
- nlp
- library
- MeCab
- algorithm
- japanese
- 日本語
PukiWiki 【FrontPage】
- 449 users
- wiki.ohgaki.net
- 暮らし
- 2005/10/26
なんだかやけに長い説明ばかり検索に引っかかったので書きました。 Linuxのローカル環境でDockerコンテナ内のXアプリ（GUIアプリ）を利用するには $ xhost localhost + を実行した後に $ docker run --rm --net host -e "DISPLAY" container_image_name x_app_binary_path とすれば良いです。もっと読む SSHなどよく知られたサービスポートで何も対策せずにいると数えきらないくらいの攻撃リクエストが来ます。不必要なログを増やしてリソースを無駄にし、もし不用意なユーザーやシステムがあると攻撃に成功する場合もあります。 SshguardはC作られており、flex/bisonのパーサールールを足せば拡張できますがカスタム版をメンテナンスするのも面倒です。必要なルールを足してプルリクエストを送ってもマー
- php
- php.ini
- security
- tips
- windows
- セキュリティ
- framework
- keyboard
- linux
- フレームワーク
ルー語変換 | Elementary, ...
- 449 users
- e8y.net
- 暮らし
- 2006/12/31
URL や文章を「ルー語」にトランスレートゥ！します。ルー大柴さん公認！ルー語変換 | メールでルー語 | ルー語占い | ﾙｰ語変換ﾓﾊﾞｲﾙ例えばこの人... をルーにしたり、名作この話... をルー語で読み直してみるのはいかがでしょう。お仕事中の方はニュースをトゥギャザーしてみてください。自分や友達のブログを変えてみるのが一番おもしろいです。さっそくを
- ルー大柴
- ネタ
- generator
- ジェネレータ
- tool
- 変換
- webサービス
- neta
- webservice
- ツール
「圧縮新聞」を作った - phaの日記
- 449 users
- pha.hateblo.jp
- 暮らし
- 2007/11/24
僕は昔からロボットがロボットなりに変な文章を生成して喋ったりする人工無脳とかそういう仕組みが好きで、最近はそのへんの仕組みを勉強していました。それで大体仕組みの基本はわかったので簡単なスクリプトを書いてみたよ。圧縮新聞このスクリプトはウェブ上にある新聞社とかのニュースの文章を元にして、バラバラにして圧縮してまとめた文章を作るので、ざっと眺めるだけでその日起こった事件の全体が何となくわかるかもしれません。リロードするたび文章は変わります。生成例しょうゆ・みそ業界大手のＮＯＶＡ（大阪市）が入った郵便小包は、北朝鮮の鉄道網を連結する計画だったらしいことが２１日、わかった。タンクに灯油を補給した。検案の結果、財政難などをほとんど与えずに６者協議の外相会議の早期再開に期待を表明した国と製薬会社に賠償を求めた。その後、死亡した。しくみこういった人工無脳みたいな文章生成をするには形態素解析と
話題の ChatGPT + LangChain で、膨大な PDF ドキュメントの内容を爆速で把握する - Qiita
- 447 users
- qiita.com/hiroki_okuhata_int
- テクノロジー
- 2023/04/21
話題の ChatGPT + LangChain で、膨大な PDF ドキュメントの内容を爆速で把握するPDFOpenAIChatGPTlangchain記事投稿キャンペーン_ChatGPT はじめに本記事では、ChatGPT と LangChain の API を使用して、PDF ドキュメントの内容を自然言語で問い合わせる方法を紹介します。具体的には、PDF ドキュメントに対して自然言語で問い合わせをすると、自然言語で結果が返ってくる、というものです。 ChatGPT と LangChain を使用することで、下記のような複数ステップの仕事を非常に簡単に実行させることができます。 PDF ドキュメントからテキストを抽出して複数に分割する分割したテキストからテキスト間の関連を表すベクターデータを作成する作成したベクターデータをベクターストアに格納しておく ChatGPT に外部から与
- ChatGPT
- LangChain
- あとで読む
- AI
- pdf
- LLM
- python
- API
- 人工知能
- 機械学習
子供にマインクラフト使ったPythonプログラミングを教えようとしたらChatGPT使ったプログラミング不要な世界を体験させちゃった | DevelopersIO
- 445 users
- dev.classmethod.jp
- テクノロジー
- 2023/03/19
子供にマインクラフト使ったPythonプログラミングを教えようとしたらChatGPT使ったプログラミング不要な世界を体験させちゃったこんにちは、会社ではCX事業本部モダンオフショア推進担当、家庭では3児の父親の藤村です。 IT業界で働く親として、子供には幼い頃からプログラミングに親しんでもらいたいと思い、時々Scratchを使った簡単なプログラミングなどを教えていたのですが、ちょっとすると「友達とゲームする時間だから止めるね！」といって、友達とのNintendo Switch使ったオンラインゲーム(FortniteやMinecraftなど)をやり始めてしまい、親としては少し残念な気持ちになっていました。そんな時に、『マインクラフトでわくわく学ぶ！Pythonプログラミング入門』という書籍が最近発売されたことを知りました。マインクラフトでPythonを学ぶ！これは息子にドンピシャの内容
- ChatGPT
- AI
- python
- プログラミング
- あとで読む
- 教育
- programming
- Minecraft
- 人工知能
- マイクラ
驚異の1ビットLLMを試す。果たして本当に学習できるのか?｜shi3z
- 442 users
- note.com/shi3zblog
- テクノロジー
- 2024/02/29
昨日話題になった「BitNet」という1ビットで推論するLLMがどうしても試したくなったので早速試してみた。 BitNetというのは、1ビット(-1,0,1の三状態を持つ)まで情報を削ぎ落とすことで高速に推論するというアルゴリズム。だから正確には0か1かではなく、-1か0か1ということ。この手法の行き着くところは、GPUが不要になり新しいハードウェアが出現する世界であると予言されている。マジかよ。 https://arxiv.org/pdf/2402.17764.pdf ということで早速試してみることにした。オフィシャルの実装は公開されていないが、そもそも1ビット(と言っていいのかわからない,-1,0,1の三状態を持つからだ。論文著者はlog2(3)で1.58ビットという主張をしている)量子化のアルゴリズム自体の研究の歴史は古いので、BitNetによるTransformerの野良実装
- LLM
- AI
- あとで読む
- BitNet
- 機械学習
- 学習
- 人工知能
- 技術
- Microsoft
- 研究
ChatGPTの10ヶ月と開発トレンドの現在地
- 442 users
- speakerdeck.com/hirosatogamo
- テクノロジー
- 2023/09/29
9/28の #日本CTO協会さんのイベントで登壇した資料を公開しました。「ChatGPTの10ヶ月と開発トレンドの現在地」開発のトレンドの最新情報をざっくり纏めています。・Prompt Engineering開発の現在地・RAG開発の現在地・Plugin開発の現在地・GPT-Vの登場と生成AI時代のこれからについてやや開発者寄りな内容なので、基礎を知りたい場合はAzure OpenAI大全も併せてご確認を。 (こっちも近々最新化します…) https://speakerdeck.com/hirosatogamo/chatgpt-azure-openai-da-quan
- ChatGPT
- あとで読む
- AI
- Azure
- GPT
- OpenAI
- 開発
- CTO
- 機械学習
- LLM
話題のチャットAI「Claude 3」のプロンプト集、公式が公開中　「Excelの数式作って」など64種
- 440 users
- www.itmedia.co.jp
- テクノロジー
- 2024/03/11
AIスタートアップの米Anthropicが、同社のチャットAI「Claude 3」向けに公式プロンプト集を公開している。3月11日までに64種類の使用例を公開中。専用のWebサイト「プロンプトライブラリ」で公開しており、英語と日本語表示に対応している。例えば、入力した材料や好みに応じた料理レシピを提案する「料理クリエイター」などのプロンプトを公開している。プロンプトは「システム」と「ユーザー」の2つに分かれ、まず前者でAIに指示し、次に後者でユーザー個別の条件や要件を伝える仕組み。料理クリエイターの場合は以下のような具合だ（原文ママ）。システム：あなたの仕事は、利用可能な材料や食事の好みに関するユーザーの入力に基づいて、パーソナライズされたレシピのアイデアを生成することです。この情報を使用して、ユーザーの食事のニーズに対応しながら、指定された材料を使用して作ることができるさまざまな創造
- AI
- あとで読む
- claude
- 人工知能
- プロンプト
- LLM
- 生成AI
- Excel
- Claude3
- ChatGPT
日本語入力について - アスペ日記
- 439 users
- takeda25.hatenablog.jp
- テクノロジー
- 2012/05/11
私が日本語入力について思っていることを書いてみる。自分としては、デフォルト以外の日本語入力システムとして、ATOK と Google 日本語入力ぐらい（まあ、Baidu IME とかもあるが）しかないのが心の底から残念でたまらない。雑誌の特集などで、Google 日本語入力と ATOK に単語や文章を変換させて精度を比較しているものを見かける。まあ総合的には同じぐらいの結果になっている。だが、実際に長い間使っているとわかるのだが、Google 日本語入力の間違え方のほうが「理不尽」なのだ。どうしてこれがこうなる？と思わず言いたくなるような。その点、ATOK は弱い部分が前もってわかる。アニメやゲームなど、マニアックな変換には弱い。しかし、ATOK である程度日本語の文章を打ち慣れた人にとっては、そういう「難しいだろうな」と思うようなところは、打つ前からそのことがわかるものだ。 ATO
- 日本語入力
- ATOK
- ime
- 日本語
- 言語
- google
- language
- 読み物
- 文章
- 考え方
Google Colab ではじめる Stable Diffusion v1.4｜npaka
- 438 users
- note.com/npaka
- テクノロジー
- 2022/08/23
2. ライセンスの確認以下のモデルカードにアクセスして、ライセンスを確認し、「Access Repository」を押し、「Hugging Face」にログインして（アカウントがない場合は作成）、同意します。 4. Colabでの実行Colabでの実行手順は、次のとおりです。 (1) メニュー「編集→ノートブックの設定」で、「ハードウェアアクセラレータ」に「GPU」を選択。 (2) 「Stable Diffusion」のインストール。 # パッケージのインストール !pip install diffusers==0.3.0 transformers scipy ftfy(3) トークン変数の準備。以下の「<HugginFace Hubのトークン>」の部分に、先程取得したHuggingFace Hubのトークンをコピー&ペーストします。 # トークン変数の準備 YOUR_TOKEN="<H
- AI
- あとで読む
- StableDiffusion
- google
- 画像
- Stable Diffusion
- 画像生成
- 機械学習
- Colab
- deep learning
日本語言語モデル「Japanese StableLM Alpha」をリリースしました — Stability AI Japan
- 437 users
- ja.stability.ai
- テクノロジー
- 2023/08/10
Stability AI Japan は70億パラメータの日本語向け汎用言語モデル「Japanese StableLM Base Alpha 7B」及び、指示応答言語モデル「Japanese StableLM Instruct Alpha 7B」を一般公開しました（略して「JSLM」)。これらのモデルはベンチマークスイート「lm-evaluation-harness」による複数の日本語タスクを用いた性能評価において、一般公開されている日本語向けモデルで最高の性能を発揮しています。汎用言語モデル「Japanese StableLM Base Alpha 7B」「Japanese StableLM Base Alpha 7B」はウェブを中心とした大規模なデータを用いてテキスト生成を学習したモデルです。学習データは主に日本語と英語で、それに加えソースコードが約2%含まれています。学習データに
- AI
- あとで読む
- LLM
- 日本語
- 学習
- 機械学習
- ChatGPT
- NLP
- japan
- japanese
自然言語処理をサービスで活用しよう！ Sansanに学ぶ「多種多様なテキスト」からのデータ分析｜ハイクラス転職・求人情報サイト AMBI（アンビ）
- 435 users
- en-ambi.com
- テクノロジー
- 2019/01/22
自然言語処理をサービスで活用しよう！ Sansanに学ぶ「多種多様なテキスト」からのデータ分析自然言語処理をサービスに投入し、“できること”とは？名刺管理サービス「Sansan」を提供するSansan社では、名刺に記載された情報のデータ化において、自然言語処理を徹底的に活用しています。同社のデータ統括部門DSOCで日夜研究を続ける奥田裕樹さんと高橋寛治さんの2人に、サービスの裏で動く、自然言語処理のユースケースを語っていただきました。名前や企業名、電話番号、メールアドレス──。名刺のなかには、重要な個人情報がテキストの形で記載されています。そういった情報や企業のWebページ情報などを解析し、ユーザーに有効活用してもらうべく研究開発を続けているのが、法人向けクラウド名刺管理サービス「Sansan」や個人向け名刺アプリ「Eight」を提供するSansan株式会社です。同社はいわば、日本で
- 自然言語処理
- あとで読む
- データ
- 学習
- サービス
- 研究
- キャリア
- 機械学習
- nlp
- python
はてなブックマークの作り直しについて - naoyaのはてなダイアリー
- 431 users
- naoya-2.hatenadiary.org
- 暮らし
- 2008/03/24
id:naoya:20080320:1206009912 でも少し触れましたが、京都に来てからはてなブックマークの作り直しをしています。どういう意図を持って作り直そうとしているかを述べておきます。まず大前提として、今のはてなブックマークに追加したい機能、変更したい仕様、本来追加するはずが途中で頓挫したものが結構な数で山積みになっています。それを実現するための基礎作りです。追加したい機能、変更したい箇所おそらく新システムの最初のリリース時には、それほど大きく変わった、という印象にはならないかと思います。長く続いているサービスですし、インタフェースや使い方もリリース当初からそれほど大きくは変わっていません。既存システムからの極端な変更は歓迎されないだろうと思っており、まずはオリジナルが持っていた機能をしっかり再現することが重要です。ただし、既存システムでも問題と思っている箇所は改善して
LINE、NAVERと共同で、世界初、日本語に特化した超巨大言語モデルを開発　新規開発不要で、対話や翻訳などさまざまな日本語AIの生成を可能に | ニュース | LINE株式会社
- 430 users
- linecorp.com
- テクノロジー
- 2020/11/25
LINE、NAVERと共同で、世界初、日本語に特化した超巨大言語モデルを開発　新規開発不要で、対話や翻訳などさまざまな日本語AIの生成を可能に従来の特化型言語モデルとは異なる、汎用型言語モデルを実現予定。処理インフラには世界でも有数の、700ペタフロップス以上の高性能スーパーコンピュータを活用 LINE株式会社（所在地：東京都新宿区、代表取締役社長：出澤剛）はNAVERと共同で、世界でも初めての、日本語に特化した超巨大言語モデル開発と、その処理に必要なインフラ構築についての取り組みを発表いたします。超巨大言語モデル（膨大なデータから生成された汎用言語モデル）は、AIによる、より自然な言語処理・言語表現を可能にするものです。日本語に特化した超巨大言語モデル開発は、世界でも初めての試みとなります。従来の言語モデルは、各ユースケース（Q&A、対話、等）に対して、自然言語処理エンジニアが個
- AI
- あとで読む
- LINE
- 機械学習
- 言語
- NLP
- 開発
- 日本語
- 自然言語処理
- データ
今、人工知能研究で何が起こっているのか
- 429 users
- blog.unnono.net
- 学び
- 2014/07/24
半年前くらいに書いた草稿が、投稿されずに残ってたのでちゃんと書きました。最近、人工知能という言葉がまた流行しているような印象を受けます。ブームということの本質は2つ有ると思っています。 1つは学術会で、最近良い成果が立て続けに出てきたという側面です。もう一つは、それに呼応して大きな会社、特にIBMやGoogle、Facebookといった大きなコンピュータ系、インターネット関連企業が力を入れていることが大々的に報道されたことです。両者はもちろん関係していて、いくつか技術的ブレークスルーがあって、それが企業の投資を呼んでいる、それと呼応するように学術的な成果が企業からでているという、正のスパイラルが生まれている様に見えます。こうした流れをいち早くとらえた新書として、「クラウドからAIへ」という本があったので読んでみたのですが、一般のビジネスマンを意識して、歴史、現在、未来について大局
- AI
- 人工知能
- 科学
- NLP
- science
- engineering
- クラウド
- machinelearning
- tech
- あとで読む
セガとNHNには抱き合って死んでもらいたい事例が個人的に発生 - やまもといちろうBLOG（ブログ）
- 428 users
- kirik.tea-nifty.com
- アニメとゲーム
- 2012/06/20
戦場のヴァルキュリアがブラウザゲームになるというので、とりあえず登録してみたわけです。ブラウザカードゲーム「戦場のヴァルキュリアDUEL」のメンバーサイトオープン＆誰でも参加可能な“ユーザーテスト”がスタート http://www.4gamer.net/games/170/G017090/20120619055/ 「キャラクターネームを入れろ」というので、まあ私も男ですから当然本名で勝負するんですな。UO時代からの伝統で、オンゲはなるだけ自分の名前で頑張ることにしています。もちろんUOのSONOMA鯖ではICHIROが赤ネームだったわけですが。そしたら、お前の名前は不適切な表現だとか言ってハネられるわけです。如何したものでしょう。何か悪いことしましたか？そしたら…　このクソがああああああああぁぁぁぁぁぁぁぁぁ！！！！！１！セガもNHNもふざけやがって！！！！！！！！！　倒産しろ！！
ChatGPT活用を激震させる新機能｢Code Interpreter｣にNetflixをデータ解析させたらスゴかった
- 426 users
- www.businessinsider.jp
- 世の中
- 2023/07/31
コード・インタープリターはChatGPTの有料版｢ChatGPT Plus｣で、GPT-4の付加機能として呼び出せる。画像：筆者によるスクリーンショット ChatGPTの有料版である｢ChatGPT Plus｣（月額20ドル）には、7月初めから｢Code Interpreter（コード・インタープリター）｣という機能が追加された。この機能が画期的だとして、一時ネットでは大いに話題になった。これまでは面倒だった｢データ集計｣などを、チャットの命令だけで実行できるからだ。データ集計は、Excelなどの表計算ソフトやPythonなどのデータ処理に強いプログラミング言語で処理することが多い。しかしコード・インタープリターでは、それらを使う必要はほとんどなく、データさえ用意できればいい。さまざまな手間がほぼゼロになり、ChatGPT任せにできる。そうはいってもピンと来ない人も多いはず。そこ
- ChatGPT
- あとで読む
- AI
- プログラミング
- データ
- Excel
- 人工知能
- python
- 統計
- 文章生成AI
TechCrunch | Startup and Technology News
- 426 users
- jp.techcrunch.com
- テクノロジー
- 2016/11/23
Mistral AI has closed its much rumored Series B funding round with General Catalyst leading the round. The company has secured €600 million (around $640 million at today’s exchange rate)…
- AI
- google
- 人工知能
- 翻訳
- あとで読む
- 言語
- deep learning
- ニューラルネットワー
- translate
- NLP
ChatGPTのプロンプトデザインって何だ？
- 423 users
- soysoftware.sakura.ne.jp
- テクノロジー
- 2023/03/17
この前、公園を散歩しながらスマホでウイークリー落合の番組を聞いていたら、そこで落合さんがChatGPTに謎の呪文？コマンド？のようなものを入力していた。 https://newspicks.com/movie-series/87?movieId=2528 その時はまったく意味がサーパリ分からなかったので、まったく意識に入ってこないでスルーしてしまった。清水さんのnote記事によれば、新登場したGPT-4で物語を作って遊んでいたら、落合さんから例の呪文？が送られてきたそうだ。それを入力したら何か物語の筋書きが生成されたらしい。 GPT-4使ってみたコマンドを転載させてもらうが、このようなものだった↓ #[このコンテンツは [Goal] を SeekするためのTemplateです］ - [コンテンツの詳細]: - [Goal]： - Goalを達成するため
- ChatGPT
- AI
- あとで読む
- 機械学習
- GPT
- prompt
- 自然言語処理
- 文章
- 人工知能
- プログラミング
DALL-E3 (ダリスリー) の無料教科書:初級編｜プチpony
- 422 users
- note.com/chatgpt4graph
- 暮らし
- 2023/11/24
DALL-E3を実装日からほぼ毎日使用し面白さにとりつかれています。何となくで触っているため, いまいち思った画像が出来ないことも多々ありましたので今回まじめに作成法を勉強してみました。初級編と名前がついているのは高等テクニックを教えるほどの技術がないだけで後に上級編が控えているという意味ではないです。 0. はじめに DALL-E とはシンプルなテキストのみで画像がつくれるAIです。簡単なテキストのみで画像生成語源は『ウォーリー探せ』と芸術家の『ダリ』から来ているみたいです。ウィーリーはある種の「探し物」をする, userが提示するテキストのプロンプトから隠された要素やまだ見ぬ画像を「探し出し」生成することらしいです。ウォーリーをインスパイアした少年1. 問題点, 主に著作権やはり何と言っても著作権問題ではないでしょうか。現在法整備が進行しているところです。OpenAIはコンテンツポ
- AI
- あとで読む
- ChatGPT
- 画像
- 画像生成AI
- イラスト
- image
- 生成AI
- 画像生成
- tutorial
正規表現に見切りをつけるとき
- 422 users
- leoclock.blogspot.com
- 暮らし
- 2009/01/27
Perl, Rubyなど手軽に使えるプログラミング言語に慣れてくると、あらゆるテキストデータの処理に正規表現(regular expression)を使ってしまいがちです。けれど実は、正規表現の処理能力を超えるフォーマットというのが存在します。その典型的な例が、XMLやJSONのように、入れ子になったデータフォーマットです。
- 正規表現
- antlr
- regexp
- programming
- parser
- プログラミング
- 構文解析
- regex
- algorithm
- 開発
中学生にもわかるウェーブレット行列 - アスペ日記
- 422 users
- takeda25.hatenablog.jp
- テクノロジー
- 2013/03/03
id:echizen_tm さんの記事「ウェーブレット木の効率的で簡単な実装 "The Wavelet Matrix"」から始まったウェーブレット行列ブームから半年以上が過ぎ、すでに枯れた技術として確立されつつある感があります。 …嘘です。日本以外ではあんまり来ていません。理由としては、やはりアルファベット圏では単語境界が明確であるため、こちらの記事で書かれているような「キーワード分割の難易度」といったことがあまり問題にならないということがあるかもしれません。まあ、そういうわけで局所的に来ているウェーブレット行列ですが、日本語をはじめとする単語境界のない言語圏にとっては重要なネタであると思うため、解説記事を書き直して*1みようと思います。ウェーブレット行列でできること主となる操作は、文字列に対する定数時間の rank() と select()*2 です。 rank() は、「文
プロンプトエンジニアリング基礎編｜ChatGPT研究所
- 421 users
- chatgpt-lab.com
- テクノロジー
- 2023/03/23
AGIラボは、最高のAI情報をお届けするためのマガジン・コミュニティです。GPTsを筆頭にClaude 3やSoraなど注目のAIについても詳しく解説、今日から使えるAI活用情報を一番わかりやすくお伝えします。他に限定コミュニティへのアクセス、限定イベントへの参加権が含まれます。
ひげぽん OSとか作っちゃうかMona- - ハッカー養成塾:ハッカーへの遠回り
- 421 users
- higepon.hatenablog.com
- 暮らし
- 2007/04/01
オープンソースマガジン2007年1月号に向けて書いた記事の元の原稿です。前回のアルファギーク舘野君から、バトンを渡されたひげぽんです。 Mona OSというオープンソースOSを開発しています。僕はハッカーと呼ばれるには実力不足ですが、知り合いのスゴ腕ハッカーに少しでも追いつこうと日々実践していることをいくつか紹介します。ハッカーに学ぶオンラインでもオフラインでも構いません、自分よりも優れているハッカーを探してお手本とすることから始めましょう。彼（または彼女）が何を勉強し、発言し、考えているかを観察することで多くのことを学べるはずです。周りにハッカーがいなければ、勉強会・カンファレンスに参加したり、ブログを利用してコミュニケーションをとるのもひとつの方法です。「ハッカーに交わればハッカーになる」とまではうまくいきませんが、周りは自分より優秀な人ばかりであるという環境を作り上げる
- hacker
- programming
- ハッカー
- プログラミング
- 勉強
- 読み物
- higepon
- lifehacks
- programmer
- hack
ChatGPTやAI関連で面白かった・気になった事例まとめ - Qiita
- 421 users
- qiita.com/nyanko5656
- テクノロジー
- 2023/03/02
はじめに前回のChatGPTで電卓アプリを作れるか試した件について、Twitter等からも反応を見ることができて嬉しかったです。おまけの評判が良かったので、私がここ最近で気に入ってるChatGPT関連の情報をまとめさせていただきます。 ※私も前回おまけをまとめていて、本編よりもこっちを見てほしい！！と途中から思っていたので、評判が良くて嬉しかったですｗ ChatGPT 感情回路を埋め込み大学の授業レポート代行 AlexaでChatGPTとやり取りロボット制御に応用 Pythonコードを、JavaScriptに書き換え p5.jsで冬の情景を描画デバイスの傾きで左右に回転する三角形をHTML上で描画 Googleアドセンス合格した方法 VSCodeのChatGPTプラグイン ChatGPTを日本企業はどう使う？その他AI言語モデル関連ローカルでも動かせる言語モデル「FlexGe
- ChatGPT
- AI
- あとで読む
- 機械学習
- プログラミング
- ツール
- gpt
- 開発
- まとめ
- 考え方
ELYZA DIGEST
- 420 users
- www.digest.elyza.ai
- テクノロジー
- 2021/08/26
ELYZA DIGEST
- AI
- webサービス
- 要約
- あとで読む
- 機械学習
- 読書
- web
- 文章
- generator
- webservice