2018.08.22 複数の文字列の中にあるパターンが存在するとき、そのようなパターンを表すのに正規表現が用いられる。他のプログラミング言語と同様に、R においても、いくつかの文字列処理関数が正規表現に対応している。例えば、パターンマッチ関数 grep や match、文字列置換関数 sub などの関数が正規表現に対応している。 正規表現の基本的な使い方 文字列そのものがパターンであるとき、その文字列をそのまま並べて、正規表現とする。例えば、複数の文字列からなるベクトルの中から、ATG を含む文字列を調べる場合は次のようにする。 x <- c("ATTAGCATGTCTA", "TACGTAGTGCCA", "CAGTATGCA", "CCGGCATTAG", "GGCATAGTCTC") grep("ATG", x) ## [1] 1 3 あるパターンにおいて、特定位置にある文字が指定さ
R における正規表現 R の正規表現とそれを用いる関数に付いて解説(ほとんどオンラインヘルプそのもの)します。これらは、オブジェクトの検索や文字列処理、等に使われます。 R における正規表現 R の幾つかの関数はいわゆる正規表現(GNU grep に準ずる)を受け付ける。 例えば、grep,regexp,sub, gsub,strsplit。他にも関数 apropos, browseEnv, help.search, list.files, ls はオブジェクト・ファイル名等に関し正規表現を許す。 ↑ 詳細 「正規表現 (regular expression)」は文字列のある集合を表すパターンである。 R では三種類の正規表現を使える。 grep(extended = TRUE) で使われる「拡張正規表現」 grep(extended = FALSE) で使われる「基本正規表現」 grep
文字列を操作するパッケージ stringiパッケージのwrapper 元は違ったけど“i”の性能がよかったから Hadley Wickham謹製 特徴 baseの関数群より処理が速い 関数名が“str_”で始まってる 主な文字列処理はこれひとつでOK “%>%”で連鎖しやすい! インストール CRANからインストール install.packages("stringr") GitHubからインストール devtools::install_github("hadley/stringr") githubinstallでもOK githubinstall::githubinstall("stringr") 参考資料 stringr - RDocumentation R Documentationというサイトにあるパッケージ紹介サイト Helpの内容をベースに,サイト内で実際にコードが試せます {
概要 前書き - Rで文字列処理をするライブラリである{stringr}と{stringi}について、baseの関数と付き合わせたコードの自分用のメモ 参照サイト stringr-vignettes stringi hadley/stringr RPubs - このパッケージがすごい2014: stringr stringi package arekore stringiで輝く☆テキストショリスト stringr 1.0.0を使ってみる ライブラリ読み込み SET_LOAD_LIB <- c("knitr", "readr", "dplyr", "tidyr", "readr", "stringr", "stringi") sapply(X = SET_LOAD_LIB, FUN = library, character.only = TRUE, logical.return = TRU
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く