第 4 章 字符串操作

Handling Strings with RR for Data Science 提供字符串入门介绍 ,Sara Stoudt 整理了 stringr 包与 Base R 正则表达式函数的对应表 https://stringr.tidyverse.org/articles/from-base.html

stringr 基于 stringi 包字符串处理包, re2r 包基于 Google 开发的 C++ 库 re2,Google 编程之夏项目提供了一份 正则表达式性能综述stringdist Approximate String Matching and String Distance Functions 近似字符串匹配和字符串距离计算函数 [11]

stringdist stringfish stringb stringi stringr

字符和字符串类型的数据值得单独拿出来讲,不仅因为内容多,而且比较难,应用范围最广,特别是面对文本类型的数据时,几乎是避不开的!R 的前身是 S,S 的前身是一些 Fortran 和 C 子程序,最早在贝尔实验室是用于文本分析领域,因此在 R 基础包中提供了丰富的字符串处理函数,你可以在R控制台中执行如下一行命令查看

help.search(keyword = "character", package = "base")

本章主要介绍 R 内置的字符串操作函数

参考文献

[11]
M. P. J. van der Loo, “The stringdist package for approximate string matching,” The R Journal, vol. 6, pp. 111–122, 2014,Available: https://CRAN.R-project.org/package=stringdist