PYTHON 中的字符串函数及示例_第1页
PYTHON 中的字符串函数及示例_第2页
PYTHON 中的字符串函数及示例_第3页
PYTHON 中的字符串函数及示例_第4页
PYTHON 中的字符串函数及示例_第5页
已阅读5页,还剩5页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

常用字符串函数列表下表显示了许多常见的字符串函数及其说明及其在MSExcel中的等效函数。我们在工作场所都使用MSExcel,并且熟悉MSExcel中使用的功能。MSEXCEL和Python中字符串函数的比较可以帮助你快速学习函数并在面试前做好准备。功能描述MSExcel函数字符串[:N]从字符串开头提取N个字符。左边()mystring[-N:]从字符串末尾提取N个字符正确的()字符串[X:Y]从字符串中间提取字符,从X位置开始,以Y结束中()str.split(sep='')分割字符串-str.replace(旧子字符串,新子字符串)用不同的子字符串替换部分文本代替()str.lower()将字符转换为小写降低()str.upper()将字符转换为大写上部()str.contains('模式',case=False)检查模式是否匹配(Pandas函数)SQLLIKE运算符str.extract(正则表达式)返回匹配的值(Pandas函数)-str.count('sub_string')计算字符串中模式的出现次数-字符串查找()返回子字符串或模式的位置寻找()str.isalnum()检查字符串是否仅由字母数字字符组成-str.islower()检查字符是否全部小写-str.isupper()检查字符是否全部大写-str.isnumeric()检查字符串是否仅由数字字符组成-str.isspace()检查字符串是否仅由空格字符组成-仅有的()计算字符串长度仅有的()猫()连接字符串(Pandas函数)连接()分隔符.join(str)连接字符串连接()左、右和中功能如果您是MSExcel中级用户,您一定使用过LEFT、RIGHT和MID函数。这些函数用于从字符串中提取N个字符或字母。1.从字符串开头提取前两个字符mystring="Heybuddy,wassup?"mystring[:2]Out[1]:'He'string[start:stop:step]

表示项目从0(默认)开始到(stop-1),步长为1(默认)。mystring[:2]

相当于

mystring[0:2]mystring[:2]

告诉Python从字符串对象中提取前2个字符mystring。索引从零开始,因此它包括第一个、第二个元素,但不包括第三个元素。2.查找字符串的最后两个字符mystring[-2:]上面的命令返回p?。-2开始从倒数第二个位置到字符串最大长度的范围。3.从字符串中间查找字符mystring[1:3]Out[1]:'ey'mystring[1:3]返回第二个和第三个字符。1指第二个字符,因为索引从0开始。4.如何反转字符串?mystring[::-1]Out[1]:'?pussaw,yddubyeH'-1告诉Python从末尾开始,并从右到左加1。5.如何从PandasDataFrame中的字符串变量中提取字符?让我们创建一个假数据框来进行说明。在下面的代码中,我们创建一个名为的数据框df,仅包含1个名为var1importpandasaspddf=pd.DataFrame({"var1":["A_2","B_1","C_2","A_2"]})var10A_21B_12C_23A_2为了处理PythonPandasDataframe中的文本数据,我们可以使用str属性。它可用于切片字符值。df['var1'].str[0]在本例中,我们从变量中获取第一个字符var1。请参阅下面所示的输出。Output0A1B2C3A从字符串中提取单词假设您需要从字符串中取出单词而不是字符。通常我们将一个空格作为分隔符来从字符串中查找单词。1.查找字符串的第一个单词mystring.split()[0]Out[1]:'Hey'怎么运行的?split()函数使用空格作为默认分隔符来中断字符串mystring.split()回报

['Hey','buddy,','wassup?']0返回第一个项目或单词

Hey2.逗号作为单词的分隔符mystring.split(',')[0]Out[1]:'Heybuddy'3.如何提取最后一个单词mystring.split()[-1]Out[1]:'wassup?'4.如何提取DataFrame中的单词让我们构建一个由客户姓名组成的虚拟数据框并将其称为变量custnamemydf=pd.DataFrame({"custname":["Priya_Sehgal","David_Stevart","Kasia_Woja","Sandy_Dave"]})custname0Priya_Sehgal1David_Stevart2Kasia_Woja3Sandy_Dave#FirstWordmydf['fname']=mydf['custname'].str.split('_').str[0]#LastWordmydf['lname']=mydf['custname'].str.split('_').str[1]详细说明Outputcustnamefnamelname0Priya_SehgalPriyaSehgal1David_StevartDavidStevart2Kasia_WojaKasiaWoja3Sandy_DaveSandyDavestr.split()类似于split().

它用于激活Python中pandas数据框的分割功能。在上面的代码中,我们创建了两个新列,名为fname并lname存储名字和姓氏。PandasDataFrame中的SQLLIKE运算符在SQL中,LIKE语句用于查找字符串是否匹配或包含模式。我们可以在python中使用str.contains()function来实现类似的功能。df2=pd.DataFrame({"var1":["AA_2","B_1","C_2","a_2"],“var2”:[“X_2”,“Y_1”,“Z_2”,“X2”]})var1var20AA_2X_21B_1Y_12C_2Z_23a_2X2如何在变量var1中查找包含A或B的行?df2['var1'].str.contains('A|B')str.contains(pattern)用于匹配PandasDataframe中的模式。Output0True1True2False3False由于函数区分大小写,因此上述命令对第四行返回FALSE。为了忽略大小写,我们可以使用case=False参数。请参阅下面的工作示例。df2['var1'].str.contains('A|B',case=False)如何过滤包含特定模式的行?在下面的程序中,我们要求Python根据条件对数据进行子集化-包含字符值A或B。它相当于SQL中的WHERE关键字。df2[df2['var1'].str.contains('A|B',case=False)]Outputvar1var20AA_2X_21B_1Y_13a_2X2假设您只需要那些字母后跟“_”的值df2[df2['var1'].str.contains('^[AZ]_',case=False)]^是正则表达式的标记,表示以特定项目开始。var1var21B_1Y_12C_2Z_23a_2X2查找特定字符或关键字的位置str.find(pattern)用于查找子字符串的位置。在本例中,子字符串是“_”。df2['var1'].str.find('_')02112131替换子串str.replace(old_text,new_text,case=False)用于用一些新值或模式替换特定字符或模式。在下面的代码中,我们将变量var1中的_替换为--。df2['var1'].str.replace('_','--',case=False)Output0AA--21B--12C--23A--2我们还可以像下面的程序一样复杂的模式。+表示某项出现一次或多次。在这种情况下,字母表出现1次或多次。df2['var1'].str.replace('[AZ]+_','X',case=False)0X21X12X23X2查找字符串的长度len(string)用于计算字符串的长度。在pandas数据框中,您可以申请str.len()相同的。df2['var1'].str.len()Output04132333要查找特定字符的出现次数(例如,每行中出现“A”的次数),您可以使用str.count(pattern)function.df2['var1'].str.count('A')转换为小写和大写#Converttolowercasemydf['custname'].str.lower()#Converttouppercasemydf['custname'].str.upper()删除前导和尾随空格1、str.strip()删除前导和尾随空格。2、str.lstrip()删除前导空格(在开头)。3、str.rstrip()删除尾随空格(在末尾)。df1=pd.DataFrame({'y1':['jack','jill','jesse','frank']})df1['both']=df1['y1'].str.strip()df1['left']=df1['y1'].str.lstrip()df1['right']=df1['y1'].str.rstrip()y1bothleftright0jackjackjackjack1jilljilljilljill2jessejessejessejesse3frankfrankfrankfrank将数字转换为字符串通过使用str()函数,您可以将数值转换为字符串。myvariable=4mystr=str(myvariable)连接或连接字符串只需使用+,您就可以连接两个字符串值。x="Deepanshu"y="Bhalla"x+yDeepanshuBhalla如果您想在两个字符串之间添加空格,可以使用-

x+''+yreturnsDeepanshuBhalla

假设您有一个包含多个字符串值的列表,并且您想要将它们组合起来。您可以使用join()函数。string0=['Ram','Kumar','Singh']''.join(string0)Output'RamKumarSingh'假设您想要组合或连接pandas数据框的两列。mydf['fullname']=mydf['fname']+''+mydf['lname']或者mydf['fullname']=mydf[['fname','lname']].apply(lambdax:''.join(x),axis=1)custnamefnamelnamefullname0Priya_SehgalPriyaSehgalPriyaSehgal1David_StevartDavidStevartDavidStevart2Kasia_WojaKasiaWojaKasiaWoja3Sandy_DaveSandyDaveSandyDavePandas中的SQLIN运算符我们可以使用isin(list)函数在过滤或子集标准中包含多个值。mydata=pd.DataFrame({'product':['A','B','B','C','C','D','A']})mydata[mydata['product'].isin(['A','B'])]product0A1B2B6A如何在选择多个值时应用NO

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论