字符串是 Python 中最常用的數(shù)據(jù)類型。我們可以使用引號(hào)('或")來(lái)創(chuàng)建字符串。

創(chuàng)建字符串很簡(jiǎn)單,只要為變量分配一個(gè)值即可。例如:

var1 = 'Hello World!'
var2 = "Python php"

Python訪問(wèn)字符串中的值

Python不支持單字符類型,單字符也在Python也是作為一個(gè)字符串使用。

Python訪問(wèn)子字符串,可以使用方括號(hào)來(lái)截取字符串,如下實(shí)例:

#!/usr/bin/python

var1 = 'Hello World!'
var2 = "Python php"

print "var1[0]: ", var1[0]
print "var2[1:5]: ", var2[1:5]

以上實(shí)例執(zhí)行結(jié)果:

var1[0]:  H
var2[1:5]:  ytho

Python字符串更新

你可以對(duì)已存在的字符串進(jìn)行修改,并賦值給另一個(gè)變量,如下實(shí)例:

#!/usr/bin/python
# -*- coding: UTF-8 -*-

var1 = 'Hello World!'

print "更新字符串 :- ", var1[:6] + 'php!'

以上實(shí)例執(zhí)行結(jié)果

更新字符串 :-  Hello php!

Python轉(zhuǎn)義字符

在需要在字符中使用特殊字符時(shí),python用反斜杠(\)轉(zhuǎn)義字符。如下表:

轉(zhuǎn)義字符描述
\(在行尾時(shí))續(xù)行符
\\反斜杠符號(hào)
\'單引號(hào)
\"雙引號(hào)
\a響鈴
\b退格(Backspace)
\e轉(zhuǎn)義
\000
\n換行
\v縱向制表符
\t橫向制表符
\r回車
\f換頁(yè)
\oyy八進(jìn)制數(shù),yy代表的字符,例如:\o12代表?yè)Q行
\xyy十六進(jìn)制數(shù),yy代表的字符,例如:\x0a代表?yè)Q行
\other其它的字符以普通格式輸出

Python字符串運(yùn)算符

下表實(shí)例變量a值為字符串"Hello",b變量值為"Python":

操作符描述實(shí)例
+字符串連接a + b 輸出結(jié)果: HelloPython
*重復(fù)輸出字符串a*2 輸出結(jié)果:HelloHello
[]通過(guò)索引獲取字符串中字符a[1] 輸出結(jié)果 e
[ : ]截取字符串中的一部分a[1:4] 輸出結(jié)果 ell
in成員運(yùn)算符 - 如果字符串中包含給定的字符返回 TrueH in a 輸出結(jié)果 1
not in成員運(yùn)算符 - 如果字符串中不包含給定的字符返回 TrueM not in a 輸出結(jié)果 1
r/R原始字符串 - 原始字符串:所有的字符串都是直接按照字面的意思來(lái)使用,沒(méi)有轉(zhuǎn)義特殊或不能打印的字符。 原始字符串除在字符串的第一個(gè)引號(hào)前加上字母"r"(可以大小寫)以外,與普通字符串有著幾乎完全相同的語(yǔ)法。print r'\n' 輸出 \n 和 print R'\n' 輸出 \n
%格式字符串請(qǐng)看下一章節(jié)

實(shí)例如下:

#!/usr/bin/python
# -*- coding: UTF-8 -*-

a = "Hello"
b = "Python"

print "a + b 輸出結(jié)果:", a + b 
print "a * 2 輸出結(jié)果:", a * 2 
print "a[1] 輸出結(jié)果:", a[1] 
print "a[1:4] 輸出結(jié)果:", a[1:4] 

if( "H" in a) :
    print "H 在變量 a 中" 
else :
print "H 不在變量 a 中" 

if( "M" not in a) :
    print "M 不在變量 a 中" 
else :
print "M 在變量 a 中"

print r'\n'
print R'\n'

以上程序執(zhí)行結(jié)果為:

a + b 輸出結(jié)果: HelloPython
a * 2 輸出結(jié)果: HelloHello
a[1] 輸出結(jié)果: e
a[1:4] 輸出結(jié)果: ell
H 在變量 a 中
M 不在變量 a 中
\n
\n

Python字符串格式化

Python 支持格式化字符串的輸出 。盡管這樣可能會(huì)用到非常復(fù)雜的表達(dá)式,但最基本的用法是將一個(gè)值插入到一個(gè)有字符串格式符 %s 的字符串中。

在 Python 中,字符串格式化使用與 C 中 sprintf 函數(shù)一樣的語(yǔ)法。

如下實(shí)例:

#!/usr/bin/python

print "My name is %s and weight is %d kg!" % ('Zara', 21)

以上實(shí)例輸出結(jié)果:

My name is Zara and weight is 21 kg!

python字符串格式化符號(hào):


    符   號(hào)描述
      %c 格式化字符及其ASCII碼
      %s 格式化字符串
      %d 格式化整數(shù)
      %u 格式化無(wú)符號(hào)整型
      %o 格式化無(wú)符號(hào)八進(jìn)制數(shù)
      %x 格式化無(wú)符號(hào)十六進(jìn)制數(shù)
      %X 格式化無(wú)符號(hào)十六進(jìn)制數(shù)(大寫)
      %f 格式化浮點(diǎn)數(shù)字,可指定小數(shù)點(diǎn)后的精度
      %e 用科學(xué)計(jì)數(shù)法格式化浮點(diǎn)數(shù)
      %E 作用同%e,用科學(xué)計(jì)數(shù)法格式化浮點(diǎn)數(shù)
      %g %f和%e的簡(jiǎn)寫
      %G %f 和 %E 的簡(jiǎn)寫
      %p 用十六進(jìn)制數(shù)格式化變量的地址

格式化操作符輔助指令:

符號(hào)功能
*定義寬度或者小數(shù)點(diǎn)精度
-用做左對(duì)齊
+在正數(shù)前面顯示加號(hào)( + )
<sp>在正數(shù)前面顯示空格
#在八進(jìn)制數(shù)前面顯示零('0'),在十六進(jìn)制前面顯示'0x'或者'0X'(取決于用的是'x'還是'X')
0顯示的數(shù)字前面填充'0'而不是默認(rèn)的空格
%'%%'輸出一個(gè)單一的'%'
(var)映射變量(字典參數(shù))
m.n.m 是顯示的最小總寬度,n 是小數(shù)點(diǎn)后的位數(shù)(如果可用的話)

Python三引號(hào)(triple quotes)

python中三引號(hào)可以將復(fù)雜的字符串進(jìn)行復(fù)制:

python三引號(hào)允許一個(gè)字符串跨多行,字符串中可以包含換行符、制表符以及其他特殊字符。

三引號(hào)的語(yǔ)法是一對(duì)連續(xù)的單引號(hào)或者雙引號(hào)(通常都是成對(duì)的用)。

 >>> hi = '''hi 
there'''
>>> hi   # repr()
'hi\nthere'
>>> print hi  # str()
hi 
there

三引號(hào)讓程序員從引號(hào)和特殊字符串的泥潭里面解脫出來(lái),自始至終保持一小塊字符串的格式是所謂的WYSIWYG(所見(jiàn)即所得)格式的。

一個(gè)典型的用例是,當(dāng)你需要一塊HTML或者SQL時(shí),這時(shí)用字符串組合,特殊字符串轉(zhuǎn)義將會(huì)非常的繁瑣。

 errHTML = '''
<HTML><HEAD><TITLE>
Friends CGI Demo</TITLE></HEAD>
<BODY><H3>ERROR</H3>
<B>%s</B><P>
<FORM><INPUT TYPE=button VALUE=Back
ONCLICK="window.history.back()"></FORM>
</BODY></HTML>
'''
cursor.execute('''
CREATE TABLE users (  
login VARCHAR(8), 
uid INTEGER,
prid INTEGER)
''')

Unicode 字符串

Python 中定義一個(gè) Unicode 字符串和定義一個(gè)普通字符串一樣簡(jiǎn)單:

>>> u'Hello World !'
u'Hello World !'

引號(hào)前小寫的"u"表示這里創(chuàng)建的是一個(gè) Unicode 字符串。如果你想加入一個(gè)特殊字符,可以使用 Python 的 Unicode-Escape 編碼。如下例所示:

>>> u'Hello\u0020World !'
u'Hello World !'

被替換的 \u0020 標(biāo)識(shí)表示在給定位置插入編碼值為 0x0020 的 Unicode 字符(空格符)。


python的字符串內(nèi)建函數(shù)

字符串方法是從python1.6到2.0慢慢加進(jìn)來(lái)的——它們也被加到了Jython中。

這些方法實(shí)現(xiàn)了string模塊的大部分方法,如下表所示列出了目前字符串內(nèi)建支持的方法,所有的方法都包含了對(duì)Unicode的支持,有一些甚至是專門用于Unicode的。

方法描述

string.capitalize()

把字符串的第一個(gè)字符大寫

string.center(width)

返回一個(gè)原字符串居中,并使用空格填充至長(zhǎng)度 width 的新字符串

string.count(str, beg=0, end=len(string))

返回 str 在 string 里面出現(xiàn)的次數(shù),如果 beg 或者 end 指定則返回指定范圍內(nèi) str 出現(xiàn)的次數(shù)

string.decode(encoding='UTF-8', errors='strict')

以 encoding 指定的編碼格式解碼 string,如果出錯(cuò)默認(rèn)報(bào)一個(gè) ValueError 的 異 常 , 除 非 errors 指 定 的 是 'ignore' 或 者'replace'

string.encode(encoding='UTF-8', errors='strict')

以 encoding 指定的編碼格式編碼 string,如果出錯(cuò)默認(rèn)報(bào)一個(gè)ValueError 的異常,除非 errors 指定的是'ignore'或者'replace'

string.endswith(obj, beg=0, end=len(string))

檢查字符串是否以 obj 結(jié)束,如果beg 或者 end 指定則檢查指定的范圍內(nèi)是否以 obj 結(jié)束,如果是,返回 True,否則返回 False.

string.expandtabs(tabsize=8)

把字符串 string 中的 tab 符號(hào)轉(zhuǎn)為空格,tab 符號(hào)默認(rèn)的空格數(shù)是 8。

string.find(str, beg=0, end=len(string))

檢測(cè) str 是否包含在 string 中,如果 beg 和 end 指定范圍,則檢查是否包含在指定范圍內(nèi),如果是返回開始的索引值,否則返回-1

string.index(str, beg=0, end=len(string))

跟find()方法一樣,只不過(guò)如果str不在 string中會(huì)報(bào)一個(gè)異常.

string.isalnum()

如果 string 至少有一個(gè)字符并且所有字符都是字母或數(shù)字則返

回 True,否則返回 False

string.isalpha()

如果 string 至少有一個(gè)字符并且所有字符都是字母則返回 True,

否則返回 False

string.isdecimal()

如果 string 只包含十進(jìn)制數(shù)字則返回 True 否則返回 False.

string.isdigit()

如果 string 只包含數(shù)字則返回 True 否則返回 False.

string.islower()

如果 string 中包含至少一個(gè)區(qū)分大小寫的字符,并且所有這些(區(qū)分大小寫的)字符都是小寫,則返回 True,否則返回 False

string.isnumeric()

如果 string 中只包含數(shù)字字符,則返回 True,否則返回 False

string.isspace()

如果 string 中只包含空格,則返回 True,否則返回 False.

string.istitle()

如果 string 是標(biāo)題化的(見(jiàn) title())則返回 True,否則返回 False

string.isupper()

如果 string 中包含至少一個(gè)區(qū)分大小寫的字符,并且所有這些(區(qū)分大小寫的)字符都是大寫,則返回 True,否則返回 False

string.join(seq)

以 string 作為分隔符,將 seq 中所有的元素(的字符串表示)合并為一個(gè)新的字符串

string.ljust(width)

返回一個(gè)原字符串左對(duì)齊,并使用空格填充至長(zhǎng)度 width 的新字符串

string.lower()

轉(zhuǎn)換 string 中所有大寫字符為小寫.

string.lstrip()

截掉 string 左邊的空格

string.maketrans(intab, outtab])

maketrans() 方法用于創(chuàng)建字符映射的轉(zhuǎn)換表,對(duì)于接受兩個(gè)參數(shù)的最簡(jiǎn)單的調(diào)用方式,第一個(gè)參數(shù)是字符串,表示需要轉(zhuǎn)換的字符,第二個(gè)參數(shù)也是字符串表示轉(zhuǎn)換的目標(biāo)。

max(str)

返回字符串 str 中最大的字母。

min(str)

返回字符串 str 中最小的字母。

string.partition(str)

有點(diǎn)像 find()和 split()的結(jié)合體,從 str 出現(xiàn)的第一個(gè)位置起,把 字 符 串 string 分 成 一 個(gè) 3 元 素 的 元 組 (string_pre_str,str,string_post_str),如果 string 中不包含str 則 string_pre_str == string.

string.replace(str1, str2,  num=string.count(str1))

把 string 中的 str1 替換成 str2,如果 num 指定,則替換不超過(guò) num 次.

string.rfind(str, beg=0,end=len(string) )

類似于 find()函數(shù),不過(guò)是從右邊開始查找.

string.rindex( str, beg=0,end=len(string))

類似于 index(),不過(guò)是從右邊開始.

string.rjust(width)

返回一個(gè)原字符串右對(duì)齊,并使用空格填充至長(zhǎng)度 width 的新字符串

string.rpartition(str)

類似于 partition()函數(shù),不過(guò)是從右邊開始查找.

string.rstrip()

刪除 string 字符串末尾的空格.

string.split(str="", num=string.count(str))

以 str 為分隔符切片 string,如果 num有指定值,則僅分隔 num 個(gè)子字符串

string.splitlines(num=string.count('\n'))

按照行分隔,返回一個(gè)包含各行作為元素的列表,如果 num 指定則僅切片 num 個(gè)行.

string.startswith(obj, beg=0,end=len(string))

檢查字符串是否是以 obj 開頭,是則返回 True,否則返回 False。如果beg 和 end 指定值,則在指定范圍內(nèi)檢查.

string.strip([obj])

在 string 上執(zhí)行 lstrip()和 rstrip()

string.swapcase()

翻轉(zhuǎn) string 中的大小寫

string.title()

返回"標(biāo)題化"的 string,就是說(shuō)所有單詞都是以大寫開始,其余字母均為小寫(見(jiàn) istitle())

string.translate(str, del="")

根據(jù) str 給出的表(包含 256 個(gè)字符)轉(zhuǎn)換 string 的字符,

要過(guò)濾掉的字符放到 del 參數(shù)中

string.upper()

轉(zhuǎn)換 string 中的小寫字母為大寫

string.zfill(width)

返回長(zhǎng)度為 width 的字符串,原字符串 string 右對(duì)齊,前面填充0

string.isdecimal()

isdecimal()方法檢查字符串是否只包含十進(jìn)制字符。這種方法只存在于unicode對(duì)象。