PHP開發(fā)基礎(chǔ)教程之類型、字元集、引擎和索引
資料型別
#MySQL中存的是資料。只要是數(shù)據(jù),我們就會(huì)規(guī)定數(shù)據(jù)的類型。在表格的欄位中規(guī)定了使用的是某個(gè)資料類型。那麼,在插入的資料中就要使用對(duì)應(yīng)的資料類型。並且,遵守資料類型的長(zhǎng)度要求。
在MySQL裡面我們將資料型別分成了以下一些類型:
#數(shù)值型別(整數(shù)、浮點(diǎn))
字串型別
日期時(shí)間型別
#複合型別
##整數(shù)
整數(shù)的長(zhǎng)度不同,在實(shí)際使用過程也就PHP學(xué)院。
就可以保證所包含數(shù)字少於 6 個(gè)的值從資料庫中檢索出來時(shí)能夠自動(dòng)地用空格填充。需要注意的是,使用一個(gè)寬度指示器不會(huì)影響欄位的大小和它可以儲(chǔ)存的值的範(fàn)圍。
- 注意:
- 在建立表格欄位時(shí),性別我們可以使用無符號(hào)的微小整數(shù)(tinyint)來表示。用0表示女、用1表示男。用2表示未知。
- 同樣人類年齡也是,在建立表格欄位時(shí)可用無符號(hào)的整數(shù)。因?yàn)槿祟惖哪挲g還沒有負(fù)數(shù)
- 在實(shí)際使用過程中。我們業(yè)務(wù)中最大需要儲(chǔ)存多大的數(shù)值。我們建立表格時(shí),就選擇什麼樣的類型來儲(chǔ)存這樣的值。
浮點(diǎn)型別
##注意:
浮點(diǎn)是非精確值,會(huì)存在不太準(zhǔn)確的情況
*CHAR *?類型用於設(shè)定長(zhǎng)字串,並且必須在圓括號(hào)內(nèi)用一個(gè)大小修飾符來定義。這個(gè)大小修飾符的範(fàn)圍從 0-255。比指定長(zhǎng)度大的值將被截短,而比指定長(zhǎng)度小的值將會(huì)用空格作填補(bǔ)。
*VARCHAR *?把這個(gè)大小當(dāng)成數(shù)值的大小,不長(zhǎng)度不足的情況下就用空格補(bǔ)足。而 VARCHAR 類型把它視為最大值並且只使用儲(chǔ)存字串實(shí)際需要的長(zhǎng)度
類型不會(huì)被空格填補(bǔ),但長(zhǎng)於指示器的值仍然會(huì)被截?cái)唷?
因?yàn)?VARCHAR 類型可以根據(jù)實(shí)際內(nèi)容動(dòng)態(tài)改變儲(chǔ)存值的長(zhǎng)度,所以在無法確定欄位需要多少字元時(shí)使用 VARCHAR 類型可以大幅節(jié)省磁碟空間、提高儲(chǔ)存效率。
text類型與blob類型?對(duì)於欄位長(zhǎng)度要求超過 255 個(gè)的情況下,MySQL 提供了 TEXT 和 BLOB 兩種類型。根據(jù)儲(chǔ)存資料的大小,它們都有不同的子類型。這些大型的資料用於儲(chǔ)存文字區(qū)塊或圖像、
聲音檔案等二進(jìn)位資料類型。
TEXT 和 BLOB 類型在分類和比較上有差異。 BLOB 類型區(qū)分大小寫,而 TEXT 不區(qū)分大小寫。大小修飾符不用於各種 BLOB 和 TEXT 子類型。
時(shí)間類型
#注意:
時(shí)間類型在web系統(tǒng)中用的比較少,很多時(shí)候很多人喜歡使用int來儲(chǔ)存時(shí)間。插入時(shí)插入的是unix時(shí)間戳,因?yàn)檫@種方式比較方便計(jì)算。在前端業(yè)務(wù)中用date類型的函數(shù),再將unix時(shí)間戳轉(zhuǎn)成人們可辨識(shí)的時(shí)間。
上面的類型你可以根據(jù)實(shí)際情況實(shí)際進(jìn)行選擇
有些人為了在資料庫管理中方便查看,也有人使用datetime類型來儲(chǔ)存時(shí)間。
複合型別
#一個(gè)ENUM 類型只允許從一個(gè)集合中取得一個(gè)值;而SET 類型允許從一個(gè)集合中取得任意多個(gè)值。
1.ENUM 類型
ENUM 類型因?yàn)橹辉试S在集合中取得一個(gè)值,有點(diǎn)類似單一選項(xiàng)。在處理相互排拆的資料時(shí)容易讓人理解,例如人類的性別。 ENUM 類型欄位可以從集合中取得一個(gè)值或使用null值,除此之外的輸入將會(huì)使 MySQL 在這個(gè)欄位中插入一個(gè)空字串。另外如果插入值的大小寫與集合中值的大小寫不匹配,MySQL會(huì)自動(dòng)使用插入值的大小寫轉(zhuǎn)換成與集合中大小寫一致的值。
ENUM 型別在系統(tǒng)內(nèi)部可以儲(chǔ)存為數(shù)字,並且從1開始用數(shù)字做索引。一個(gè) ENUM 類型最多可以包含 65536 個(gè)元素,其中一個(gè)元素被 MySQL 保留,用來儲(chǔ)存錯(cuò)誤訊息,這個(gè)錯(cuò)誤值用索引 0 或一個(gè)空字串表示。
MySQL 認(rèn)為 ENUM 類型集合中出現(xiàn)的值是合法輸入,除此之外其它任何輸入都會(huì)失敗。這說明透過搜尋包含空字串或?qū)?yīng)數(shù)字索引為 0 的行就可以輕鬆找到錯(cuò)誤記錄的位置。
2.SET 類型?SET 類型與 ENUM 類型相似但不同。 SET類型可以從預(yù)先定義的集合中取得任意數(shù)量的值。並且與 ENUM 類型相同的是任何試圖在 SET 類型欄位中插入非預(yù)先定義的值都會(huì)使MySQL插入一個(gè)空字串。如果插入一個(gè)即有合法的元素又有非法的元素的記錄,MySQL 將會(huì)保留合法的元素,除去非法的元素。
一個(gè) SET 類型最多可以包含 64 項(xiàng)元素。在 SET 元素中值被儲(chǔ)存為一個(gè)分離的「位元」序列,這些「位元」表示與它相對(duì)應(yīng)的元素。 「位」是創(chuàng)建有序元素集合的一種簡(jiǎn)單而有效的方式。
而且它也去掉了重複的元素,所以SET類型中不可能包含兩個(gè)相同的元素。
希望從 SET 類型欄位中找出非法的記錄只需尋找包含空字串或二進(jìn)位值為 0 的行。
類型使用
我們學(xué)習(xí)了這麼多類型,在建立表格的語句的時(shí)候使用對(duì)應(yīng)的類型即可。
舉例如下:
CREATE TABLE IF NOT EXISTS?demo?(
id?int(11) NOT NULL,
username?varchar(50) NOT NULL,
password?char(#password?char(50) NOT NULL,
password?char( 32) NOT NULL,
content?longtext NOT NULL,
createtime?datetime NOT ##字段其他屬性設(shè)定
UNSIGNED(無符號(hào))?主要用於整數(shù)和浮點(diǎn)類型,使用無符號(hào)。即,沒有前面面的-(負(fù)號(hào))。
建立時(shí)在整數(shù)或浮點(diǎn)欄位語句後面接著上: unsigned
ZEROFILL(0填) 0(不是空格)可以用來真補(bǔ)輸出的值。使用這個(gè)修飾符可以阻止 MySQL 資料庫儲(chǔ)存負(fù)值。
建立時(shí)在整數(shù)或浮點(diǎn)欄位語句後面接著:
zerofill
default?default屬性確保在沒有任何值可用的情況下,賦予某個(gè)常數(shù)值,這個(gè)值必須是常數(shù),因?yàn)镸ySQL不允許插入函數(shù)或表達(dá)式值。此外,此屬性無法用於BLOB或TEXT列。如果已經(jīng)為此列指定了NULL屬性,沒有指定預(yù)設(shè)值時(shí)預(yù)設(shè)值將為NULL,否則預(yù)設(shè)值將依賴於欄位的資料類型。
建立時(shí)在整數(shù)或浮點(diǎn)欄位語句後接上:
#default '值'
not null?如果將一個(gè)欄位定義為not null,將不允許向該欄位插入null值。建議在重要情況下始終使用not null屬性,因?yàn)樗峁┝艘粋€(gè)基本驗(yàn)證,確保已經(jīng)向查詢傳遞了所有必要的值。
建立時(shí)在整數(shù)或浮點(diǎn)欄位語句後面接著上:
not null
null?為列指定null屬性時(shí),該列可以保持為空,而不論行中其它列是否已經(jīng)被填入。記住,null精確的說法是“無”,而不是空字串或0。
建立時(shí)在整數(shù)或浮點(diǎn)欄位語句後不要宣告not null即可。
字元集
#字元集是什麼
為了更好的辨識(shí)中文、日文、英文、希臘文。對(duì)於常用的符號(hào)進(jìn)行了編碼,這個(gè)編碼就是一個(gè)字元集。
字元集確定了文字的儲(chǔ)存方式。
字元集相當(dāng)於電腦中人類的語言。
舉例:
我說的是英文,所以我儲(chǔ)存的時(shí)候要用英文文字來儲(chǔ)存。
如果我說的是中文,用英文字元來儲(chǔ)存的話。那麼人們就看不懂也看不明白,就是我們所說的亂碼。
因?yàn)樽衷嗔?,足夠有幾十種上百種之多。所以我們不需要了解太多的字符集的知識(shí),甚至不需要了解字符集到底是如何編成人類可見字符的。
字元集的重點(diǎn)知識(shí)
#我們只需要了解:
常用字元集
資料庫中我們用什麼字元集
#英文字元集:
ASCII
ASCII 碼使用指定的7 位元或8 位元二進(jìn)位數(shù)組合來表示128 或256 種可能的字元。標(biāo)準(zhǔn)ASCII 碼也叫基礎(chǔ)ASCII碼,使用7 位元二進(jìn)位數(shù)來表示所有的大寫和小寫字母,數(shù)字0 到9、標(biāo)點(diǎn)符號(hào), 以及在美式英語中使用的特殊控製字元。
其中:
0~31及127(共33個(gè))是控製字元或通訊專用字元(其餘為可顯示字元),如控制符:LF(換行)、CR(Enter)、FF(換頁)、DEL(刪除)、BS( 、10 和13 分別轉(zhuǎn)換為退格、製表、換行和回車字元。它們並沒有特定的圖形顯示,但會(huì)依不同的應(yīng)用程序,而對(duì)文字顯示有不同的影響。
32~126(共95個(gè))是字元(32是空格),其中48~57為0到9十個(gè)阿拉伯?dāng)?shù)字。
65~90為26個(gè)大寫英文字母,97~122號(hào)為26個(gè)小寫英文字母,其餘為一些標(biāo)點(diǎn)符號(hào)、運(yùn)算符號(hào)等。
GBK
GBK 向下與 GB 2312 編碼相容。是中華人民共和國(guó)定義的漢字計(jì)算機(jī)編碼規(guī)範(fàn)。早期版本為GB2312。
Unicode
Unicode(統(tǒng)一碼、萬國(guó)碼、單碼)Unicode是國(guó)際組織制定的可以容納世界上所有文字和符號(hào)的字元編碼方案。以滿足跨語言、跨平臺(tái)進(jìn)行文字轉(zhuǎn)換、處理的要求。
UTF-8
是針對(duì)Unicode的可變長(zhǎng)度字元編碼,也是萬國(guó)碼。因?yàn)閁NICODE比ASCII佔(zhàn)用大一倍的空間,而對(duì)ASCII來說高位元組的0對(duì)他毫無用處。為了解決這個(gè)問題,就出現(xiàn)了一些中間格式的字元集,他們被稱為通用轉(zhuǎn)換格式,即UTF(Universal Transformation Format)
實(shí)際工作中要使用的編碼
在中文常用的字元集分為utf-8和GBK。
實(shí)際使用的如下:
觀察(圖一)的特性你會(huì)發(fā)現(xiàn),MySQL字元集由三個(gè)部份組成:
1.字元集?
2.語言
3.型別
最後的bin是指二進(jìn)位字元集,後面的ci是指儲(chǔ)存排序時(shí)不區(qū)分字元的大小寫。
注意:
mysql在寫utf-8的時(shí)候?qū)懙氖莡tf8。不加中間的中橫線。
表引擎
MySQL的強(qiáng)大之處在於它的插件式儲(chǔ)存引擎,我們可以基於表的特點(diǎn)使用不同的儲(chǔ)存引擎,從而達(dá)到最好的效能。
如果你夠熟悉,並且有一定工作經(jīng)驗(yàn)後。你也可以使用阿里巴巴和網(wǎng)易開源出來的MySQL引擎在自己的伺服器中使用。
大家在後面的一節(jié)《資料庫結(jié)構(gòu)定義語句》中可以學(xué)到建立表格的語句。 mysql在建立表格的時(shí)候,可以指定對(duì)應(yīng)的引擎。
在mysql指令中使用:
show engines;
可以檢視到目前伺服器支援的所有引擎。
我們介紹幾種常用的引擎和了解幾個(gè)不常用的引擎。避免未來在實(shí)際工作中看到一些引擎不知道概念。
MyISAM
不支援事務(wù),表鎖(表級(jí)鎖,加鎖會(huì)鎖住整個(gè)表),支援全文索引,操作速度快。常用於讀取多的業(yè)務(wù)。
myisam儲(chǔ)存引擎表由myd和myi組成。 .myd用來存放資料文件,.myi用來存放索引文件。
對(duì)於myisam儲(chǔ)存引擎表,mysql資料庫只快取其索引文件,資料文件的快取由作業(yè)系統(tǒng)本身來完成。
InnoDB
支援事務(wù),主要針對(duì)線上事務(wù)處理(OLTP)的應(yīng)用。
行鎖定設(shè)計(jì),支援外鍵,即預(yù)設(shè)讀取操作不加鎖。
InnoDB是為處理巨大資料量時(shí)的最大效能設(shè)計(jì)。
註:
行鎖:寫入、更新操作的時(shí)候?qū)⑦@一行鎖起來,不讓其他人再操作了。
表鎖:寫入、更新操作時(shí),將表格給鎖起來不讓其他人再操作了。
事務(wù):同時(shí)操作多個(gè)數(shù)據(jù),若其中的一個(gè)數(shù)據(jù)操作失敗。可回滾到操作之前。常用於銀行、電商、金融等系統(tǒng)。
索引
#索引看著挺高大上的名字,說穿了就是我們書最新面的目錄。
假如你用新華字典來查找「張」這個(gè)漢字,不使用目錄的話,你可能要從新華字典的第一頁找到最後一頁,可能要花二個(gè)小時(shí)。字典越厚呢,你花的時(shí)間就越多?,F(xiàn)在你使用目錄來找出「張」這個(gè)漢字,張的首字母是z,z開頭的漢字從900多頁開始,有了這條線索,你查找一個(gè)漢字可能只要一分鐘,由此可見索引的重要性。
索引用於快速找出在某個(gè)欄位中有一特定值的行。
不使用索引,MySQL必須從第1筆記錄開始然後讀取完整表直到找出相關(guān)的行。表越大,花費(fèi)的時(shí)間越多。如果表中查詢的欄位有索引,MySQL能快速到達(dá)一個(gè)位置去搜尋到資料檔案的中間,沒有必要看所有資料。
當(dāng)然索引也不易過多,索引越多寫入,修改的速度越慢。因?yàn)?,寫入修改資料時(shí),也要修改索引。
MySQL的索引類型