詳細(xì)闡述PHP環(huán)境下如何將GBK編碼轉(zhuǎn)成UTF-8格式
Jun 08, 2016 pm 05:32 PMapache 字符集 GB 2312
mysql 字符集 GBK
現(xiàn)要從 mysql 中提出信息(GBK) 寫入到 XML 中
XML中的編碼格式是 UTF-8
那么,如何將GBK編碼成 UTF8 ??
具體介紹:
前一陣子見到了qiushuiwuhen君的關(guān)于gbk,unicode,big5的轉(zhuǎn)換的文章
但是多少有一些不太大的問題
于是我設(shè)計了一個負(fù)責(zé)字符轉(zhuǎn)換的類,修正了其中的一些不足,增加了部分功能,以后我會不斷擴(kuò)充該類,來支持更多的字符集
增加了如下幾點:
unicode->gbk 符號部分的轉(zhuǎn)換
歐元符的識別
big5,Unicode,GBK之間的相互轉(zhuǎn)換,前提是只轉(zhuǎn)換共同的字符集部分,
使用說明:
暫時程序支持以下字符編碼方式:
GBK,BIG5,UTF-16BE(Unicode big-endian字節(jié)順序),UTF-16LE(Unicode little-endian字節(jié)順序),UTF-8
默認(rèn)輸入編碼方式為GBK,默認(rèn)輸出編碼方式為UTF-16BE;
該類別提供兩個函數(shù)用來修改輸入和輸出編碼方式:
修改輸入編碼方式 boolean SetGetEncoding(string $GetEncoding)
修改輸出編碼方式 boolean SetToEncoding(string $ToEncoding)
函數(shù)參數(shù)只能使用上述5種編碼方式,區(qū)分大小寫,如GBK不能寫成gbk
假如設(shè)置成功,返回true,假如使用了錯誤的編碼名,返回false,并現(xiàn)實錯誤信息
函數(shù)
string EncodeString(string $String)
負(fù)責(zé)進(jìn)行字符編碼轉(zhuǎn)換,返回轉(zhuǎn)換后的字符串
使用前,請將var $FilePath=""變量該為該程序文件的絕對路徑,否則將會找不到數(shù)據(jù)文件
例子:
將gbk編碼的字符串轉(zhuǎn)化為UTF-8編碼:
$s="GBK編碼";
$CharEncoding=new Encoding();
$CharEncoding->SetGetEncoding("GBK")||die("編碼名錯誤");
$CharEncoding->SetToEncoding("UTF-8")||die("編碼名錯誤");
echo $CharEncoding->EncodeString($s);
在瀏覽器中使用UTF-8編碼察看,將會看到正確的字符

Alat AI Hot

Undress AI Tool
Gambar buka pakaian secara percuma

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Clothoff.io
Penyingkiran pakaian AI

Video Face Swap
Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas

Tukar jenis data asas kepada rentetan menggunakan fungsi String.valueOf() Java Dalam pembangunan Java, apabila kita perlu menukar jenis data asas kepada rentetan, kaedah biasa ialah menggunakan fungsi valueOf() kelas String. Fungsi ini boleh menerima parameter jenis data asas dan mengembalikan perwakilan rentetan yang sepadan. Dalam artikel ini, kami akan meneroka cara menggunakan fungsi String.valueOf() untuk penukaran jenis data asas dan menyediakan beberapa contoh kod untuk

Kaedah menukar tatasusunan char kepada rentetan: Ia boleh dicapai dengan penugasan Gunakan sintaks {char a[]=" abc d\0efg ";string s=a;} untuk membenarkan tatasusunan char terus memberikan nilai kepada rentetan, dan laksanakan. kod untuk melengkapkan penukaran.

Gantikan aksara (rentetan) dalam rentetan menggunakan fungsi String.replace() Java Dalam Java, rentetan ialah objek tidak boleh ubah, yang bermaksud apabila objek rentetan dicipta, nilainya tidak boleh diubah suai. Walau bagaimanapun, anda mungkin menghadapi situasi di mana anda perlu menggantikan aksara atau rentetan tertentu dalam rentetan. Pada masa ini, kita boleh menggunakan kaedah replace() dalam kelas String Java untuk melaksanakan penggantian rentetan. Kaedah replace() kelas String mempunyai dua jenis:

Pemahaman mendalam tentang PHP: Kaedah pelaksanaan menukar JSONUnicode kepada Bahasa Cina Semasa pembangunan, kami sering menghadapi situasi di mana kami perlu memproses data JSON dan pengekodan Unicode dalam JSON akan menyebabkan kami beberapa masalah dalam beberapa senario, terutamanya apabila kami perlu menukar Unicode Apabila pengekodan ditukar kepada aksara Cina. Dalam PHP, terdapat beberapa kaedah yang boleh membantu kami mencapai proses penukaran ini Kaedah biasa akan diperkenalkan di bawah dan contoh kod khusus akan disediakan. Mula-mula, mari kita fahami dulu Un dalam JSON

Gunakan fungsi String.length() Java untuk mendapatkan panjang rentetan Dalam pengaturcaraan Java, rentetan ialah jenis data yang sangat biasa Kita selalunya perlu mendapatkan panjang rentetan, iaitu bilangan aksara dalam rentetan. Di Java, kita boleh menggunakan fungsi length() kelas String untuk mendapatkan panjang rentetan. Berikut ialah kod contoh mudah: publicclassStringLengthExample{publ

Analisis pengekodan bahasa Go: Perbandingan UTF-8 dan GBK Dalam bahasa Go, memproses pengekodan rentetan ialah salah satu tugas biasa. Antaranya, UTF-8 dan GBK ialah dua kaedah pengekodan aksara yang biasa digunakan. Artikel ini akan menjalankan perbandingan terperinci antara UTF-8 dan GBK, membincangkan perbezaan dan penggunaannya, serta melampirkan contoh kod khusus. 1. Pengenalan kepada UTF-8 dan GBK UTF-8: UTF-8 ialah kaedah pengekodan Unicode berpanjangan boleh ubah yang boleh mewakili aksara dalam hampir semua bahasa di dunia. UTF-8

Unicode ialah standard pengekodan aksara yang digunakan untuk mewakili pelbagai bahasa dan simbol. Untuk menukar pengekodan Unicode kepada aksara Cina, anda boleh menggunakan fungsi terbina dalam Python chr() dan ord().

Salam semua, hari ini saya akan berkongsi dengan anda pengetahuan asas Java: String. Tidak perlu diperkatakan kepentingan kelas String, ia boleh dikatakan sebagai kelas yang paling banyak digunakan dalam pembangunan back-end kami, jadi adalah perlu untuk membincangkannya.
