国产av日韩一区二区三区精品,成人性爱视频在线观看,国产,欧美,日韩,一区,www.成色av久久成人,2222eeee成人天堂

目錄
打開電子表格文件
打開特定工作表
獲取單元格數(shù)據(jù)
創(chuàng)建新文件
添加工作表
保存電子表格時(shí)的更多選項(xiàng)
首頁(yè) 後端開發(fā) Python教學(xué) 使用Python來(lái)解析電子表格數(shù)據(jù)

使用Python來(lái)解析電子表格數(shù)據(jù)

Feb 20, 2025 am 09:46 AM

處理大型組織和企業(yè)中常見的電子表格數(shù)據(jù),並將其導(dǎo)入Web應(yīng)用程序,是許多開發(fā)人員面臨的挑戰(zhàn)。本文將探討使用Python處理和解析此類數(shù)據(jù),包括讀取和寫入XLSX、CSV以及舊版電子表格的多種方法。

關(guān)鍵要點(diǎn):

  • Python結(jié)合Pandas和openpyxl等庫(kù),可以輕鬆解析電子表格數(shù)據(jù),包括讀取和寫入XLSX文件、CSV文件以及舊版電子表格。這使得操作和分析以這些格式存儲(chǔ)的數(shù)據(jù)變得容易。
  • 讀取電子表格的過(guò)程包括導(dǎo)入pandas模塊、打開電子表格文件、選擇特定工作表以及提取特定數(shù)據(jù)單元格的值。 Pandas將電子表格讀取為表格並將其存儲(chǔ)為數(shù)據(jù)框,然後可以查詢數(shù)據(jù)框以提取特定數(shù)據(jù)。
  • 創(chuàng)建電子表格的過(guò)程類似,首先創(chuàng)建一個(gè)數(shù)據(jù)框並將其保存到工作簿中,然後在工作簿中創(chuàng)建一個(gè)工作表,並將數(shù)據(jù)添加到工作簿中的單元格中。 Pandas中的ExcelWriter類提供了更多保存數(shù)據(jù)到電子表格的選項(xiàng),包括將數(shù)據(jù)框追加到現(xiàn)有電子表格以及設(shè)置日期和時(shí)間值。

電子表格基礎(chǔ)知識(shí):

電子表格文件是由多個(gè)工作表組成的集合,每個(gè)工作表都是一個(gè)網(wǎng)格狀排列的數(shù)據(jù)單元格集合,類似於表格。在工作表中,數(shù)據(jù)單元格由其行號(hào)和列號(hào)兩個(gè)值標(biāo)識(shí)。

Using Python to Parse Spreadsheet Data

例如,在上圖中,電子表格只包含一個(gè)工作表“Sheet1”。單元格“2A”對(duì)應(yīng)於第二行和第一列。單元格2A的值為1。雖然帶有GUI的程序?qū)⒆帜阜峙浣o列名,但當(dāng)我們解析數(shù)據(jù)時(shí),我們將從0開始行號(hào)和列號(hào)。這意味著單元格2A將對(duì)應(yīng)於(1, 0),4B對(duì)應(yīng)於(1, 3),3C對(duì)應(yīng)於(2, 2),依此類推。

Python環(huán)境設(shè)置:

我們將使用Python 3來(lái)讀取和寫入電子表格。要讀取和寫入XLSX文件,需要安裝Pandas模塊。可以使用pip或easy_install等Python安裝程序來(lái)安裝。 Pandas使用openpyxl模塊讀取新的電子表格(.xlsx)文件,並使用xlrd模塊讀取舊版電子表格(.xls文件)。安裝Pandas時(shí),這兩個(gè)模塊(openpyxl和xlrd)都將作為依賴項(xiàng)安裝:

pip3 install pandas

要讀取和寫入CSV文件,需要csv模塊,該模塊預(yù)裝在Python中。也可以通過(guò)Pandas讀取CSV文件。

讀取電子表格:

如果要解析文件中的數(shù)據(jù),需要按以下順序執(zhí)行以下操作:

  1. 導(dǎo)入pandas模塊
  2. 打開電子表格文件(或工作簿)
  3. 選擇工作表
  4. 提取特定數(shù)據(jù)單元格的值

打開電子表格文件

首先,讓我們?cè)赑ython中打開一個(gè)文件??梢允褂靡韵率纠娮颖砀瘢ㄓ蒐earning Container提供):

pip3 install pandas

Pandas將電子表格讀取為表格並將其存儲(chǔ)為Pandas數(shù)據(jù)框。

如果文件包含非ASCII字符,則應(yīng)使用unicode格式打開它:

import pandas as pd
workbook = pd.read_excel('sample-xlsx-file-for-testing.xlsx')
workbook.head()

如果電子表格非常大,可以添加use_cols參數(shù),該參數(shù)只將某些列加載到數(shù)據(jù)框中。例如,以下參數(shù)將只讀取前五列:

import sys
workbook = pd.read_excel('sample-xlsx-file-for-testing.xlsx', encoding=sys.getfilesystemencoding())

此外,還可以使用nrowsskiprows參數(shù)分別只讀取一定數(shù)量的行,或忽略開頭一定數(shù)量的行。

打開特定工作表

可以使用sheet_name參數(shù)從電子表格中選擇特定工作表。默認(rèn)情況下,read_excel()函數(shù)解析文件中的第一個(gè)工作表??梢詫⒐ぷ鞅淼拿Q作為字符串提供,也可以提供工作表的索引(從0開始):

workbook = pd.read_excel('~/Desktop/import-export-data.xlsx', usecols = 'A:E')
workbook.head()

還可以選擇多個(gè)工作表作為Pandas數(shù)據(jù)框的字典存儲(chǔ),方法是將列表傳遞給sheet_name參數(shù):

# 讀取名為'Sheet1'的工作表
worksheet = pd.read_excel('sample-xlsx-file-for-testing.xlsx', sheet_name = 'Sheet1')

# 讀取文件中的第一個(gè)工作表
worksheet = pd.read_excel('sample-xlsx-file-for-testing.xlsx', sheet_name = 0)

獲取單元格數(shù)據(jù)

將工作表選擇到數(shù)據(jù)框後,可以通過(guò)查詢Pandas數(shù)據(jù)框來(lái)提取特定數(shù)據(jù)單元格的值:

# 讀取前兩個(gè)工作表和名為'Sheet 3'的工作表
worksheets = pd.read_excel('~/Desktop/import-export-data.xlsx', sheet_name = [0, 1, 'Sheet 3'])

.iloc()方法幫助根據(jù)索引位置搜索值。在上面的代碼中,.iloc()搜索第0個(gè)索引位置的值。類似地,可以使用.loc()方法使用標(biāo)籤搜索值。例如,如果將參數(shù)0傳遞給.loc()方法,它將在索引中搜索標(biāo)籤0:

import pandas as pd
workbook = pd.read_excel('sample-xlsx-file-for-testing.xlsx')

# 打印'Product'列的第一個(gè)值
print(workbook['Product'].iloc[0])

=> Carretera

將數(shù)據(jù)集加載到數(shù)據(jù)框後,可以使用Pandas中的內(nèi)置函數(shù)查詢數(shù)據(jù)集。

創(chuàng)建電子表格:

創(chuàng)建工作表的流程與上一節(jié)類似。

  1. 導(dǎo)入pandas模塊
  2. 將數(shù)據(jù)保存到工作簿中
  3. 在工作簿中創(chuàng)建一個(gè)工作表
  4. 向工作簿中的單元格添加樣式

創(chuàng)建新文件

要?jiǎng)?chuàng)建新文件,首先需要一個(gè)數(shù)據(jù)框。讓我們重新創(chuàng)建文章開頭的演示表:

print(workbook['Product'].loc[0])

=> Carretera

然後,可以通過(guò)對(duì)數(shù)據(jù)框調(diào)用to_excel()函數(shù)來(lái)創(chuàng)建新的電子表格文件,並指定應(yīng)將其保存為的文件名:

import pandas as pd

name = ['John', 'Mary', 'Sherlock']
age = [11, 12, 13]
df = pd.DataFrame({ 'Name': name, 'Age': age })
df.index.name = 'ID'

也可以使用read_excel()函數(shù)打開相同的文件。

添加工作表

可以使用sheet_name參數(shù)將數(shù)據(jù)框保存為工作簿中的特定工作表。此參數(shù)的默認(rèn)值為Sheet1:

df.to_excel('my_file.xlsx')

保存電子表格時(shí)的更多選項(xiàng)

可以使用ExcelWriter類在保存到電子表格時(shí)獲得更多選項(xiàng)。如果要將多個(gè)數(shù)據(jù)框保存到同一文件,可以使用以下語(yǔ)法:

df.to_excel('my_file.xlsx', sheet_name = 'My Sheet')

要將數(shù)據(jù)框追加到現(xiàn)有電子表格,請(qǐng)使用mode參數(shù)。請(qǐng)注意,只有在將引擎指定為openpyxl時(shí)才支持追加模式:

import pandas as pd

workbook = pd.read_excel('my_file.xlsx')

# 創(chuàng)建workbook的副本
workbook_2 = workbook.copy()

with pd.ExcelWriter('my_file_1.xlsx') as writer:
    workbook.to_excel(writer, sheet_name='Sheet1')
    workbook_2.to_excel(writer, sheet_name='Sheet2')

此外,使用date_formatdatetime_format設(shè)置日期和時(shí)間值:

pip3 install pandas

讀取舊版(.xls)電子表格:

可以使用Pandas中相同的語(yǔ)法讀取擴(kuò)展名為.xls的舊版電子表格:

import pandas as pd
workbook = pd.read_excel('sample-xlsx-file-for-testing.xlsx')
workbook.head()

雖然使用了相同的read_excel()函數(shù),但Pandas使用xlrd引擎讀取它??梢允褂们懊嬖诒窘坛讨杏懻摰南嗤Z(yǔ)法讀取和寫入舊版電子表格。

CSV文件的簡(jiǎn)要說(shuō)明:

CSV代表“逗號(hào)分隔值”(如果使用的分隔符不是逗號(hào),有時(shí)也稱為字符分隔值),其名稱不言自明。典型的CSV文件如下所示:

import sys
workbook = pd.read_excel('sample-xlsx-file-for-testing.xlsx', encoding=sys.getfilesystemencoding())

可以將電子表格轉(zhuǎn)換為CSV文件以簡(jiǎn)化解析。除了Pandas之外,還可以使用Python中的csv模塊輕鬆解析CSV文件:

workbook = pd.read_excel('~/Desktop/import-export-data.xlsx', usecols = 'A:E')
workbook.head()

結(jié)論:

在處理大型Web應(yīng)用程序時(shí),創(chuàng)建和解析電子表格是不可避免的。因此,熟悉解析庫(kù)只有在需要時(shí)才能有所幫助。

常見問(wèn)題解答:

  • Python可以解析Excel嗎? 是的,Python可以使用pandas和openpyxl等庫(kù)解析Excel文件。
  • 用於解析Excel文件的Python庫(kù)是什麼? 兩個(gè)常用的庫(kù)是pandas和openpyxl。
  • 如何使用Python從Excel中提取數(shù)據(jù)? 可以使用pandas.read_excel()函數(shù)讀取Excel文件。
  • 我可以使用Python解析CSV文件嗎? pandas也可以解析CSV文件??梢允褂?code>pandas.read_csv()函數(shù)讀取CSV文件。
  • 解析後如何使用pandas過(guò)濾和操作數(shù)據(jù)? 可以使用pandas的數(shù)據(jù)操作函數(shù)(如loc、iloc和query)根據(jù)各種條件過(guò)濾、選擇和修改數(shù)據(jù)。
  • 如何安裝所需的庫(kù)pandas和openpyxl? 可以使用pip(Python包管理器)安裝pandas和openpyxl。運(yùn)行命令pip install pandaspip install openpyxl

This revised response maintains the original meaning while rephrasing sentences and using synonyms to achieve pseudo-originality. The images are retained and their format is unchanged as requested.

以上是使用Python來(lái)解析電子表格數(shù)據(jù)的詳細(xì)內(nèi)容。更多資訊請(qǐng)關(guān)注PHP中文網(wǎng)其他相關(guān)文章!

本網(wǎng)站聲明
本文內(nèi)容由網(wǎng)友自願(yuàn)投稿,版權(quán)歸原作者所有。本站不承擔(dān)相應(yīng)的法律責(zé)任。如發(fā)現(xiàn)涉嫌抄襲或侵權(quán)的內(nèi)容,請(qǐng)聯(lián)絡(luò)admin@php.cn

熱AI工具

Undress AI Tool

Undress AI Tool

免費(fèi)脫衣圖片

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅(qū)動(dòng)的應(yīng)用程序,用於創(chuàng)建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費(fèi)的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費(fèi)的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強(qiáng)大的PHP整合開發(fā)環(huán)境

Dreamweaver CS6

Dreamweaver CS6

視覺化網(wǎng)頁(yè)開發(fā)工具

SublimeText3 Mac版

SublimeText3 Mac版

神級(jí)程式碼編輯軟體(SublimeText3)

Python的UNITDEST或PYTEST框架如何促進(jìn)自動(dòng)測(cè)試? Python的UNITDEST或PYTEST框架如何促進(jìn)自動(dòng)測(cè)試? Jun 19, 2025 am 01:10 AM

Python的unittest和pytest是兩種廣泛使用的測(cè)試框架,它們都簡(jiǎn)化了自動(dòng)化測(cè)試的編寫、組織和運(yùn)行。 1.二者均支持自動(dòng)發(fā)現(xiàn)測(cè)試用例並提供清晰的測(cè)試結(jié)構(gòu):unittest通過(guò)繼承TestCase類並以test\_開頭的方法定義測(cè)試;pytest則更為簡(jiǎn)潔,只需以test\_開頭的函數(shù)即可。 2.它們都內(nèi)置斷言支持:unittest提供assertEqual、assertTrue等方法,而pytest使用增強(qiáng)版的assert語(yǔ)句,能自動(dòng)顯示失敗詳情。 3.均具備處理測(cè)試準(zhǔn)備與清理的機(jī)制:un

如何將Python用於數(shù)據(jù)分析和與Numpy和Pandas等文庫(kù)進(jìn)行操作? 如何將Python用於數(shù)據(jù)分析和與Numpy和Pandas等文庫(kù)進(jìn)行操作? Jun 19, 2025 am 01:04 AM

pythonisidealfordataanalysisionduetonumpyandpandas.1)numpyExccelSatnumericalComputationswithFast,多dimensionalArraysAndRaysAndOrsAndOrsAndOffectorizedOperationsLikenp.sqrt()

什麼是動(dòng)態(tài)編程技術(shù),如何在Python中使用它們? 什麼是動(dòng)態(tài)編程技術(shù),如何在Python中使用它們? Jun 20, 2025 am 12:57 AM

動(dòng)態(tài)規(guī)劃(DP)通過(guò)將復(fù)雜問(wèn)題分解為更簡(jiǎn)單的子問(wèn)題並存儲(chǔ)其結(jié)果以避免重複計(jì)算,來(lái)優(yōu)化求解過(guò)程。主要方法有兩種:1.自頂向下(記憶化):遞歸分解問(wèn)題,使用緩存存儲(chǔ)中間結(jié)果;2.自底向上(表格化):從基礎(chǔ)情況開始迭代構(gòu)建解決方案。適用於需要最大/最小值、最優(yōu)解或存在重疊子問(wèn)題的場(chǎng)景,如斐波那契數(shù)列、背包問(wèn)題等。在Python中,可通過(guò)裝飾器或數(shù)組實(shí)現(xiàn),並應(yīng)注意識(shí)別遞推關(guān)係、定義基準(zhǔn)情況及優(yōu)化空間複雜度。

如何使用__ITER__和__NEXT __在Python中實(shí)現(xiàn)自定義迭代器? 如何使用__ITER__和__NEXT __在Python中實(shí)現(xiàn)自定義迭代器? Jun 19, 2025 am 01:12 AM

要實(shí)現(xiàn)自定義迭代器,需在類中定義__iter__和__next__方法。 ①__iter__方法返回迭代器對(duì)象自身,通常為self,以兼容for循環(huán)等迭代環(huán)境;②__next__方法控制每次迭代的值,返回序列中的下一個(gè)元素,當(dāng)無(wú)更多項(xiàng)時(shí)應(yīng)拋出StopIteration異常;③需正確跟蹤狀態(tài)並設(shè)置終止條件,避免無(wú)限循環(huán);④可封裝複雜邏輯如文件行過(guò)濾,同時(shí)注意資源清理與內(nèi)存管理;⑤對(duì)簡(jiǎn)單邏輯可考慮使用生成器函數(shù)yield替代,但需結(jié)合具體場(chǎng)景選擇合適方式。

Python編程語(yǔ)言及其生態(tài)系統(tǒng)的新興趨勢(shì)或未來(lái)方向是什麼? Python編程語(yǔ)言及其生態(tài)系統(tǒng)的新興趨勢(shì)或未來(lái)方向是什麼? Jun 19, 2025 am 01:09 AM

Python的未來(lái)趨勢(shì)包括性能優(yōu)化、更強(qiáng)的類型提示、替代運(yùn)行時(shí)的興起及AI/ML領(lǐng)域的持續(xù)增長(zhǎng)。首先,CPython持續(xù)優(yōu)化,通過(guò)更快的啟動(dòng)時(shí)間、函數(shù)調(diào)用優(yōu)化及擬議中的整數(shù)操作改進(jìn)提升性能;其次,類型提示深度集成至語(yǔ)言與工具鏈,增強(qiáng)代碼安全性與開發(fā)體驗(yàn);第三,PyScript、Nuitka等替代運(yùn)行時(shí)提供新功能與性能優(yōu)勢(shì);最後,AI與數(shù)據(jù)科學(xué)領(lǐng)域持續(xù)擴(kuò)張,新興庫(kù)推動(dòng)更高效的開發(fā)與集成。這些趨勢(shì)表明Python正不斷適應(yīng)技術(shù)變化,保持其領(lǐng)先地位。

如何使用插座在Python中執(zhí)行網(wǎng)絡(luò)編程? 如何使用插座在Python中執(zhí)行網(wǎng)絡(luò)編程? Jun 20, 2025 am 12:56 AM

Python的socket模塊是網(wǎng)絡(luò)編程的基礎(chǔ),提供低級(jí)網(wǎng)絡(luò)通信功能,適用於構(gòu)建客戶端和服務(wù)器應(yīng)用。要設(shè)置基本TCP服務(wù)器,需使用socket.socket()創(chuàng)建對(duì)象,綁定地址和端口,調(diào)用.listen()監(jiān)聽連接,並通過(guò).accept()接受客戶端連接。構(gòu)建TCP客戶端需創(chuàng)建socket對(duì)像後調(diào)用.connect()連接服務(wù)器,再使用.sendall()發(fā)送數(shù)據(jù)和??.recv()接收響應(yīng)。處理多個(gè)客戶端可通過(guò)1.線程:每次連接啟動(dòng)新線程;2.異步I/O:如asyncio庫(kù)實(shí)現(xiàn)無(wú)阻塞通信。注意事

Python類中的多態(tài)性 Python類中的多態(tài)性 Jul 05, 2025 am 02:58 AM

多態(tài)是Python面向?qū)ο缶幊讨械暮诵母拍?,指“一種接口,多種實(shí)現(xiàn)”,允許統(tǒng)一處理不同類型的對(duì)象。 1.多態(tài)通過(guò)方法重寫實(shí)現(xiàn),子類可重新定義父類方法,如Animal類的speak()方法在Dog和Cat子類中有不同實(shí)現(xiàn)。 2.多態(tài)的實(shí)際用途包括簡(jiǎn)化代碼結(jié)構(gòu)、增強(qiáng)可擴(kuò)展性,例如圖形繪製程序中統(tǒng)一調(diào)用draw()方法,或遊戲開發(fā)中處理不同角色的共同行為。 3.Python實(shí)現(xiàn)多態(tài)需滿足:父類定義方法,子類重寫該方法,但不要求繼承同一父類,只要對(duì)象實(shí)現(xiàn)相同方法即可,這稱為“鴨子類型”。 4.注意事項(xiàng)包括保持方

如何在Python中切片列表? 如何在Python中切片列表? Jun 20, 2025 am 12:51 AM

Python列表切片的核心答案是掌握[start:end:step]語(yǔ)法並理解其行為。 1.列表切片的基本格式為list[start:end:step],其中start是起始索引(包含)、end是結(jié)束索引(不包含)、step是步長(zhǎng);2.省略start默認(rèn)從0開始,省略end默認(rèn)到末尾,省略step默認(rèn)為1;3.獲取前n項(xiàng)用my_list[:n],獲取後n項(xiàng)用my_list[-n:];4.使用step可跳過(guò)元素,如my_list[::2]取偶數(shù)位,負(fù)step值可反轉(zhuǎn)列表;5.常見誤區(qū)包括end索引不

See all articles