-
當(dāng)前位置:首頁(yè) > 創(chuàng)意學(xué)院 > 技術(shù) > 專題列表 > 正文
pd.tocsv參數(shù)(pd.to_csv)
大家好!今天讓創(chuàng)意嶺的小編來(lái)大家介紹下關(guān)于pd.tocsv參數(shù)的問(wèn)題,以下是小編對(duì)此問(wèn)題的歸納整理,讓我們一起來(lái)看看吧。
ChatGPT國(guó)內(nèi)免費(fèi)在線使用,一鍵生成原創(chuàng)文章、方案、文案、工作計(jì)劃、工作報(bào)告、論文、代碼、作文、做題和對(duì)話答疑等等
只需要輸入關(guān)鍵詞,就能返回你想要的內(nèi)容,越精準(zhǔn),寫出的就越詳細(xì),有微信小程序端、在線網(wǎng)頁(yè)版、PC客戶端
官網(wǎng):https://ai.de1919.com
本文目錄:
一、Python Pandas——Read_csv詳解
可以指定整個(gè)DataFrame或各個(gè)列的數(shù)據(jù)類型:
pandas提供了多種方法來(lái)確保列僅包含一個(gè)dtype。例如,可以使用read_csv()的converters參數(shù):
或者,可以在讀取數(shù)據(jù)后使用to_numeric()函數(shù)強(qiáng)進(jìn)行類型轉(zhuǎn)換。
可以通過(guò)指定dtype ='category'或dtype = CategoricalDtype(類別,有序)直接解析類別列。
可以使用dict指定將某列為Category類型:
指定dtype ='category'將導(dǎo)致無(wú)序分類,其類別是數(shù)據(jù)中觀察到的唯一值。
要更好地控制類別和順序,可以創(chuàng)建CategoricalDtype,然后將其傳遞給該列的dtype。
使用dtype = CategoricalDtype時(shí),dtype.categories之外的“意外”值將被視為缺失值。
文件可能包含標(biāo)題行,也可能沒(méi)有標(biāo)題行。 pandas假定第一行應(yīng)用作列名:
通過(guò)指定name與header,可以重命名列以及是否丟棄標(biāo)題行:
如果標(biāo)題不在第一行中,則將行號(hào)傳遞給標(biāo)題,將跳過(guò)header前面的行:
如果文件或標(biāo)題包含重復(fù)的名稱,默認(rèn)情況下,pandas會(huì)將它們區(qū)分開,以防止覆蓋數(shù)據(jù).
usecols參數(shù)允許您使用列名,位置號(hào)或可調(diào)用的方法選擇文件中列的任何子集.
如果指定了comment參數(shù),則將忽略注釋行。 默認(rèn)情況下,空行也將被忽略。
如果skip_blank_lines = False,則read_csv將不會(huì)忽略空行:
警告:被忽略的行的存在可能會(huì)導(dǎo)致涉及行號(hào)的歧義; 參數(shù)標(biāo)題使用行號(hào)(忽略注釋/空行),而行首使用行號(hào)(包括注釋/空行).
如果同時(shí)指定了skiprows和header,則header將相對(duì)于skiprows的末尾。 例如:
為了更好地使用日期時(shí)間數(shù)據(jù),read_csv()使用關(guān)鍵字參數(shù)parse_dates和date_parser允許用戶指定列的日期/時(shí)間格式,將string轉(zhuǎn)換為日期時(shí)間對(duì)象。
通常,我們可能希望分別存儲(chǔ)日期和時(shí)間數(shù)據(jù),或分別存儲(chǔ)各種日期字段。 parse_dates關(guān)鍵字可用于指定列的組合,以從中解析日期和/或時(shí)間。 您可以指定要parse_dates的列或嵌套列表,結(jié)果日期列將被添加到輸出的前面(以便不影響現(xiàn)有的列順序),新的列名為各列Name的連接。
默認(rèn)情況下,解析器會(huì)刪除組件日期列,可以選擇通過(guò)keep_date_col關(guān)鍵字保留它們:
請(qǐng)注意,如果您希望將多個(gè)列合并為一個(gè)日期列,則必須使用嵌套列表。 換句話說(shuō),parse_dates = [1,2]表示第二和第三列應(yīng)分別解析為單獨(dú)的日期列,而parse_dates = [[1,2]]意味著應(yīng)將這兩列解析為單個(gè)列。
還可以使用字典來(lái)指定自定義名稱列:
重要的是要記住,如果要將多個(gè)文本列解析為單個(gè)日期列,則在數(shù)據(jù)前添加一個(gè)新列。
index_col參數(shù)基于這組新列而不是原始數(shù)據(jù)列:
注意:如果列或索引包含不可解析的日期,則整個(gè)列或索引將作為對(duì)象數(shù)據(jù)類型原樣返回。 對(duì)于非標(biāo)準(zhǔn)日期時(shí)間解析,請(qǐng)?jiān)趐d.read_csv之后使用to_datetime()。
注意:read_csv具有用于解析iso8601格式的日期時(shí)間字符串的fast_path,例如“ 2000-01-01T00:01:02 + 00:00”和類似的變體。 如果可以安排數(shù)據(jù)以這種格式存儲(chǔ)日期時(shí)間,則加載時(shí)間將明顯縮短,約20倍。
最后,解析器允許您指定自定義date_parser函數(shù),以充分利用日期解析API的靈活性:
Pandas不能原生表示具有混合時(shí)區(qū)的列或索引。 如果CSV文件包含帶有時(shí)區(qū)混合的列,則默認(rèn)結(jié)果將是帶有字符串的object-dtype列,即使包含parse_dates。
要將混合時(shí)區(qū)值解析為datetime列,請(qǐng)將部分應(yīng)用的to_datetime()傳遞給utc = True作為date_parser。
二、index=false
index=False含義
輸出不顯示index(索引)值
在輸出代碼行中,加入“index=False”如下:
m_pred_survived.to_csv(“clasified.csv”,index=False)
三、pandas to_csv 如何在文件中不輸出index列
1、雙擊打開pycharm工具,新建python項(xiàng)目并導(dǎo)入numpy和pandas,如下圖所示。
2、調(diào)用pandas模塊中的Series,創(chuàng)建一個(gè)序列,并使用numpy中的nan,如下圖所示。
3、保存代碼并直接運(yùn)行這個(gè)文件,可以看到打印的序列值,如下圖所示。
4、再調(diào)用date_range()方法,設(shè)置一個(gè)開始日期,生成30個(gè)序列,如下圖所示。
5、再次保存代碼并運(yùn)行文件,可以在控制臺(tái)查看到30個(gè)日期序列,如下圖所示就完成了 。
四、python讀取csv指定坐標(biāo)
csv文件
name,agefjp,25
gxl,26
yc,26
zjw,25
腳本文件:
# coding:utf-8import pandas as pd
# 讀取csv文件
f = pd.read_csv('Test.csv', sep=',')
# 3-5行,列名為name
res = f.loc[3:5, ['name']]
# 寫入csv文件
res.to_csv('123.csv', sep=',', index=True)
以上就是關(guān)于pd.tocsv參數(shù)相關(guān)問(wèn)題的回答。希望能幫到你,如有更多相關(guān)問(wèn)題,您也可以聯(lián)系我們的客服進(jìn)行咨詢,客服也會(huì)為您講解更多精彩的知識(shí)和內(nèi)容。
推薦閱讀:
景觀設(shè)計(jì)主題概念pdf(景觀設(shè)計(jì)主題概念分析圖)
環(huán)境景觀設(shè)計(jì)原理(環(huán)境景觀設(shè)計(jì)原理 黃春華 pdf)
以舊換新海報(bào)(手機(jī)以舊換新海報(bào))
引流推廣多少錢一個(gè)人(引流推廣多少錢一個(gè)人做)