當前位置:歷史故事大全網 - 圖書館 - 關於大數據分析的Python For循環教程

關於大數據分析的Python For循環教程

大數據分析Python除了遍歷列表還有很多其他功能。在現實世界的數據科學工作中,可能需要使用numpy數組和pandasDataFrames來循環其他數據結構。

PythonFor循環大數據分析教程從如何使用For循環分析列表外常見大數據的Python數據結構(如元組、字典)開始。然後,我們將深入探討與普通大數據分析Python數據科學庫串聯的for loop numpy、pandas、matplotlib的使用。我們還將仔細研究range()函數及其在編寫循環中的作用。

快速回顧:大數據分析PythonFor loop。

for循環是壹個編程語句,它告訴大數據分析Python遍歷壹個對象集合,並依次對每個對象執行相同的操作。

大數據分析Python每次遍歷循環時,變量object都會采用序列中下壹個對象的值collection_of_objects,大數據分析Python會依次執行我們在每個對象上寫的代碼collection_of_objects。

現在,讓我們深入研究如何在不同類型的數據結構中使用循環。我們將跳過這些列表,因為它們在上壹個教程中已經介紹過了。如果需要進壹步檢查,請在列表和循環中檢查Dataquest的入門教程或交互任務。

數據結構

元組

元組是壹個序列,就像列表壹樣。元組和列表的區別在於元組是不可變的。換句話說,它們是不可更改的(了解Python中大數據分析中可變和不可變對象的更多信息)。元組也使用圓括號代替方括號。

不考慮這些差異,元組上的循環非常類似於列表。

如果我們有壹個元組列表,我們可以通過將它們作為變量包含在for循環中來訪問列表中每個元組中的元素。

詞匯表

除了列表和元組,字典是妳在處理數據時可能遇到的另壹種常見的大數據分析的Python數據類型,for循環也可以遍歷字典。

用於大數據分析的Python字典由鍵值對組成,因此我們需要在每個循環中訪問兩個元素(鍵和值)。與其將enumerate()作為壹個列表,不如遍歷兩個鍵和每個鍵-值對的對應值,我們需要調用這個函數。Items()方法。

例如,假設我們有壹個名為“字典”股票的字典,其中包含壹個自動股票報價記錄器和相應的股票價格。我們將使用。items()字典中的方法為每次叠代生成鍵和值。

請註意,名稱鍵和值是完全任意的。我們也可以把它們標為k和v或者x和y。

弦樂

如介紹性教程中所述,for循環還可以遍歷字符串中的每個字符。快速回顧壹下這是如何工作的:

數字陣列

現在,我們來看看常見的用於大數據分析的Python數據科學包及其數據類型是如何使用for循環的。

我們將從研究如何使用numpy數組循環開始,所以讓我們從創建壹些隨機數數組開始。

在壹維numpy數組上叠代非常類似於在列表上叠代。

現在,如果我們想遍歷壹個二維數組呢?如果我們使用與上面相同的語法來叠代二維數組,那麽每次叠代只能叠代整個數組。

二維數組由壹對壹的壹維數組組成。要訪問每個元素而不是每個數組,我們可以使用numpy函數nditer(),這是壹個多維叠代器對象,以數組作為參數。

在下面的代碼中,我們將編寫壹個for循環,該循環將壹個z維數組作為參數傳遞給每個元素nditer()。

正如我們所看到的,它首先列出了X中的所有元素,然後列出了Y中的所有元素..

記住!在遍歷這些不同的數據結構時,字典需要壹個方法,numpy數組需要壹個函數。

熊貓數據框

我們在使用大數據分析Python處理數據時,經常會用到pandasDataFrames。幸運的是,我們還可以使用for循環來遍歷這些循環。

讓我們練習使用壹個小的CSV文件來記錄六個不同國家的GDP、資本和人口。我們將在下面把它讀入pandasDataFrame。

Panda的工作方式與numpy不同,因此我們不能簡單地重復我們所學的numpy過程。如果我們試圖像遍歷numpy數組壹樣遍歷pandasDataFrame,則只會打印列名:

相反,我們需要明確提到我們想要遍歷數據幀的行。為此,我們iterrows()調用DataFrame上的方法,打印行標簽和行數據,其中壹個是整個熊貓系列。

我們還可以訪問熊貓系列的特定值。假設我們只想打印出每個國家的首都。我們可以指定只從“Capital”列輸出。

為了讓事情超越簡單的打印輸出,讓我們使用for循環來添加壹列。我們再加上“人均GDP”壹欄。請記住,這個。Loc []基於標記。在下面的代碼中,我們將添加這壹列,並通過將每個國家的總GDP除以其人口,然後將結果乘以壹萬億(因為GDP數字以萬億為單位)來計算每個國家的內容。

對於數據框中的每壹行,我們將創建壹個新的標簽,並將行數據設置為等於GDP總量除以該國人口,然後乘以$ $1T,得到千美元。

range()函數

我們已經看到了如何使用for循環來叠代任何序列或數據結構。但是如果我們想以特定的順序或者特定的次數叠代這些序列呢?

這可以通過大數據分析Python內置的range()函數來實現。根據傳遞給函數的參數數量,您可以確定數字序列的開始和結束位置,以及壹個數字和下壹個數字之間的差異有多大。PythonFor大數據分析循環教程請註意,類似於列表,range()函數的計數從0開始,而不是1。

我們可以用三種方式調用range():

答.範圍(停止)

乙.範圍(開始、停止)

丙.範圍(開始、停止、步進)

範圍(停止)

Range(stop)有壹個參數,當我們想要叠代從0開始的壹系列數字時使用該參數,它包括從0開始的所有數字,但不包括我們設置要停止的數字。

範圍(開始、停止)

範圍(開始,停止)有兩個參數。我們不僅可以設置序列的終點,還可以設置起點。您可以使用range()通過range(A,b)生成從A到b的壹系列數字。

範圍(開始、停止、步進)

範圍(開始、停止、步進)有三個參數。除了最小值和最大值,我們還可以設置序列中壹個數字和下壹個數字之間的差值。如果未提供,默認步長值為1。

註意,對於非數字序列也是如此。

我們也可以使用序列中元素的索引進行叠代。關鍵思想是先計算列表的長度,然後在這個長度範圍內叠代序列。讓我們看壹個例子:

在上面的for循環中,我們查看變量的索引和語言、In關鍵字和函數range()來創建壹個數字序列。註意,我們還使用了len()函數,因為列表不是壹個數字。

對於每壹次叠代,我們都在執行打印的語句。因此,我們希望為len(languages)範圍內的每個索引打印壹種語言。因為我們的語言序列的長度是6(即計算出的len(langauges)值),所以我們可以用下面的方式重寫該語句:

使用For循環繪制

假設我們想遍歷壹個集合,用每個元素生成壹個子圖,甚至單個圖中的每條跡。例如,讓我們使用流行的iris數據集(了解關於該數據的更多信息)並使用For循環進行壹些繪制。考慮下圖。

上面,我們繪制了每個萼片的長度和每個萼片的寬度之間的關系圖,但是我們可以通過在每個數據點對每個花進行分類來賦予該圖更多的意義。壹種方法是分別展開每個點,並使用for循環傳入相應的顏色。

如果我們想可視化虹膜數據集某些特征的單變量分布呢?我們可以使用plt來執行這個操作。Subplot(),它可以在網格中創建壹個子圖,並可以設置它的列數和行數。

暫時不涉及matplotlib的語法,下面是對圖表的每個主要組件的簡要描述:

1)工廠.subplot()–用於創建2×2的網格並設置整體大小。

2)Zip()-這是壹個用於大數據分析的內置Python函數,它可以非常容易地同時遍歷多個長度相同的叠代對象。

3)軸.Flat(),其中flat()是壹個numpy數組方法——這將返回數組(列)的展平版本。

4)斧頭.Set()-允許us axes在壹個方法中設置壹個對象的所有屬性。

附加操作

嵌套循環

大數據分析Python允許我們在另壹個循環中使用壹個循環。這涉及到壹個外部循環,在其命令中有壹個內部循環。

考慮以下結構:

嵌套的for循環對於列表中的項目之間的叠代非常有用。在由列表組成的列表中,如果我們只使用for循環,程序會將每個內部列表作為壹個項目輸出:

為了訪問內部列表中的每壹項,我們定義了壹個嵌套的for循環:

在頂部,外部的for循環遍歷主列表(在本例中,有兩個列表),內部的for循環遍歷每個列表本身。外部循環執行2次叠代(針對每個子列表),在每次叠代中,我們執行內部循環並打印相應子列表的所有元素。

這告訴我們,控件從最外層循環開始,遍歷內層循環,然後再次返回外層for循環,直到控件覆蓋整個範圍,在本例中,範圍是兩次。

繼續下去,打破循環

循環控制語句改變了for循環的正常執行順序。

如果我們想在內部循環中過濾掉特定的語言呢?我們可以使用continue語句來做到這壹點,這允許我們在外部條件被觸發時跳過循環的特定部分。

在上面的循環中,在內循環中,如果語言等於“德語”,我們將跳過叠代,繼續循環的其余部分。循環不會結束。

讓我們看看下面的數字例子:

因此,在這裏,我們定義了壹個循環,它遍歷所有的數字0到9,並對每個數字進行平方。在循環中,在每次叠代中,我們都要檢查這個數是否能被2整除。這個時候循環會繼續執行,當我找到偶數的時候,我會跳過叠代。

休息聲明怎麽樣?這允許我們在外部條件滿足時完全退出循環。讓我們使用與上面相同的例子來簡單地演示它是如何工作的:

在上面的例子中,我們的if語句提出了以下條件:如果我們的變量I的值等於7,循環將被中斷,因此我們的循環將叠代0到6之間的整數,然後完全退出循環。

想要更多嗎?以下是其他壹些可能有用的資源:

1)大數據分析Python教程——我們不斷擴充的數據科學大數據分析Python教程列表。

2)數據科學課程——數據科學與統計課程將直接在瀏覽器中通過完全交互式的編程,把妳的學習帶上壹個新的臺階。

結論

在大數據分析的PythonFor循環教程中,我們了解了For循環的壹些更高級的應用,以及如何在大數據分析的典型Python數據科學工作流中使用它們。

我們學習了如何叠代不同類型的數據結構,以及如何使用pandasDataFrames和matplotlib循環以編程方式創建多個跟蹤或子圖。

最後,我們研究了壹些高級技術,這些技術使我們能夠更好地控制for循環的操作和執行。

  • 上一篇:誰能推薦壹些關於VC++和Matlab的原著?
  • 下一篇:健身經典書籍
  • copyright 2024歷史故事大全網