色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

使用pandas進行數據選擇和過濾的基本技術和函數

冬至子 ? 來源:思否AI ? 作者:思否AI ? 2023-12-01 10:14 ? 次閱讀

Python pandas庫提供了幾種選擇和過濾數據的方法,如loc、iloc、[]括號操作符、query、isin、between等等

本文將介紹使用pandas進行數據選擇和過濾的基本技術和函數。無論是需要提取特定的行或列,還是需要應用條件過濾,pandas都可以滿足需求。

選擇列

loc[]:根據標簽選擇行和列。df.row_label loc, column_label]

也可以使用loc進行切片操作:

df.loc['row1_label':'row2_label' , 'column1_label':'column2_label']

例如

# Using loc for label-based selection
 df.loc[:, 'Customer Country':'Customer State']

# Using loc for label-based selection
 df.loc[[0,1,2], 'Customer Country':'Customer State']

iloc[]:根據位置索引選擇行和列。df.iloc [row_position column_position]

可以使用iloc進行切片操作:

df.iloc['row1_position':'row2_position','col1_position':'col2_position']

例如:

# Using iloc for index-based selection
 df.iloc[[0,1,2,3] , [3,4,5,6,7,8]]
 
 # or
 df.iloc[[0,1,2,3] , 3:9]

# Using iloc for index-based selection
 df.iloc[:, 3:8]

[]括號操作符:它允許選擇一個或多個列。df[['column_label']]或df[['column1', 'column2']]]

# Selecting a single column
 df[['Customer Country']]

# Selecting multiple columns
 df[['Customer Country', 'Customer State']]

過濾行

loc[]:按標簽過濾行。df.loc(條件)

# Using loc for filtering rows
 condition = df['Order Quantity']  > 3
 df.loc[condition]
 
 # or
 df.loc[df['Order Quantity']  > 3]

# Using loc for filtering rows
 df.loc[df['Customer Country'] == 'United States']

iloc():按位置索引篩選行。

# Using iloc for filtering rows
 df.iloc[[0, 2, 4]]

# Using iloc for filtering rows
 df.iloc[:3, :2]

[]括號操作符:它允許根據條件過濾行。df(條件)

# Using [] bracket operator for filtering rows# Using [] bracket operator for filtering rows
 condition = df['Order Quantity'] > 3
 df[condition]
 
 # or
 df[df['Order Quantity'] > 3]

isin([]):基于列表過濾數據。df (df (column_name”).isin ([value1, ' value2 ']))

# Using isin for filtering rows
 df[df['Customer Country'].isin(['United States', 'Puerto Rico'])]

# Filter rows based on values in a list and select spesific columns
 df[["Customer Id", "Order Region"]][df['Order Region'].isin(['Central America', 'Caribbean'])]

# Using NOT isin for filtering rows
 df[~df['Customer Country'].isin(['United States'])]

query():方法用于根據類似sql的條件表達式選擇數據。df.query(條件)

如果列名包含空格或特殊字符,首先應該使用rename()函數來重命名它們。

# Rename the columns before performing the query
 df.rename(columns={'Order Quantity' : 'Order_Quantity', "Customer Fname" : "Customer_Fname"}, inplace=True)
 
 # Using query for filtering rows with a single condition
 df.query('Order_Quantity > 3')

# Using query for filtering rows with multiple conditions
 df.query('Order_Quantity > 3 and Customer_Fname == "Mary"')

between():根據在指定范圍內的值篩選行。df[df['column_name'].between(start, end)]

# Filter rows based on values within a range
 df[df['Order Quantity'].between(3, 5)]

字符串方法:根據字符串匹配條件篩選行。例如str.startswith(), str.endswith(), str.contains()

# Using str.startswith() for filtering rows
 df[df['Category Name'].str.startswith('Cardio')]

# Using str.contains() for filtering rows
 df[df['Customer Segment'].str.contains('Office')]

更新值

loc[]:可以為DataFrame中的特定行和列并分配新值。

# Update values in a column based on a condition
 df.loc[df['Customer Country'] == 'United States', 'Customer Country'] = 'USA'

iloc[]:也可以為DataFrame中的特定行和列并分配新值,但是他的條件是數字索引

# Update values in a column based on a condition
 df.iloc[df['Order Quantity'] > 3, 15] = 'greater than 3'
 
 #
 condition = df['Order Quantity'] > 3
 df.iloc[condition, 15] = 'greater than 3'

replace():用新值替換DataFrame中的特定值。df.['column_name'].replace(old_value, new_value, inplace=True)

# Replace specific values in a column
 df['Order Quantity'].replace(5, 'equals 5', inplace=True)

總結

Python pandas提供了很多的函數和技術來選擇和過濾DataFrame中的數據。比如我們常用的 loc和iloc,有很多人還不清楚這兩個的區別,其實它們很簡單,在Pandas中前面帶i的都是使用索引數值來訪問的,例如 loc和iloc,at和iat,它們訪問的效率是類似的,只不過是方法不一樣,我們這里在使用loc和iloc為例做一個簡單的說明:

loc:根據標簽(label)索引,什么是標簽呢?

行標簽就是我們所說的索引(index),列標簽就是列名(columns)

iloc,根據標簽的位置索引。

iloc就是 integer loc的縮寫。也就是說我們不知道列名的時候可以直接訪問的第幾行,第幾列

這樣解釋應該可以很好理解這兩個的區別了。最后如果你看以前(很久以前)的代碼可能還會看到ix,它是先于iloc、和loc的。但是現在基本上用iloc和loc已經完全能取代ix,所以ix已經被官方棄用了。 如果有看到的話說明這個代碼已經很好了,并且完全可以使用iloc替代。

最后,通過靈活本文介紹的這些方法,可以更高效地處理和分析數據集,從而更好地理解和挖掘數據的潛在信息

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • SQL
    SQL
    +關注

    關注

    1

    文章

    768

    瀏覽量

    44177
  • python
    +關注

    關注

    56

    文章

    4799

    瀏覽量

    84820
收藏 人收藏

    評論

    相關推薦

    Python利用pandas讀寫Excel文件

    使用pandas模塊讀取Excel文件可以更為方便和快捷。pandas可以將Excel文件讀取為一個DataFrame對象,方便進行數據處理和分析。
    的頭像 發表于 12-16 11:22 ?1375次閱讀
    Python利用<b class='flag-5'>pandas</b>讀寫Excel文件

    mysql是根據哪些原則來進行數據類型選擇的?

    mysql應該根據那些原則來進行數據類型的選擇
    發表于 07-23 06:32

    pandas對babynames數據集的簡單處理

    利用Python進行數據分析——第二章 引言(2):利用pandas對babynames數據進行簡單處理
    發表于 08-09 12:58

    Pandas中的四種繪圖函數

    數據可視化(三):Pandas中的繪圖函數
    發表于 09-04 09:04

    pandas和seaborn繪圖方法

    《利用Python進行數據分析》 92 使用pandas和seaborn繪圖
    發表于 10-28 10:25

    pandas是什么?

    人工智能的不斷發展,機器學習這門技術也越來越重要,很多人都開啟了學習機器學習,本文就介紹了機器學習的基礎內容。提示:以下是本篇文章正文內容,下面案例可供參考一、pandas是什么?示例:pandas 是基于NumPy 的一種工具
    發表于 01-12 07:53

    基于LDA主題模型進行數據選擇方法

    基于數據源的樣本文檔集和查詢之間的關鍵詞匹配,通常無法很好地解決少量樣本文檔的信息缺失問題。針對這一問題,提出了基于隱含狄利克雷分布( LDA)主題模型進行數據選擇的方法。首先,使用LDA主題模型獲得
    發表于 01-04 15:00 ?0次下載
    基于LDA主題模型<b class='flag-5'>進行數據</b>源<b class='flag-5'>選擇</b>方法

    從Excel到Python-最常用的36個Pandas函數

    本文涉及pandas最常用的36個函數,通過這些函數介紹如何完成數據生成和導入、數據清洗、預處理,以及最常見的
    的頭像 發表于 12-10 21:31 ?695次閱讀

    更高效的利用Jupyter+pandas進行數據分析

    本文將對pandas支持的多種格式數據在處理數據的不同方面進行比較,包含I/O速度、內存消耗、磁盤占用空間等指標,試圖找出如何為我們的數據
    的頭像 發表于 03-12 15:20 ?1756次閱讀

    盤點Pandas的100個常用函數

    分析過程中,必然要做一些數據的統計匯總工作,那么對于這一塊的數據運算有哪些可用的函數可以幫助到我們呢?具體看如下幾張表。 import pandas as pd import nump
    的頭像 發表于 04-01 09:52 ?2887次閱讀
    盤點<b class='flag-5'>Pandas</b>的100個常用<b class='flag-5'>函數</b>

    解讀12 種 Numpy 和 Pandas 高效函數技巧

    本文分享給大家 12 種 Numpy 和 Pandas 函數,這些高效的函數會令數據分析更為容易、便捷。最后,讀者也可以在 GitHub 項目中找到本文所用代碼的 Jupyter No
    的頭像 發表于 06-29 17:05 ?1511次閱讀

    十種pandas數據編碼的方法分享

    題主表示pandas用起來很亂,事實真的如此嗎?本文就將先如何利用pandas行數據轉換/編碼的十種方案,最后再回答這個問題。
    的頭像 發表于 05-10 15:33 ?1323次閱讀

    超強圖解Pandas,建議收藏

    Pandas數據挖掘常見的工具,掌握使用過程中的函數是非常重要的。本文將借助可視化的過程,講解Pandas的各種操作。
    的頭像 發表于 08-29 15:15 ?642次閱讀
    超強圖解<b class='flag-5'>Pandas</b>,建議收藏

    盤點66個Pandas函數合集

    今天我們重新盤點66個Pandas函數合集,包括數據預覽、數值數據操作、文本數據操作、行/列操作等等,涉及“
    的頭像 發表于 10-30 09:58 ?1442次閱讀
    盤點66個<b class='flag-5'>Pandas</b><b class='flag-5'>函數</b>合集

    如何使用SQL進行數據分析

    使用SQL進行數據分析是一個強大且靈活的過程,它涉及從數據庫中提取、清洗、轉換和聚合數據,以便進行進一步的分析和洞察。 1. 數據提取(Da
    的頭像 發表于 11-19 10:26 ?327次閱讀
    主站蜘蛛池模板: 干性感美女| SAO货腿张开JI巴CAO死我| 999久久狠狠免费精品| 久久大香萑太香蕉av| 香蕉在线播放| 国产成+人欧美+综合在线观看| 欧美乱妇15p图| 91黄色影院| 免费在线观看黄色网址| 在线免费中文字幕| 久久久精品国产免费A片胖妇女| 亚洲精品电影久久久影院| 国产午夜永久福利视频在线观看 | 九色PORNY丨视频入口| 亚洲国产成人精品久久久久| 国产亚洲制服免视频| 亚洲免费观看视频| 鸡鸡插屁股| 中文字幕高清在线中文字幕| 麻豆国产成人AV在线| 99久热精品免费观看| 琪琪see色原网色原网站| 补课H湿 1V1 PLAY| 无码不卡中文字幕在线观看| 国产精品一区二区资源| 亚洲国产成人久久一区www妖精 | 亚洲a视频在线观看| 精品久久久久久久高清| 综合伊人久久| 青柠在线观看视频在线高清| 东北成人社区| 亚洲黄色免费在线观看| 久久最新地址获取| 爱穿丝袜的麻麻3d漫画免费| 桃色园社区| 精品人伦一区二区三区潘金莲| 最近2019中文字幕免费| 欧美一级黄色影院| 国产伦精品一区二区三区| 伊人久久青草| 日韩欧美国产免费看清风阁|