色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

盤點Pandas的100個常用函數

數據分析與開發 ? 來源:數據分析1480 ? 作者:劉順祥 ? 2021-04-01 09:52 ? 次閱讀

經過一段時間的整理,本期將分享我認為比較常規的100個實用函數,這些函數大致可以分為六類,分別是統計匯總函數、數據清洗函數、數據篩選、繪圖與元素級運算函數、時間序列函數和其他函數。

一、統計匯總函數數據分析過程中,必然要做一些數據的統計匯總工作,那么對于這一塊的數據運算有哪些可用的函數可以幫助到我們呢?具體看如下幾張表。

96410908-9247-11eb-8b86-12bb97331649.png

96624186-9247-11eb-8b86-12bb97331649.png

import pandas as pd import numpy as np x = pd.Series(np.random.normal(2,3,1000)) y = 3*x + 10 + pd.Series(np.random.normal(1,2,1000)) # 計算x與y的相關系數 print(x.corr(y)) # 計算y的偏度 print(y.skew()) # 計算y的統計描述值 print(x.describe()) z = pd.Series([‘A’,‘B’,‘C’]).sample(n = 1000, replace = True) # 重新修改z的行索引 z.index = range(1000) # 按照z分組,統計y的組內平均值 y.groupby(by = z).aggregate(np.mean)

968a6328-9247-11eb-8b86-12bb97331649.png

96a9b8b8-9247-11eb-8b86-12bb97331649.jpg

# 統計z中個元素的頻次 print(z.value_counts()) a = pd.Series([1,5,10,15,25,30]) # 計算a中各元素的累計百分比 print(a.cumsum() / a.cumsum()[a.size - 1])

96cea812-9247-11eb-8b86-12bb97331649.png

二、數據清洗函數同樣,數據清洗工作也是必不可少的工作,在如下表格中羅列了常有的數據清洗的函數。

96e2916a-9247-11eb-8b86-12bb97331649.jpg

x = pd.Series([10,13,np.nan,17,28,19,33,np.nan,27]) #檢驗序列中是否存在缺失值 print(x.hasnans) # 將缺失值填充為平均值 print(x.fillna(value = x.mean())) # 前向填充缺失值 print(x.ffill())

96f12176-9247-11eb-8b86-12bb97331649.png

96f9eba8-9247-11eb-8b86-12bb97331649.png

income = pd.Series([‘12500元’,‘8000元’,‘8500元’,‘15000元’,‘9000元’]) # 將收入轉換為整型 print(income.str[:-1].astype(int)) gender = pd.Series([‘男’,‘女’,‘女’,‘女’,‘男’,‘女’]) # 性別因子化處理 print(gender.factorize()) house = pd.Series([‘大寧金茂府 | 3室2廳 | 158.32平米 | 南 | 精裝’, ‘昌里花園 | 2室2廳 | 104.73平米 | 南 | 精裝’, ‘紡大小區 | 3室1廳 | 68.38平米 | 南 | 簡裝’]) # 取出二手房的面積,并轉換為浮點型 house.str.split(‘|’).str[2].str.strip().str[:-2].astype(float)

9740314e-9247-11eb-8b86-12bb97331649.png

三、數據篩選數據分析中如需對變量中的數值做子集篩選時,可以巧妙的使用下表中的幾個函數,其中部分函數既可以使用在序列身上,也基本可以使用在數據框對象中。

976a23fa-9247-11eb-8b86-12bb97331649.png

np.random.seed(1234) x = pd.Series(np.random.randint(10,20,10)) # 篩選出16以上的元素 print(x.loc[x 》 16]) print(x.compress(x 》 16)) # 篩選出13~16之間的元素 print(x[x.between(13,16)]) # 取出最大的三個元素 print(x.nlargest(3)) y = pd.Series([‘ID:1 name:張三 age:24 income:13500’, ‘ID:2 name:李四 age:27 income:25000’, ‘ID:3 name:王二 age:21 income:8000’]) # 取出年齡,并轉換為整數 print(y.str.findall(‘age:(d+)’).str[0].astype(int))

97983e3e-9247-11eb-8b86-12bb97331649.png

四、繪圖與元素級函數

97adf68e-9247-11eb-8b86-12bb97331649.png

np.random.seed(123) import matplotlib.pyplot as plt x = pd.Series(np.random.normal(10,3,1000)) # 繪制x直方圖 x.hist() # 顯示圖形 plt.show() # 繪制x的箱線圖 x.plot(kind=‘box’) plt.show() installs = pd.Series([‘1280萬’,‘6.7億’,‘2488萬’,‘1892萬’,‘9877’,‘9877萬’,‘1.2億’]) # 將安裝量統一更改為“萬”的單位 def transform(x): if x.find(‘億’) != -1: res = float(x[:-1])*10000 elif x.find(‘萬’) != -1: res = float(x[:-1]) else: res = float(x)/10000 return res installs.apply(transform)

97fc5bbc-9247-11eb-8b86-12bb97331649.png

981dfbdc-9247-11eb-8b86-12bb97331649.png

983ede6a-9247-11eb-8b86-12bb97331649.png

五、時間序列函數

98644f1a-9247-11eb-8b86-12bb97331649.png

987f2696-9247-11eb-8b86-12bb97331649.png

98daee0e-9247-11eb-8b86-12bb97331649.png

六、其他函數

9912aa10-9247-11eb-8b86-12bb97331649.png

import numpy as np import pandas as pd np.random.seed(112) x = pd.Series(np.random.randint(8,18,6)) print(x) # 對x中的元素做一階差分 print(x.diff()) # 對x中的元素做降序處理 print(x.sort_values(ascending = False)) y = pd.Series(np.random.randint(8,16,100)) # 將y中的元素做排重處理,并轉換為列表對象 y.unique().tolist()

9955e87a-9247-11eb-8b86-12bb97331649.png

9977d3ae-9247-11eb-8b86-12bb97331649.png

原文標題:100 個 pandas 數據分析函數總結

文章出處:【微信公眾號:數據分析與開發】歡迎添加關注!文章轉載請注明出處。

責任編輯:haq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 函數
    +關注

    關注

    3

    文章

    4338

    瀏覽量

    62752

原文標題:100 個 pandas 數據分析函數總結

文章出處:【微信號:DBDevs,微信公眾號:數據分析與開發】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    RAPIDS cuDF將pandas提速近150倍

    在 NVIDIA GTC 2024 上,NVIDIA 宣布,RAPIDS cuDF 當前已能夠為 950 萬 pandas 用戶帶來 GPU 加速,且無需修改代碼。
    的頭像 發表于 11-20 09:52 ?221次閱讀
    RAPIDS cuDF將<b class='flag-5'>pandas</b>提速近150倍

    常用SQL函數及其用法

    SQL(Structured Query Language)是一種用于管理和操作關系數據庫的編程語言。SQL 提供了豐富的函數庫,用于數據檢索、數據更新、數據刪除以及數據聚合等操作。以下是一些常用
    的頭像 發表于 11-19 10:18 ?335次閱讀

    RNN的損失函數與優化算法解析

    函數有以下幾種: 交叉熵損失函數 :交叉熵(Cross Entropy)是一種評估兩概率分布之間差異的度量方法,即通過比較模型預測的概率分布和真實概率分布之間的差異,來評估模型訓練的性能。在RNN中,交叉熵損失
    的頭像 發表于 11-15 10:16 ?493次閱讀

    SUMIF函數與SUMIFS函數的區別

    SUMIF函數和SUMIFS函數都是Excel中用于條件求和的函數,它們可以幫助用戶根據特定的條件對數據進行求和。盡管它們的基本功能相似,但在使用場景和功能上存在一些差異。以下是對這兩
    的頭像 發表于 10-30 09:51 ?1269次閱讀

    Python常用函數大全

    在 Python 世界里,有一些寶藏函數和模塊,它們可以讓你編程更輕松、代碼更高效。這篇文章將帶你一一認識這些神器,讓你的開發生活瞬間輕松不少!
    的頭像 發表于 10-27 17:20 ?290次閱讀

    什么叫系統的頻率響應函數?它和傳遞函數有何關系

    工具。它是一復數函數,通常用H(jω)表示,其中ω是角頻率,j是虛數單位。頻率響應函數可以提供系統在頻域內的行為特征,包括系統的增益、相位以及共振頻率等信息。 頻率響應
    的頭像 發表于 10-18 09:29 ?2085次閱讀

    labview常用的基本函數

    電子發燒友網站提供《labview常用的基本函數.pdf》資料免費下載
    發表于 10-15 17:29 ?7次下載

    labview中常用的字符串函數有哪些?

    ) : 功能:該函數用于返回字符串所包含的字符個數。 應用場景:常用于需要計算字符串長度的場景,如文件命名、數據處理等。 連接字符串(String Concatenate) : 功能:將兩或多個字符串連接成一
    的頭像 發表于 09-04 15:43 ?826次閱讀

    簡述socket編程中的常用函數

    Socket編程是一種基于TCP/IP協議的網絡編程技術,它允許應用程序通過網絡進行通信。在Socket編程中,有許多常用函數,它們用于創建、配置、連接、發送和接收數據等操作。以下是對這些常用
    的頭像 發表于 08-16 10:49 ?420次閱讀

    函數信號發生器怎么調頻率

    函數信號發生器是一種常用的電子測試設備,它能夠產生各種波形、頻率和幅度的信號,廣泛應用于科研、教學、生產和維修等領域。在使用函數信號發生器時,調整頻率是其中一非常重要的步驟。本文將詳
    的頭像 發表于 05-20 18:23 ?1677次閱讀

    MATLAB信號處理常用函數詳解

    MATLAB是一款功能強大的數學軟件,尤其在信號處理領域,它提供了眾多的函數和工具箱,使得信號的分析、處理、仿真變得簡單而高效。本文將詳細介紹MATLAB在信號處理中常用函數,并通過具體示例來闡述其應用。
    的頭像 發表于 05-17 14:31 ?2418次閱讀

    回調函數(callback)是什么?回調函數的實現方法

    回調函數是一種特殊的函數,它作為參數傳遞給另一函數,并在被調用函數執行完畢后被調用。回調函數
    發表于 03-12 11:46 ?3037次閱讀

    函數指針與回調函數的應用實例

    通常我們說的指針變量是指向一整型、字符型或數組等變量,而函數指針是指向函數函數指針可以像一般函數一樣,用于調用
    的頭像 發表于 03-07 11:13 ?412次閱讀
    <b class='flag-5'>函數</b>指針與回調<b class='flag-5'>函數</b>的應用實例

    ROUND函數的使用方法

    ROUND函數是一種常用的數學函數,在各種程序和計算機語言中都有廣泛的應用。它的作用是對一給定的數字進行四舍五入運算,可以根據指定的小數位數進行精確的舍入操作。本文將詳細介紹ROUN
    的頭像 發表于 01-14 11:19 ?1993次閱讀

    系統函數怎么判斷低通高通

    判斷一系統函數是低通還是高通,可以通過多種方法和指標來進行分析。下面將介紹常用的幾種判斷方法,并詳細解釋每種方法的原理和應用。 頻率響應分析法 通過分析系統函數的頻率響應特性,可以判
    的頭像 發表于 01-12 11:06 ?3797次閱讀
    主站蜘蛛池模板: 纯肉腐文高H总受男男| 久久热在线视频精品店| 男人插曲女人身体视频| 最近中文字幕2019免费版| 美女露出乳胸扒开尿口| poronovideos动物狗猪| 受坐在攻腿上H道具PLAY| 国产一区二区高清| 亚洲一卡久久4卡5卡6卡7卡| 麻豆国产成人AV在线| www.青青草原| 亚洲成人网导航| 男人把女人桶到高潮嗷嗷叫| 大香交伊人| 亚洲中文字幕永久在线全国| 老师的脚奴| 大学生第一次破苞疼哭了| 亚洲精品国产熟女久久久| 欧美5g影院天天爽天天看| 国产毛多水多高潮高清| 91久久精一区二区三区大全| 探花口爆颜射乳交日韩| 久久天堂成人影院| 高冷师尊被CAO成SAO货| 亚洲欧美人成视频在线| 祺鑫WRITEAS流出来了| 含羞草最新版本| 99国内偷揿国产精品人妻| 亚洲 在线 日韩 欧美| 木凡的天空在线收听| 国产系列在线亚洲视频| yy4408午夜场理论片| 亚洲国产精品久久精品成人网站| 男插女高潮一区二区| 国模大胆一区二区三区| 爆操日本美女| 在线免费观看毛片| 亚洲国产AV精品一区二区蜜芽| 欧美在线激情| 久久国内精品视频| 国产精品无码视频一区二区|