亚洲福利影院,天海翼无码,亚洲男人网站

經過一段時間的整理，本期將分享我認為比較常規的100個實用函數，這些函數大致可以分為六類，分別是統計匯總函數、數據清洗函數、數據篩選、繪圖與元素級運算函數、時間序列函數和其他函數。

一、統計匯總函數數據分析過程中，必然要做一些數據的統計匯總工作，那么對于這一塊的數據運算有哪些可用的函數可以幫助到我們呢？具體看如下幾張表。

import pandas as pd import numpy as np x = pd.Series（np.random.normal（2，3，1000）） y = 3*x + 10 + pd.Series（np.random.normal（1，2，1000）） # 計算x與y的相關系數 print（x.corr（y）） # 計算y的偏度 print（y.skew（）） # 計算y的統計描述值 print（x.describe（）） z = pd.Series（［‘A’，‘B’，‘C’］）.sample（n = 1000， replace = True） # 重新修改z的行索引 z.index = range（1000） # 按照z分組，統計y的組內平均值 y.groupby（by = z）.aggregate（np.mean）

# 統計z中個元素的頻次 print（z.value_counts（）） a = pd.Series（［1，5，10，15，25，30］） # 計算a中各元素的累計百分比 print（a.cumsum（） / a.cumsum（）［a.size - 1］）

二、數據清洗函數同樣，數據清洗工作也是必不可少的工作，在如下表格中羅列了常有的數據清洗的函數。

x = pd.Series（［10，13，np.nan，17，28，19，33，np.nan，27］） #檢驗序列中是否存在缺失值 print（x.hasnans） # 將缺失值填充為平均值 print（x.fillna（value = x.mean（））） # 前向填充缺失值 print（x.ffill（））

income = pd.Series（［‘12500元’，‘8000元’，‘8500元’，‘15000元’，‘9000元’］） # 將收入轉換為整型 print（income.str［：-1］.astype（int）） gender = pd.Series（［‘男’，‘女’，‘女’，‘女’，‘男’，‘女’］） # 性別因子化處理 print（gender.factorize（）） house = pd.Series（［‘大寧金茂府 | 3室2廳 | 158.32平米 | 南 | 精裝’， ‘昌里花園 | 2室2廳 | 104.73平米 | 南 | 精裝’， ‘紡大小區 | 3室1廳 | 68.38平米 | 南 | 簡裝’］） # 取出二手房的面積，并轉換為浮點型 house.str.split（‘|’）.str［2］.str.strip（）.str［：-2］.astype（float）

三、數據篩選數據分析中如需對變量中的數值做子集篩選時，可以巧妙的使用下表中的幾個函數，其中部分函數既可以使用在序列身上，也基本可以使用在數據框對象中。

np.random.seed（1234） x = pd.Series（np.random.randint（10，20，10）） # 篩選出16以上的元素 print（x.loc［x 》 16］） print（x.compress（x 》 16）） # 篩選出13~16之間的元素 print（x［x.between（13，16）］） # 取出最大的三個元素 print（x.nlargest（3）） y = pd.Series（［‘ID:1 name：張三 age:24 income:13500’， ‘ID:2 name：李四 age:27 income:25000’， ‘ID:3 name：王二 age:21 income:8000’］） # 取出年齡，并轉換為整數 print（y.str.findall（‘age：（d+）’）.str［0］.astype（int））

四、繪圖與元素級函數

np.random.seed（123） import matplotlib.pyplot as plt x = pd.Series（np.random.normal（10，3，1000）） # 繪制x直方圖 x.hist（） # 顯示圖形 plt.show（） # 繪制x的箱線圖 x.plot（kind=‘box’） plt.show（） installs = pd.Series（［‘1280萬’，‘6.7億’，‘2488萬’，‘1892萬’，‘9877’，‘9877萬’，‘1.2億’］） # 將安裝量統一更改為“萬”的單位 def transform（x）： if x.find（‘億’）！= -1： res = float（x［：-1］）*10000 elif x.find（‘萬’）！= -1： res = float（x［：-1］） else： res = float（x）/10000 return res installs.apply（transform）

五、時間序列函數

六、其他函數

import numpy as np import pandas as pd np.random.seed（112） x = pd.Series（np.random.randint（8，18，6）） print（x） # 對x中的元素做一階差分 print（x.diff（）） # 對x中的元素做降序處理 print（x.sort_values（ascending = False）） y = pd.Series（np.random.randint（8，16，100）） # 將y中的元素做排重處理，并轉換為列表對象 y.unique（）.tolist（）

原文標題：100 個 pandas 數據分析函數總結

文章出處：【微信公眾號：數據分析與開發】歡迎添加關注！文章轉載請注明出處。

責任編輯：haq

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

函數

函數

+關注

關注
3

文章
4338

瀏覽量
62752

原文標題：100 個 pandas 數據分析函數總結

文章出處：【微信號：DBDevs，微信公眾號：數據分析與開發】歡迎添加關注！文章轉載請注明出處。

RAPIDS cuDF將pandas提速近150倍

在 NVIDIA GTC 2024 上，NVIDIA 宣布，RAPIDS cuDF 當前已能夠為 950 萬 pandas 用戶帶來 GPU 加速，且無需修改代碼。

發表于 11-20 09:52 ?221次閱讀

RAPIDS cuDF將<b class='flag-5'>pandas</b>提速近150倍

常用SQL函數及其用法

SQL（Structured Query Language）是一種用于管理和操作關系數據庫的編程語言。SQL 提供了豐富的函數庫，用于數據檢索、數據更新、數據刪除以及數據聚合等操作。以下是一些常用

發表于 11-19 10:18 ?335次閱讀

RNN的損失函數與優化算法解析

函數有以下幾種：交叉熵損失函數：交叉熵（Cross Entropy）是一種評估兩個概率分布之間差異的度量方法，即通過比較模型預測的概率分布和真實概率分布之間的差異，來評估模型訓練的性能。在RNN中，交叉熵損失

發表于 11-15 10:16 ?493次閱讀

SUMIF函數與SUMIFS函數的區別

SUMIF函數和SUMIFS函數都是Excel中用于條件求和的函數，它們可以幫助用戶根據特定的條件對數據進行求和。盡管它們的基本功能相似，但在使用場景和功能上存在一些差異。以下是對這兩個

發表于 10-30 09:51 ?1269次閱讀

Python常用函數大全

在 Python 世界里，有一些寶藏函數和模塊，它們可以讓你編程更輕松、代碼更高效。這篇文章將帶你一一認識這些神器，讓你的開發生活瞬間輕松不少！

發表于 10-27 17:20 ?290次閱讀

什么叫系統的頻率響應函數?它和傳遞函數有何關系

工具。它是一個復數函數，通常用H(jω)表示，其中ω是角頻率，j是虛數單位。頻率響應函數可以提供系統在頻域內的行為特征，包括系統的增益、相位以及共振頻率等信息。頻率響應

發表于 10-18 09:29 ?2085次閱讀

labview常用的基本函數

電子發燒友網站提供《labview常用的基本函數.pdf》資料免費下載

發表于 10-15 17:29 ?7次下載

labview中常用的字符串函數有哪些?

）：功能：該函數用于返回字符串所包含的字符個數。應用場景：常用于需要計算字符串長度的場景，如文件命名、數據處理等。連接字符串（String Concatenate）：功能：將兩個或多個字符串連接成一

發表于 09-04 15:43 ?826次閱讀

簡述socket編程中的常用函數

Socket編程是一種基于TCP/IP協議的網絡編程技術，它允許應用程序通過網絡進行通信。在Socket編程中，有許多常用的函數，它們用于創建、配置、連接、發送和接收數據等操作。以下是對這些常用

發表于 08-16 10:49 ?420次閱讀

函數信號發生器怎么調頻率

函數信號發生器是一種常用的電子測試設備，它能夠產生各種波形、頻率和幅度的信號，廣泛應用于科研、教學、生產和維修等領域。在使用函數信號發生器時，調整頻率是其中一個非常重要的步驟。本文將詳

發表于 05-20 18:23 ?1677次閱讀

MATLAB信號處理常用函數詳解

MATLAB是一款功能強大的數學軟件，尤其在信號處理領域，它提供了眾多的函數和工具箱，使得信號的分析、處理、仿真變得簡單而高效。本文將詳細介紹MATLAB在信號處理中常用的函數，并通過具體示例來闡述其應用。

發表于 05-17 14:31 ?2418次閱讀

回調函數(callback)是什么？回調函數的實現方法

回調函數是一種特殊的函數，它作為參數傳遞給另一個函數，并在被調用函數執行完畢后被調用。回調函數通

發表于 03-12 11:46 ?3037次閱讀

函數指針與回調函數的應用實例

通常我們說的指針變量是指向一個整型、字符型或數組等變量，而函數指針是指向函數。函數指針可以像一般函數一樣，用于調用

發表于 03-07 11:13 ?412次閱讀

ROUND函數的使用方法

ROUND函數是一種常用的數學函數，在各種程序和計算機語言中都有廣泛的應用。它的作用是對一個給定的數字進行四舍五入運算，可以根據指定的小數位數進行精確的舍入操作。本文將詳細介紹ROUN

發表于 01-14 11:19 ?1993次閱讀

系統函數怎么判斷低通高通

判斷一個系統函數是低通還是高通，可以通過多種方法和指標來進行分析。下面將介紹常用的幾種判斷方法，并詳細解釋每種方法的原理和應用。頻率響應分析法通過分析系統函數的頻率響應特性，可以判

發表于 01-12 11:06 ?3797次閱讀

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

盤點Pandas的100個常用函數

評論

RAPIDS cuDF將pandas提速近150倍

常用SQL函數及其用法

RNN的損失函數與優化算法解析

SUMIF函數與SUMIFS函數的區別

Python常用函數大全

什么叫系統的頻率響應函數?它和傳遞函數有何關系

labview常用的基本函數

labview中常用的字符串函數有哪些?

簡述socket編程中的常用函數

函數信號發生器怎么調頻率

MATLAB信號處理常用函數詳解

回調函數(callback)是什么？回調函數的實現方法

函數指針與回調函數的應用實例

ROUND函數的使用方法

系統函數怎么判斷低通高通