佳木斯湛栽影视文化发展公司

主頁 > 知識庫 > Python pandas入門系列之眾數(shù)和分位數(shù)

Python pandas入門系列之眾數(shù)和分位數(shù)

熱門標(biāo)簽:銀行業(yè)務(wù) 美圖手機 檢查注冊表項 呼叫中心市場需求 智能手機 網(wǎng)站文章發(fā)布 鐵路電話系統(tǒng) 服務(wù)器配置

準(zhǔn)備

本文用到的表格內(nèi)容如下:

先來看一下原始情形:

import pandas as pd
​
df = pd.read_excel(r'C:\Users\admin\Desktop\測試.xlsx')
print(df)

result:

   數(shù)學(xué)成績  語文成績  英語成績
0    89    78    98
1    35    34    34
2    43    56    25
3    35    78    83
4    67    46    65
5    89    89    83
6    96    45    83
7    35    67    45
8    35    78    83

1.求眾數(shù)

1.1對全表進行操作

1.1.1求取每列的眾數(shù)

df = pd.read_excel(r'C:\Users\admin\Desktop\測試.xlsx')
print(df.var())

result:

   數(shù)學(xué)成績  語文成績  英語成績
0    35    78    83

1.1.2 求取每行的眾數(shù)

df = pd.read_excel(r'C:\Users\admin\Desktop\測試.xlsx')
print(df.mode(axis=1))

result:

      0     1     2
0  78.0  89.0  98.0
1  34.0   NaN   NaN
2  25.0  43.0  56.0
3  35.0  78.0  83.0
4  46.0  65.0  67.0
5  89.0   NaN   NaN
6  45.0  83.0  96.0
7  35.0  45.0  67.0
8  35.0  78.0  83.0

1.2 對單獨的一行或者一列進行操作

1.2.1 求取單獨某一列的眾數(shù)

df = pd.read_excel(r'C:\Users\admin\Desktop\測試.xlsx')
print(df.mode(axis=1))

result:

0    35
dtype: int64

1.2.2 求取單獨某一行的眾數(shù)

df = pd.read_excel(r'C:\Users\admin\Desktop\測試.xlsx')
print(df.iloc[[0]].mode())

result:

   數(shù)學(xué)成績  語文成績  英語成績
0    89    78    98

1.3 對多行或者多列進行操作

1.3.1 求取多列的眾數(shù)

df = pd.read_excel(r'C:\Users\admin\Desktop\測試.xlsx')
print(df[['數(shù)學(xué)成績', "語文成績"]].mode())

result:

   數(shù)學(xué)成績  語文成績
0    35    78

1.3.2 求取多行的眾數(shù)

df = pd.read_excel(r'C:\Users\admin\Desktop\測試.xlsx')
print(df.iloc[[0, 1]].mode())

result:

   數(shù)學(xué)成績  語文成績  英語成績
0    35    34    34
1    89    78    98

2 求分位數(shù)

分位數(shù)是比中位數(shù)更加詳細的基于位置的指標(biāo),分位數(shù)主要有四分之一分位數(shù),二分之一分位數(shù)(就是中位數(shù))、四分之三分位數(shù)

2.1 求取不同分位的分位數(shù)

2.1.1 四分之一分位數(shù)

import pandas as pd
​
df = pd.read_excel(r'C:\Users\admin\Desktop\測試.xlsx')
print(df.quantile(0.25))

result:

數(shù)學(xué)成績    35.0
語文成績    46.0
英語成績    45.0
Name: 0.25, dtype: float64

2.1.2 四分之三分位數(shù)

df = pd.read_excel(r'C:\Users\admin\Desktop\測試.xlsx')
print(df.quantile(0.75))

result:

數(shù)學(xué)成績    89.0
語文成績    78.0
英語成績    83.0
Name: 0.75, dtype: float64

2.2對全表進行操作

2.2.1對每一列求分位數(shù)

df = pd.read_excel(r'C:\Users\admin\Desktop\測試.xlsx')
print(df.quantile(0.25))

result:

數(shù)學(xué)成績    35.0
語文成績    46.0
英語成績    45.0
Name: 0.25, dtype: float64

2.2.2 對每一行求分位數(shù)

df = pd.read_excel(r'C:\Users\admin\Desktop\測試.xlsx')
print(df.quantile(0.25, axis=1))

result:

0    83.5
1    34.0
2    34.0
3    56.5
4    55.5
5    86.0
6    64.0
7    40.0
8    56.5
Name: 0.25, dtype: float64

2.3 對單獨的一行或者一列進行操作

2.3.1 對某一列求分位數(shù)

df = pd.read_excel(r'C:\Users\admin\Desktop\測試.xlsx')
print(df['數(shù)學(xué)成績'].quantile(0.25))

result:

35.0

2.3.2 對某一行求分位數(shù)

df = pd.read_excel(r'C:\Users\admin\Desktop\測試.xlsx')
print(df.iloc[[0]].quantile(0.25))

result:

數(shù)學(xué)成績    89.0
語文成績    78.0
英語成績    98.0
Name: 0.25, dtype: float64

2.4 對多行或者多列進行操作

2.4.1 對多列求分位數(shù)

df = pd.read_excel(r'C:\Users\admin\Desktop\測試.xlsx')
print(df[['數(shù)學(xué)成績', "語文成績"]].quantile(0.25))

result:

數(shù)學(xué)成績    35.0
語文成績    46.0
Name: 0.25, dtype: float64

2.4.2 對多行求分位數(shù)

df = pd.read_excel(r'C:\Users\admin\Desktop\測試.xlsx')
print(df.iloc[[0, 1]].quantile(0.25))

result:

數(shù)學(xué)成績    48.5
語文成績    45.0
英語成績    50.0
Name: 0.25, dtype: float64

附:pandas 和 numpy計算分位數(shù)的區(qū)別

pandas 和 numpy中都有計算分位數(shù)的方法,pandas中是quantile,numpy中是percentile

兩個方法其實沒什么區(qū)別,用法上稍微不同,quantile的優(yōu)點是與pandas中的groupby結(jié)合使用,可以分組之后取每個組的某分位數(shù)

quantile代碼:

import pandas as pd
import numpy as np
data = pd.read_csv('order_rank_p_0409.txt',sep='\t')
#將data按id_1 和 id_2 分組
grouped=data.groupby(['id_1','id_2'])
#用quantile計算第40%的分位數(shù)
grouped['gmv'].quantile(0.4) 
#用to_csv生成文件
x.to_csv('order_ran_re.txt',sep= '\t')

percentile代碼:

import pandas as pd
import numpy as np
data = pd.read_csv('order_rank_p_0409.txt',sep='\t')
a = array(data['gmv'])
np.percentile(a,0.4)

兩段代碼,兩種方法計算的結(jié)果是一樣的

總結(jié)

到此這篇關(guān)于Python pandas系列之眾數(shù)和分位數(shù)的文章就介紹到這了,更多相關(guān)pandas眾數(shù)和分位數(shù)內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • Python Pandas分組聚合的實現(xiàn)方法
  • python中pandas對多列進行分組統(tǒng)計的實現(xiàn)
  • 詳解python pandas 分組統(tǒng)計的方法
  • Python Pandas實現(xiàn)數(shù)據(jù)分組求平均值并填充nan的示例
  • Python學(xué)習(xí)筆記之pandas索引列、過濾、分組、求和功能示例
  • Python Pandas的簡單使用教程
  • Python pandas求方差和標(biāo)準(zhǔn)差的方法實例
  • python geopandas讀取、創(chuàng)建shapefile文件的方法
  • 使用Python pandas讀取CSV文件應(yīng)該注意什么?
  • 利用python Pandas實現(xiàn)批量拆分Excel與合并Excel
  • python pandas分組聚合詳細

標(biāo)簽:沈陽 滄州 紅河 新疆 河南 上海 長治 樂山

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《Python pandas入門系列之眾數(shù)和分位數(shù)》,本文關(guān)鍵詞  ;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 收縮
    • 微信客服
    • 微信二維碼
    • 電話咨詢

    • 400-1100-266
    青海省| 钟祥市| 克山县| 望都县| 天柱县| 陕西省| 普定县| 南安市| 澎湖县| 广丰县| 乌拉特前旗| 阆中市| 南陵县| 清徐县| 佛坪县| 达尔| 临江市| 武城县| 盐边县| 大厂| 宕昌县| 贵德县| 邢台县| 永吉县| 西盟| 工布江达县| 三河市| 红河县| 新和县| 广河县| 酒泉市| 济宁市| 明水县| 巴马| 获嘉县| 凤城市| 固原市| 普兰店市| 科技| 含山县| 娄底市|