佳木斯湛栽影视文化发展公司

主頁 > 知識庫 > python中pandas對多列進行分組統(tǒng)計的實現(xiàn)

python中pandas對多列進行分組統(tǒng)計的實現(xiàn)

熱門標簽:智能手機 服務(wù)器配置 呼叫中心市場需求 美圖手機 銀行業(yè)務(wù) 檢查注冊表項 鐵路電話系統(tǒng) 網(wǎng)站文章發(fā)布

使用groupby([ ]).size()統(tǒng)計的結(jié)果,值相同的字段值會不顯示


如上圖所示,第一個空著的行是982499 7 3388 1,因為此行與前面一行的這兩個字段值是一樣的,所以不顯示。第二個空著的行是390192 22 4278 1,因為此行與前面一行的第一個字段值是一樣的,所以不顯示。這樣的展示方式更直觀,但對于剛用的人,可能會讓其以為是缺失值。

如果還不明白可以看下面的全部數(shù)據(jù)及操作。

import pandas as pd
res6 = pd.read_csv('test.csv')
res6.shape
(12, 3)
res6.columns
Index(['user_id', 'cate', 'shop_id'], dtype='object')
res6.info()
class 'pandas.core.frame.DataFrame'>
RangeIndex: 12 entries, 0 to 11
Data columns (total 3 columns):
user_id    12 non-null int64
cate       12 non-null int64
shop_id    12 non-null int64
dtypes: int64(3)
memory usage: 368.0 bytes
res6.describe()

user_id cate shop_id
count 1.200000e+01 12.000000 12.000000
mean 6.468688e+05 10.666667 3594.000000
std 3.988181e+05 6.665151 373.271775
min 2.421410e+05 7.000000 3388.000000
25% 3.901920e+05 7.000000 3388.000000
50% 4.938730e+05 7.000000 3388.000000
75% 9.824990e+05 10.250000 3586.250000
max 1.558165e+06 23.000000 4278.000000

res6

user_id cate shop_id
0 390192 20 4178
1 390192 23 4179
2 390192 22 4278
3 1021819 7 3388
4 242141 7 3388
5 283284 7 3388
6 1558165 7 3388
7 533696 7 3388
8 982499 7 3388
9 493873 7 3388
10 493873 7 3388
11 982499 7 3389

res6['user_id'].value_counts()

390192     3
982499     2
493873     2
242141     1
1021819    1
533696     1
1558165    1
283284     1
Name: user_id, dtype: int64
res6.groupby(['user_id']).size().sort_values(ascending=False)

user_id
390192     3
982499     2
493873     2
1558165    1
1021819    1
533696     1
283284     1
242141     1
dtype: int64

res6.groupby(['user_id', 'cate']).size().sort_values(ascending=False)

user_id  cate
982499   7       2
493873   7       2
1558165  7       1
1021819  7       1
533696   7       1
390192   23      1
         22      1
         20      1
283284   7       1
242141   7       1
dtype: int64
res6_test = res6.groupby(['user_id', 'cate', 'shop_id']).size().sort_values(ascending=False)
res6_test
user_id  cate  shop_id
493873   7     3388       2
1558165  7     3388       1
1021819  7     3388       1
982499   7     3389       1
               3388       1
533696   7     3388       1
390192   23    4179       1
         22    4278       1
         20    4178       1
283284   7     3388       1
242141   7     3388       1
dtype: int64

到此這篇關(guān)于python中pandas對多列進行分組統(tǒng)計的實現(xiàn)的文章就介紹到這了,更多相關(guān)pandas多列分組統(tǒng)計內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • Python Pandas分組聚合的實現(xiàn)方法
  • 詳解python pandas 分組統(tǒng)計的方法
  • Python Pandas實現(xiàn)數(shù)據(jù)分組求平均值并填充nan的示例
  • Python學(xué)習筆記之pandas索引列、過濾、分組、求和功能示例
  • Python Pandas的簡單使用教程
  • Python pandas入門系列之眾數(shù)和分位數(shù)
  • Python pandas求方差和標準差的方法實例
  • python geopandas讀取、創(chuàng)建shapefile文件的方法
  • 使用Python pandas讀取CSV文件應(yīng)該注意什么?
  • 利用python Pandas實現(xiàn)批量拆分Excel與合并Excel
  • python pandas分組聚合詳細

標簽:長治 新疆 滄州 紅河 河南 樂山 上海 沈陽

巨人網(wǎng)絡(luò)通訊聲明:本文標題《python中pandas對多列進行分組統(tǒng)計的實現(xiàn)》,本文關(guān)鍵詞  ;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 收縮
    • 微信客服
    • 微信二維碼
    • 電話咨詢

    • 400-1100-266
    博湖县| 方城县| 西峡县| 武川县| 锡林郭勒盟| 黎川县| 荔波县| 磐安县| 玛多县| 永安市| 桦南县| 邢台县| 霍邱县| 翁牛特旗| 静海县| 沭阳县| 界首市| 怀宁县| 丰镇市| 海门市| 巫溪县| 八宿县| 板桥市| 芦山县| 鞍山市| 六枝特区| 南充市| 新昌县| 保山市| 邹平县| 商丘市| 榆中县| 西贡区| 尉氏县| 虎林市| 专栏| 鄂尔多斯市| 信丰县| 石台县| 东乌珠穆沁旗| 信宜市|