佳木斯湛栽影视文化发展公司

主頁 > 知識庫 > (手寫)PCA原理及其Python實現(xiàn)圖文詳解

(手寫)PCA原理及其Python實現(xiàn)圖文詳解

熱門標簽:銀行業(yè)務(wù) 鐵路電話系統(tǒng) 美圖手機 網(wǎng)站文章發(fā)布 檢查注冊表項 服務(wù)器配置 智能手機 呼叫中心市場需求

1、背景

為什么需要降維呢?

因為數(shù)據(jù)個數(shù) N 和每個數(shù)據(jù)的維度 p 不滿足 N >> p,造成了模型結(jié)果的“過擬合”。有兩種方法解決上述問題:

增加N;減小p。

這里我們講解的 PCA 屬于方法2。

2、樣本均值和樣本方差矩陣


3、PCA


3.1 最大投影方差

3.2 最小重構(gòu)距離

4、Python實現(xiàn)

"""
    -*- coding: utf-8 -*-
    @ Time     : 2021/8/15  22:19
    @ Author   : Raymond
    @ Email    : wanght2316@163.com
    @ Editor   : Pycharm
"""
from sklearn.datasets import load_digits
from sklearn.decomposition import PCA
import pandas as pd
import matplotlib.pyplot as plt

digits = load_digits()
print(digits.keys())
print("數(shù)據(jù)的形狀為: {}".format(digits['data'].shape))
# 構(gòu)建模型 - 降到10 d
pca = PCA(n_components=10)
pca.fit(digits.data)
projected=pca.fit_transform(digits.data)
print('降維后主成分的方差值為:',pca.explained_variance_)
print('降維后主成分的方差值占總方差的比例為:',pca.explained_variance_ratio_)
print('降維后最大方差的成分為:',pca.components_)
print('降維后主成分的個數(shù)為:',pca.n_components_)
print('original shape:',digits.data.shape)
print('transformed shape:',projected.shape)
s = pca.explained_variance_
c_s = pd.DataFrame({'b': s,'b_sum': s.cumsum() / s.sum()})
c_s['b_sum'].plot(style= '--ko',figsize= (10, 4))
plt.rcParams['font.sans-serif'] = ['SimHei']  # 指定默認字體
plt.rcParams['axes.unicode_minus'] = False  # 解決保存圖像是負號'-'顯示為方塊的問題
plt.axhline(0.85,  color= 'r',linestyle= '--')
plt.text(6, c_s['b_sum'].iloc[6]-0.08, '第7個成分累計貢獻率超過85%', color='b')
plt.title('PCA 各成分累計占比')
plt.grid()
plt.savefig('./PCA.jpg')
plt.show()

結(jié)果展示:

總結(jié)

本篇文章就到這里了,希望能給你帶來幫助,也希望您能夠多多關(guān)注腳本之家的更多內(nèi)容!

您可能感興趣的文章:
  • Python機器學習之PCA降維算法詳解
  • 在Python中使用K-Means聚類和PCA主成分分析進行圖像壓縮
  • python實現(xiàn)PCA降維的示例詳解
  • Python sklearn庫實現(xiàn)PCA教程(以鳶尾花分類為例)
  • 利用python-pypcap抓取帶VLAN標簽的數(shù)據(jù)包方法

標簽:新疆 河南 沈陽 上海 紅河 長治 滄州 樂山

巨人網(wǎng)絡(luò)通訊聲明:本文標題《(手寫)PCA原理及其Python實現(xiàn)圖文詳解》,本文關(guān)鍵詞  ;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 收縮
    • 微信客服
    • 微信二維碼
    • 電話咨詢

    • 400-1100-266
    太原市| 东台市| 隆林| 卓尼县| 吉林省| 施秉县| 保康县| 库尔勒市| 宁南县| 罗江县| 偃师市| 肃宁县| 启东市| 仁化县| 伊金霍洛旗| 南宫市| 乐清市| 永宁县| 博罗县| 邢台市| 金昌市| 晴隆县| 贡觉县| 文化| 镇宁| 邵武市| 大英县| 宜丰县| 昌宁县| 青浦区| 贡山| 石渠县| 东安县| 大关县| 唐山市| 晋江市| 山西省| 丹阳市| 平远县| 锡林浩特市| 浙江省|