佳木斯湛栽影视文化发展公司

主頁(yè) > 知識(shí)庫(kù) > 利用python數(shù)據(jù)分析處理進(jìn)行炒股實(shí)戰(zhàn)行情

利用python數(shù)據(jù)分析處理進(jìn)行炒股實(shí)戰(zhàn)行情

熱門(mén)標(biāo)簽:銀行業(yè)務(wù) 美圖手機(jī) 呼叫中心市場(chǎng)需求 服務(wù)器配置 鐵路電話系統(tǒng) 檢查注冊(cè)表項(xiàng) 網(wǎng)站文章發(fā)布 智能手機(jī)

作為一個(gè)新手,你需要以下3個(gè)步驟:

1、用戶注冊(cè) > 2、獲取token > 3、調(diào)取數(shù)據(jù)

數(shù)據(jù)內(nèi)容:

包含股票、基金、期貨、債券、外匯、行業(yè)大數(shù)據(jù),

同時(shí)包括了數(shù)字貨幣行情等區(qū)塊鏈數(shù)據(jù)的全數(shù)據(jù)品類的金融大數(shù)據(jù)平臺(tái),

為各類金融投資和研究人員提供適用的數(shù)據(jù)和工具。

1、數(shù)據(jù)采集

我們進(jìn)行本地化計(jì)算,首先要做的,就是將所需的基礎(chǔ)數(shù)據(jù)采集到本地?cái)?shù)據(jù)庫(kù)里

本篇的示例源碼采用的數(shù)據(jù)庫(kù)是MySQL5.5,數(shù)據(jù)源是xxx pro接口。

我們現(xiàn)在要取一批特定股票的日線行情

部分代碼如下:

# 設(shè)置xxxxx pro的token并獲取連接
# 公眾號(hào):信息技術(shù)智庫(kù)
ts.set_token('xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx')
pro = ts.pro_api()
# 設(shè)定獲取日線行情的初始日期和終止日期,其中終止日期設(shè)定為昨天。
start_dt = '20100101'
time_temp = datetime.datetime.now() - datetime.timedelta(days=1)
end_dt = time_temp.strftime('%Y%m%d')
# 建立數(shù)據(jù)庫(kù)連接,剔除已入庫(kù)的部分
db = pymysql.connect(host='127.0.0.1', user='root', passwd='admin', db='stock', charset='utf8')
cursor = db.cursor()
# 設(shè)定需要獲取數(shù)據(jù)的股票池
stock_pool = ['603912.SH','300666.SZ','300618.SZ','002049.SZ','300672.SZ']
total = len(stock_pool)
# 循環(huán)獲取單個(gè)股票的日線行情
for i in range(len(stock_pool)):
    try:
        df = pro.daily(ts_code=stock_pool[i], start_date=start_dt, end_date=end_dt)
        # 打印進(jìn)度
        print('Seq: ' + str(i+1) + ' of ' + str(total) + '   Code: ' + str(stock_pool[i]))

上述代碼的注釋部分已將每行代碼的功能解釋清楚了,實(shí)際上數(shù)據(jù)采集的程序主要設(shè)置三個(gè)參數(shù):獲取行情的初始日期,終止日期,以及股票代碼池。

當(dāng)我們獲取數(shù)據(jù)后,就要往本地?cái)?shù)據(jù)庫(kù)進(jìn)行寫(xiě)入(存儲(chǔ))操作了,

本篇代碼用的是SQL語(yǔ)言,需提前在數(shù)據(jù)庫(kù)內(nèi)建好相應(yīng)的表,表配置和表結(jié)構(gòu)如下:

庫(kù)名:stock 表名:stock_all

其中 state_dt stock_code 是主鍵和索引。state_dt 的格式是 ‘yyyy-mm-dd'(例:'2018-06-11')。

這樣的日期格式便于查詢,且在MySQL內(nèi)部能夠進(jìn)行大小比較。

2、數(shù)據(jù)預(yù)處理

無(wú)論是量化策略還是單純的機(jī)器學(xué)習(xí)項(xiàng)目,數(shù)據(jù)預(yù)處理都是非常重要的一環(huán)。

以機(jī)器學(xué)習(xí)的視角來(lái)看,數(shù)據(jù)預(yù)處理主要包括

  • 數(shù)據(jù)清洗
  • 排序
  • 缺失值或異常值處理
  • 統(tǒng)計(jì)量分析
  • 相關(guān)性分析
  • 主成分分析(PCA)
  • 歸一化等

本篇所要介紹的數(shù)據(jù)預(yù)處理比較簡(jiǎn)單

只是將存在本地?cái)?shù)據(jù)庫(kù)的日線行情數(shù)據(jù)整合成一份訓(xùn)練集數(shù)據(jù),

以用于后續(xù)的機(jī)器學(xué)習(xí)建模和訓(xùn)練。

在介紹具體的示例代碼之前,我們需要先思考一個(gè)問(wèn)題,

應(yīng)用有監(jiān)督學(xué)習(xí)的算法對(duì)個(gè)股進(jìn)行建模

  • 我們的輸入數(shù)據(jù)有哪些,
  • 我們期望得到的輸出數(shù)據(jù)又是什么?

這個(gè)問(wèn)題的答案因人而異,因策略而異。

這個(gè)問(wèn)題本身是將市場(chǎng)問(wèn)題轉(zhuǎn)化為數(shù)學(xué)問(wèn)題的一個(gè)過(guò)程。

依賴的是量化寬客自己的知識(shí)體系和對(duì)市場(chǎng)的理解。

回到正題,本篇示例我們將以最簡(jiǎn)單的數(shù)據(jù)進(jìn)行分析,

我們輸入端的數(shù)據(jù)是個(gè)股每日基礎(chǔ)行情,輸出端數(shù)據(jù)是股價(jià)相較前一交易日的漲跌狀態(tài)。

簡(jiǎn)單點(diǎn)說(shuō)就是,我們向模型輸入今天的基礎(chǔ)行情,讓模型預(yù)測(cè)明天股價(jià)是漲還是跌。

在代碼實(shí)現(xiàn)方式上,

  • 采用面向?qū)ο蟮乃枷耄?/li>
  • 將整個(gè)數(shù)據(jù)預(yù)處理過(guò)程和結(jié)果,封裝成一個(gè)類,每次創(chuàng)建一個(gè)類實(shí)例,
  • 就得到了特定條件下的一份訓(xùn)練集。

示例代碼如下:

class data_collect(object):
     def __init__(self, in_code,start_dt,end_dt):
        ans = self.collectDATA(in_code,start_dt,end_dt) 
    def collectDATA(self,in_code,start_dt,end_dt):
        # 建立數(shù)據(jù)庫(kù)連接,獲取日線基礎(chǔ)行情(開(kāi)盤(pán)價(jià),收盤(pán)價(jià),最高價(jià),最低價(jià),成交量,成交額)
        db = pymysql.connect(host='127.0.0.1', user='root', passwd='admin', db='stock', charset='utf8')
        cursor = db.cursor()
        sql_done_set = "SELECT * FROM stock_all a where stock_code = '%s' and state_dt >= '%s' and state_dt = '%s' order by state_dt asc" % (in_code, start_dt, end_dt)
        cursor.execute(sql_done_set)
        done_set = cursor.fetchall()
        if len(done_set) == 0:
            raise Exception
        self.date_seq = []
        self.open_list = []
        self.close_list = []
        self.high_list = []
        self.low_list = []
        self.vol_list = []
        self.amount_list = []
        for i in range(len(done_set)):
            self.date_seq.append(done_set[i][0])
            self.open_list.append(float(done_set[i][2]))
            self.close_list.append(float(done_set[i][3]))
            self.high_list.append(float(done_set[i][4]))
            self.low_list.append(float(done_set[i][5]))
            self.vol_list.append(float(done_set[i][6]))
            self.amount_list.append(float(done_set[i][7]))
        cursor.close()
        db.close()
        # 將日線行情整合為訓(xùn)練集(其中self.train是輸入集,self.target是輸出集,self.test_case是end_dt那天的單條測(cè)試輸入)
        self.data_train = []
        self.data_target = []

最終這個(gè)類實(shí)例化后是要整合出三個(gè)數(shù)據(jù):

1. self.train :訓(xùn)練集中的輸入端數(shù)據(jù),本例中是每日基礎(chǔ)行情。

2. self.target :訓(xùn)練集中的輸出數(shù)據(jù),本例中相較于前一天股價(jià)的漲跌,漲為1,不漲為0。并且在排序上,每條 t 交易日的self.train里的數(shù)據(jù)對(duì)應(yīng)的是 t+1 天股價(jià)的漲跌狀態(tài)。

3. self.test_case :在 t 末交易日的基礎(chǔ)行情數(shù)據(jù),作為輸入端,用于模型訓(xùn)練完成后,對(duì)第二天的漲跌進(jìn)行預(yù)測(cè)。

3、SVM建模

機(jī)器學(xué)習(xí)中有諸多有監(jiān)督學(xué)習(xí)算法

SVM是比較常見(jiàn)的一種,本例采用SVM算法進(jìn)行建模。

關(guān)于SVM的理論原理本篇不做詳述,以下僅從實(shí)踐角度進(jìn)行建模介紹。

先貼一段建模、訓(xùn)練并進(jìn)行預(yù)測(cè)的代碼大家感受一下:)

model = svm.SVC()               # 建模
model.fit(train, target)        # 訓(xùn)練
ans2 = model.predict(test_case) # 預(yù)測(cè)

三行代碼,讓人想起了把大象裝冰箱分幾步的冷笑話……

不過(guò)這側(cè)面也說(shuō)明Python在數(shù)據(jù)挖掘方面的強(qiáng)大之處:簡(jiǎn)單,方便,好用。

本例用的機(jī)器學(xué)習(xí)框架是scikit-learn是個(gè)非常強(qiáng)大的算法庫(kù)。

熟悉算法原理的朋友可以查閱官方API文檔,可修改模型參數(shù),進(jìn)一步調(diào)優(yōu)模型;

亦可嘗試其他算法比如決策樹(shù),邏輯回歸,樸素貝葉斯等。

以上就是利用python數(shù)據(jù)分析進(jìn)行炒股實(shí)戰(zhàn)行情的詳細(xì)內(nèi)容,更多關(guān)于python數(shù)據(jù)分析的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!

您可能感興趣的文章:
  • python實(shí)現(xiàn)股票歷史數(shù)據(jù)可視化分析案例
  • 基于Python爬取股票數(shù)據(jù)過(guò)程詳解
  • Python爬取股票信息,并可視化數(shù)據(jù)的示例
  • 使用Python畫(huà)股票的K線圖的方法步驟

標(biāo)簽:紅河 沈陽(yáng) 滄州 河南 樂(lè)山 長(zhǎng)治 新疆 上海

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《利用python數(shù)據(jù)分析處理進(jìn)行炒股實(shí)戰(zhàn)行情》,本文關(guān)鍵詞  ;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問(wèn)題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無(wú)關(guān)。
  • 相關(guān)文章
  • 收縮
    • 微信客服
    • 微信二維碼
    • 電話咨詢

    • 400-1100-266
    建平县| 铜陵市| 关岭| 仁化县| 钦州市| 隆安县| 苍南县| 体育| 扶绥县| 静宁县| 吉安市| 那曲县| 长泰县| 黄龙县| 阿巴嘎旗| 原平市| 舞阳县| 汕头市| 哈巴河县| 钟祥市| 蓬莱市| 湖南省| 长海县| 芮城县| 板桥市| 通化县| 澜沧| 佛坪县| 恩平市| 襄垣县| 噶尔县| 丰宁| 长沙市| 涟水县| 庆阳市| 金乡县| 苏尼特右旗| 新巴尔虎右旗| 吉木乃县| 龙井市| 谷城县|