佳木斯湛栽影视文化发展公司

主頁 > 知識庫 > 用python寫個顏值評分器篩選最美主播

用python寫個顏值評分器篩選最美主播

熱門標簽:美圖手機 服務(wù)器配置 銀行業(yè)務(wù) 檢查注冊表項 呼叫中心市場需求 鐵路電話系統(tǒng) 智能手機 網(wǎng)站文章發(fā)布

前言

晚上回家閑來無事,想打開某直播平臺,看看小姐姐直播??粗粋€個多才多藝的小姐姐,眼花繚亂,好難抉擇。究竟看哪個小姐姐直播好呢?

今天我們就一起來做個顏值評分器,爬取小姐姐們的直播照片,對每位小姐姐的顏值進行打分排序,選出最靚的star。

一、核心功能設(shè)計

總體來說,我們需要做的是獲取直播顏值區(qū)的主播小姐姐的正在直播的全部主播名稱和封面圖并保存下來,用百度AI提供的人臉識別接口,進行顏值評分排序,選出顏值最高的。

拆解需求,大致可以整理出核心功能如下:

獲取主播直播封面圖

  • 打開直播顏值區(qū)模塊對頁面進行分析
  • 發(fā)送網(wǎng)絡(luò)請求,解析數(shù)據(jù)
  • 保存數(shù)據(jù)

主播顏值評分

  • 百度人臉識別接口
  • 遍歷主播照片,調(diào)用顏值檢測接口對主播顏值進行打分
  • 對評分進行排序

二、實現(xiàn)步驟

1. 獲取主播名稱和照片

首先我們選擇的是某牙直播,進入首頁打開顏值區(qū),按F12可以進入開發(fā)者模式。

import requests
# 1.找到數(shù)據(jù)所在url地址(系統(tǒng)分析網(wǎng)頁性質(zhì))
url = "https://www.huya.com/g/2168"
headers = {
        'User-Agent': 'User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 '
                      '(KHTML, like Gecko) Chrome/87.0.4280.88 Safari/537.36'
    }

# 2. 發(fā)送網(wǎng)絡(luò)請求
response = requests.get(url=url, headers=headers)
html_data = response.text
print(html_data)

不難發(fā)現(xiàn)所有的小姐姐直播封面對應(yīng)的都是在li標簽里面。我們只要解析獲取這些li標簽數(shù)據(jù)就可以了。

接著我們需要拿到直播小姐姐的封面圖片,通過分析上面li標簽里面的內(nèi)容,可以發(fā)現(xiàn)下面有個a標簽,里面的img標簽中的data-original不就是我們要的小姐姐圖片嘛!

接下來我們想要獲取主播小姐姐的名字怎么辦呢?點開li標簽繼續(xù)分析,可以看到下面有個span標簽,其中的i標簽內(nèi)容就是小姐姐直播的名字。

網(wǎng)頁結(jié)構(gòu)我們上面已經(jīng)分析好了,那么我們就可以來動手爬取我們所需要的數(shù)據(jù)了。獲取到所有的數(shù)據(jù)資源之后,把圖片保存下來即可。文件的下載保存的方式比較多,我用的是通過 with open打開文件的方式 ,比較簡單。

# 3. 數(shù)據(jù)解析
selector = parsel.Selector(html_data)
lis = selector.xpath('//li[@class="game-live-item"]')  # 所有l(wèi)i標簽

for li in lis:
    img_name = li.xpath('.//span[@class="avatar fl"]/i/text()').get()  # 主播名字
    img_url = li.xpath('.//a/img/@data-original').get()  # 主播圖片地址
    # print(img_name, img_url)

    # 請求圖片數(shù)據(jù)
    img_data = requests.get(url=img_url).content  # 圖片數(shù)據(jù)

    # 4. 數(shù)據(jù)保存
    # 準備文件名
    file_name = img_name + '.jpg'
    with open('img\\' + file_name, mode='wb') as f:
        f.write(img_data)
        print('正在保存:', file_name)

這樣小姐姐的直播名稱和照片都可以保存下來了,效果如下:

2. 主播顏值評分

我們調(diào)用的是百度開放的人臉識別接口 – 百度AI開放平臺鏈接。

這里面我們可以創(chuàng)建一個人臉識別應(yīng)用,其中的API Key及Secret Key后面我們調(diào)用人臉識別檢測接口時會用到。

接下來我們可以看看官方提供的API幫助文檔,里面介紹的很詳細。包括如何調(diào)用請求URL數(shù)據(jù)格式,向API服務(wù)地址使用POST發(fā)送請求,必須在URL中帶上參數(shù)access_token,可通過后臺的API Key和Secret Key生成。這里面的API Key和Secret Key就是我們上面提到的。

那我們要的打分顏值分數(shù)是哪個呢?提供返回結(jié)果參數(shù),可以看到里面有個beauty就是我們要的顏值分數(shù)。

這樣顏值檢測的接口流程基本就已經(jīng)清楚了,可以進行代碼實現(xiàn)了。

其中獲取token的時候,需要用到client_id 和 client_secret ,這兩個就是上面創(chuàng)建人臉識別應(yīng)用時提供的。

import base64
import requests
# import pprint


# 獲取token
def get_token():
    # client_id 為官網(wǎng)獲取的AK, client_secret 為官網(wǎng)獲取的SK
    host = 'https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentialsclient_id=【官網(wǎng)獲取的AK】client_secret=【官網(wǎng)獲取的SK】'
    response = requests.get(host)
    if response:
        # print(response.json())
        return response.json()['access_token']


# 顏值檢測接口
def face_input(file_path):
    with open(file_path, 'rb') as file:
        data = base64.b64encode(file.read())
    img = data.decode()
    request_url = "https://aip.baidubce.com/rest/2.0/face/v3/detect"

    params = "{\"image\":\"%s\",\"image_type\":\"BASE64\",\"face_field\":\"beauty\"}" % img
    access_token = get_token()
    request_url = request_url + "?access_token=" + access_token
    headers = {'content-type': 'application/json'}
    response = requests.post(request_url, data=params, headers=headers)
    if response:
        beauty = response.json()['result']['face_list'][0]['beauty']
        # pprint.pprint(response.json())
        return beauty

可以看到result字段里面的beauty就是代表對小姐姐的顏值評分。效果如下:

調(diào)用顏值檢測接口已經(jīng)寫好了,下面我們要遍歷之前保存的所有小姐姐直播照片,對每個進行顏值打分。

path = './img'
img_list = os.listdir(path)
# print(img_list)
score_dict ={}

for img in img_list:
    try:
        # 提取主播名字
        name = img.split('.')[0]
        # 構(gòu)建圖片路徑
        img_path = path + '//' + img
        # 調(diào)用顏值檢測接口
        face_score = face_input(img_path)
        # print(face_score)
        score_dict[name] = face_score
    except:
        print(f'正在檢測{name}| 檢測失敗')
    else:
        print(f'正在檢測{name}| \t\t 顏值打分為:{face_score}')

最后我們就只需要按照顏值分數(shù)進行降序排列,就可以選出顏值最高的小姐姐啦~

sorted_score = sorted(score_dict.items(), key=lambda x: x[1], reverse=True)
# print(sorted_score)

for i, j in enumerate(sorted_score):
    print(f'小姐姐名字是:{sorted_score[i][0]} | 顏值名次是:第{i+1}名 | 顏值分數(shù)是:{sorted_score[i][1]}')

通過顏值檢測,這樣就可以找到顏值最高的小姐姐了,顏值打分有90分以上。今天我們就到這里,明天繼續(xù)努力!不說了,趕緊看直播去~


如果本篇博客有任何錯誤,請批評指教,不勝感激 !

到此這篇關(guān)于用python寫個顏值評分器篩選最美主播的文章就介紹到這了,更多相關(guān)python顏值評分器內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • Python實現(xiàn)在線批量美顏功能過程解析
  • Python實現(xiàn)對照片中的人臉進行顏值預(yù)測
  • 使用python實現(xiàn)男神女神顏值打分系統(tǒng)(推薦)
  • python實現(xiàn)知乎高顏值圖片爬取
  • python實戰(zhàn)練習(xí)之最新男女顏值打分小系統(tǒng)

標簽:新疆 紅河 河南 長治 沈陽 樂山 滄州 上海

巨人網(wǎng)絡(luò)通訊聲明:本文標題《用python寫個顏值評分器篩選最美主播》,本文關(guān)鍵詞  ;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 收縮
    • 微信客服
    • 微信二維碼
    • 電話咨詢

    • 400-1100-266
    长海县| 永泰县| 疏勒县| 龙泉市| 凉城县| 金塔县| 东兴市| 桐柏县| 政和县| 应用必备| 托里县| 南丰县| 遵义县| 闽清县| 枣庄市| 双峰县| 边坝县| 千阳县| 垫江县| 东明县| 新丰县| 壤塘县| 衡南县| 吴桥县| 繁峙县| 南宫市| 木里| 昌乐县| 禄劝| 称多县| 新乡县| 海兴县| 封开县| 海林市| 章丘市| 保亭| 砀山县| 甘孜县| 白城市| 荆门市| 富民县|