主要是:ppt文件轉(zhuǎn)為pdf文件,pdf文件轉(zhuǎn)圖片(png)。
描述一下需求:上傳PPT或者PDF文件到七牛,最終轉(zhuǎn)換為圖片。文件上傳部分的功能已經(jīng)講過了,這里說一下轉(zhuǎn)換處理的部分。
文檔類型
因?yàn)槠吲U麄€(gè)的文件存儲(chǔ)系統(tǒng)中文件類型并不靠后綴來區(qū)分,而是有它自己的 文件類型(mineType),所以在堆bucket中的資源進(jìn)行處理的時(shí)候,首先要判斷minetype。
多次的測(cè)試結(jié)果表明,pdf文件上傳后的minetype一為application/pdf,而ppt上傳后的類型就比較多了,通過jssdk上傳,以及直接在七牛上傳,上傳后綴為ppt、pptx的結(jié)果都有可能不一樣。最終總結(jié)出如下的幾種類型:
application/vnd.openxmlformats-officedocument.presentationml.presentation
application/zip
application/vnd.ms-powerpoint
application/ppt
application/x-ole-storage
這里的文檔類型判斷PHP-SDK已經(jīng)提供了,是BucketManager這個(gè)類。
//使用方式
$bucketManager = new BucketManager($this->getAuth());//getAuth()方法見七牛php-sdk使用-文件上傳
$mineTypeInfo = $bucketManager->stat(bucketName, 七牛資源名);
$mimeType = $mineTypeInfo[0]['mimeType'];
持久化處理
七牛的服務(wù)都是通過http請(qǐng)求附加不同的參數(shù)來實(shí)現(xiàn)的,比如我們處理剪裁一張圖片,或者獲取視頻某一秒的截圖,在我們的頁(yè)面中可以直接使用src=http://qiniu.com.cn?xxx這種方式,就能得到我們想要結(jié)果,但有的時(shí)候我們需要把處理的結(jié)果保存到我們的bucket中,這個(gè)就是持久化處理了。
根據(jù)sdk封裝一個(gè)持久化處理的方法,用到的sdk類為PersistentFop:
/**
* 文件持久化處理
* @param $key 七牛資源名
* @param $pfop 對(duì)資源進(jìn)行的數(shù)據(jù)處理操作的命令
* @param $bucket bucketName
* @return persistentId
*/
public function persistentOps($key,$bucket,$pfop,$notifyUrl='',$check=true)
{
header('Access-Control-Allow-Origin:*');
$auth = $this->getAuth();
$persistOps = new PersistentFop($auth,$bucket,$this->qiniu_image_pipeline,$notifyUrl);
list($id,$error) = $persistOps->execute($key,$pfop);
if($check){
//可暫時(shí)忽略,用來檢查資源持久化處理狀態(tài)
$result = $this->checkStatus($id,$persistOps);
}else{
$result = true;
}
return $result;
}
PPT轉(zhuǎn)PDF
使用到的持久化出來命令為:$pfop[] = 'yifangyun_preview/v2|saveas/'.$key;,這里使用的是七牛的第三方文檔轉(zhuǎn)換服務(wù),因?yàn)槠吲V暗膐dconv/pdf已經(jīng)不再更新維護(hù)了,而且出現(xiàn)過轉(zhuǎn)為pdf排版出現(xiàn)遮擋以及亂碼等問題,所以改為使用億方云的服務(wù)。
這里面saveas,即保存為一個(gè)新的資源,$key需要做一下說明,按照七牛的要求必須是:
$key = \Qiniu\base64_urlSafeEncode(bucketName.':'.$sourceName);
如果不按照規(guī)則進(jìn)行encode,無法保存成功。base64_urlSafeEncode,sdk functions.php中已經(jīng)存在。
有了原始的key,saveas的key,以及pfop持久化處理命令,就可以調(diào)用persistentOps方法了:
$result = $this->persistentOps($sourceName,$bucketName,$pfop);
pfop可以是一個(gè)數(shù)組,包含多個(gè)處理命令。
PDF轉(zhuǎn)圖片PNG
因?yàn)闆]有PPT轉(zhuǎn)圖片這條路,所以只能先轉(zhuǎn)PDF。
用到的pfop命令:
odconv/png/page/頁(yè)碼/density/150/quality/80|saveas/'.$key;
參數(shù)包括頁(yè)碼,質(zhì)量,像素密度等,還有更多的參數(shù)可以查閱文檔。所以這里我們首先要獲取PDF文檔的總頁(yè)數(shù)。使用到的接口命令是:
//odconv/png/info
$url = 'http://'.$this->qiniu_image_domain.'/'.$sourceName.'.pdf?odconv/png/info';
//url部分就是七牛資源可以訪問的完整鏈接,?后面就是要用到的命令
使用curl去請(qǐng)求這個(gè)鏈接,會(huì)返回json數(shù)據(jù),里面會(huì)包含page_num成員。
有了page_num,就可以構(gòu)造pfop數(shù)組了。
public function pdf2PngPfop($page,$sourceName)
{
$pfop = [];
$pngName = $sourceName;//原圖
for($i=1;$i=$page;$i++){
$randName = $pngName.'_'.$i.'.png';//原圖
$key = \Qiniu\base64_urlSafeEncode($this->bucket_for_image.':'.$randName);
$pfop[] = 'odconv/png/page/'.$i.'/density/150/quality/80|saveas/'.$key;
}
return $pfop;
}
然后調(diào)用:
$res = $this->persistentOps($sourceName.'.pdf',$this->bucket_for_image,$pfop,'',false);
note:在處理比較大的文檔,例如一個(gè)PPT有100多頁(yè),那PHP運(yùn)行等待七牛的結(jié)果返回再進(jìn)行數(shù)據(jù)的保存就可能會(huì)超時(shí),一個(gè)解決方案,是指定回調(diào)url,persistentOps的倒數(shù)第二個(gè)參數(shù)就是回調(diào)url,當(dāng)文檔轉(zhuǎn)換完成的時(shí)候,七牛會(huì)向這個(gè)地址發(fā)起一個(gè)請(qǐng)求,后續(xù)的圖片鏈接保存操作我們交給回調(diào)來做。
tips: 如果對(duì)每個(gè)pfop命令都指定回調(diào)地址,對(duì)我們的(普通)業(yè)務(wù)服務(wù)器也會(huì)造成些許的請(qǐng)求壓力,所以我的做法是給最后一頁(yè)的PDF轉(zhuǎn)圖片命令添加回調(diào)url。
回調(diào)地址函數(shù)
public function actionQiniuCallback()
{
$notifyBody = file_get_contents('php://input');
$notifyBodyArray = json_decode($notifyBody,true);
$topicId = Yii::$app->request->get('topicId');
$totalPage = Yii::$app->request->get('totalPage');//pdf頁(yè)數(shù)
$key = $notifyBodyArray['inputKey'];//這個(gè)是pdf文件的key
//業(yè)務(wù)代碼
...
}
總結(jié)
php來做這個(gè)文檔轉(zhuǎn)換七牛七牛遇到的一個(gè)主要問題就是超時(shí)的問題,所以我們可以把轉(zhuǎn)換的過程拆解,在數(shù)據(jù)庫(kù)中保存處理狀態(tài),然后用定時(shí)任務(wù)來自動(dòng)處理。
以上就是本文的全部?jī)?nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
您可能感興趣的文章:- 使用PHPWord生成word文檔的方法詳解
- PHP實(shí)現(xiàn)動(dòng)態(tài)創(chuàng)建XML文檔的方法
- PHP讀取word文檔的方法分析【基于COM組件】
- php刪除txt文件指定行及按行讀取txt文檔數(shù)據(jù)的方法
- PHPExcel導(dǎo)出2003和2007的excel文檔功能示例
- PHP生成word文檔的三種實(shí)現(xiàn)方式
- PHP庫(kù) 查詢Mongodb中的文檔ID的方法
- PHP實(shí)現(xiàn)仿百度文庫(kù),豆丁在線文檔效果(word,excel,ppt轉(zhuǎn)flash)