佳木斯湛栽影视文化发展公司

主頁 > 知識庫 > 關(guān)聯(lián)數(shù)據(jù)入門——RDF應(yīng)用

關(guān)聯(lián)數(shù)據(jù)入門——RDF應(yīng)用

熱門標(biāo)簽:服務(wù)器配置 美圖手機(jī) 鐵路電話系統(tǒng) 銀行業(yè)務(wù) 檢查注冊表項(xiàng) 智能手機(jī) 呼叫中心市場需求 網(wǎng)站文章發(fā)布
引言
語義網(wǎng)(Semantic Web)是一種數(shù)據(jù)的網(wǎng)絡(luò),讓數(shù)據(jù)得以共享,而不僅僅是被應(yīng)用程序束縛。
但語義網(wǎng)也不僅僅是把數(shù)據(jù)放在互聯(lián)網(wǎng)上,而是試圖將數(shù)據(jù)聯(lián)系起來,并產(chǎn)生數(shù)據(jù)與現(xiàn)實(shí)事物的聯(lián)系,以方便人與機(jī)器閱讀與理解這些數(shù)據(jù)。

The Semantic Web isn't just about putting data on the web. It is about making links, so that a person or machine can explore the web of data.

——Linked Data Design Issues . Tim Berners-Lee
關(guān)聯(lián)數(shù)據(jù)(Linked Data)是第一種可行的語義網(wǎng)表達(dá)形式,它采用RDF數(shù)據(jù)模型,利用URI(統(tǒng)一資源標(biāo)識符)命名數(shù)據(jù)實(shí)體,來發(fā)布和部署實(shí)例數(shù)據(jù)和類數(shù)據(jù),從而可以通過HTTP協(xié)議揭示并獲取這些數(shù)據(jù),同時(shí)強(qiáng)調(diào)數(shù)據(jù)的相互關(guān)聯(lián)、相互聯(lián)系以及有益于人機(jī)理解的語境信息。

Linked data is a set of best practices for publishing and deploying instance and class data using the RDF data model, and uses uniform resource identifiers (URIs) to name the data objects. The approach exposes the data for access via the HTTP protocol, while emphasizing data interconnections, interrelationships and context useful to both humans and machine agents.

——Linked Data FAQ . M.K. Bergman
因?yàn)檎Z義網(wǎng)是一項(xiàng)龐大的工程,并相伴著各種困難,使其成為一種長期目標(biāo)與愿景,而關(guān)系數(shù)據(jù)是一類實(shí)踐活動(dòng),其可行并實(shí)用,成為當(dāng)前語義網(wǎng)實(shí)現(xiàn)的一種最佳可行方案。

RDF的特點(diǎn)

資源描述框架(Resource Description Framework),作為XML(Extensible Markup Language)的一種衍生版本,他是關(guān)聯(lián)數(shù)據(jù)的基本數(shù)據(jù)模型。蒂姆·伯納斯-李(Tim Berners-Lee)在設(shè)計(jì)它的時(shí)候面臨了以下兩個(gè)問題:

•怎樣去設(shè)計(jì)方便易學(xué)易于傳播并適合標(biāo)準(zhǔn)化的語言?
•怎樣去設(shè)計(jì)離散數(shù)據(jù)的入口和出口?
為了解決這兩個(gè)問題,RDF有以下一些特點(diǎn):

•使用XML作為基本語言
•使用URIs作為現(xiàn)實(shí)事物的名字
•使用HTTP URIs使人們知道如何通過名字在網(wǎng)絡(luò)中尋找數(shù)據(jù)(即創(chuàng)建離散數(shù)據(jù)入口)
•包含與其他URIs的聯(lián)系,使人們可以通過其找到更多有用的東西(即創(chuàng)建離散數(shù)據(jù)出口)
•使用三元組(Triple)形式存儲數(shù)據(jù)
實(shí)際上,一些RDF版本并非使用XML語言,這里主要指的是初始版本。

一個(gè)簡單的RDF例子
復(fù)制代碼 代碼如下:

?xml version="1.0"?>
rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:dc="http://purl.org/dc/elements/1.1/">
rdf:Description rdf:about="http://www.w3.org/">
dc:title>World Wide Web Consortium/dc:title>
/rdf:Description>
/rdf:RDF>

將該RDF例子通過W3C RDF驗(yàn)證服務(wù),會出現(xiàn)以下列表:
Triples of the Data Model 
Number Subject Predicate Object
1 http://www.w3.org/ http://purl.org/dc/elements/1.1/title "World Wide Web Consortium"

這是啥東東?

三元組(Triple),RDF數(shù)據(jù)模型的基本表現(xiàn)單元。所謂三元組就是:主(Subject)-謂(Predicate)-賓(Object)。

A triple store is designed to store and retrieve identities that are constructed from triplex collections of strings (sequences of letters). These triplex collections represent a subject-predicate-object relationship that more or less corresponds to the definition put forth by the RDF standard.

——Triple Store . Jack Rusher
不同于關(guān)系數(shù)據(jù),其數(shù)據(jù)本身沒有龐大的聯(lián)系(這在數(shù)據(jù)網(wǎng)絡(luò)如此龐大的數(shù)據(jù)面前也是不可行的),而是使用類似人類陳述語句(Statement)的方式來存儲數(shù)據(jù),例如:

•Tom is a man.(Tom是個(gè)男人)
•Tom lives in a red house.(Tom住在一個(gè)紅房子里)
•Tom married with Lili.(Tom和Lili結(jié)婚了)
可見三元組形式也有強(qiáng)大的數(shù)據(jù)存儲表達(dá)潛力,人類正是這種形式的長期受益者。當(dāng)然像上面這么表述對人類友好,但對機(jī)器卻不怎么友好,因?yàn)檫@種謂語對于賓語并沒有良好的限定,至少機(jī)器不這么認(rèn)為。所以我們應(yīng)該寫成這樣的模式:

•Tom(Tom) sex(性別) man(男)
•Tom(Tom) house(房子) red(紅色)
•Tom(Tom) wife(妻子) Lili(Lili)
回到標(biāo)題,這是什么東東?其表述了下列內(nèi)容:

1.http://www.w3.org (表示該陳述是描述的主體是什么,由于HTTP URI映射現(xiàn)實(shí)事物,所以可以看做該是對什么現(xiàn)實(shí)事物的描述)
2.http://purl.org/dc/elements/1.1/title (主體的屬性,一般表示賓體的類型,例如dc:title是都柏林核心中用來指明資源名稱的,即客體是該資源的一個(gè)名字)
3.World Wide Web Consortium (客體)

別人是如何獲得RDF的?

下圖說明了這個(gè)過程:

 

•首先先對HTTP URI進(jìn)行請求。
•通常瀏覽器HTTP請求頭是:text/html、application/xhtml+xml類型,故服務(wù)器返回一般html/xhtml文檔。
•但對于語義瀏覽器,其HTTP請求頭是:application/rdf+xml類型,故服務(wù)器進(jìn)行303重定向,得到相應(yīng)RDF文件。
也就是說,對于一個(gè)HTTP URI可以返回兩種表達(dá)形式:文檔和數(shù)據(jù)。這樣就建立了兩種不同的網(wǎng)絡(luò),一個(gè)利于人類閱讀的文檔網(wǎng),另一種是利于機(jī)器閱讀的數(shù)據(jù)網(wǎng)。

標(biāo)簽:長治 沈陽 樂山 新疆 紅河 河南 滄州 上海

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《關(guān)聯(lián)數(shù)據(jù)入門——RDF應(yīng)用》,本文關(guān)鍵詞  ;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 收縮
    • 微信客服
    • 微信二維碼
    • 電話咨詢

    • 400-1100-266
    西藏| 东至县| 莫力| 莱西市| 大英县| 江油市| 吉木萨尔县| 海原县| 册亨县| 西安市| 商南县| 峨眉山市| 修文县| 绍兴县| 革吉县| 金山区| 延安市| 曲阜市| 富蕴县| 三门县| 凌云县| 长春市| 潮安县| 安图县| 靖江市| 东安县| 邵武市| 卢湾区| 长泰县| 房产| 海晏县| 泾阳县| 文登市| 罗源县| 津南区| 盐边县| 莱芜市| 伊宁县| 桦南县| 徐汇区| 松江区|