服務熱線:400-006-5356

企業新聞您現在的位置: 首頁 > 新聞資訊 > 行業動態

區塊鏈+大數據 任重而道遠

投注国足对伊朗 www.dzlnq.icu 時間:2019-1-10 17:35:12

作者:佚名來源:BB財經


隨著共享經濟的迅猛發展,“區塊鏈+大數據”似乎已經成為一個非常明顯的發展趨勢。一方面,區塊鏈可以解決大數據存在的諸多問題,從而使其為共享經濟提供更加優質的服務;另一方面,為了最大限度地體現自身價值,越來越成熟的大數據迫切需要一個應用實體。然而,作為兩種相互獨立的互聯網技術,大數據和區塊鏈要想真正實現深度融合,仍舊任重而道遠。

一、數據孤島問題突出

俗話說: “巧婦難為無米之炊?!筆菔譴笫蕕幕?,而且只有被共享才可以擁有“生命”。 另外,如果不能獲得底層數據,那么我們就無法進行數據分析。

區塊鏈+大數據 任重而道遠

對此,中國科學院院士、北京大數據研究院院長鄂維南說道: “第一個問題就是沒數據,理論上我們中國有很多數據,但實際做數據分析會發現非常困難?!?由此來看,數據孤島確實是一個十分嚴重的問題。

通常情況下,不同企業會用不同格式將數據存儲在不同地方。在各方之間信息不對稱、數據共享渠道十分缺乏、制度法律不完善等因素的影響下,很多企業和政府都不愿意公開自己手中的數據,再加上已經公開的數據還會因為某些原因而無法關聯融合,形成數據孤島就成為了一個必然結果。

此外,形成數據孤島的原因還有另外一個——利益。從目前的情況來看,很多企業都會以?;ど桃禱芪啥話咽莨蠶沓隼?,不僅如此,一些政府部門也會因為各種各樣的原因(例如,數據已經被用于商業交易、工作人員懶政等)而讓數據“沉睡”。

實際上,無論是企業還是政府,不進行數據共享的根本原因是利益,正如鄂維南所說: “數據孤島的痛不是技術問題,而是利益問題,背后隱藏的利益導致了數據孤島的產生?!?/p>

二、增強數據可信度

數據發展存在3個階段:

  • 在第一階段,數據并沒有經過充分檢驗,而且是無序的;

  • 在第二階段,大數據正式興起,可以在人工智能算法的助力下進行質量排序;

  • 在第三階段,采用區塊鏈機制以后,數據獲得了在互聯網全局基礎上的可信質量。

正是因為有了區塊鏈,數據才會進入第三階段??梢運?,在人類目前獲得的所有數據中,區塊鏈上的大數據是可信度最高的一種,而且還具有很高的精確度和良好的數據質量。

1、用區塊鏈驗證數據出處和精確性

2016年,IDC Government Insights 發布了一篇報告,該報告深刻闡述了區塊鏈對政府數據權限管理和精確性的巨大價值,同時還指出,對于政府的數據采集系統來說,使用區塊鏈共識機制獲取和驗證信息的方式是非常合適的。此外,在未來的幾年內,政府會以此篇報告為依據,對區塊鏈進行技術測試,從而挖掘出區塊鏈的真正價值。

此前,政府數據權限并不是特別完善,信息精確性也沒有保障,而在區塊鏈的幫助下,政府長期控制數據、信息精確性無法驗證的難題都可以被有效解決,正如 IDC Government Insights 報告所指出的那樣: “區塊鏈可能成為驗證數據出處和精確性的核心工具,可以追蹤數據升級,為不同數據領域建立真正的權威數據?!?/p>

對此,IDC Government Insights 研究主管肖恩·麥卡錫說道:“當前,政府已經對IT安全、信息安全、可靠性提起了高度重視,而 區塊鏈被認為是IT經理人的強大工具,不僅可以使欺詐得以大幅度減少,還可以最大限度地保證數據安全。 更重要的是,區塊鏈也可以拉近政府和公民之間的距離,進而形成一種全新的關系?!?/p>

IDC Government Insights 報告顯示,在改善數據真實性和精確性方面,區塊鏈可以發揮出非常大的作用。這主要是因為區塊鏈可以對代表有價物品的不同實體進行轉移和監控,而且還可以保證審計跟蹤的穩定性。

在跟蹤實體活動的時候,區塊鏈采取的是共享記錄的方式,這樣就可以保證實體活動不會受到未授權更改及黑客攻擊的影響。如果在P2P網絡的助力下建立了共享的權威版本,那么眾多節點就會一起工作以確保數據的完整性。

區塊鏈的共識協議會對活動的有效性,以及是否可以添加到區塊鏈中進行檢查,通過檢查以后,區塊鏈會把這個權威記錄和其他信息放在一起進行核對。

毋庸置疑,區塊鏈可以在土地登記、版權、智能合約、病歷等多個方面發揮作用,但 IDC Government Insights 報告似乎將焦點放在以下3個方面。

  • 1)數據精確性:對于任何類型的數據而言,精確性都是一個關鍵特性,這不僅可以表示任意對象的數據值記錄都是正確的,還可以表示形式、描述對象、內容都是一致的。

  • 2)數據權威性:區塊鏈為數據賦予的權威性不僅詳細說明了數據出處,還對數據所有權及數據最終權威版本的位置進行了明確規定。

  • 3)數據訪問控制:區塊鏈不僅可以跟蹤公共信息,還可以跟蹤私人信息,具體包括可以更新數據的人、數據對應的交易、數據本身的詳細信息等。

從目前的情況來看,政府剛剛開始對區塊鏈解決方案的實際能力進行測試,測試重點放在了數據?;?、權限管理兩個方面。另外,根據IDC的預測,區塊鏈解決方案原型搭建的關鍵推動者應該是系統集成商。

針對區塊鏈解決方案,肖恩·麥卡錫總結道: “我們建議企業和政府機構把區塊鏈解決方案的機遇及價值研究納入第三平臺戰略,可以借助內部戰略文件的力量,確定區塊鏈的實際意義及應該遵循什么樣的實施路徑?!?/p>

可以看到,在政府數據方面,區塊鏈可以發揮比較大的作用,一方面,有利于解決數據權限問題;另一方面,有利于保證數據的精確性。

2、區塊鏈與大數據共建未來信用

區塊鏈改變了人與人之間的信任方式,這一點是毋庸置疑的。在當今世界上,信用可謂是一個既稀缺又昂貴的資源,而人類也曾為此付出過非常大的代價。另外,為了最大限度地規避道德風險,擺脫信任困境,一筆交易必須被拆分成多個環節,形成多個交易主體。

區塊鏈不僅是一項技術,也是一種數據庫,更重要的是,它還可以建立信任,從而實現價值的轉移和傳遞 。而大數據也可以通過分析和處理相關數據,建立起數據的一種智能。 那么,二者既然有如此多的相似之處,是不是可以很好地融合在一起,從而推動整個互聯網經濟的發展呢?答案是肯定的。

在商品經濟的發展過程中,信用是一項必不可少的資源,而在交易支付領域,以點對點網絡和開源系統為基礎的區塊鏈則掌握著 去中心化、加密安全、不可篡改、去信任機制 等諸多優勢。這樣看來,在區塊鏈的助力下,基于信任需要的交易環節可以有所減少,從而大幅度降低了交易成本。

一些專家學者認為,信用需求的不斷擴大是區塊鏈出現的一個重要歷史原因。在商品經濟時代,商業模式是物物交換,但這種商業模式需要非常高的運輸成本。鑒于此,降低交易成本成為市場經濟的首要考慮因素。于是,商業模式開始轉變為利用信用建立交易。

互聯網金融在市場上出現后,獲得了非常良好的發展。拿微信來說,其主要特征是通過大數據來建立信用??梢運?,對于互聯網金融而言,大數據金融是一個非常重要的基礎,既降低了信用建立的成本,又加快了信用建立的速度,還提高了信用建立的質量。

不過,信用建立也不能一直依靠某個(些)“中心”,因為如果中心化程度過高,很可能引發信息不對稱的問題,從而對參與方及其他人的利益造成損害。而區塊鏈則利用自身所具有的去中心化特征,有效地解決了這一問題。

在區塊鏈大數據時代,全網公證是建立信用的一種絕佳手段。對于傳統信用體系而言,這是極具顛覆性意義的。另外,區塊鏈上的大數據可以將信用賦予每一個人,而區塊鏈也會成為全球金融的基礎架構。

三、解決大數據風控弊端

區塊鏈也可以有效解決大數據風控的很多弊端,例如,數據質量低下、數據孤島、數據泄露等,本節將對此進行詳細說明。

1、改善數據質量

眾所周知,區塊鏈中的每一個節點都可以記錄和存儲交易信息,不僅如此,為了驗證交易數據的真實“身份”,這些節點也可以對交易數據進行檢查。在這種情況下,數據的真實性和有效性就有了很大的保障。另外,由于區塊鏈具有去中心化的特征,因此,無論是誰都不可以對區塊鏈上的數據進行篡改,這樣數據篡改的可能性就被降到了最低。

可見,在區塊鏈的助力下,數據的公開性、安全性都有了大幅度提升,而這也帶來了數據質量的提高,以及數據檢驗能力的增強。

OKLink分析師曾說過: “區塊鏈技術擁有高可靠性、簡化流程、交易可追蹤及改善數據質量等特質,使得其具備重構金融業基礎架構的潛力?!?/p>

2、解決數據孤島問題

大數據存在非常嚴重的數據孤島問題,而區塊鏈則有望解決這一問題。之所以會這樣說,主要是因為區塊鏈不僅是一個分布式賬本,而且還具有去中心化、開放性等特征。

在區塊鏈的助力下,信息傳遞到金融市場參與者的過程會變得越來越公開透明。不僅如此,作為金融市場中的秩序維護者,監管機構還可以通過區塊鏈中的數據鏈條來預測和分析可能出現的風險問題,并制定出相應的規避措施,以此來保證金融市場的正常運行。

可以看到, 區塊鏈的去中心化的特征,不僅能夠解決大數據中的數據孤島問題,還可以實現不同主體間的信息共享,從而進一步完善現有的風控模式。

另外,在區塊鏈的巨大影響下,區塊鏈創業公司像雨后春筍般不斷涌現。不過,對于區塊鏈創業公司來說,提供完善的區塊鏈解決方案是可以的,但這些解決方案能否順利落地還是一個未知數。

可以說,區塊鏈目前的發展狀況與20世紀90年代互聯網的發展情形非常相似,其對行業、政府、企業的改變是一定會發生的。到2020年,不僅區塊鏈創業公司的數量可能會大幅度增加,區塊鏈聯盟的數量也可能會有所增加。

在維護一個可靠數據庫時,區塊鏈采取了去中心化和去信任的方式,這也注定了區塊鏈與大數據融合在一起是必然的。甚至可以說,區塊鏈的誕生是對大數據的重構。

3、解決數據泄露問題

從本質上來講,區塊鏈其實是一個去中心化的數據庫,因此,如果區塊鏈中的某個節點對數據“動了手腳”的話,那么其他節點會在第一時間發現,這樣數據泄露的可能性會大幅度降低。

只有通過私鑰的形式,區塊鏈中各個節點的身份信息才可以被成功獲取,而且私鑰還是數據擁有者才可以知道的。 即使數據已經泄露出去,但如果私鑰沒有被泄露的話,那些已經被泄露的數據也沒有辦法與節點身份進行匹配,因此,它們并沒有任何使用價值。

另外,區塊鏈只能被那些計算力超過50%的黑客攻破,不僅如此,隨著區塊鏈節點的不斷增多,所需的節點力也會越來越大。當節點增多到一定數量時,發動一次攻擊的成本就會變得非常高,對于黑客而言,這其實是得不償失的。由此來看,通過區塊鏈對數據存儲技術進行加密,可以最大限度地確保數據安全,從而把數據泄露的風險降到最低。

可以說,“區塊鏈+大數據”是解決大數據風控弊端的最佳模式,同時,該模式還可以大幅度提升金融業務風控能力,從而推動金融行業的不斷發展。

四、用區塊鏈解決大數據交易問題

區塊鏈可以從根本上解決大數據的交易問題。一方面,區塊鏈可以實現對數據的追根溯源;另一方面,區塊鏈可以實現對靜態數據的隔離驗證。

1、追溯數據的源頭

在數據交易的過程中,數據提供方會有這樣的顧慮: 數據被發送出去以后,很可能會通過其他渠道流入二級市場,并且被轉賣的次數越多,數據價值越小。 另外,在現有技術的基礎上,數據的可復制性和二次傳播還沒有辦法完全避免,再加上數據價值會隨著傳播次數的增多而不斷減小,所以數據提供方根本不愿意,也害怕將數據提供出來進行交易。

簡言之,數據提供方不想進行數據交易的原因主要包括以下兩點:

  • 1)二次傳播導致數據價值的不斷減小。

  • 2)為了獲取原始數據全集,數據接收方會進行多次購買。

眾所周知,馬太效應會在數據本身的量級上展示出來,如果不能有效解決數據溯源問題的話,數據接收方必然會分次獲取數據全集,從而對數據提供方的數據交易價值產生嚴重影響。從目前的情況來看,在商業協議的?;は?,數據雖然可以不被二次轉賣,但由于舉證困難,如果數據接收方違約,數據提供方根本無法追責。

俗話說:“羅馬不是一天建成的?!痹諳鐘屑際醪荒鼙苊饈荼歡胃粗坪妥艫那榭魷?,讓數據具備可溯源性特征也是一種非常不錯的過渡手段。當出現數據接收方蓄意違約的現象時,數據提供方如果具備舉證手段,可以在很大程度上消除其進行數據交易的顧慮。

一個非常有效的實現方法是通過區塊鏈的不對稱加密技術,對需要交易的數據進行簽名,具體包括以下幾個環節:

  • 1)數據交易雙方針對簽名算法進行協商,例如,使用AES128。

  • 2)數據接收方生成自己的公鑰和私鑰。

  • 3)數據接收方將自己的公鑰和私鑰同時提供給數據提供方。

  • 4)數據提供方使用私鑰對數據關鍵字段進行簽名。數據關鍵字段包括枚舉類型、ID類型等。值得一提的是,數值類型應該保留明文,然后將已經簽過名的數據出售給數據接收方,原始數據則由數據提供方保留。

  • 5)數據接收方購買到加密數據以后,把自己系統內的關鍵數據用私鑰簽名進行轉換,以便供數據銜接使用。

  • 6)如果市場上出現相關出售數據,那么數據接收方可以通過公鑰對數據進行驗證,根據公鑰和私鑰的驗證結果,了解數據究竟出自哪一個數據提供者。

這種方法雖然可以對具體的數據提供方進行驗證,但也存在一個問題:如果數據接收方充滿惡意,妄圖同時掌握私鑰和公鑰的話,那么數據提供方很有可能遭到陷害。這也表示,要想真正實現數據的追根溯源,除了需要區塊鏈的助力,還需要監管機構的公證。

2、靜態數據的隔離驗證

比特幣的隔離驗證BIP是隔離驗證一詞的來源,很多專家學者都認為,隔離驗證可以引入到靜態數據交易中。

從目前的情況來看,對靜態數據進行交易是特別困難的。因為靜態數據涉及了太多的用戶隱私,所以使數據提供方和數據接收方承擔大量的監管風險。另外,從法律層面來看,很多靜態數據都處于灰色地帶,而且其中大部分都產生于政府職能部門。

在這種情況下, 如果我們可以使用隔離驗證技術,將那些合法且可以出售的數據進行隔離驗證處理,那么就可以在?;び沒б降耐?,為數據接收方的合法使用提供保障。

這方面我們可以使用靜態數據哈希,將不能被泄露的用戶隱私數據進行哈希,使數據接收方只有在擁有某些數據的情況下,才可以借助哈希比對獲取一條數據記錄的其他字段,從而實現與隔離驗證相類似的功能。

可以看到,在解決大數據交易問題方面,區塊鏈確實有著得天獨厚的優勢,而且也可以發揮真正的作用。一方面,區塊鏈可以追溯數據的源頭,從而保證數據提供方和數據接收方的利益;另一方面,區塊鏈可以實現靜態數據的隔離驗證,從而降低數據交易中的風險。

區塊鏈+大數據何時應聲落地、遍地開花?我們拭目以待。