對象存儲九大關(guān)鍵特征
作(zuò)者:存儲在線  來(lái)源:存儲在線  發表時(shí)間(jiān):2017-2-9  點擊:3754
  對象存儲是一(yī)個(gè)相對較新(xīn)并且在持續穩步增長的市(shì)場(chǎng)部分(fēn)。對于新(xīn)手而言,對象存儲用于保存大量非結構化(huà)數據,其中每個(gè)“對象”實際上(shàng)是一(yī)個(gè)沒有特定格式的文件(也(yě)稱二進制文件)。實際上(shàng),從小的對象(人(rén)類可讀取文件)到媒體(tǐ)(音(yīn)頻和視(shì)頻)或其它行業特定格式(石油&天然氣,醫(yī)學成像等),對象存儲可以保存任何類型的數據。

  與傳統存儲相比,采用對象存儲的好(hǎo)(hǎo)處良多。基于塊的系統(例如(rú)光纖通道和iSCSI)無法很好(hǎo)(hǎo)地向外擴展,并且沒有真正的了(le)解所存儲的數據。它們是以低(dī)延遲和高粒度提供内容的“啞”塊設備。文件系統将一(yī)些(xiē)結構放(fàng)在數據上(shàng),将文件對象放(fàng)入層級結構(文件夾/目錄)然後将元數據附加到這(zhè)些(xiē)對象上(shàng)。然而,元數據通常隻是基于存儲文件所需的信息(創建時(shí)間(jiān),時(shí)間(jiān)更新(xīn),訪問規則)存儲文件。

  對象存儲更進一(yī)步消除了(le)文件夾層次結構,具有高度可搜索的可擴展元數據。在規模方面,對象存儲可以增加到多(即便不是上(shàng)百)PB容量,通常對數據沒有地域限制。因為(wèi)對象存儲平台提供了(le)優于傳統存儲的形式,越來(lái)越多的企業開始采用它。基于塊的存儲陣列無法很好(hǎo)(hǎo)地擴展,且帶有大量HDD和SSD的數據保護(例如(rú)RAID)的問題。基于文件的系統受到系統自身(shēn)的可擴展性限制,無論是在對象計數、并發、并行訪問或恢複時(shí)間(jiān)方面,都能(néng)檢驗出文件系統結構的一(yī)緻性。對象存儲代表一(yī)種更簡單、更可擴展的解決方案,通過标準的基于網絡的協議(yì)可輕松訪問。

  對于尋求采用對象存儲的IT企業來(lái)說(shuō),最大的挑戰是如(rú)何選用平台以及如(rú)何評估供應商(shāng)的産品。對象存儲使用基于Web的協議(yì),因此需要一(yī)定程度的編碼才能(néng)使用。這(zhè)方面正在發生(shēng)改變,我們将在後面討(tǎo)論。

  從特性的角度來(lái)看,對象存儲在諸多方面能(néng)使某個(gè)平台在适用性方面更加突出。接下(xià)來(lái),我們對IT組織在對象存儲平台中的尋找目标來(lái)做一(yī)下(xià)識别分(fēn)類和描述。

  1.可擴展性——大和小

  正如(rú)我們已討(tǎo)論的那樣,對象存儲的設計比諸如(rú)橫向擴展型NAS那樣的傳統數據存儲的可擴展性範圍要更進一(yī)步。供應商(shāng)産品具有多PB級容量,可以存儲數十億個(gè)對象。然而,實現(xiàn)高可擴展性不僅僅是簡單地測量對象和數據量。注意事(shì)項包括:

  a.對象大小。對象存儲處理(lǐ)大/小對象方面的表現(xiàn)如(rú)何?處理(lǐ)小對象的方式是什(shén)麽?

  b.容量限制。容量是否真的有限制?容量增長是否需要添加更多的硬件或軟件節點?可以簡單地擴展存儲嗎(ma)?

  c.分(fēn)層和緩存。對象存儲該如(rú)何管理(lǐ)數據分(fēn)層?随着容量的增加,大量數據通常是不活躍的,并且存檔到更廉價的介質上(shàng)。在這(zhè)一(yī)點上(shàng),分(fēn)層能(néng)力成為(wèi)關(guān)鍵。閃存介質還可用作(zuò)緩存或分(fēn)層時(shí)以提高性能(néng)。

  d.元數據管理(lǐ)。随着對象存儲的發展,元數據該如(rú)何管理(lǐ)?對象存儲的容量大小是否影響搜索性能(néng)?

  e.對象訪問。随着對象存儲的發展,針對對象的單獨訪問時(shí)間(jiān)是否要增加(還是不希望增加)?

  最後一(yī)點對于構建對象存儲特别重要,為(wèi)多個(gè)對象存儲/檢索請求的提供并行訪問,例如(rú)CDN網絡的後端系統服務(wù)。在一(yī)個(gè)對象存儲中增加存儲數量是不應增加檢索時(shí)間(jiān)的,更重要的是“到第一(yī)個(gè)字節的時(shí)間(jiān)”,這(zhè)是從接收點開始将對象回流到請求者所花費的時(shí)間(jiān)要求。

  當然,我們不應該忘記對象存儲可能(néng)需要啓動小的對象,不需要有幾百TB或PB級初始容量。小的初級容量有助于降低(dī)進入并采用對象存儲的障礙,随之而來(lái)的需求是,以最小的影響從小到大進行容量擴展。

  2.數據保護

  數據保護的概念涵蓋了(le)對象存儲中的許多方面。與傳統的主存儲相比,對象存儲可能(néng)用于長期保存數據,因此數據耐久性是一(yī)個(gè)重要因素。我們可以将耐久性視(shì)為(wèi)需要确保由于一(yī)系列錯誤(包括硬件讀取失敗和數據損壞)而不損壞正在存儲中的數據。

  與25年前的設備相比,現(xiàn)代硬盤非常可靠。盡管如(rú)此,仍然會出現(xiàn)讀取錯誤和其他瞬态問題。對象存儲應執行一(yī)系列磁盤管理(lǐ)的功能(néng),包括數據清理(lǐ)、CRC的損壞檢驗,以及對不一(yī)緻數據的重建。這(zhè)些(xiē)後台任務(wù)代表了(le)長期保持數據健康的重要性。

  第二個(gè)要考慮的是對硬件故障的保護。當今,大多數的存儲陣列将RAID(獨立磁盤冗餘陣列)作(zuò)為(wèi)一(yī)種從硬件故障導緻的丢失中恢複數據的方法。随着數據量的上(shàng)升,RAID在可擴展性方面出現(xiàn)問題。存儲供應商(shāng)已經實現(xiàn)了(le)雙重甚至三重奇偶校(xiào)驗,以防止載有大硬盤容量的多個(gè)驅動器(qì)發生(shēng)故障。然而,延長驅動器(qì)重建時(shí)間(jiān)對RAID對象存儲中的大量數據而言是不切實際的。

  替代方案是用糾删碼的方式來(lái)保護數據。糾删碼是對數據劃分(fēn)和變換為(wèi)多個(gè)冗餘片段的描述過程,恢複原始信息所需的最小計數。例如(rú),編碼方案可以将數據翻譯成12條數據,重建原始數據所需的其中的任何8條數據。這(zhè)12條數據可以分(fēn)布在多個(gè)驅動器(qì)上(shàng),服務(wù)器(qì)/節點甚至在地理(lǐ)上(shàng)提供高彈性。在12/8方案中,跨越三個(gè)位置分(fēn)布數據意味着任何一(yī)個(gè)位置的丢失都是允許的。

  對象存儲應根據客戶需要提供具有可變保護值的糾删碼。由于糾删碼有處理(lǐ)開銷,因此RAID還可以用于保護較小的對象并改善訪問性能(néng)。當數據在地理(lǐ)上(shàng)分(fēn)布時(shí),重建對網絡的影響變得尤其重要。因此,糾删碼系統的具體(tǐ)實現(xiàn)(以及需要通過WAN檢索數據)将直接影響恢複時(shí)間(jiān)和客戶SLA(服務(wù)水平協議(yì))。當本地LAN延遲較高時(shí),也(yě)會發生(shēng)此問題——任何基于分(fēn)布式網絡的恢複都将一(yī)直受到網絡性能(néng)的影響。快(kuài)速恢複非常重要,因為(wèi)不受保護的數據需要快(kuài)速重新(xīn)保護,以避免潛在的數據丢失。

  3.搜索、索引和元數據

  在對象存儲中搜索和檢索數據的能(néng)力是最關(guān)鍵的要求之一(yī)。與結構化(huà)數據(如(rú)數據庫和文件系統)相比,對象存儲将數據保存在平面層次結構中,隻有少量的邏輯或物理(lǐ)分(fēn)隔(例如(rú)存儲段或池)。這(zhè)意味着存儲的每個(gè)對象都需要有大量的信息,以便于數據檢索。

  對象存儲通常使用的兩種方法的其中之一(yī)——終端用戶設置對象的名稱(可能(néng)看起來(lái)像标準文件名),或者使用系統生(shēng)成的對象ID(OID)存儲和訪問對象。對象ID通常是由象存儲本身(shēn)随機生(shēng)成的長字符串和數字。

  在使用OID的情況下(xià),元數據很關(guān)鍵。對象存儲用戶還可以維護對象ID及其使用的單獨數據庫。元數據提供關(guān)于對象本身(shēn)(系統元數據)的信息,例如(rú)對象大小、訪問權限、創建對象的用戶等。用戶元數據的擴展是與對象存儲信息相對應的,用于傳遞搜索和有索引能(néng)力的應用程序。

  元數據的搜索性能(néng)應該與存儲在對象存儲自身(shēn)的數據量相互獨立,這(zhè)是管理(lǐ)可擴展性的關(guān)鍵要求。

  4.性能(néng)

  目前,在我們討(tǎo)論的需求中,性能(néng)是實現(xiàn)可擴展性,數據保護和搜索的一(yī)個(gè)主題。但(dàn)在對象存儲第一(yī)次開發時(shí),性能(néng)理(lǐ)念卻并非主要因素,因為(wèi)很多對象存儲隻是用作(zuò)長期存檔或是備份數據庫。随着越來(lái)越多的對象平台适用于更加活躍的數據——用作(zuò)主動存檔,或媒體(tǐ)及其他流式内容的資源庫。

  因此,我們需要對象存儲平台提供高吞吐量,線性可擴展功能(néng)以及處理(lǐ)高級并發請求。在将對象平台用作(zuò)CDN(内容交付網絡)或其他軟件即服務(wù)(SaaS)解決方案的後備存儲時(shí),對并發性的需求尤其重要。并發就(jiù)意味着能(néng)夠同時(shí)傳輸多個(gè)對象,每秒(miǎo)處理(lǐ)大量的單個(gè)數據請求。在衡量标準方面,通常基于IOPS和吞吐量。

  5.安全性

  和任何數據存儲一(yī)樣,安全是一(yī)個(gè)關(guān)鍵特性。在對象存儲中,安全特性則涵蓋了(le)許多方面。

  因為(wèi)數據可能(néng)保存到對象存儲區域,多租戶變得非常重要。業務(wù)用戶(企業中的獨立部門或獨立企業)都希望自己的數據與其他人(rén)訪問的數據隔離開。這(zhè)表示擁有了(le)獨立的安全憑證,并為(wèi)每位客戶提供了(le)加密密鑰。

  對象存儲通常是憑借HTTP調用對象存儲本身(shēn)提供的認證密鑰來(lái)提供數據訪問。因為(wèi)數據可能(néng)通過公共互聯網傳輸,這(zhè)些(xiē)密鑰就(jiù)是憑證,而非普通的用戶/密碼組合。管理(lǐ)憑證更大的任務(wù)是身(shēn)份管理(lǐ)功能(néng)的部分(fēn),它還能(néng)夠提供标準化(huà)平台集成,如(rú)LDAP和MicrosoftActiveDirectory。

  訪問單個(gè)對象或存儲段是通過訪問控制列表進行分(fēn)配,這(zhè)些(xiē)列表決定或單個(gè)或組級數據訪問。許多對象存儲會允許通過用于存儲和檢索數據,同樣基于Web的REST接口來(lái)設置和管理(lǐ)訪問控制。

  除身(shēn)份管理(lǐ)以外,不論在傳輸還是保存狀态都必須要通過數據加密來(lái)提供安全性。通常在數據傳輸狀态使用TLS(如(rú)HTTPS)實現(xiàn)數據保護。

  而數據保存狀态時(shí),為(wèi)了(le)防止物理(lǐ)服務(wù)器(qì)或驅動器(qì)/設備直接訪問,應對數據進行加密。加密的具體(tǐ)點或實現(xiàn)可取決于終端用戶想要管理(lǐ)加密密鑰的方式。數據可以在被添加到對象存儲之前或同時(shí)被加密。

  6.合規性&審計

  合規性是數據安全的另一(yī)個(gè)方面,側重于滿足特定受控的行業(如(rú)醫(yī)療保健和金(jīn)融)保存數據的監管要求。

  通常,兼容系統需要能(néng)規定數據的不可變性,提供對象版本控制(以便可以追蹤更改的數據),實現(xiàn)對象鎖定或WORM(一(yī)寫多讀),再次用于不可變的數據。相比塊系統和基于文件的系統,大多數對象存儲不更新(xīn)數據。這(zhè)一(yī)點提供了(le)一(yī)定程度的控制權,符合合規性要求。

  審計與合規性互補,能(néng)對數據如(rú)何在對象存儲系統中存儲進行追蹤。審計追蹤還可以提供附加信息,例如(rú)層之間(jiān)的數據遷移,内容校(xiào)驗和驗證(确保無篡改)以及對單個(gè)數據對象存儲段的所有訪問。

  7.部署模型

  對象存儲一(yī)直在走向軟件定義存儲(SDS)的前列。大型向外擴展型部署的本質意味着對象存儲與商(shāng)用硬件和供應商(shāng)所提供軟件的成本模式能(néng)夠進行很好(hǎo)(hǎo)地協作(zuò)。最終,我們看到許多基于純軟件的對象存儲實現(xiàn)。

  當然,商(shāng)用硬件的采用無法滿足所有的要求。很多潛在客戶可能(néng)不情願或無法管理(lǐ)采購(gòu)和構建一(yī)個(gè)定制對象存儲解決方案的過程,而甯願從供應商(shāng)那裏拿到一(yī)個(gè)軟硬件的組合解決方案。

  在這(zhè)種情況下(xià),供應商(shāng)為(wèi)了(le)滿足客戶需求要提供設備,可能(néng)會與已經進入客戶數據中心的服務(wù)器(qì)和存儲供應商(shāng)合作(zuò)。

  為(wèi)什(shén)麽?因為(wèi)支持模式,内部技術和部署藍圖都已經是基于首選硬件供應商(shāng)的了(le)。為(wèi)了(le)最大的靈活性,供應商(shāng)可能(néng)提供以下(xià)三種選項:

  純軟件——用作(zuò)VSA(虛拟存儲設備)或本地部署到硬件上(shàng)。

  設備——專用硬件設備,構建為(wèi)一(yī)個(gè)白盒子(zǐ)或與要硬件提供商(shāng)之一(yī)配合使用。

  雲——在公有雲中作(zuò)為(wèi)一(yī)個(gè)實例部署。

  每一(yī)個(gè)選項,客戶應該希望完全的互操作(zuò)性和一(yī)緻的管理(lǐ)接口。

  8.協議(yì)支持和标準

  初期的對象存儲是基于HTTP(S)協議(yì),采用基于REST的API調用存儲和檢索數據。HTTP的使用很靈活,可以在網絡((局部或廣域網)上(shàng)的任何地方訪問數據,然而,相比在橫向擴展型文件系統中訪問數據,為(wèi)了(le)使用對象存儲,應用程序必須進行編碼。

  因此,供應商(shāng)已經開始對其産品增加NFS和SMB支持,允許通過基于文件的标準協議(yì)來(lái)存儲和檢索數據。為(wèi)了(le)完全支持向外擴展型功能(néng),其中還應包括支持并行文件系統。

  擴展協議(yì)支持意味着數據采用了(le)對象存儲,現(xiàn)有應用程序能(néng)夠輕松地進行移植或修改。而值得我們深思的是,與橫向擴展型文件存儲相比,對象存儲的架構差異在于,它是通過使用模拟了(le)文件存儲的對象存儲提供。

  基本數據并不是用基于inode(索引節點)和目錄架構進行存儲,因此系統崩潰後,FSCK(文件系統掃描)的概念并不适用。與傳統文件系統相比,這(zhè)對(支持文件系統的)對象存儲的可擴展性和性能(néng)有很大的影響。

  協議(yì)支持還需要擴展到采用業界标準。對對象存儲而言,這(zhè)意味着要使用AmazonS3和Swift——兩個(gè)已經獲得廣泛普及的“标準”。亞馬遜憑借2006年發布的S3平台進入對象市(shì)場(chǎng),因為(wèi)S3API經曆了(le)成長,成熟以及完善的過程,所以成為(wèi)了(le)許多供應商(shāng)選擇遵循的标準。Swift已經發展成OpenStack項目的對象存儲組件。

  9.成本

  沒有價格和總擁有成本討(tǎo)論的對象存儲,不是完整的對象存儲。最顯而易見的認證模式是基于容量的——向平台增加更多可用或原始容量,并以實際增量為(wèi)認證支付更多的錢(qián)。供應商(shāng)還可以選擇針對每個(gè)節點收費,那麽終端用戶就(jiù)要确保它們部署的硬件能(néng)夠提供盡可能(néng)大的容量。

  還有一(yī)個(gè)選擇就(jiù)是按功能(néng)收費,一(yī)些(xiē)供應商(shāng)看準了(le)這(zhè)個(gè)機會,構建了(le)一(yī)個(gè)包含所有功能(néng)選項的收費結構。從終端用戶的角度來(lái)看,這(zhè)顯然更具競争力,但(dàn)隐藏的額外成本可能(néng)是一(yī)個(gè)問題。

  計算(suàn)TCO(總擁有成本)提出了(le)關(guān)于對象存儲平台效率的一(yī)個(gè)有趣的問題。橫向擴展節點設計采用計算(suàn),系統内存和磁盤或閃存存儲來(lái)提供一(yī)定的用戶容量。

  一(yī)旦在白盒硬件上(shàng)構建,軟件的效率與構建解決方案的成本直接相關(guān)。到目前為(wèi)止,沒有實際的标準來(lái)對比對象存儲的效率,這(zhè)是需要行業發展的一(yī)個(gè)領域。

  結論

  以上(shàng)就(jiù)是對象存儲的九大主要特征。供應商(shāng)将以實現(xiàn)這(zhè)些(xiē)功能(néng)的方式來(lái)使其産品架構更具吸引力。

服務(wù)項目

維保運維服務(wù)

信息系統集成服務(wù)

機房(fáng)搬遷服務(wù)

 
 
 
QQ 在線客服
QQ 在線客服
 
電話(huà):
0531-88818533
客服QQ
2061058957
1905215487