Objects儲存:您為何以及何時需要它?

本文由 Nutanix 高級產品營銷經理 Rohit Goyal 撰寫

  知識就是力量!現代 IT 的關鍵在於知識的來源:數據。如果數據儲存沒有優化,它將阻礙整個業務的敏捷性。有很多方法可以儲存它,然而,要清楚找到不同情境時的最佳解法又不太容易。文中我們將揭示最受關注的選項之一「Objects儲存」,以及它與Files和Blocks的區別。

產業視角

  數據正在以驚人的速度增長,根據 IDC 的數據,到 2020 年,總數據量將達到 40 ZB(1ZB = 1,000,000,000 TB ),其中約 63% 是非結構化的。這種增長需要可擴展性和靈活性並用簡化的智能管理。

資料來源:全球和美國企業儲存系統預測更新,Natalya Yezhkova,2016-2020

Blocks和Files的快速回顧

  傳統上,主要數據在數據中心內以Blocks和Files儲存。特別是block儲存在非常低的級別上運作,以bytes為單位,並組織在易於索引和搜索的結構化固定區塊(structured fixed blocks)中。因此稱為「結構化數據」,這通常是您的SAN(Storage Area Network)設備。然而,File儲存通常佈置在文件和文件夾的層次結構中,可在NAS(Network Attached Storage)系統上找到。SAN設備使用iSCSI和光纖通道協議,NAS 文件管理器使用SMB或NFS。

  這些類型的儲存很自然地會靠近計算資源。然而,隨著數據不斷增長,特別是那些尚未準備好遷移到舊儲存(cold storage)且不需要使用計算儲存的數據,這應該有一些可以更有效、安全且經濟的地方法來儲存這些數據。

進入Objects儲存

  Objects儲存專為在雲計算領域有高度擴展性和彈性的非結構化數據而設計。非結構化數據沒有固定格式,它由不同大小的文件組成。它可以透過與S3兼容的HTTP REST API 使用.。S3(Simple Storage Service)是由 Amazon Web Services開發,因為他們是第一個進入市場,並且有一個功能齊全的界面,所以它已成為當今許多領導Objects儲存供應商的標準。

以下是一些典型的Objects儲存特性:

  • 與傳統的blocks相比,數據是被儲存成物件。
  • Objects可以包含備份、存檔、影片、圖片、logs、HTML 文件等。
  • 它本質上是非結構化的,因為數據的儲存方式沒有格式。
  • 資料不放在目錄的階層中,而是存在於平坦的位址空間。
  • 使用UID(unique IDs)而不是文件名儲存物件,大大減少了儲存數據所需的開銷。
  • Objects與用戶定義的後設資料(metadata)一起儲存,便於在大規模中查找目標
  • Objects的大小可以是幾TB或只是幾KB而已,一個儲存桶(bucket)可以容納數十億個物件。
  • 應用程序開發人員可以輕鬆地使用與simple S3 兼容的 API calls,透過“GET”和“PUT”請求使用Objects,而無需複雜的目錄結構。

您會注意到此圖表中三種儲存選項之間的差異:

  如上所述,Objects可以有許多不同的形狀和大小,並且可以通過特定的URL訪問,該URL由儲存桶名稱(bucket name)和object ID 構成。

  Objects不像其他文件、資料夾或數據那樣嵌套(nested)在Objects中。它們可通過單個命名空間獲得,並且大小可以從幾TB增長到PB。由於單一命名空間(namespace)—— 一個可以橫跨多個儲存裝置的單一數據邏輯視圖,我們與數據的互動更容易。

100MB文件示範

  讓我們深入研究一個範例,以更好地理解blocks和objects之間的區別。100MB大小的文件在blocks和objects處理會有什麼差別?

  當數據寫入blocks解決方案時,100MB文件會被分解為固定大小的粒度塊,而不像objects是將整個物件寫入儲存解決方案。blocsk適用於高度交互的本地請求,但規模有限。在更新 100MB 文件的情況下,blocks儲存可以在不替換整個100MB文件的情況下進行粒度更新(granular updates)。這對於高度事務性的數據庫工作負載非常有用。

  同樣地,當更新 100MB 的objects時,可以輕鬆地將整個objects放入儲存桶中,而無需將文件分成具有固定大小邊界的blocks。這種完整儲存方式使objects成為不常更新數據集的理想選擇。objects儲存往往是企業為一次寫入但多次讀取的數據(WORM)選擇的常見解決方案。隨著您的需求不斷增長,它具有高度可擴展性,它採用多餘構建(redundancy)以確保數據始終可用,並且降低總體 TCO 具有成本效益。

您應該在哪裡考慮適合您業務的objects儲存方案?

  objects儲存並不適用於所有工作負載和使用情境,但肯定有很多適用的地方。試著定義一下在一個低I/O工作負載下且資料不斷地在成長,但你的企業沒有過多的預算可以供應時,想一想您可以如何少量的消耗儲存空間,但同時保持簡易性。以下是一些可能有幫助的指南:

  • 長期保留 – 法規遵從性數據(regulatory compliance data)、WORM數據
  • 備份 – 數據庫轉儲、記錄檔(log files)、現有軟體(例如:Commtrade HYCU、Commvault)的備份
  • DevOps – 單一全局命名空間,使用簡單的PUT和GET請求輕鬆取得圖像和工件管理
  • 非結構化數據 – 媒體文件、文檔、靜態影像、音樂和影片文件
  • 擁有大數據集的行業:
  • 醫療保健 – 電子病歷、數位影像、PACS 系統數據
  • 金融 – 交易平台、電子郵件/IM 系統數據、監管檔案系統數據
  • 靜態網頁內容 – 用於網站的大型 HTML 文件和圖像

結論

  有幾個不同的儲存選項可以考慮,無論您是在更新數據中心、擴展它,還是只是在尋找更新穎的技術。請記住,使用適當的儲存解決方案可以繼續推動您的業務發展並讓您的用戶滿意。傳統架構設計通常通過單獨的解決方案提供files、blocks和objects,但是現代設計可以利用相同的物理儲存後端將所有這些作為集成解決方案提供。

※原文網址※

※點我看更多Nutanix文章※

Author: mike

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *