提要:目前,國內自主研發的文件系統可謂鳳毛麟角。淘寶在這一領域做了有效的探索和實踐,TaobaoFileSystem(TFS)作為淘寶內部使用的分布式文件系統,針對海量小文件的隨機讀寫訪問性能做了特殊優化,承載著淘寶主站所有圖片、商品描述等數據存儲。
文章首先概括了TFS的特點:
TFS是什么
TFS,TaobaoFileSystem,淘寶內部使用的分布式文件系統,主要針對海量小文件的隨機讀寫訪問性能做了特殊優化,承載著淘寶主站所有圖片、商品描述等數據的存儲。
TFS有什么特點
1.完全扁平化的數據組織結構,拋棄了傳統文件系統的目錄結構。
2.在塊設備基礎上建立自有的文件系統,減少EXT3等文件系統數據碎片帶來的性能損耗
3.單進程管理單塊磁盤的方式,摒除RAID5機制
4.帶有HA機制的中央控制節點,在安全穩定和性能復雜度之間取得平衡。
5.盡量縮減元數據大小,將元數據全部加載入內存,提升訪問速度。
6.跨機架和IDC的負載均衡和冗余安全策略。
7.完全平滑擴容
TFS在淘寶的應用規模
1.數百臺PCServer
2.PB級數據量3.百億數據級別TFS的性能參數
TFS在淘寶的部署環境中前端有兩層緩沖,到達TFS系統的請求非常離散,所以TFS內部是沒有任何數據的內存緩沖的,包括傳統文件系統的內存緩沖也不存在。我們主要的性能參數不是IO吞吐量,而是單臺PCServer提供隨機讀寫IOPS。由于大家硬件型號不同,當然也是因為一些技術保密的原因,我們很難給出一個參考值來說明性能。但基本上我們可以達到單塊磁盤隨機IOPS理論最大值的60%左右,整機的輸出隨盤數增加而線性增加。
TFS的邏輯架構圖
以上是TFS的一個簡要的應用情況和架構介紹,后續將逐步豐富,歡迎大家拍磚。并再次做個廣告,TFS計劃在今年9月份建立開源社區,請大家支持。
文章發表以后,讀者反響熱烈,在評論中提出了各種問題與作者楚材進行技術交流,由此可見國內社區對自主研發文件系統的關注程度。(編輯:燕青)
來源: 億邦動力
?