跳至主要内容

容量規劃

本文件盤點目前的運算、儲存和網路資源,評估使用率,並識別擴展選項。

運算資源

指標總計備註
伺服器總數5皆為 x86_64
CPU 核心總數120 個實體核心(01:32 + 02:32 + 04:24 + 05:24 + 06:8)
活躍運算 CPU 核心112 個實體核心(01:32 + 02:32 + 04:24 + 05:24)不含 openstack06(無運算角色)
RAM 總計1,728 GB(01:512 + 02:512 + 04:256 + 05:256 + 06:192)
活躍運算 RAM1,536 GB(01:512 + 02:512 + 04:256 + 05:256)不含 openstack06(無運算角色)
Hypervisor4 個活躍(01、02、04、05)

儲存資源(Ceph)

層級裝置類別原始容量可用容量(複寫後)主機
NVMenvme~24.9 TiB~8.3 TiB(3x 複寫)01、02、04
SATA SSDsata_ssd~4.4 TiB~2.2 TiB(2x 複寫)01、02、05
HDDhdd~87.3 TiB~29.1 TiB(3x 複寫)04、05、06
總計全部~112.6 TiB 原始~39.6 TiB 可用5 台主機

網路資源

鏈路頻寬備註
每節點上行50 Gbps(2x25G LACP)至 Arista 核心交換器
上游200 Gbps(2x100G LACP 至 AS 38008)網際網路 transit
管理每節點 1 Gbps經由 EX3300 管理交換器

擴展選項

1. 新增運算節點

新伺服器可連接至 Arista 核心交換器,該交換器有多個未使用的 100G 埠可用。Kolla-Ansible 可納入新的運算主機,Ceph 可從其本地磁碟新增 OSD。

2. 新增儲存容量

額外的磁碟可插入現有伺服器(若有可用的磁碟槽),或可將新的僅 OSD 節點加入 Ceph 叢集。這是擴展特定儲存層級最簡單的方式。

3. 網路擴展

Arista DCS-7060CX-32S 有 20 個以上未使用的 100G 埠,提供充足的空間用於額外的伺服器連線或上行鏈路。目前 200 Gbps 的上游在短期內不太可能成為瓶頸。

目前的瓶頸

主要限制在於維運面而非容量面:

  • NVMe 主機僅限 3 台:這是 size=3 複寫的最低要求。失去一台 NVMe 主機將使 pool 面臨風險。
  • SATA SSD pool 為 size=2:相比其他層級保護不足。詳見高可用性分析