跳至主要内容

Ceph 叢集拓撲

本頁記錄 Ceph daemon 配置、OSD 佈局、容量及 I/O 特性。所有資料來源為透過 cephadm shell 進行的即時叢集檢查。


叢集識別資訊

參數數值
版本Tentacle(Ceph 20.x,Squid 的後繼版本)
部署方式Cephadm(容器化 daemon)

Daemon 配置

Daemon 摘要

Daemon 類型數量主機
MON3openstack01(leader)、openstack02、openstack04
MGR2openstack02(active)、openstack01(standby)
OSD17openstack01(3)、openstack02(5)、openstack04(4)、openstack05(3)、openstack06(2)
RGW3openstack01、openstack02、openstack04(single zone)
Crash5每台 OSD 主機各一個

MON daemon 在 Ceph public 網路(192.168.114.x)上監聽 port 3300(v2 協定)和 6789(v1 舊版協定)。


OSD Map

主機OSD ID裝置類別權重(TiB)實體磁碟
openstack01osd.3nvme3.49Samsung PM983 3.84 TB (MZ4LB3T8HMLA)
openstack01osd.6nvme3.49KIOXIA CD6 3.84 TB (KCD61LUL3T84)
openstack01osd.2sata_ssd1.46Intel SSDSC2BB01 1.6 TB
openstack02osd.0nvme1.75KIOXIA CD6 (KCD61LUL3T84) 1.92 TB — nvme0 ns1
openstack02osd.1nvme1.75KIOXIA CD6 (KCD61LUL3T84) 1.92 TB — nvme0 ns2
openstack02osd.5nvme1.75KIOXIA CD6 (KCD61LUL3T84) 1.92 TB — nvme1 ns1
openstack02osd.10nvme1.75KIOXIA CD6 (KCD61LUL3T84) 1.92 TB — nvme1 ns2
openstack02osd.17sata_ssd1.46Intel SSDSC2BB01 1.6 TB
openstack04osd.8hdd14.55Seagate EXOS X18 16 TB (ST16000NM000J)
openstack04osd.37hdd14.55Toshiba MG08-D 16 TB (MG08ACA16TE)
openstack04osd.9nvme3.49Samsung PM983 3.84 TB (MZ4LB3T8HALS)
openstack04osd.13nvme3.49Samsung PM983 3.84 TB (MZ4LB3T8HALS)
openstack05osd.7hdd14.55WD Ultrastar DC HC550 16 TB (WUH721816AL)
openstack05osd.11hdd14.55Seagate 16 TB (ST16000NM001G)
openstack05osd.4sata_ssd1.46Intel SSDSC2BB01 1.6 TB
openstack06osd.12hdd14.55Seagate EXOS X18 16 TB (ST16000NM000J)
openstack06osd.34hdd14.55Seagate EXOS X18 16 TB (ST16000NM000J)

全部 17 個 OSD 狀態均為:upin


CRUSH 階層結構

所有主機位於 CRUSH tree 中的單一 rack(ty6)下:

root: default
rack: ty6
host: openstack01 (8.44 TiB)
host: openstack02 (8.46 TiB)
host: openstack04 (36.08 TiB)
host: openstack05 (30.56 TiB)
host: openstack06 (29.10 TiB)

完整的 CRUSH 規則定義及 failure domain 分析請參閱 CRUSH Map 與規則


網路

網路子網路VLAN介面用途
Public192.168.114.0/241114bond0(native)MON 通訊、用戶端 I/O(RBD、RGW)
Cluster192.168.115.0/241115bond0.1115OSD 複製、復原、backfill

兩個網路均在 Arista 資料平面 fabric 上運行,MTU 為 9000(jumbo frames),以降低大型循序 I/O 的每封包額外負擔。