HCI on Windows

a bunch of wires that are connected to a wall

Hyperconverged infrastructure (HCI) เป็นการรวม local disk จากแต่ละ node ใน cluster ให้เป็น shared storage สำหรับทุก node ใน cluster โดยไม่ต้องใช้ external shared storage เช่น SAN หรือ NAS

ใน Windows เราสามารถสร้าง HCI ได้ด้วย hardware ทั่วไปที่ติดตั้ง Windows Server Datacenter edition ได้, สร้าง cluster, enable Software-defined Storage (SDS) ด้วย Storage Spaces Direct (S2D),
จะเพิ่ม software-defined-networking (SDN) ด้วยก็ได้, และติดตั้ง Hyper-V เพื่อรัน virtual machines (VMs)

ค่าใช้จ่ายของโซลูชั่นนี้จะอยู่ที่ Windows Server Datacenter edition license และฮาร์ดแวร์ทั่วไปที่ซื้อมาครับ


RDMA

HCI ไม่ต้องใช้ Remote Directory Memory Access (RDMA) network interface card (NIC) สำหรับ storage traffic ก็ได้ แต่ RDMA (RoCE v2 หรือ iWARP) จะช่วยให้ SMB Direct มีประสิทธิภาพสูงขึ้น ลด CPU Overhead และเพิ่ม Throughput

ถ้าใช้ RoCE v2 ควรใช้ RDMA-capable Switch เพื่อให้เครือข่ายทำงานเต็มประสิทธิภาพด้วย ถ้าใช้ iWARP ใช้ Switch ปกติได้

แต่ switch ที่รองรับ RDMA (RoCE v2) เช่น Mellanox, Cisco Nexus อาจมีราคาสูงกว่าสวิตช์ 10/25GbE ทั่วไป 20-50%


Local disks

Local disk แบบ SSD หรือ NVMe ก็จะเร็วกว่า HDD ตามลำดับ แต่ราคาจะแพงกว่าตามลำดับ เราอาจเลือก local disks แบบผสม โดย NVMe + SSD จะให้ประสิทธิภาพสูง รองลงมาอาจเป็น SSD + HDD สำหรับการ balance ราคากับความเร็ว และ all HDD ที่ประหยัดที่สุด แต่อาจจะช้าเกินไปหากใช้งานใน production


Network paths

Network traffic ของ HCI ประกอบด้วย management, live migration, storage, และ cluster heartbeat

ใน converged ethernet ที่มีความเร็วสูงเราอาจใช้ path เดียวได้ แต่ network ที่มีอย่างน้อย 2 path คือ management network สำหรับคุยกับ AD DS, remote management และ storage/cluster network สำหรับ S2D, live migration, และ cluster communication จะทำงานได้ดีกว่า


2-node HCI

ถ้ามี 2 node เราใช้สาย crossover แทน storage switch ก็ได้ 2-node จะประหยัดจำนวน hardware แต่ในขณะที่ระบบกำลังทำงานอยู่ เราจะเสีย disk ได้แค่ลูกเดียวต่อ 1 volume แต่ถ้าเรา spare disk เปล่าไว้ระบบก็จะนำ spare disk แทนลูกที่เสียและ recover ชิ้นส่วนของข้อมูลลงไป ให้ volume กลับมา healthy โดยอัตโนมัติ


จำนวน node ที่เหมาะสม?

HCI บน Windows Server รองรับ 2 -16 node แต่จำนวน 3 node ขึ้นไป จะรองรับ failover ได้ดีกว่า 2 node

ระบบที่เราเห็นทั่วไปจึงแนะนำ 4 node, ใช้ RDMA storage network, ใช้ RDMA-capable Switch (ถ้าใช้ RoCE v2)ม และใช้ NVMe หรือ SSD ใน storage pool


Azure Stack HCI (Azure Local)

Azure Stack HCI ก็เป็น HCI ของ Microsoft ตัวนึงเหมือนกัน ตามแนวคิดการยืด Azure datacenter มาที่ on-premises ตอนนี้เปลี่ยนชื่อเป็น Azure Local แล้ว เขาใช้ Azure Stack HCI OS, ใช้ certified hardware, คิดค่าใช้จ่ายผ่าน Azure subscription ในขณะที่ Azure Stack HCI ใช้ Azure Stack HCI OS, คิดค่าใช้จ่ายผ่าน Azure subscription, และต้องใช้ Certified Hardware บริหารจัดการผ่าน Azure portal

HCI บน Windows เป็นโซลูชัน HCI ที่ยืดหยุ่น เหมาะสำหรับองค์กรที่ต้องการโครงสร้างพื้นฐานแบบ on-premises ที่ปรับแต่งได้เอง และไม่ต้องการผูกติดกับ Azure Stack HCI หรือ Subscription-based Licensing ครับ


ตัวอย่าง clip จะเป็น 2-node HCI สร้างด้วย PowerShell ลองบริหารจัดการผ่าน Windows Admin Center (WAC) ยังใช้งานได้ไม่ค่อยดีเท่าไหร่ และใช้ classic tool Failover Cluster management ทดสอบการ failover ไปมาของ VMs และ HCI node นะครับ


Ref.

Total
0
Shares
Leave a Reply

Your email address will not be published. Required fields are marked *