ที่ มหาวิทยาลัยเกษตรศาสตร์ บางเขน กรุงเทพฯ www.ku.ac.th/netday2006
มีผู้เข้าฟังบรรยายค่อนข้างมากใช้เวลา 1 ชั่วโมง โดยเนื้อหาที่ส่วนหนึ่งที่ผมได้บรรยายไว้ และอยากจะบอกกล่าว เล่าสู่กันฟัง เอาแบบย่อๆ นะครับ โดยผมจะอธิบายเฉพาะวิธีการวัด และคำนวณ ค่า Availability นะครับ
ความแตกต่างระหว่าง Availability และ Reliability (Different of Availability and Reliability)
ตัวอย่าง รถยนต์คันหนึ่งมีค่า โอกาสที่จะเสียหรือซ่อมบำรุงคิดเป็น 5% ของอายุรถ นั่นคือ ใน 100 วันรถคันนี้มีโอกาสเสีย 5 วัน
และรถมีโอกาสใช้งานได้ 95 วัน นั่นคือรถคันนี้มีค่า Reliability 95% และ Availability 95% ด้วยเช่นกัน
แต่ถ้ารถยนต์คันนี้ถูก share โดย 2 ครอบครัวดังนั้นรถคันนี้ แต่ละครอบครัวจะมีโอกาสใช้รถคันนี้เพียง 50% ของ 95% ซึ่งเท่ากับ 45.5%
นั่นคือ Availability ของรถคันนี้ของแต่ละครอบครัวคือ 45.5% โดยที่ค่า Reliability ของรถคันนี้ยังคงเป็น 95%
และถ้าเราต้องการ Improve ค่า Availability ให้เพิ่มขึ้นคือ ซึ้อรถเพิ่มอีก 1 คัน
เราลองมาดูระบบเครือข่ายบ้างนะครับ ค่า Reliability ของอุปกรณ์เครือข่ายที่มาจากโรงงานนั่นคือค่า MTBF (Mean Time Between Failures)
โดยค่า Availability หาได้จาก Availability=MTBF/(MTBF+MTTR)
MTTR=Mean Time To Recovery or Repair คือเวลาที่อุปกรณ์ใช้ในการ recovery เพื่อกลับมาทำงานได้ตามปกติ ซึ่งอุปกรณ์
ที่ไม่ได้ถูกออกแบบให้เป็น Failover ค่านี้คือเวลาที่ Vendors ใช้ในการนำอุปกรณ์ Spare มาเปลียนและทำให้ระบบกลับมาใช้งานได้ ซึ่งแล้วแต่
ว่าเราจะตกลงกันไว้ที่กี่ชั่วโมง เช่น 4 ชั่วโมง หรือ 6 ชั่วโมง
ดูสูตรการคำนวณอีกครั้งนะครับ
จากสูตรข้างต้น จะเห็นได้ว่าถ้ายิ่งค่า MTTR ยิ่งน้อย ค่า Availability จะเข้าใกล้ 100%แต่ถ้าค่า MTBF มากพอค่า MTTR จะยิ่งไม่มีผลต่อค่า Availability เลย
ดังแสดงในกราฟข้างล่างนะครับ โดยที่
แกน X เป็นค่า MTBF หน่วยเป็นชั่วโมง
แกน Y เป็นค่า Availability สูงสุดที่ 100%
เส้นกราฟ สีฟ้า มีค่า MTTR = 1 ชั่วโมง
เส้นกราฟ สีเหลือง มีค่า MTTR = 4 ชั่วโมง
เส้นกราฟ สีม่วง มีค่า MTTR = 9 ชั่วโมง
เส้นกราฟ สีน้ำเงิน มีค่า MTTR = 16 ชั่วโมง
การคำนวณค่า Availability ของอุปกรณ์ (Availability of a device)
Example:
# Layer 2 switch with non-PoE has MTBF of 200,000 hours and MTTR value of 4 hours
Availability = 200,000 / 200,004 = 0.99998
# Derive downtime
1 year = 525,960 minutes
Downtime = (1-Availability) * 525,960
= 0.00002 * 525,960
= 10.5192 minutes
#This device with an availability of 0.99998 will suffer from 10.5192 minutes of downtime
การคำนวณค่า Availability ของระบบ (Availability of Group)
ตัวอย่างการคำนวณค่า Availability ของระบบที่มี topology แบบ Serialโดยกำหนดค่า Availability ของอุปกรณ์เป็นดังนี้
Availability ของ Router A และ B = 0.9995 หรือ 99.95%
Availability ของ Switch A และ B = 0.9999 หรือ 99.99%
จะเห็นได้ว่าค่า Availability ของระบบจะลดลงเป็น 0.9988 หรือ 99.88% และทำให้มีโอกาสเกิดdowntime ใน 1 ปีแบบตลอด 24 ชั่วโมง (โดยคิดจาก 60x24x365.25=525,960) เป็น 631 นาทีต่อปี
ตัวอย่างการคำนวณค่า Availability ของระบบที่ improve โดยการต่อแบบ Parallel

จากตัวอย่างทั้ง 2 แบบข้างต้นจะเห็นว่าเมื่อเรา design network เป็นแบบ parallel จะ improve ค่า Availability ขึ้นจาก 99.88% เป็น 99.9799% และลดค่า downtime จาก 631 นาทีต่อปี เป็น
105 นาทีต่อปี ได้
เมื่อระบบ network ที่เรา design ไว้ทำงานได้ค่า Availability ที่เราวัดจาก NMS (Network Management System)
ปกติจะเทียบกับ 1 ปี (24 ชั่วโมง) ค่า Availability ที่ได้จะถูกเรียกแตกต่างกันไปตาม range ต่างๆ ดังนี้
# ระบบที่มีค่า Availability ตั้งแต่ 99.99%-99.999% หรือ Five Nines เราจะเรียกระบบนั้นว่า Fault Tolerance (FT)# ระบบที่มีค่า Availability ตั้งแต่ 99.9%-99.99% หรือ Four Nines เราจะเรียกระบบนั้นว่า Fault Resilience (FR) บางทีระบบนี้อาจเรียกว่า Fault Tolerance ได้เช่นกัน
# ระบบที่มีค่า Availability ตั้งแต่ 99.5%-99.9% หรือ Three Nines เราจะเรียกว่าระบบนั้นมีค่า High Availability (HA) แต่บางทีอาจจะคิดค่าจนถึง 99.99% ว่า HA ได้เช่นกัน
รายละเอียดเพิ่มเติมของค่า Availability

ถ้าท่านใดต้องการรายละเอียดการคำนวณรวมทั้งเทคนิคที่ใช้ในการ imporve ค่า Availability ติดต่อผู้เขียนได้นะครับ
wasan@netsunshine.com
ขอบคุณครับ
No comments:
Post a Comment