สมมติว่า นาย ก. และ ข. มีรายได้ต่อเดือน 15,000 และ 30,000 บาท ตามลำดับ ถ้าเปรียบเทียบเฉพาะตัวเลข จะเห็นว่านาย ข. มีเงินใช้มากกว่า นาย ก. แต่ถ้าผมให้ข้อมูลเพิ่มเติมว่า นาย ข. ต้องดูแลภรรยาที่เป็นแม่บ้านซึ่งเลี้ยงลูกอีก 1 คนอยู่ที่บ้าน ในขณะที่ นาย ก. ยังไม่มีครอบครัว นาย ก. จะยังมีเงินใช้ 15,000 บาท/เดือนเท่าเดิม ในขณะที่นาย ข. เฉลี่ยแล้วจะมีเงินใช้เดือนละ 30,000/3 = 10,000 บาท น้อยกว่านาย ก. ตรงกันข้ามกับที่ได้ข้อมูลตอนแรก
เช่นเดียวกับเวลาเราได้ยินจำนวนผู้ป่วยโควิด-19 ของแต่ละจังหวัด หรือแต่ละประเทศในแต่ละวัน
‘ตัวหาร’ ทำให้เห็นขนาดที่แท้จริง
ยกตัวอย่างตัวเลขเมื่อวันที่ 14 เม.ย. อเมริกามีผู้ป่วยสูงสุด 587,597 ราย รองลงมาเป็นสเปน 172,541 ราย และอิตาลี 159,516 ราย แต่สาเหตุที่อเมริกามีจำนวนผู้ป่วยมากที่สุด อาจเป็นเพราะอเมริกาเป็นประเทศใหญ่ก็ได้ ซึ่งถ้าเราหารด้วยจำนวนประชากรทั้งหมดในประเทศนั้นๆ จะพบว่าประเทศที่มีอัตราป่วยสูงที่สุดกลับเป็นสเปน เพราะมีผู้ป่วย 3,690 ราย/ประชากร 1 ล้านคน (จำนวนผู้ป่วยหารด้วยประชากรทั้งหมด แล้วคูณด้วย 1 ล้าน)
รองลงมาเป็นสวิตเซอร์แลนด์ และเบลเยียม เท่ากับ 2,982 และ 2,846 ราย/ประชากร 1 ล้านคน ตามลำดับ ซึ่งเป็นคนละลำดับกับที่จัดเรียงในตอนแรก แน่นอนว่าจำนวนนับ (count) แม้เพียง 1 รายก็เป็นตัวเลขที่มีชีวิตและต้องได้รับการตรวจรักษา แต่เพื่อความยุติธรรมในการเปรียบเทียบจำนวนผู้ป่วยแต่ละประเทศ อย่างน้อยตัวเลขนั้นควรจะมี ‘ตัวหาร’ เพราะแต่ละประเทศมีจำนวนประชากรตั้งต้นก่อนที่จะติดเชื้อไม่เท่ากัน
และเมื่อหารแล้วจะทำให้เราเห็น ‘ขนาด’ ของชิ้นเค้กที่ถูกโรคตัดออกไป ว่าแท้จริงแล้วเป็นสัดส่วน (proportion) เท่าไรจากเค้กก้อนใหญ่ทั้งหมด
โดยสัดส่วนของโรคจะแบ่งออกเป็น 2 ประเภท คือสัดส่วนที่เกี่ยวกับความป่วย (morbidity) และสัดส่วนที่เกี่ยวกับความตาย (mortality) ขึ้นอยู่กับว่าเราสนใจความเสี่ยง (risk) ในการเกิดโรคก็จะเลือกอย่างแรก หรือถ้าสนใจความรุนแรง (severity) ของโรคก็จะเลือกอย่างหลัง ซึ่งเราจะได้ยินการนำเสนอตัวเลขทั้ง 2 ประเภทนี้อยู่แล้ว เช่น “วันนี้พบผู้ป่วยรายใหม่ 34 ราย ทำให้มีผู้ป่วยสะสม 2,613 ราย และเสียชีวิต 1 ราย ทำให้มีผู้เสียชีวิตสะสม 41 ราย”
สัดส่วนที่เกี่ยวกับความป่วย
จะสังเกตว่าตัวเลขที่เกี่ยวกับความป่วยมี 2 แบบ คือ จำนวนผู้ป่วยที่เพิ่มขึ้นในช่วงระยะเวลาหนึ่ง เช่น “วันนี้พบผู้ป่วยรายใหม่ 34 ราย” ซึ่งถ้ามีตัวหารก็จะเรียกว่า ‘อุบัติการณ์’ (incidence) และอีกตัวคือ จำนวนผู้ป่วยทั้งหมดในช่วงระยะเวลาหนึ่ง เช่น “ผู้ป่วยสะสม 2,613 ราย” ซึ่งถ้ามีตัวหารจะเรียกว่า ‘ความชุก’ (prevalence) ซึ่งอาจเป็นความชุกที่จุดเวลาที่กำหนด (point prevalence) หรือในช่วงเวลาที่กำหนด (period prevalence)
โดย point prevalence จะนับเฉพาะผู้ป่วย ณ เวลานั้น เช่น ถึงแม้ขณะนี้จะมีผู้ป่วยสะสม 2,613 ราย แต่จะต้องลบด้วยจำนวนผู้ที่หายป่วยแล้ว คือ กลับบ้าน 1,405 ราย และเสียชีวิต 41 รายออกไป = 1,167 ราย หรือถ้าในการรายงานของกระทรวงสาธารณสุขของบางประเทศจะรายงานเป็นตัวเลข ‘active cases’ เพราะจะแสดงให้เห็นถึงปริมาณทรัพยากร เช่น ยา จำนวนเตียง บุคลากรทางการแพทย์ ที่กำลังถูกใช้อยู่ในปัจจุบัน
แต่ปัญหาของสัดส่วนจะอยู่ที่มี ‘ตัวเศษ’ แล้ว แต่จะหา ‘ตัวส่วน’ มาจากไหน เพราะโดยนิยามแล้วตัวเศษจะต้องรวมอยู่ในตัวส่วน และตัวส่วนจะต้องเป็นประชากรที่มีความเสี่ยงที่จะเกิดโรค (population at risk of having the condition) ยกตัวอย่าง ตัวส่วนประชากรกลุ่มเสี่ยงของมะเร็งปากมดลูกจะต้องเป็น ‘ผู้หญิง’ ดังนั้นตัวหารต้องไม่มี ‘ผู้ชาย’ รวมอยู่ด้วย หรือในกรณีนี้คือใครเป็นประชากรที่มีโอกาสได้รับเชื้อไวรัสสายพันธุ์ใหม่บ้าง?
ซึ่งถ้าเราไม่ทราบ หรือคิดว่าทุกคนในพื้นที่มีความเสี่ยงทั้งหมด เราก็จะใช้จำนวนประชากรในจังหวัดหรือประเทศนั้นเป็นตัวหาร ดังภาพที่ 2 แต่ปัญหาจะอยู่ที่ ‘ตัวส่วน’ อีกเช่นกัน เพราะส่วนใหญ่จะใช้จำนวนประชากรกลางปีตามฐานข้อมูลทะเบียนราษฎร์ ซึ่งไม่ใช่ประชากรที่อาศัยอยู่ในจังหวัดนั้นจริง ในขณะที่ ‘ตัวเศษ’ ก็อาจไม่ได้รวมอยู่ในตัวส่วน เช่น ผู้ป่วยในกรุงเทพฯ รวมผู้ป่วยชาวจีนที่เข้ามาเที่ยวช่วงเดือน ม.ค. ด้วย
สัดส่วนที่เกี่ยวกับความตาย
จากภาพที่ 1 จะสังเกตว่าสัดส่วนที่เกี่ยวกับความตายจะมี 2 แบบ (คนละแบบกับสัดส่วนความป่วย) ขึ้นกับ ‘ตัวส่วน’ อย่างแรกคืออัตราการตายต่อประชากร 1 ล้านคน จัดเป็นอัตราตายอย่างหยาบ (crude mortality rate) ซึ่งคำนวณคล้ายกับความชุกของความป่วย ใช้จำนวนผู้เสียชีวิตเป็นตัวตั้งแล้วหารด้วยจำนวน ‘ประชากร’ ทั้งหมด กับอีกอย่างคืออัตราการตายต่อการติดเชื้อ หรืออัตราป่วยตาย (case-fatality rate) ซึ่งจะหารด้วยจำนวน ‘ผู้ป่วย’ ทั้งหมด
ในทางการแพทย์จะใช้อัตราป่วยตายมากกว่า เพราะเป็นตัวเลขที่แสดงให้เห็นความรุนแรงของโรค ว่าเมื่อป่วยเป็นโรคแล้วจะมีความเสี่ยงที่จะเสียชีวิตเท่าไร? ยกตัวอย่างองค์การอนามัยโลกแถลงเมื่อวันที่ 3 มี.ค. 63 ว่าโควิด-19 มีอัตราป่วยตาย 3.4% (ณ วันที่ 3 มี.ค. 63) ในขณะที่ไข้หวัดใหญ่มีอัตราป่วยตายน้อยกว่า 1% เราจึงเห็นภาพชิ้นเค้กว่าถ้าป่วยเป็นโควิด-19 จะมีโอกาสเสียชีวิตสูงกว่าถ้าป่วยเป็นไข้หวัดใหญ่
ในขณะที่ถ้าเปรียบเทียบด้วยจำนวนผู้เสียชีวิต ในปี 2562 อเมริกาได้คาดการณ์จำนวนผู้เสียชีวิตจากไข้หวัดใหญ่เท่ากับ 34,157 ราย ส่วนในวันนี้อเมริกามีจำนวนผู้เสียชีวิตจากโควิด-19 แล้ว 23,640 ราย อาจทำให้เห็นภาพตรงกันข้าม (แต่สงครามยังไม่จบ อย่าเพิ่งนับศพทหาร จำนวนผู้ป่วยอาจเพิ่มขึ้นได้อีก และถ้ากดเครื่องคิดเลขจากจำนวนผู้ป่วยไข้หวัดใหญ่ที่เท่ากัน ในอเมริกาจะมีผู้เสียชีวิตกว่า 6 แสนราย)
นอกจากนี้อัตราป่วยตายยังสามารถใช้เปรียบเทียบระบบสาธารณสุขของแต่ละประเทศได้ ว่าเมื่อป่วยเป็นโรคแล้ว จะสามารถรองรับและรักษาผู้ป่วยไม่ให้เสียชีวิตได้เท่าไร? โดยเมื่อเปรียบเทียบประเทศที่มีผู้ป่วยสูงสุด 10 อันดับด้วยอัตราป่วยตายแล้วจะมีกลุ่มประเทศที่มีอัตราป่วยตายสูง ได้แก่ เบลเยียม (13.4%) อิตาลี (13.0%) อังกฤษ (12.9%) กับอีกกลุ่มที่มีอัตราป่วยตายต่ำ ได้แก่ ตุรกี (2.2%) เยอรมนี (2.6%) จีน (4.1%) เป็นต้น
ทั้งนี้อาจเปรียบเทียบได้คร่าวๆ เท่านั้น เพราะยังมีปัจจัยอื่นที่มีผลต่ออัตราป่วยตาย เช่น โครงสร้างประชากร เพราะยิ่งผู้ป่วยโควิด-19 อายุมาก ยิ่งมีความรุนแรงมาก โดยสถิติจากจีนและอิตาลีตรงกันว่าอัตราป่วยตายในวัยรุ่นและผู้ใหญ่ตอนต้นจะน้อยกว่า 1% เมื่ออายุมากกว่า 50 ปีขึ้นไปอัตราป่วยตายจะเริ่มสูงกว่า 1% และเพิ่มขึ้น 2-3 เท่าทุกๆ 10 ปี ดังนั้นถ้าจะเปรียบเทียบกันอาจต้องปรับมาตรฐาน (standardization/adjustment) ด้วยตัวแปรอายุด้วย
เท่านี้ยังไม่จบความยุ่งยากของอัตราป่วยตาย เพราะในระหว่างที่ยังมีการระบาดของโรคอยู่ ผู้ป่วยจำนวนมากยังไม่สิ้นสุดการรักษา ส่งผลให้ยังไม่ทราบว่าผู้ป่วยที่นอนโรงพยาบาลอยู่ในขณะนี้จะ ‘หาย’ หรือ ‘เสียชีวิต’ และจากสถิติจากจีนผู้ป่วยมักจะกลับบ้านได้ (ไม่แบบใดก็แบบหนึ่ง) ภายใน 15-25 วันหลังจากเริ่มมีอาการป่วย จึงมีผู้เสนอให้เปลี่ยน ‘ตัวหาร’ ใหม่ เช่น
-
ใช้จำนวนผู้ป่วยย้อนกลับไป T วัน เมื่อ T คือจำนวนวันเฉลี่ยที่นับจากผู้ป่วยได้รับการวินิจฉัยจนถึงผู้ป่วยเสียชีวิต (average time period from case confirmation to death) แทน เช่น สมมติให้ T = 10 วัน ตัวหารจะไม่ใช่จำนวนผู้ป่วยวันนี้ แต่เป็นวันที่ 14-10 = 4 เม.ย. ซึ่งมีจำนวนผู้ป่วย 2,067 ราย ดังนั้นอัตราป่วยตายจะเท่ากับ 2.0% ไม่ใช่ 1.6% ถ้าคิดแบบธรรมดา
-
ใช้จำนวนผู้ป่วยที่ทราบผลการรักษาแล้ว (closed cases) คือ ผู้เสียชีวิต+ผู้ป่วยกลับบ้านแทน เช่น วันนี้ประเทศไทยมีจำนวนผู้เสียชีวิต+ผู้ป่วยกลับบ้าน =41+1,405 = 1,446 ราย จะคิดอัตราป่วยตายได้เท่ากับ 2.8% ซึ่งตัวเลขที่ได้จากวิธีนี้จะสูงกว่าวิธีอื่น และเมื่อนำไปใช้กับผู้ป่วยทั้งโลกซึ่งมีผู้เสียชีวิต 126,708 รายจะได้อัตราป่วยตายสูงถึง 20.9% เลยทีเดียว
ข้อจำกัดบางอย่าง
โดยสรุปสถานการณ์การระบาดของโควิด-19 รอบนี้ ทำให้เราได้รู้จักกับตัวเลขทางระบาดวิทยาหลายตัว ซึ่งแต่ละตัวมีนิยามต่างกัน จึงทำให้มีการนำไปใช้ประโยชน์ต่างกัน ในบทความนี้ผมพูดถึงการจัดอันดับระหว่างพื้นที่ ไม่ว่าจะเป็นจังหวัดหรือประเทศ ดังนั้นตัวเลขที่นำมาใช้ควรจะมี ‘ตัวหาร’ หรือทำให้เป็น ‘สัดส่วน’ เสียก่อนถึงจะเปรียบเทียบกันได้ นอกจากนี้ตัวเลขหลายตัวยังมี ‘ข้อจำกัด’ ที่เราควรนึกถึงก่อนจะแปลผลทุกครั้ง ยกตัวอย่าง
จำนวนผู้ป่วยที่รายงานคือผู้ป่วยที่มีอาการแล้วเข้ามารับการตรวจในโรงพยาบาล หรือเป็นผู้สัมผัสที่อาจมีหรือไม่มีอาการ แต่ได้รับการตรวจจากการสอบสวนโรค หากการตรวจไม่ครอบคลุมกลุ่มเสี่ยงที่ควรได้รับการตรวจทั้งหมดก็จะทำให้จำนวนนี้ไม่เป็นตัวแทนของผู้ป่วยจริงในพื้นที่ หรือถ้าการตรวจครอบคลุมมากสามารถวินิจฉัยผู้ที่ติดเชื้อโดยไม่แสดงอาการ (asymptomatic infection) มาได้ทั้งหมด ‘ตัวหาร’ ก็จะมาก ทำให้อัตราป่วยลดลงได้
และหากจะเปรียบเทียบระหว่างประเทศหรือรวมตัวเลขเป็นก้อนเดียวกันก็ต้องตรวจสอบเกณฑ์การวินิจฉัยว่าแต่ละประเทศใช้เหมือนกันหรือไม่?
ส่วนผู้เสียชีวิตก็ยังต้อง ‘นิยาม’ อีกว่าผู้ป่วยแบบไหนถึงจะจัดเป็นผู้เสียชีวิตของโควิด-19 เช่น ผู้ป่วยโรคปอดอักเสบจากโควิด-19 ได้รับการใส่ท่อช่วยหายใจ และได้รับยาต้านไวรัสครบแล้ว อาการดีขึ้น ต่อมาเกิดการสำลักติดเชื้อแบคทีเรียแทรกซ้อนจะนับอยู่ในตัวเลขผู้เสียชีวิตหรือไม่? หรือถ้าเป็นผู้ป่วยโควิด-19 กำลังพักฟื้นอยู่ที่โรงพยาบาลสนามแต่พลัดตกตึกเสียชีวิตจะนับด้วยหรือเปล่า? ตรงนี้จะเป็นหน้าที่ของกรมควบคุมโรคในการกำหนดข้อตกลงขึ้นมา
เพราะฉะนั้น (สรุปของโดยสรุปอีกที) ควรจะเปรียบเทียบสถิติโควิด-19 ระหว่างประเทศด้วยตัวเลขใด? สำหรับผมแล้วจะขึ้นกับว่าเราสนใจความเสี่ยงหรือความรุนแรง การใช้ทรัพยากรที่จุดเวลาใดเวลาหนึ่งหรือตลอดระยะช่วงที่มีการระบาด และปัจจัยอื่นที่อาจมีผลต่อการเปรียบเทียบทำให้อาจมีการปรับมาตรฐานด้วยตัวแปรนั้นก่อน และที่สำคัญตัวเลขทุกตัวมีทั้งข้อดีและจุดด้อย ดังนั้นต้องระมัดระวังในการแปลผล
Tags: สถิติ, โควิด-19, กราฟ