06 พฤษภาคม 2556

นัยสำคัญทางสถิติ - นัยสำคัญทางปฏิบัติ


เรียน คุณหมอสันต์ ใจยอดศิลป์

ผมได้ติดตามบทความใน blog ของคุณหมอมาได้ไม่นานนักพบว่าเป็นประโยชน์กับประชาชนทั่วไปที่ต้องการความรู้และคำแนะนำในเรื่องสุขภาพเป็นอย่างมาก คุณหมอให้ความรู้ ตอบคำถามและให้ข้อมูลข้อเท็จจริงในทางวิชาการอย่างตรงไปตรงมา ในแนวทางอย่างเป็นวิทยาศาสตร์ ทุกวันนี้ข่าวสารต่างๆเกี่ยวกับสุขภาพมีมากมายท่วมท้น ยิ่งทาง Internet ด้วยแล้วเชื่อได้บางเชื่อไม่ได้บ้าง ไม่มีการอ้างอิงแหล่งที่มาของข้อมูล

ผมได้อ่านบทความเรื่อง "Physician Health Study สิ่งที่คนบ้าวิตามินตั้งตาคอย" (22 ตุลาคม 2555) และ เรื่อง "Physician Health Study ภาค 2 อกหักซ้ำสองของคนบ้าวิตามิน" (14 มีนาคม 2556) อยากจะให้ความเห็นเพิ่มเติมในเชิงวิชาการทางสถิติที่เกี่ยวกับการสรุปผลทางสถิติของการวิจัยเรื่องนี้ ซึ่งตรงกับข้อสรุปที่คุณหมอได้เขียนไว้ในตอนท้าย

แม้ว่าการทำงานวิจัยจะทำในแบบ Randomized Controlled Experiment ใช้กลุ่มตัวอย่างจำนวนมากพอ และผลที่ได้มีนัยสำคัญทางสถิติ (p<0 .05="" lang="TH" span="">ซึ่งมีความน่าเชื่ิอถือทีสุดก็ตาม ในการนำผลสรุปทางสถิติไปใช้ก็ต้องคำนึงถึงความมีนัยสำคัญในทางปฏิบัติด้วย พูดง่ายๆว่า การมีนัยสำคัญทางสถิติ (statistical significance) ไม่จำเป็นว่าจะมีนัยสำคัญในทางปฏิบัติ (practical significance) ผลงานวิจัยในเรื่องนี้มีความแตกต่างของอัตราการอุบัติของโรคมะเร็งในกลุ่มตัวอย่างเพียง 0.13% ถือได้ว่าไม่มีนัยสำคัญในทางปฏิบัติ (ในความเห็นของผม) คน 1000 คน กินวิตามินทุกวันเป็นเวลาตั้ง 10 ปี เป็นมะเร็งน้อยกว่าคนที่ไม่ได้กินเพียง 1 คน


ในทางสถิตเราสามารถออกแบบการทดลองให้มี sensitivity สูงๆ (สามารถ detect ความแตกต่างที่น้อยมากๆได้โดยมีนัยสำคัญทางสถติ) ได้โดยใช้กลุ่มตัวอย่าง (sample size) มากๆ ซึ่งก็เป็นที่ต้องการ เช่น ในงานวิจัยชิ้นนี้ใช้กลุ่มตัวอย่างถึง 2 x 7320 เราอาจออกแบบการทดลองให้สามารถตรวจพบความแตกต่างที่น้อยเพียง 0.01% โดยที่มีนัยสำคัญทางสถิติก็ทำได้ แต่มันมีความหมายในทางปฏิบัติหรือไม่เป็นสิ่งที่นักวิจัยและผู้ที่จะนำผลสรุปไปใช้ต้องคำนึงถึง อีกวิธีหนึ่งที่ใช้กันคือ มีการตั้งเป้าหมายของความแตกต่างที่คิดว่ามีนัยสำคัญในทางปฏิบัติใว้ล่วงหน้าก่อนการทดสอบนัยสำคัญทางสถิติ เช่น ในกรณีนี้อาจตั้งเป้าหมายว่าหากการกินวิตามินให้ผลในการลดการเป็นมะเร็งได้ 5% จึงจะถือว่าได้ผลหรือ effective วิธีนี้ถ้าความแตกต่างเกิดไม่ถึง 5% ก็จะถือว่าไม่มีนัยสำคัญ

ขอแสดงความนับถือ


…………………………………

ตอบครับ

แฮ้.. ดีใจ

“...ดีใจ เอ๊ยใครจะเหมือน
มีเมียสี่เดือนลูกเคลื่อนออกมาคน
ลูกเราช่างงามเหลือล้น
ผมขาวตาข้น...เอ๊ะชักยังไหง่...”

     เนื้อเพลงไม่เกี่ยวกับเรื่องหรอกครับ เกี่ยวแต่คำว่า “ดีใจ” พอดีใจแล้วผมก็เลยนึกเพลงนี้ขึ้นได้ เป็นเพลงลูกทุ่งไร้อันดับสมัยผมเด็กๆ เนื้อหาประชดประชันเมียเช่าช่วงสงครามเวียดนามซึ่งชอบมี ผ. สองคน ท่านผู้อ่านสมัยนี้คงเกิดไม่ทันหรอกครับ อย่าไปสนใจเลย มาเข้าเรื่องของเราดีกว่า  

     ที่ดีใจเพราะมีคนอ่านบล็อกของผมแบบอ่านเอาเรื่องจริงๆจังๆด้วย แทนที่จะแค่อ่านเอาม่วน แล้วจดหมายที่เขียนมานี้ก็แสดงว่าคนอ่านบล็อกของผมเนี่ย ขอโทษ ขอนุญาตใช้ภาษาจิ๊กโก๋นะครับ.. ไม่ใช่ขี้ขี้นะเนี่ย

     ประเด็นที่ท่านผู้อ่านได้วิสัชนามาดังข้างบนนี้นั้น มัน “เน็ดขนาด” จนผมต้องขอเอามาย้ำอีกที ว่าอย่าไปได้ปลื้มกับนัยสำคัญทางสถิติเสียตะพึด เพราะนัยสำคัญทางสถิตินั้น make ขึ้นมาได้ด้วยการใช้กลุ่มตัวอย่างที่ใหญ่มากพอ นี่เป็นประเด็นที่ดีแต๊ดีว่า เพราะแม้แต่แพทย์ทั่วโลก เวลาประชุมกันในระดับนานาชาติก็มีอยู่ไม่น้อยที่ผมแอบเห็นว่าข้อคอมเมนต์ของเขาในที่ประชุมแสดงว่าเขาได้ถูกนัยสำคัญทางสถิติลากเข้าป่าไปเสียแล้ว เลยกลายเป็นยี่ปั๊วให้ห้างยาโดยไม่ได้รับค่าจ้างอีกต่างหาก

    ท่านผู้อ่านท่านนี้ได้กระตุกให้ทุกท่านว่าเมื่อตีความผลวิจัยที่มีนัยสำคัญทางสถิติ ให้คำนึงถึงนัยสำคัญทางปฏิบัติด้วย ซึ่งผมก็ถือว่านัยสำคัญทางปฏิบัติเป็นประเด็นสำคัญไม่แพ้เรื่องนัยสำคัญทางสถิติเอง ในทางการแพทย์ได้ใช้ดัชนีคำหนึ่งมาบอกนัยสำคัญทางปฏิบัติ คือคำว่า “number needed to treat” หรือ NNT ซึ่งผมขออนุญาตแปลแบบลูกทุ่งว่า “จำนวนคนที่ถูกจับกรอกยา” หมายความว่าการจะป้องกันผลร้าย (เช่นเป็นมะเร็ง) ไม่ให้เกิดขึ้นหนึ่งครั้ง เราต้องเอาคนมากรอกยา (เช่นวิตามิน) ทุกวัน กี่คน จึงจะป้องกันไม่ให้คนเป็นมะเร็งได้หนึ่งคน

     ว่าจะจบแล้วแต่ก็ยังไม่อยากจบ ยังคันปากอยากจะพูดต่อ ไหนๆก็มีคนหาเรื่องปวดหัวขึ้นมาคุยแล้ว เราก็มาปวดหัวต่อไปให้มันสุดๆก็แล้วกันนะครับท่านผู้อ่าน เพราะวันนี้ผมไม่กลัวเรื่องปวดหัว เนื่องจากอารมณ์ดีที่เพิ่งกลับจากไปทำเช็ดที่ไร่มวกเหล็กมาจนสำเร็จแล้วหนึ่งหลัง คำว่า “เช็ด” นี้ไม่ได้หมายถึงไปเช็ดไปล้างอะไรนะครับ แต่หมายถึง garden shed ซึ่งก็คือส้วม..เอ๊ย ไม่ใช่ ก็คือเล้าไก่..ก็ไม่ใช่อีก หมายถึงที่เก็บของก็แล้วกัน มันเป็นที่เก็บของรกๆเล็กๆเช่นเครื่องมือทำสวน จอบ เสียม ค้อน เลื่อย ตะปู ที่คนยุโรปเขาทำไว้ท้ายสวน บางคนก็ทำไว้ซะเท่เก๋ไก๋เชียว มันเป็นที่ที่ผู้ชายชาวยุโรปใช้ลี้ภัยจากอำนาจของภรรยาซึ่งมักจะครอบครองตัวบ้านใหญ่อยู่อย่างสมบูรณายาสิทธิ์ สำหรับผู้ชายยุโรป ใครที่ไม่มีที่ลี้ภัยแบบนี้จะถูกเรียกว่าเป็น “ผู้ชายที่ไม่มีเช็ด” หรือ shedless man ซึ่งจะถูกจัดหมวดหมู่ว่าเป็นผู้ชายที่น่าสงสารมาก และจริงหรือเปล่าไม่รู้ มีคนชอบอ้างว่ามีงานวิจัยในออสเตรเลียพบว่าพวกผู้ชายที่ไม่มีเช็ดมีอัตราฆ่าตัวตายสูงมากกว่าผู้ชายที่มีเช็ด อันนี้จริงหรือเท็จผมไม่ยืนยันนะ แต่ผมเช็ดแล้ว เอ๊ย ไม่ใช่ ผมมีเช็ดแล้ว รอดตายแล้ว อิ..อิ

     เอ๊ะเมื่อตะกี้คุยเรื่องอะไรกันอยู่นะ อ้อ เรื่อง NNT คือการจะเข้าใจเรื่อง NNT ลึกซึ้งเนี่ย มันต้องเข้าใจความหมายของวิธีรายงานความเสี่ยงในทางการแพทย์ให้ลึกซึ้งก่อน อย่างน้อยต้องขึ้นใจในคำอีกสามคำ คือ

     (1) ความเสี่ยง หรือ Risk แปลว่าโอกาสเป็นโรค มีความหมายเดียวกับ ความอาจเป็นไปได้ หรือ probability หมายถึงโอกาสเกิดโรคขึ้นในหมู่คน เช่นความเสี่ยงมะเร็งปอดในคนทั่วไปคือ 0.01 หมายความว่าร้อยคนเป็นมะเร็งปอดหนึ่งคน

     (2) การลดความเสี่ยงสัมพัทธ์  หรือ Relative Risk Reduction (RRR) ซึ่งเป็นค่าหลักที่ใช้รายงานในงานวิจัยทางการแพทย์ทั้งหลาย คือรายงานว่ากลุ่มที่กินยาจริงลดความเสี่ยงลงได้เป็นกี่เปอร์เซ็นต์ของความเสี่ยงของกลุ่มกินยาหลอก ยกตัวอย่างเช่น งานวิจัยสุขภาพแพทย์ กลุ่มที่กินวิตามินรวมของจริงมีอุบัติการณ์เป็นมะเร็ง 17.0 ครั้งต่อ1,000 คน-ปี ก็เท่ากับว่ามีความเสี่ยง 1.7% ขณะที่กลุ่มที่กินวิตามินเก๊มีอุบัติการณ์เป็นมะเร็ง 18.3 ครั้ง ต่อ 1,000คน-ปีก็เท่ากับว่ามีความเสี่ยง 1.83% จับเอามาลบกันก็พบว่ามีผลต่างของความเสี่ยงอยู่ = 18.3 – 17.0 = 1.3 แล้วเอาผลได้ไปหาว่าเป็นกี่เปอร์เซ็นต์ของกลุ่มกินวิตามินหลอก = (1.3 x 100) / 18.3 = 7.1% แล้วก็รายงานผลว่าการกินวิตามินลดความเสี่ยงสัมพัทธ์ลงได้ 7.1% ฟังดูหรูนะครับ ลดความเสี่ยงได้เป็นเนื้อเป็นหนังทีเดียว แต่ยังก่อน ต้องตามไปดูอีกค่าหนึ่งซึ่งเป็นของจริงครับ คือค่าการลดความเสี่ยงสัมบูรณ์ หรือ absolute risk reduction (ARR) ซึ่งเขาจะแอบรายงานแบบซ่อนๆอยู่ ที่มาของค่านี้มียังงี้ครับ

     (3) การลดความเสี่ยงสัมบูรณ์  หรือ Absolute Risk Reduction (ARR) คือรายงานว่ากลุ่มที่กินยาจริงลดความเสี่ยงลงในภาพรวมได้เท่าไร ยกตัวอย่างเช่น งานวิจัยสุขภาพแพทย์ กลุ่มที่กินวิตามินรวมของจริงมีอุบัติการณ์เป็นมะเร็ง 17.0 ครั้งต่อ1,000 คน-ปี ก็เท่ากับว่ามีความเสี่ยง 1.7% ขณะที่กลุ่มที่กินวิตามินเก๊มีอุบัติการณ์เป็นมะเร็ง 18.3 ครั้ง ต่อ 1,000คน-ปีก็เท่ากับว่ามีความเสี่ยง 1.83% จับเอามาลบกันก็พบว่ามีผลต่างของความเสี่ยงอยู่ = 1.83 – 1.7 = 0.13% ทำจำนวนเต็ม 100 ให้เป็น 1 ก็เท่ากับว่าการกินวิตามินลดความเสี่ยงสัมบูรณ์ (ARR) ลงได้ 0.0013 แต่ว่าค่า ARR นี่เขาไม่ค่อยรายงานในผลวิจัยหรอกครับเพราะมันเข้าใจยาก ถ้าเขารายงานมา เราก็ต้องเอามาคำนวนหาว่าเขาต้องจับคนกรอกยากี่คนจึงจะลดการเป็นโรคได้หนึ่งคน หรือหาค่า number needed to treat (NTT) ดังนี้

     (4) จำนวนคนที่ถูกจับกรอกยา หรือ number needed to treat (NNT) อย่างที่ผมบอกความหมายไปแล้ว ว่ามันหมายความว่าการจะป้องกันผลร้าย (เช่นเป็นมะเร็ง) ไม่ให้เกิดขึ้นหนึ่งครั้ง เราต้องเอาคนมากินยา (เช่นวิตามิน) ทุกวัน กี่คน การจะคำนวณค่านี้เมื่อรู้ ARR แล้วก็ง่าย คือเอา 1 ตั้ง แล้วเอา ARR ไปหาร ซึ่งในงานวิจัยสุขภาพแพทย์ที่เราพูดถึงนี้ก็คือ NNT = 1 / ARR = 1 / 0.0013 = 769.23 คน นั่นหมายความว่าต้องจับคนไข้กรอกวิตามิน 769 คน จึงจะป้องกันไม่ให้คนเป็นมะเร็งได้หนึ่งคน
ปวดหัวไหมครับ ผมก็ว่าปวดหัวนะ เอาเป็นว่าเมื่อสาธุชนได้ทราบนัยสำคัญทางสถิติ และจำนวนคนไข้ที่ต้องจับกรอกยาแล้ว ใครจะกินวิตามินหรือจะไม่กินก็จงทำเถิด เพราะเป็นเรื่องที่ท่านต้องตัดสินใจเอง

“..ทำไหร่ทำเถิ้ด..อย่าเปิ๊ดผ้า
ทำไร้ไม่ว่า..ผ้าอย่าเปิ๊ด

นพ.สันต์ ใจยอดศิลป์

บรรณานุกรม

1.      Laupacis, A; Sackett, DL; Roberts, RS (1988). "An assessment of clinically useful measures of the consequences of treatment.". The New England Journal of Medicine 318 (26): 1728–33.doi:10.1056/NEJM198806303182605. PMID 3374545