นัยสำคัญทางสถิติ (p-value) และสมมุติฐานแห้ว (Null hypothesis)


สวนดอกไม้หน้าบ้าน ที่โรยรา ยามหน้าฝน

อาจารย์สันต์ครับ

    ผมชอบตามไปอ่านงานวิจัยที่อาจารย์ให้ไว้ท้ายบทความ ตามไปอ่านใน Pubmed ซึ่งเขามักมีให้อ่านแต่ abstract ในนั้นเขามักวงเล็บ p - value ไว้ ผมไม่ได้เรียนมาทางวิทยาศาสตร์ จึงเข้าใจแค่เลาๆว่ามันหมายถึงความแตกต่างกันอย่างมีนัยสำคัญทางสถิติ แต่ผมอยากรู้ว่าค่า p - value นี้จริงๆแล้วมันได้มาจากไหน ทำไม่บางที่ผลของสองกลุ่มต่างกันชัดๆ แต่ค่า p - value กลับบอกว่าไม่ต่างกันอย่างมีนัยสำคัญ อ่านคำอธิบายในเน็ทแล้วไม่เข้าใจเลย จึงต้องมารบกวนคุณหมอครับ

................................................

ตอบครับ

     1. ที่มา 

1.      วิทยาศาสตร์ได้ความรู้มาด้วยสองวิธี คือ (1) การสังเกตและจดบันทึก (2) การคิดไตร่ตรองด้วยเหตุผลและตรรกะอย่างแยบยล

    ในส่วนของการสังเกตบันทึกนั้นถูกขยายออกไปเป็นการสร้างเครื่องมือช่วย เช่น สร้างกล้องจุลทรรศน์อีเล็กตรอนและเครื่องเอ็กซเรย์คอมพิวเตอร์ขยายการมองเห็นด้วยตาเปล่า สร้างเครื่องอุลตร้าซาวด์ขยายการฟังด้วยหู เป็นต้น

    ในส่วนของการคิดไตร่ตรองด้วยเหตุผลอย่างแยบยลนั้นก็ถูกขยายออกไปเป็นการสร้างกระบวนคิดทางสถิติ เช่น การเดาความอาจเป็นไปได้ (probability) ซึ่งก็คล้ายๆกับวิธีการเดาของหมอดูหรือของพวกโต๊ดเถื่อนที่รับแทงบอลนั่นแหละ เพราะวิทยาศาสตร์ก็คือการเดาอย่างมีชั้นเชิง คือเดาแบบทำให้มันใช้ประโยชน์ได้มากขึ้นด้วยการทำวิจัยเปรียบเทียบระหว่างวิธีใหม่หรือยาใหม่ (กลุ่มทดลอง) กับวิธีเก่าหรือยาเก่า (กลุ่มควบคุม) แล้วคิดค้นค่านัยสำคัญทางสถิติ หรือ p - value มาช่วยในการแปลผลว่าผลที่ได้ในกลุ่มทดลองมันแตกต่างจากผลที่ได้ในกลุ่มควบคุมอย่างมีนัยสำคัญไหม 

    2. คอนเซ็พท์ของ p - value

    ในการเปรียบเทียบผลของสิ่งใหม่ (กลุ่มทดลอง) กับสิ่งเก่า (กลุ่มควบคุม) ให้ถือไว้ก่อนว่า

    "ของใหม่มันไม่ต่างไปจากของเก่าดอก" 

    ซึ่งผมขอเรียกการทึกทักล่วงหน้าแบบนี้ว่า "สมมุติฐานแห้ว (null hypothesis)" อันเป็นสิ่งตรงกันข้ามกับความอยากได้ของคุณในฐานะนักวิจัย ซึ่งความอยากได้ของคุณนี้ผมขอเรียกว่า "สมมุติฐานสมหวัง  (alternative hypothesis)" 

    คนจะศรัทธาว่าสิ่งใหม่ที่คุณคิดค้นขึ้นมานั้นดีกว่าสิ่งเก่าอย่างมีนัยสำคัญก็ต่อเมื่อคุณพิสูจน์ได้ว่าโอกาสความเป็นไปได้ (probability) ที่สมมุติฐานแห้วจะเป็นจริงนั้นมีต่ำกว่า 5% หรือพูดให้เป็นภาษาเท่ๆหน่อยว่าคุณต้องพิสูจน์ได้ว่ามีค่า p- value ต่ำกว่า 0.05 (ขณะที่โอกาสเต็มคือ 1.0) จึงจะถือว่าคุณหักล้างสมมุติฐานแห้วได้สำเร็จ (reject null hypothesis) ระดับที่มีนัยสำคัญหรือ p = <0.05 นี้บางทีก็เรียกว่าอัลฟา นี่คือคอนเซ็พท์พื้นฐานของค่า p - value กล่าวคือ p - value ต้องต่ำกว่า 0.05 จึงจะเป็นความแตกต่างกันระหว่างวิธีรักษาหรือยาไหม่กับเก่าอย่างมีนัยสำคัญ และยิ่งต่ำมากเช่น p <0.001 ก็ยิ่งมีนัยสำคัญของความแตกต่างกันมาก แต่ถ้า p - value มากกว่า 0.05 ก็เท่ากับว่าสมมุติฐานแห้วน่าจะเป็นจริงมากกว่าสมมุติฐานสมหวัง หมายความว่าวิธีการรักษาใหม่หรือยาใหม่ของคุณมันไม่ต่างจากของเก่าอย่างมีนัยสำคัญ

       3. วิธีคิดคำนวณค่า p - value

    ตัว p ในชื่อ p - value นั้นย่อมาจาก probability ซึ่งแปลว่าโอกาสเป็นไปได้ ถ้าจะพูดให้ละเอียดก็คือโอกาสเป็นไปได้ที่ผลของกลุ่มทดลองจะเป็นแค่การแกว่งหรือความฟลุ้คอยู่ภายใต้พิสัยการกระจายตัวตามปกติของข้อมูลของกลุ่มควบคุม ดังนั้นวิธีคำนวณหาค่า p - value ก็ต้องเขียนภาพใหญ่ของการกระจายความถี่ของข้อมูลของกลุ่มควบคุมออกมาเป็นเส้นกราฟรูประฆังคว่ำให้ได้ก่อน แล้วค่อยก็มาคำนวณต่อว่าค่าเฉลี่ยของผลวิจัยกลุ่มทดลองมันตกอยู่ตรงไหนของกราฟระฆังคว่ำนี้ ตำแหน่งนั้นบอกถึงโอกาสความเป็นไปได้ที่ผลวิจัยใหม่จะเป็นแค่อีกหนึ่งความเป็นไปได้ของการกระจายความถี่ของข้อมูลของกลุ่มทดลอง ยิ่งจุดนี้อยู่ไกลจากศูนย์กลางระฆังออกไปมากเท่าไหร่ก็ยิ่งมีโอกาสความเป็นไปได้ต่ำ หากโอกาสดังกล่าวมันมีต่ำกว่า 5% (p-value =<0.05) ก็ถือเอาโดยอนุโลมว่าเนื่องจากมันเป็นไปได้น้อยมากจึงให้ถือเอาได้เลยว่าค่าเฉลี่ยของกลุ่มทดลองนี้มันเป็นคนละเรื่องกับค่าเฉลี่ยของกลุ่มควบคุม มันไม่ใช่เป็นแค่การกระจายตัวตามปกติของข้อมูลในกลุ่มควบคุม มันแตกต่างจากข้อมูลในกลุ่มควบคุมอย่างสิ้นเชิง หรืออย่างมีนัยสำคัญ

    ตัวแปรที่ใช้ในการคำนวณก็คือ (1) ค่าเฉลี่ยผลของกลุ่มทดลอง (2) ค่าเฉลี่ยผลของกลุ่มควบคุม (3) ความเบี่ยงเบนมาตรฐาน (SD) ของข้อมูลในกลุ่มทดลอง และ (4) จำนวนตัวอย่าง (n) ของกลุ่มทดลอง เอาปัจจัยทั้งหมดนี้ผูกเป็นสูตรคำนวณได้ผลออกมาเป็นตัวเลขที่บอกจุดตำแหน่งที่ข้อมูลตัวแทนกลุ่มทดลองจะยืนอยู่บนแกนนอนภายใต้กราฟรูประฆังคว่ำของกลุ่มควบคุมออกมา ซึ่งเรียกจุดนี้ว่าคะแนนมาตรฐาน (standard score) จากจุดนี้ก็เอาไปเทียบค่าโอกาสความเป็นไปได้จากตารางข้อมูลการกระจายความถี่มาตรฐาน ได้ออกมาเป็นตัวเลขค่าโอกาสความเป็นไปได้ที่คะแนนตัวแทนกลุ่มทดลองจะแกว่ง (ออกจากค่าเฉลี่ยกลางของข้อมูลกลุ่มควบคุม) มาได้ไกลถึงจุดนี้ นั่นก็คือค่า p - value 

    ผมขออนุญาตไม่พูดถึงรายละเอียดของสูตรคณิตศาสตร์ที่ใช้ในการคำนวณเพราะผมจำไม่ได้ และในทางปฏิบัติสมัยนี้นักวิจัยทุกคนก็ล้วนใช้วิธีใส่ผลตัวแปรต่างๆที่เก็บได้จากการวิจัยเข้าไปในโปรแกรมคอมพิวเตอร์ในอินเตอร์เน็ทก็จะได้ค่า p - value ออกมา ไม่มีใครคิดเลขคำนวณเอาจากสูตรจริงๆหรอก

นพ.สันต์ ใจยอดศิลป์

โพสต์ยอดนิยมจากบล็อกนี้

สอนวิธีอ่านผล CBC (การตรวจนับเม็ดเลือด)

สอนวิธีแปลผลเคมีของเลือด

แจ้งข่าวด่วน หมอสันต์ตัวปลอมกำลังระบาดหนัก

ชีวิตเมื่อตายไปแล้ว

เลิกเสียทีได้ไหม ชีวิตที่ต้องมีอะไรมาจ่อคิวต่อรอให้ทำอยู่ตลอดเวลา

ไปเที่ยวเมืองจีนขึ้นที่สูงแล้วกลับมาป่วยยาว (โรค HAPE)

เสพย์ติดหนังโป๊และการช่วยตัวเอง (masturbation)

ทุกประเด็นเกี่ยวกับขนมปังซาวโด (Sourdough Bread)

งานวิจัยในคนพบว่ากินอาหารมีฟลาโวนอยด์มากจะตายช้า มาเจาะลึกเรื่องฟลาโวนอยด์กันหน่อยก็ดี

ปวดหลัง กินยา Arcoxia และ Norgesic และ Voltaren