นัยสำคัญทางสถิติ (p-value) และสมมุติฐานแห้ว (Null hypothesis)


สวนดอกไม้หน้าบ้าน ที่โรยรา ยามหน้าฝน

อาจารย์สันต์ครับ

    ผมชอบตามไปอ่านงานวิจัยที่อาจารย์ให้ไว้ท้ายบทความ ตามไปอ่านใน Pubmed ซึ่งเขามักมีให้อ่านแต่ abstract ในนั้นเขามักวงเล็บ p - value ไว้ ผมไม่ได้เรียนมาทางวิทยาศาสตร์ จึงเข้าใจแค่เลาๆว่ามันหมายถึงความแตกต่างกันอย่างมีนัยสำคัญทางสถิติ แต่ผมอยากรู้ว่าค่า p - value นี้จริงๆแล้วมันได้มาจากไหน ทำไม่บางที่ผลของสองกลุ่มต่างกันชัดๆ แต่ค่า p - value กลับบอกว่าไม่ต่างกันอย่างมีนัยสำคัญ อ่านคำอธิบายในเน็ทแล้วไม่เข้าใจเลย จึงต้องมารบกวนคุณหมอครับ

................................................

ตอบครับ

     1. ที่มา 

1.      วิทยาศาสตร์ได้ความรู้มาด้วยสองวิธี คือ (1) การสังเกตและจดบันทึก (2) การคิดไตร่ตรองด้วยเหตุผลและตรรกะอย่างแยบยล

    ในส่วนของการสังเกตบันทึกนั้นถูกขยายออกไปเป็นการสร้างเครื่องมือช่วย เช่น สร้างกล้องจุลทรรศน์อีเล็กตรอนและเครื่องเอ็กซเรย์คอมพิวเตอร์ขยายการมองเห็นด้วยตาเปล่า สร้างเครื่องอุลตร้าซาวด์ขยายการฟังด้วยหู เป็นต้น

    ในส่วนของการคิดไตร่ตรองด้วยเหตุผลอย่างแยบยลนั้นก็ถูกขยายออกไปเป็นการสร้างกระบวนคิดทางสถิติ เช่น การเดาความอาจเป็นไปได้ (probability) ซึ่งก็คล้ายๆกับวิธีการเดาของหมอดูหรือของพวกโต๊ดเถื่อนที่รับแทงบอลนั่นแหละ เพราะวิทยาศาสตร์ก็คือการเดาอย่างมีชั้นเชิง คือเดาแบบทำให้มันใช้ประโยชน์ได้มากขึ้นด้วยการทำวิจัยเปรียบเทียบระหว่างวิธีใหม่หรือยาใหม่ (กลุ่มทดลอง) กับวิธีเก่าหรือยาเก่า (กลุ่มควบคุม) แล้วคิดค้นค่านัยสำคัญทางสถิติ หรือ p - value มาช่วยในการแปลผลว่าผลที่ได้ในกลุ่มทดลองมันแตกต่างจากผลที่ได้ในกลุ่มควบคุมอย่างมีนัยสำคัญไหม 

    2. คอนเซ็พท์ของ p - value

    ในการเปรียบเทียบผลของสิ่งใหม่ (กลุ่มทดลอง) กับสิ่งเก่า (กลุ่มควบคุม) ให้ถือไว้ก่อนว่า

    "ของใหม่มันไม่ต่างไปจากของเก่าดอก" 

    ซึ่งผมขอเรียกการทึกทักล่วงหน้าแบบนี้ว่า "สมมุติฐานแห้ว (null hypothesis)" อันเป็นสิ่งตรงกันข้ามกับความอยากได้ของคุณในฐานะนักวิจัย ซึ่งความอยากได้ของคุณนี้ผมขอเรียกว่า "สมมุติฐานสมหวัง  (alternative hypothesis)" 

    คนจะศรัทธาว่าสิ่งใหม่ที่คุณคิดค้นขึ้นมานั้นดีกว่าสิ่งเก่าอย่างมีนัยสำคัญก็ต่อเมื่อคุณพิสูจน์ได้ว่าโอกาสความเป็นไปได้ (probability) ที่สมมุติฐานแห้วจะเป็นจริงนั้นมีต่ำกว่า 5% หรือพูดให้เป็นภาษาเท่ๆหน่อยว่าคุณต้องพิสูจน์ได้ว่ามีค่า p- value ต่ำกว่า 0.05 (ขณะที่โอกาสเต็มคือ 1.0) จึงจะถือว่าคุณหักล้างสมมุติฐานแห้วได้สำเร็จ (reject null hypothesis) ระดับที่มีนัยสำคัญหรือ p = <0.05 นี้บางทีก็เรียกว่าอัลฟา นี่คือคอนเซ็พท์พื้นฐานของค่า p - value กล่าวคือ p - value ต้องต่ำกว่า 0.05 จึงจะเป็นความแตกต่างกันระหว่างวิธีรักษาหรือยาไหม่กับเก่าอย่างมีนัยสำคัญ และยิ่งต่ำมากเช่น p <0.001 ก็ยิ่งมีนัยสำคัญของความแตกต่างกันมาก แต่ถ้า p - value มากกว่า 0.05 ก็เท่ากับว่าสมมุติฐานแห้วน่าจะเป็นจริงมากกว่าสมมุติฐานสมหวัง หมายความว่าวิธีการรักษาใหม่หรือยาใหม่ของคุณมันไม่ต่างจากของเก่าอย่างมีนัยสำคัญ

       3. วิธีคิดคำนวณค่า p - value

    ตัว p ในชื่อ p - value นั้นย่อมาจาก probability ซึ่งแปลว่าโอกาสเป็นไปได้ ถ้าจะพูดให้ละเอียดก็คือโอกาสเป็นไปได้ที่ผลของกลุ่มทดลองจะเป็นแค่การแกว่งหรือความฟลุ้คอยู่ภายใต้พิสัยการกระจายตัวตามปกติของข้อมูลของกลุ่มควบคุม ดังนั้นวิธีคำนวณหาค่า p - value ก็ต้องเขียนภาพใหญ่ของการกระจายความถี่ของข้อมูลของกลุ่มควบคุมออกมาเป็นเส้นกราฟรูประฆังคว่ำให้ได้ก่อน แล้วค่อยก็มาคำนวณต่อว่าค่าเฉลี่ยของผลวิจัยกลุ่มทดลองมันตกอยู่ตรงไหนของกราฟระฆังคว่ำนี้ ตำแหน่งนั้นบอกถึงโอกาสความเป็นไปได้ที่ผลวิจัยใหม่จะเป็นแค่อีกหนึ่งความเป็นไปได้ของการกระจายความถี่ของข้อมูลของกลุ่มทดลอง ยิ่งจุดนี้อยู่ไกลจากศูนย์กลางระฆังออกไปมากเท่าไหร่ก็ยิ่งมีโอกาสความเป็นไปได้ต่ำ หากโอกาสดังกล่าวมันมีต่ำกว่า 5% (p-value =<0.05) ก็ถือเอาโดยอนุโลมว่าเนื่องจากมันเป็นไปได้น้อยมากจึงให้ถือเอาได้เลยว่าค่าเฉลี่ยของกลุ่มทดลองนี้มันเป็นคนละเรื่องกับค่าเฉลี่ยของกลุ่มควบคุม มันไม่ใช่เป็นแค่การกระจายตัวตามปกติของข้อมูลในกลุ่มควบคุม มันแตกต่างจากข้อมูลในกลุ่มควบคุมอย่างสิ้นเชิง หรืออย่างมีนัยสำคัญ

    ตัวแปรที่ใช้ในการคำนวณก็คือ (1) ค่าเฉลี่ยผลของกลุ่มทดลอง (2) ค่าเฉลี่ยผลของกลุ่มควบคุม (3) ความเบี่ยงเบนมาตรฐาน (SD) ของข้อมูลในกลุ่มทดลอง และ (4) จำนวนตัวอย่าง (n) ของกลุ่มทดลอง เอาปัจจัยทั้งหมดนี้ผูกเป็นสูตรคำนวณได้ผลออกมาเป็นตัวเลขที่บอกจุดตำแหน่งที่ข้อมูลตัวแทนกลุ่มทดลองจะยืนอยู่บนแกนนอนภายใต้กราฟรูประฆังคว่ำของกลุ่มควบคุมออกมา ซึ่งเรียกจุดนี้ว่าคะแนนมาตรฐาน (standard score) จากจุดนี้ก็เอาไปเทียบค่าโอกาสความเป็นไปได้จากตารางข้อมูลการกระจายความถี่มาตรฐาน ได้ออกมาเป็นตัวเลขค่าโอกาสความเป็นไปได้ที่คะแนนตัวแทนกลุ่มทดลองจะแกว่ง (ออกจากค่าเฉลี่ยกลางของข้อมูลกลุ่มควบคุม) มาได้ไกลถึงจุดนี้ นั่นก็คือค่า p - value 

    ผมขออนุญาตไม่พูดถึงรายละเอียดของสูตรคณิตศาสตร์ที่ใช้ในการคำนวณเพราะผมจำไม่ได้ และในทางปฏิบัติสมัยนี้นักวิจัยทุกคนก็ล้วนใช้วิธีใส่ผลตัวแปรต่างๆที่เก็บได้จากการวิจัยเข้าไปในโปรแกรมคอมพิวเตอร์ในอินเตอร์เน็ทก็จะได้ค่า p - value ออกมา ไม่มีใครคิดเลขคำนวณเอาจากสูตรจริงๆหรอก

นพ.สันต์ ใจยอดศิลป์

โพสต์ยอดนิยมจากบล็อกนี้

ทะเลาะกันเรื่องฝุ่น PM 2.5 บ้าจี้ เพ้อเจ้อ หรือว่าไม่รับผิดชอบ

สอนวิธีแปลผลเคมีของเลือด

ชีวิตเมื่อตายไปแล้ว

เจ็ดใครหนอ

แจ้งข่าวด่วน หมอสันต์ตัวปลอมกำลังระบาดหนัก

อายุ 70 ปีถูกคนในบ้านไล่ให้ไปฉีดวัคซีนไข้เลือดออก

เสพย์ติดหนังโป๊และการช่วยตัวเอง (masturbation)

หมอสันต์สวัสดีปีใหม่ 2568 / 2025

เลิกเสียทีได้ไหม ชีวิตที่ต้องมีอะไรมาจ่อคิวต่อรอให้ทำอยู่ตลอดเวลา

ไปเที่ยวเมืองจีนขึ้นที่สูงแล้วกลับมาป่วยยาว (โรค HAPE)