คุยกันเรื่องสถิติเพื่อการอ่านงานวิจัยและตำราแพทย์
ถึง อาจารย์สันต์ ใจยอดศิลป์
สวัสดีครับ ผมนศพ. ... เป็นนักศึกษาแพทย์ชั้นปีที่ 6 คณะแพทยศาสตร์ มหาวิทยาลัยเชียงใหม่ครับ ผมได้อ่านบทความเรื่อง “เรื่องสถิติการแพทย์ คนที่ไม่อยากให้ชีวิตลำบากโปรดอย่าอ่าน” ที่โพสต์ไว้เมื่อวันที่ 26 สิงหาคม 2555 เพราะด้วยความที่อยากทบทวนความเข้าใจอีกรอบ เพราะไม่ได้ใช้นานแล้ว ทำให้ผมเข้าใจได้ง่ายขึ้นมาก สร้างวิธีจำของตัวเองง่ายขึ้น แต่ในช่วงท้ายของบทความ ที่เขียนอธิบายยกตัวอย่างว่า Specificity กับ PPV มีความหมายต่างกันนั้น PPV ไม่น่าจะมีค่าเท่ากับ 1 หรือ 100% แต่น่าจะมีค่าเท่ากับ 10,000 หารด้วย 3 + 10,000 เท่ากับ 0.9997 หรือ 99.97% นะครับ
ผมเองก็ไม่แน่ใจว่าบทความที่เคยเขียนไปแล้วจะแก้ไขใหม่ได้หรือไม่ หรือผมเองที่เข้าใจผิด รบกวนอาจารย์ช่วยชี้แนะด้วยครับ
ด้วยความเคารพอย่างยิ่ง
นศพ. ...
..............................................................
ตอบครับ
แฮ้..ดีใจ มีคนอ่านบทความของผมจริงจังจนจับผิดที่ผมเขียนได้ โห บทความเก่าตั้งแปดปียังมีคุณอ่านอยู่นะ คุณหมอไม่ได้เข้าใจอะไรผิดดอกครับ ผมเขียนผิดเอง ผมได้แก้ให้แล้ว ขอบพระคุณที่เขียนมาทักท้วงทันเวลา เพราะถ้ามาช้ากว่านี้อีกแปดปีผมคงหมดปัญญาวิเคราะห์เพราะเป็นอัลไซเมอร์ไปแล้ว
ไหนคุณก็เขียนมาเรื่องสถิติแล้ว ผมขอถือโอกาสนี้เอาบทความที่เพิ่งแก้ไขไปมาลงให้ท่านผู้อ่านทั่วไปที่สนใจได้อ่านอีกครั้ง
..........................................................
ผมชอบอ่านบล็อกของอาจารย์ แต่ในบทความวันที่ 19 สค. 55 อาจารย์อธิบาย specificity 99.97% แปลว่าถ้าเอาคนไม่เป็นโรคมา 10,000 คน จะตรวจได้ผลลบ 9,997 คน อีก 3 คน (0.03%) ตรวจได้ผลบวก หรือมีผลบวกเทียม 0.03% แล้วอาจารย์ถามว่าอ่านแล้วงงไหม ผมว่าคนอ่านงงนะครับ ผมว่าถ้าเปลี่ยนคำพูดเสียใหม่ว่า
“..ถ้าตรวจได้ผลบวกในคน 10,000 คน หมายความว่า 9,997 คนติดเชื้อ แต่มีอยู่ 3 คนไม่ติดเชื้อ (แต่ผลทดสอบบอกผิด)..”
พูดแบบนี้อาจารย์ว่าจะเข้าใจง่ายกว่าไหมครับ
ขอบคุณครับ
..............................................................
ตอบครับ
ขอบคุณมากๆครับที่อ่านแล้วช่วยเขียนมา โดยเฉพาะอย่างยิ่งในประเด็นที่ผมคิดว่าไม่มีใครสนใจ แต่คุณสนใจ ผมรู้สึกดีมากที่จะมีคนคุยเรื่องสถิติด้วย ก็เลยขอถือโอกาสนี้สัมมนากับคุณถึงเรื่องหลักสถิติที่เราใช้กันในทางการแพทย์เสียเลย สำหรับท่านผู้อ่านท่านอื่นที่ไม่อยากหาเรื่องให้ชีวิตตัวเองต้องประสบกับความลำบากโดยใช่เหตุ ผมแนะนำให้ข้ามบทความนี้ไปเสีย ไม่ต้องอ่านก็ได้ครับ เดี๋ยวจะหาว่าผมไม่เตือน
คำว่า “ความจำเพาะ” หรือ specificity มีคำนิยามในภาษาสถิติว่า “คือโอกาสที่คนไม่เป็นโรค จะตรวจได้ผลลบ (ส่วนที่เหลือนั้นก็ตรวจได้ผลบวก ซึ่งเป็นผลบวกเทียม เพราะไม่ได้เป็นโรค)
ขณะเดียวกันก็มีคำที่คู่กันคือคำว่า “ความไว” หรือ sensitivity ซึ่งมีคำนิยามในภาษาสถิติว่า “คือโอกาสที่คนที่เป็นโรคแล้ว จะตรวจได้ผลบวก (ส่วนที่เหลือนั้นก็ตรวจได้ผลลบ (ซึ่งเป็นผลลบเทียม เพราะเป็นโรคอยู่แล้วยังตรวจได้ผลลบ)
ในการตรวจเอดส์ด้วยวิธี ECLIA นั้นมีความไว 100% และมีความจำเพาะ 99.97% หมายความว่าผลลบเทียมไม่มี แต่มีผลบวกเทียม 0.03% แต่ระวังนะครับ การจะเปลี่ยนคำพูดจาก แบบที่ 1 ว่า
“..ถ้าเอาคนไม่เป็นโรคมา 10,000 คน จะตรวจได้ผลลบ 9,997 คน อีก 3 คน ตรวจได้ผลบวก (ทั้งๆที่ไม่ติดเชื้อ)..”
ไปเป็นพูดแบบที่ 2 ว่า
“..ถ้าตรวจได้ผลบวกในคน 10,000 คน หมายความว่า 9,997 คนติดเชื้อ แต่มีอยู่ 3 คนไม่ติดเชื้อ..”
มองเผินก็น่าจะเป็นเรื่องเดียวกันนะครับ แต่จริงๆแล้วไม่ใช่ เพราะความจำเพาะ (specificity) เป็นการพูดถึงโอกาสที่คนที่ไม่เป็นโรคจะตรวจได้ผลลบ คือเป็นการพูดถึงฐานที่เป็นจำนวนคน หรือจำนวนผู้ป่วย หรือจำนวนผู้ไม่ป่วย
ส่วนการพูดในแบบที่สองนั้นเป็นการพูดถึงฐานที่เป็นจำนวนครั้งของการตรวจ (test) ว่าในการตรวจที่ได้ผลบวก 10,000 ครั้งนั้น จะมีกี่ครั้งที่เจ้าของเลือดเป็นโรคจริงๆ ซึ่งการพูดแบบที่ 2 นี้ทางสถิติเรียกว่าเป็นการพูดถึง โอกาสเป็นโรคจริงเมื่อตรวจได้ผลบวก (positive predictive value)
คุณอาจจะฉุนกึกว่าแล้ว positive predictive value กับ specificity มันต่างกันตรงไหนวะ
แฮ่..แฮ่ ตัวเลขมันอาจจะเท่ากันหรือเกือบเท่ากันนะครับ แต่มันต่างกันที่ความหมายเวลาเราพูดถึง เพื่อที่เราจะได้ไม่ทะเลาะกัน ผมขอเปลี่ยนวิธีอธิบายใหม่ โดยใช้ตารางที่ในวิชาสถิติเรียกว่า 2 x 2 Contingency Table ซึ่งเขียนเป็นตารางดังนี้
จากตารางข้างบนนี้ ผมจะเขียนนิยามคำทั้งสี่คำเสียใหม่ดังนี้
1. ความไวของการทดสอบ (Sensitivity) = a / (a+c)
หมายควายว่าในบรรดาคนที่เป็นโรคจริงๆทั้งหมด (a+c) มีกี่คนที่ตรวจได้ผลบวก (a)
2. ความจำเพาะของการทดสอบ (Specificity) = d / (b+d)
หมายควายว่าในบรรดาคนที่ไม่เป็นโรคทั้งหมด (b+d) มีกี่คนที่ตรวจได้ผลลบ (d)
3. โอกาสเป็นโรคของผลบวก (Positive predictive value) = a / (a+b)
หมายควายว่าในบรรดาคนที่ตรวจได้ผลบวกทั้งหมด (a+b) มีกี่คนที่เป็นโรคจริง (a)
4. โอกาสไม่เป็นโรคของผลลบ (Negative predictive value) = d / (c+d)
หมายควายว่าในบรรดาคนที่ตรวจได้ผลลบทั้งหมด (c+d) มีกี่คนที่ไม่เป็นโรคจริงๆ (d)
ค่าทั้งสี่ค่าความหมายไม่เหมือนกันสักค่า แต่ผลการคิดตัวเลขอาจจะอนุโลมได้ว่าเท่ากัน ผมจะลองใส่ค่าจริงของการตรวจเอดส์ด้วยวิธี ACLIA ให้ดูนะครับ
จะเห็นว่าขณะที่ความจำเพาะของการตรวจ (specificity) เท่ากับ = d / (b+d) หรือ 99.97%
แต่โอกาสเป็นโรคของผู้ตรวจได้ผลบวก (positive predictive value) เท่ากับ = a / (a+b) = 0.99970009 หรือคร่าวๆ 99.97%
คือตัวเลขเท่ากัน แต่เป็นการมองความหมายมาจากคนละมุมมอง คนละความหมาย
ท่านผู้อ่านท่านอื่นงงมากใช่ไหมครับ ผมบอกแล้ว ถ้าไม่อยากทำชีวิตให้ลำบากอย่าอ่าน ตัวใครตัวมันละครับ ส่วนผมขอตัวไปนอนก่อนแล่ว เพราะเพิ่งกลับมาจากสอน Health Camp มาสามวันสามคืนรวด ยังไม่หายมึน บ๊าย..บาย
นพ.สันต์ ใจยอดศิลป์
สวัสดีครับ ผมนศพ. ... เป็นนักศึกษาแพทย์ชั้นปีที่ 6 คณะแพทยศาสตร์ มหาวิทยาลัยเชียงใหม่ครับ ผมได้อ่านบทความเรื่อง “เรื่องสถิติการแพทย์ คนที่ไม่อยากให้ชีวิตลำบากโปรดอย่าอ่าน” ที่โพสต์ไว้เมื่อวันที่ 26 สิงหาคม 2555 เพราะด้วยความที่อยากทบทวนความเข้าใจอีกรอบ เพราะไม่ได้ใช้นานแล้ว ทำให้ผมเข้าใจได้ง่ายขึ้นมาก สร้างวิธีจำของตัวเองง่ายขึ้น แต่ในช่วงท้ายของบทความ ที่เขียนอธิบายยกตัวอย่างว่า Specificity กับ PPV มีความหมายต่างกันนั้น PPV ไม่น่าจะมีค่าเท่ากับ 1 หรือ 100% แต่น่าจะมีค่าเท่ากับ 10,000 หารด้วย 3 + 10,000 เท่ากับ 0.9997 หรือ 99.97% นะครับ
ผมเองก็ไม่แน่ใจว่าบทความที่เคยเขียนไปแล้วจะแก้ไขใหม่ได้หรือไม่ หรือผมเองที่เข้าใจผิด รบกวนอาจารย์ช่วยชี้แนะด้วยครับ
ด้วยความเคารพอย่างยิ่ง
นศพ. ...
..............................................................
ตอบครับ
แฮ้..ดีใจ มีคนอ่านบทความของผมจริงจังจนจับผิดที่ผมเขียนได้ โห บทความเก่าตั้งแปดปียังมีคุณอ่านอยู่นะ คุณหมอไม่ได้เข้าใจอะไรผิดดอกครับ ผมเขียนผิดเอง ผมได้แก้ให้แล้ว ขอบพระคุณที่เขียนมาทักท้วงทันเวลา เพราะถ้ามาช้ากว่านี้อีกแปดปีผมคงหมดปัญญาวิเคราะห์เพราะเป็นอัลไซเมอร์ไปแล้ว
ไหนคุณก็เขียนมาเรื่องสถิติแล้ว ผมขอถือโอกาสนี้เอาบทความที่เพิ่งแก้ไขไปมาลงให้ท่านผู้อ่านทั่วไปที่สนใจได้อ่านอีกครั้ง
..........................................................
ผมชอบอ่านบล็อกของอาจารย์ แต่ในบทความวันที่ 19 สค. 55 อาจารย์อธิบาย specificity 99.97% แปลว่าถ้าเอาคนไม่เป็นโรคมา 10,000 คน จะตรวจได้ผลลบ 9,997 คน อีก 3 คน (0.03%) ตรวจได้ผลบวก หรือมีผลบวกเทียม 0.03% แล้วอาจารย์ถามว่าอ่านแล้วงงไหม ผมว่าคนอ่านงงนะครับ ผมว่าถ้าเปลี่ยนคำพูดเสียใหม่ว่า
“..ถ้าตรวจได้ผลบวกในคน 10,000 คน หมายความว่า 9,997 คนติดเชื้อ แต่มีอยู่ 3 คนไม่ติดเชื้อ (แต่ผลทดสอบบอกผิด)..”
พูดแบบนี้อาจารย์ว่าจะเข้าใจง่ายกว่าไหมครับ
ขอบคุณครับ
..............................................................
ตอบครับ
ขอบคุณมากๆครับที่อ่านแล้วช่วยเขียนมา โดยเฉพาะอย่างยิ่งในประเด็นที่ผมคิดว่าไม่มีใครสนใจ แต่คุณสนใจ ผมรู้สึกดีมากที่จะมีคนคุยเรื่องสถิติด้วย ก็เลยขอถือโอกาสนี้สัมมนากับคุณถึงเรื่องหลักสถิติที่เราใช้กันในทางการแพทย์เสียเลย สำหรับท่านผู้อ่านท่านอื่นที่ไม่อยากหาเรื่องให้ชีวิตตัวเองต้องประสบกับความลำบากโดยใช่เหตุ ผมแนะนำให้ข้ามบทความนี้ไปเสีย ไม่ต้องอ่านก็ได้ครับ เดี๋ยวจะหาว่าผมไม่เตือน
คำว่า “ความจำเพาะ” หรือ specificity มีคำนิยามในภาษาสถิติว่า “คือโอกาสที่คนไม่เป็นโรค จะตรวจได้ผลลบ (ส่วนที่เหลือนั้นก็ตรวจได้ผลบวก ซึ่งเป็นผลบวกเทียม เพราะไม่ได้เป็นโรค)
ขณะเดียวกันก็มีคำที่คู่กันคือคำว่า “ความไว” หรือ sensitivity ซึ่งมีคำนิยามในภาษาสถิติว่า “คือโอกาสที่คนที่เป็นโรคแล้ว จะตรวจได้ผลบวก (ส่วนที่เหลือนั้นก็ตรวจได้ผลลบ (ซึ่งเป็นผลลบเทียม เพราะเป็นโรคอยู่แล้วยังตรวจได้ผลลบ)
ในการตรวจเอดส์ด้วยวิธี ECLIA นั้นมีความไว 100% และมีความจำเพาะ 99.97% หมายความว่าผลลบเทียมไม่มี แต่มีผลบวกเทียม 0.03% แต่ระวังนะครับ การจะเปลี่ยนคำพูดจาก แบบที่ 1 ว่า
“..ถ้าเอาคนไม่เป็นโรคมา 10,000 คน จะตรวจได้ผลลบ 9,997 คน อีก 3 คน ตรวจได้ผลบวก (ทั้งๆที่ไม่ติดเชื้อ)..”
ไปเป็นพูดแบบที่ 2 ว่า
“..ถ้าตรวจได้ผลบวกในคน 10,000 คน หมายความว่า 9,997 คนติดเชื้อ แต่มีอยู่ 3 คนไม่ติดเชื้อ..”
มองเผินก็น่าจะเป็นเรื่องเดียวกันนะครับ แต่จริงๆแล้วไม่ใช่ เพราะความจำเพาะ (specificity) เป็นการพูดถึงโอกาสที่คนที่ไม่เป็นโรคจะตรวจได้ผลลบ คือเป็นการพูดถึงฐานที่เป็นจำนวนคน หรือจำนวนผู้ป่วย หรือจำนวนผู้ไม่ป่วย
ส่วนการพูดในแบบที่สองนั้นเป็นการพูดถึงฐานที่เป็นจำนวนครั้งของการตรวจ (test) ว่าในการตรวจที่ได้ผลบวก 10,000 ครั้งนั้น จะมีกี่ครั้งที่เจ้าของเลือดเป็นโรคจริงๆ ซึ่งการพูดแบบที่ 2 นี้ทางสถิติเรียกว่าเป็นการพูดถึง โอกาสเป็นโรคจริงเมื่อตรวจได้ผลบวก (positive predictive value)
คุณอาจจะฉุนกึกว่าแล้ว positive predictive value กับ specificity มันต่างกันตรงไหนวะ
แฮ่..แฮ่ ตัวเลขมันอาจจะเท่ากันหรือเกือบเท่ากันนะครับ แต่มันต่างกันที่ความหมายเวลาเราพูดถึง เพื่อที่เราจะได้ไม่ทะเลาะกัน ผมขอเปลี่ยนวิธีอธิบายใหม่ โดยใช้ตารางที่ในวิชาสถิติเรียกว่า 2 x 2 Contingency Table ซึ่งเขียนเป็นตารางดังนี้
+ve ของจริง
คนเป็นโรค
|
-ve ของจริง
คนไม่เป็นโรค
| |
Test +ve
ตรวจได้ผลบวก
|
A
|
B
|
Test –ve
ตรวจได้ผลลบ
|
C
|
D
|
1. ความไวของการทดสอบ (Sensitivity) = a / (a+c)
หมายควายว่าในบรรดาคนที่เป็นโรคจริงๆทั้งหมด (a+c) มีกี่คนที่ตรวจได้ผลบวก (a)
2. ความจำเพาะของการทดสอบ (Specificity) = d / (b+d)
หมายควายว่าในบรรดาคนที่ไม่เป็นโรคทั้งหมด (b+d) มีกี่คนที่ตรวจได้ผลลบ (d)
3. โอกาสเป็นโรคของผลบวก (Positive predictive value) = a / (a+b)
หมายควายว่าในบรรดาคนที่ตรวจได้ผลบวกทั้งหมด (a+b) มีกี่คนที่เป็นโรคจริง (a)
4. โอกาสไม่เป็นโรคของผลลบ (Negative predictive value) = d / (c+d)
หมายควายว่าในบรรดาคนที่ตรวจได้ผลลบทั้งหมด (c+d) มีกี่คนที่ไม่เป็นโรคจริงๆ (d)
ค่าทั้งสี่ค่าความหมายไม่เหมือนกันสักค่า แต่ผลการคิดตัวเลขอาจจะอนุโลมได้ว่าเท่ากัน ผมจะลองใส่ค่าจริงของการตรวจเอดส์ด้วยวิธี ACLIA ให้ดูนะครับ
+ve ของจริง
คนเป็นโรค
|
-ve ของจริง
คนไม่เป็นโรค
| |
Test +ve
ตรวจได้ผลบวก
|
10,000
|
3
|
Test –ve
ตรวจได้ผลลบ
|
0
|
9,997
|
แต่โอกาสเป็นโรคของผู้ตรวจได้ผลบวก (positive predictive value) เท่ากับ = a / (a+b) = 0.99970009 หรือคร่าวๆ 99.97%
คือตัวเลขเท่ากัน แต่เป็นการมองความหมายมาจากคนละมุมมอง คนละความหมาย
ท่านผู้อ่านท่านอื่นงงมากใช่ไหมครับ ผมบอกแล้ว ถ้าไม่อยากทำชีวิตให้ลำบากอย่าอ่าน ตัวใครตัวมันละครับ ส่วนผมขอตัวไปนอนก่อนแล่ว เพราะเพิ่งกลับมาจากสอน Health Camp มาสามวันสามคืนรวด ยังไม่หายมึน บ๊าย..บาย
นพ.สันต์ ใจยอดศิลป์