แนวปฏิบัติสำหรับการคำนวณขนาดกลุ่มตัวอย่างในการทำวิจัย
ความสำคัญของการคำนวณขนาดตัวอย่าง
การมีระเบียบวิธีวิจัยที่ถูกต้องสามารถลดอคติ (Systematic error) เกิดขึ้นจากกระบวนการวิจัยและส่งผลต่อความน่าเชื่อถือ การคำนวณหาขนาดตัวอย่างเป็นขั้นตอนที่สำคัญในระเบียบวิธีวิจัยเพื่อให้ได้มาของขนาดตัวอย่าง (Sample size) ที่เหมาะสมและเพียงพอ กลุ่มตัวอย่าง หมายถึงกลุ่มคน เหตุการณ์ หรือสิ่งที่ผู้วิจัยสนใจศึกษา สำหรับการวิจัยทางสาธารณสุขกลุ่มตัวอย่างส่วนใหญ่ คือ ประชาชน กลุ่มผู้ป่วย หรือผู้รับบริการทางการแพทย์และสาธารณสุข และได้รับคัดเลือกด้วยวิธีการที่เหมาะสมจากกลุ่มประชากร (Population of the study) เพื่อเป็นตัวแทน (Representative) หรือเพื่ออ้างอิง (Generalization) สู่ประชากรที่ศึกษา
โดยทั่วไปการคำนวณหาขนาดตัวอย่างมีความสำคัญในทุกรูปแบบการศึกษาวิจัย ซึ่งผลที่ได้จากการศึกษาในกลุ่มตัวอย่างเป็นตัวสะท้อนถึงลักษณะของประชากร โดยเป็นการอ้างอิง(Generalization)สู่กลุ่มประชากรที่ทำการศึกษา การศึกษารูปแบบเชิงพรรณนา ผลการศึกษาที่ได้จากกลุ่มตัวอย่างมักเป็นการประมาณค่า และเป็นค่าที่ดีที่สุดสำหรับกลุ่มประชากรที่ทำการศึกษา โดยนำเสนอผลการศึกษาในลักษณะของอัตราความชุก อุบัติการณ์ ค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐาน
การพิจารณาการคำนวณขนาดกลุ่มตัวอย่าง
การคำนวณหาขนาดกลุ่มตัวอย่างในงานวิจัยเป็นขั้นตอนหนึ่งที่สำคัญในระเบียบวิธีวิจัย ซึ่งส่งผลต่อความน่าเชื่อถือและอคติที่อาจเกิดขึ้น การคำนวณหาขนาดกลุ่มตัวอย่างที่เหมาะสมและเพียงพอ ช่วยให้ผู้วิจัยสามารถเตรียมการ วางแผนและจัดการในขั้นตอนของการเก็บรวบรวมข้อมูลได้เป็นอย่างดี
หลักเกณฑ์ที่ใช้ในการพิจารณาสำหรับการคำนวณหาขนาดกลุ่มตัวอย่างมีดังนี้
- ระดับความเชื่อมั่น (Confidence level ) จากพื้นฐานทางทฤษฎีแนวโน้มเข้าสู่ส่วนกลาง
(Central limit theorem) มีแนวคิดหลักที่ว่าเมื่อประชากรถูกสุ่มซ้ำกันหลายครั้ง ค่าที่ได้จากการสุ่มในกลุ่มตัวอย่างจะมีค่าเท่ากับที่เป็นจริงในกลุ่มประชากรเสมอ นอกจากนี้ค่าที่ได้จากการสุ่มในกลุ่มตัวอย่างการกระจายแบบโค้งปกติ ซึ่งร้อยละ 95 ของค่าจริงในกลุ่มตัวอย่างอยู่ภายใต้สองส่วนของค่าส่วนเบี่ยงเบนมาตรฐานของค่าที่ได้จากกลุ่มประชากรจริง โดยทั่วไป ค่าพื้นที่ใต้โค้งปกติ (Z α/2หรือ Z 0.025) เท่ากับ 1.96
- ระดับความแปรปรวน (Degree of variability; P หรือ Ó)เป็นคุณลักษณะที่ถูกวัดกล่าวถึง
การกระจายในกลุ่มประชากร ในกรณีที่กลุ่มประชากรมีความแตกต่างกันมาก (Heterogeneity)ขนาดของกลุ่มตัวอย่างก็มากขึ้นด้วย ถ้าประชากรมีความแตกต่างกันน้อย (Homogeneity) ขนาดของกลุ่มตัวอย่างก็น้อยลง
3.ระดับความแม่นยำ (Precision level; e หรือ d)คือความคลาดเคลื่อนจากการสุ่ม (Sampling
error)เป็นค่าที่สำคัญในการประมาณค่าจริงของกลุ่มประชากรจากการศึกษาในกลุ่มตัวอย่าง กำหนดให้เป็นค่าร้อยละ (เช่น+ร้อยละ 5)และค่าดังกล่าวผกผันกับระดับความแม่นยำ (d2) การกำหนดค่าระดับความแม่นยำในการศึกษา โดยทั่วไปผู้วิจัยเป็นผู้กำหนดขนาดของความคลาดเคลื่อนว่าต้องการให้มีความคลาดเคลื่อนมากหรือน้อย
สูตรการคำนวณหาขนาดตัวอย่าง
การคำนวณหาขนาดกลุ่มตัวอย่างสามารถพิจารณาจาก 1) ระดับความเชื่อมั่น (Confidence
level) 2) ระดับของความแปรปรวน (Degree of variability; P หรือ Ó ) และ 3) ระดับความแม่นยำ (Precision level: e หรือ d) การเลือกใช้สูตรกาคำนวณหาขนาดตัวอย่างสามารถพิจารณาจากประเภทของการประมาณค่า ได้แก่ การประมาณค่าเฉลี่ยและการประมาณค่าสัดส่วน และแต่ละประเภทของการประมาณค่าจำแนกเป็น 2 ประเภทคือ กรณีทราบประชากร และไม่ทราบประชากร ดังนี้
เพื่อลดปัญหาของการตอบกลับของแบบสอบถามที่ไม่สมบูรณ์หรือน้อยกว่าที่กำหนด ทำให้ข้อมูล
มีการสูญหาย (Missing data) ทำให้เกิดอคติ (Information bias) ได้ ดังนั้นเพื่อเป็นการลดอคติดังกล่าวผู้วิจัยควรมีการทบทวนวรรณกรรมถึงอัตราการตอบกลับ (Response rate; R) จากงานวิจัยที่เกี่ยวข้องหรือใกล้เคียงกลับการศึกษามากที่สุด ซึ่งนำเสนอในรูปร้อยละและคำนวณปรับขนาดตัวอย่างด้วยสูตรดังนี้
|
ตัวอย่างการเลือกสูตรและวิธีการคำนวณ
การศึกษาวิจัยทางสาธารณสุข โดยเฉพาะการศึกษาที่มีรูปแบบการวิจัยเชิงพรรณนา ผู้วิจัยควรมีการคำนวณหาขนาดตัวอย่างที่ถูกต้อง ดังตัวอย่าง
ตัวอย่างที่ 1จากการศึกษาเกี่ยวกับความพึงพอใจของประชาชนต่อการใช้น้ำประปาจากระบบประปาหมู่บ้าน ในพื้นที่ตำบลถ้ำลา ตำบลลานข่อย อำเภอป่าพะยอม จังหวัดพัทลุง จากการศึกษา กำหนดให้ตัวอย่าง คือประชาชนที่อาศัยอยู่ในพื้นที่บ้านถ้ำลา ตำบลลานข่อย อำเภอป่าพะยอม จังหวัดพัทลุง และมีการใช้น้ำประปาจากระบบประปาหมู่บ้าน นอกจากนี้การศึกษาครั้งนี้มีตัวแปรตามคือ ความพึงพอใจ ซึ่งมีระดับการวัดของข้อมูลแบบช่วงมาตรา (Interval scale) หรือตัวแปรต่อเนื่อง (Continous variable) ดังนั้นสูตรที่ใช้ในการคำนวณหาขนาดตัวอย่างในการศึกษาครั้งนี้คือ สูตรการประมาณค่าเฉลี่ย ในกรณีไม่ทราบประชากร สูตรที่ 1 เนื่องจาก การศึกษาดังกล่าวไม่ได้กล่าวถึงขนาดของจำนวนประชากร การคำนวณหาขนาดกลุ่มตัวอย่างโดยการกำหนดค่าที่สำคัญคือ
- ระดับความเชื่อมั่น (Confidence level;Z เท่ากับ 96 )
- ระดับความแปรปรวน (Degree of variability: Ó) จากการศึกษาครั้งนี้ได้ทำการทบทวน
วรรณกรรม และพบว่าค่าเฉลี่ยของคะแนนความพึงพอใจต่อการใช้น้ำประปาหมู่บ้านเท่ากับ 3.43 คะแนน และมีค่าส่วนเบี่ยงเบนมาตรฐานเท่ากับ 0.31 (ปวิตร ชัยวิสิทธิ์. 2548: 83-86)และ
- ระดับความแม่นยำ ( Precision Level;eหรือd) จากการศึกษาครั้งนี้กำหนดระดับความแม่นยำ
หรือมีความผิดพลาดไม่เกินร้อยละ 5
เมื่อแท่นค่าในสูตรที่ 1 ดังนี้
1.962 X0.312
0.05 2
= 147.67
จากการศึกษาครั้งนี้ ได้ขนาดตัวอย่างในการศึกษาไม่น้อยกว่า 148 คน
ตัวอย่างที่ 2การศึกษาคุณภาพชีวิตของผู้สูงอายุ ตำบลแหลมตะโหนดอำเภอควนขนุนจังหวัดพัทลุง จากฐานข้อมูลทะเบียนประชากรของโรงพยาบาลส่งเสริมสุขภาพตำบลแหลมตะโหนด อำเภอควนขนุนจังหวัดพัทลุง พบว่า มีจำนวนผู้สูงอายุที่ได้รับการขึ้นทะเบียนจำนวน 713 ราย
โดยกำหนดตัวแปรตามคือ คุณภาพชีวิต ซึ่งมีระดับการวัดของข้อมูลแบบช่วงมาตรา
(Interval scale) หรือตัวแปรต่อเนื่อง (Continous variable) ดังนั้น สูตรที่ใช้ในการคำนวณหาขนาดตัวอย่างในการศึกษาครั้งนี้ คือสูตรการประมาณค่าเฉลี่ย ในกรณีทราบประชากร สูตรที่ 2 การคำนวณหากลุ่มตัวอย่างโดยการกำหนดค่าที่สำคัญคือ
1) ระดับความเชื่อมั่น (Confidence level;Z เท่ากับ 1.96 )
2) ระดับความแปรปรวน (Degree of variability: Ó) จากการศึกษาครั้งนี้ได้ทำการทบทวนวรรณกรรม และพบว่าส่วนเบี่ยงเบนมาตรฐานของคุณภาพชีวิตของผู้สูงอายุเท่ากับ 10.75 คะแนน (จันธณา สงนุ้ย. 2551:83-87) และ
3) ระดับความแม่นยำ ( Precision Level;eหรือd)จากการศึกษาครั้งนี้กำหนดค่าความคลาดเคลื่อนที่ยอมรับได้เท่ากับ 1.61 โดยกำหนดให้ความคลาดเคลื่อนของการศึกษาครั้งนี้แตกต่างจากค่าส่วนเบี่ยงเบนมาตรฐานจากการทบทวนวรรณกรรมร้อยละ 15
เมื่อแทนค่าในสูตรที่ 2 ดังนี้
=713×1.96 2 x10.75 2
[1.612(713-1)]+[ 1.962x10.752]
= 316,532.7137
2,289.5201
=138.52
การศึกษาครั้งนี้ ได้ขนาดตัวอย่างในการศึกษาไม่น้อยกว่า 139 คน
ตัวอย่างที่ 3จากการศึกษาพบว่าอัตราความชุกของอาการปวดทางโครงร่างและกล้ามเนื้อใน
คนงานโรงงานผลิตชิ้นส่วนสารกึ่งตัวนำในนิคมอุตสาหกรรมภาคเหนือ (วิลาวัลย์ ชัยแก่น. 2550 : 226-233)กลุ่มตัวอย่างคือ คนงานที่ปฏิบัติงานในโรงงานผลิตชิ้นส่วนสารกึ่งตัวนำในนิคมอุตสาหกรรมภาคเหนือ
จากการศึกษาครั้งนี้กำหนดให้ตัวแปรตามคือ อัตราความชุกของอาการปวดทางโครงร่างและ
กล้ามเนื้อ (Prevalence rate) ซึ่งมีระดับการวัดแบบนามบัญญัติ (Nominal scale)หรือตัวแปรแจงนับ (Categorical variable) ดังนั้นสูตรที่ใช้ในการคำนวณหาขนาดตัวอย่างในการศึกษาครั้งนี้คือ สูตรการประมาณค่าสัดส่วน ในกรณีที่ไม่ทราบประชากร สูตรที่ 3 การคำนวณหาขนาดกลุ่มตัวอย่างโดยการกำหนดค่าที่สำคัญคือ
1) ระดับความเชื่อมั่น (Confidence level;Z เท่ากับ 1.96 )
2) ระดับความแปรปรวน (Degree of variability: p) จากการศึกษาครั้งนี้ได้ทำการทบทวนวรรณกรรมที่เกี่ยวข้อง และพบว่าอัตราความชุกของการเกิดอาการปวดทางโครงร่างและกล้ามเนื้อเป็นร้อยละ 79.8 (p=0.798) (TaylorW.,2005 : U1629) และ
3) ระดับความแม่นยำ ( Precision Level;e หรือd)จากการศึกษาครั้งนี้กำหนดค่าความคลาดเคลื่อนที่ยอมรับได้เท่ากับ 0.05
เมื่อแทนค่าในสูตรที่ 3ดังนี้
=1.96 2 x0.798x(1-0.798)
0.052
= 0.6193
0.0025
= 247.70
การศึกษาครั้งนี้ ได้ขนาดตัวอย่างในการศึกษาไม่น้อยกว่า 248 คน
ตัวอย่างที่ 4จากการศึกษาปัจจัยที่มีความสัมพันธ์ต่อการออกกำลังกายของประชาชนตำบลแหลมโตนด อำเภอควนขนุน จังหวัดพัทลุง(ปุญญพัฒน์ ไชยเมย์. 2556 :38-48)กลุ่มตัวอย่างคือ ประชาชนตำบลแหลมโตนด อำเภอควนขนุน จังหวัดพัทลุง ที่มีอายุระหว่าง 20-60 ปี จากฐานข้อมูลประชากรทะเบียนราษฎร์โรงพยาบาลส่งเสริมสุขภาพระดับตำบลจำนวน 2,639 คน จาก 9 หมู่บ้าน
จากการศึกษาครั้งนี้กำหนดให้ตัวแปรตามคือการออกกำลังกาย โดยกำหนดให้มีพฤติกรรมการออกกำลังกายหรือไม่มี (มี/ไม่มี) ซึ่งมีระดับการวัดแบบนามบัญญัติ (Nominal scale)หรือตัวแปรแจงนับ (Categorical variable) ดังนั้นสูตรที่ใช้ในการคำนวณหาขนาดตัวอย่างในการศึกษาครั้งนี้คือ สูตรการประมาณค่าสัดส่วน ในกรณีที่ทราบประชากร สูตรที่ 4 การคำนวณหาขนาดกลุ่มตัวอย่างโดยการกำหนดค่าที่สำคัญคือ
1) ระดับความเชื่อมั่น (Confidence level;Z เท่ากับ 1.96 )
2) ระดับความแปรปรวน (Degree of variability: p) จากการศึกษาครั้งนี้ได้ทำการทบทวนวรรณกรรมที่เกี่ยวข้อง และพบว่าสัดส่วนของการเกิดพฤติกรรมการออกกำลังกายเป็นร้อยละ 75 (p=0.75)
(ศิริพร รุ่งเรือง. 2549 : 315-322) และ
3) ระดับความแม่นยำ ( Precision Level;e หรือd)จากการศึกษาครั้งนี้กำหนดค่าความคลาดเคลื่อนที่ยอมรับได้เท่ากับ 0.05
เมื่อแทนค่าในสูตรที่ 4 ดังนี้
= 2,639×1.96 2x0.75(1-0.75)
[0.05 2(2,639-1)]+[1.96 2x0.75(1-0.75)]
= 1,900.8717
7.3153
= 259.84
การศึกษาครั้งนี้ ได้ขนาดตัวอย่างในการศึกษาไม่น้อยกว่า 260 คน
ตัวอย่างที่ 5จากการศึกษาคุณภาพชีวิตของผู้สูงอายุ ตำบลแหลมโตนด อำเภอควนขนุน จังหวัดพัทลุง (ปุญญพัฒน์ ไชยเมล์. 2555 : 54-64) จากการคำนวณหาขนาดตัวอย่างโดยการประมาณค่าเฉลี่ยของประชากร ในกรณีทราบประชากร สูตรที่ 2 และจากการทบทวนวรรณกรรมพบจากการศึกษาปัจจัยที่มีความสัมพันธ์กับคุณภาพชีวิตของผู้สูงอายุในศูนย์ส่งเสริมภูมิปัญญาผู้สูงอายุเทศบาลเมืองพัทลุง จังหวัดพัทลุง พบว่าอัตราการตอบกลับของแบบสอบถามในกลุ่มผู้สูงอายุคิดเป็นร้อยละ 90 (จันธณา สงนุ้ย. 2551 : 83-87)
ดังนั้นการศึกษาครั้งนี้จึงปรับขนาดของกลุ่มตัวอย่างที่ใช้ในการศึกษาโดยใช้สูตรในการปรับขนาดสัดส่วน สูตรที่ 5 โดยกำหนดให้ค่าอัตราการสูญเสียเท่ากับร้อยละ 10 (R=1-0.90=0.10)
เมื่อแทนค่าในสูตรที่ 5 ดังนี้
n = n
1-R
= 139
1-0.1
= 154
ดังนั้น การศึกษาครั้งนี้ต้องเพิ่มขนาดกลุ่มตัวอย่างจำนวน 19 คน รวมเป็น 154 คน
การใช้โปรแกรมในการคำนวณขนาดของกลุ่มตัวอย่าง โดยใช้โปรแกรม PS sample size software
การใชโปรแกรม PS เพื่อคํานวณขนาดของกลุมตัวอยาง ( PS Sample Size software: online) หรือสามารถดาวโหลดโปรแกรมได้ทาง internet โปรแกรมนี้เหมาะสําหรับคํานวณงานวิจัยเชิงทดลอง กึ่งทดลอง แตไมเหมาะสําหรับ งานวิจัยเชิงบรรยาย )
ถางานวิจัยเปนการ เปรียบเทียบ 2 กลุม และผลลัพธหลักของการวิจัยเปนคาเฉลี่ย วิเคราะหขอมูลโดยเลือก t-test เปดใชโปรแกรมจะพบคําวา Out put : What do you want to know? ใหผูวิจัยเลือก Sample size แลวจะถูกถามวา Paired or independent ? ถารูปแบบการวิจัยเปนการเปรียบเทียบในกลุมเดียวกันไมอิสระตอกัน หรือเก็บขอมูล กอนและหลังการให intervention ในกลุมตัวอยางกลุมเดียวกัน(one sample) ใหเลือก Sample Size Design: แบบ Paired ถาเลือก independent หมายถึง รูปแบบการวิจัยเปนการเปรียบเทียบตางกลุม หรือ กลุม ตัวอยางคนละกลุม มี อิสระตอกัน Input : α (ความคลาดเคลื่อนชนิดที่ 1/ type I error) คือ โอกาสที่ผูวิจัยจะพบความแตก ตางของผลการวิจัยของประชากรที่ศึกษากับประชากรเปาหมายในขณะที่ความจริงนั้นไมมีความ แตกตาง (ไมมีความแตกตางระหวางผลการศึกษาระหวางกลุมประชากร) โดยทั่วไปมักกําหนดไวที่ ระดับ รอยละ 5 หรือ .05 นั่นเอง )
Power of test หมายถึง ความนาจะเปนของระดับความมั่นใจวาตัดสินใจไดถูกตองใน การ ปฎิเสธ สมมุติฐานศูนย เมื่อสมมุติฐานศูนยไมเปนจริง โดยทั่วไปนิยมกําหนดคา Power ให เทากับ รอยละ 80 (เวลาเติมคาในโปรแกรมใหใช = 0.80) (delta หรือΔ) หมายถึง คาความแตกตางของคาเฉลี่ย กรณีที่งานวิจัยใชเครื่องมือเดิม วิธีการเดิมใหใช คาเฉลี่ยลบกัน ( คาเฉลี่ยกอนลงinterventionลบดวยคาเฉลี่ยหลังไดรับ intervention แลว ) ในกรณีที่งานวิจัยเปลี่ยนแปลงไปจากเดิม เปลี่ยนเครื่องมือใหมทําใหใชขอมูลเดิมไมได ก็ควรทํา Pilot study เพื่อหาคาความแตกตางของคาเฉลี่ยกอนหรือ อาจจะใชคาที่หนวยงานกําหนด เปาหมายไวหรือใชคา gold standard ที่ยอมรับกันในระดับสากล σ (ซิกมา/Sigma) หมายถึง คาเบี่ยงเบนมาตรฐาน(Standard Deviation/SD) ใหใชคาSDที่ มากกวาคาSDตัวอื่นมาแทนคาในสูตรเพื่อทําใหไดขนาดกลุมตัวอยางจํานวนที่มากพอจะครอบคลุม การหาคําตอบ m หมายถึงอัตราสวนระหวางกลุมควบคุมและกลุมทดลอง โดย ถารูปแบบการวิจัยเปน Paired จะไมมีการระบุคา m เพราะใชตัวอยางกลุมเดียวแตวัดกอนและหลัง ถารูปแบบการวิจัยเปน independent ใหระบุอัตราสวนระหวางกลุมควบคุมและกลุมทดลอง เปน อัตราสวน 1 : 1 หรือ 2:1 แลวแตความตองการของผูวิจัย โดยระบุในชองเปน m