แนวปฏิบัติสำหรับการคำนวณขนาดกลุ่มตัวอย่างในการทำวิจัย

ความสำคัญของการคำนวณขนาดตัวอย่าง

          การมีระเบียบวิธีวิจัยที่ถูกต้องสามารถลดอคติ (Systematic error) เกิดขึ้นจากกระบวนการวิจัยและส่งผลต่อความน่าเชื่อถือ การคำนวณหาขนาดตัวอย่างเป็นขั้นตอนที่สำคัญในระเบียบวิธีวิจัยเพื่อให้ได้มาของขนาดตัวอย่าง (Sample size) ที่เหมาะสมและเพียงพอ กลุ่มตัวอย่าง หมายถึงกลุ่มคน เหตุการณ์ หรือสิ่งที่ผู้วิจัยสนใจศึกษา สำหรับการวิจัยทางสาธารณสุขกลุ่มตัวอย่างส่วนใหญ่ คือ ประชาชน กลุ่มผู้ป่วย หรือผู้รับบริการทางการแพทย์และสาธารณสุข และได้รับคัดเลือกด้วยวิธีการที่เหมาะสมจากกลุ่มประชากร (Population of the study) เพื่อเป็นตัวแทน (Representative) หรือเพื่ออ้างอิง (Generalization) สู่ประชากรที่ศึกษา

โดยทั่วไปการคำนวณหาขนาดตัวอย่างมีความสำคัญในทุกรูปแบบการศึกษาวิจัย ซึ่งผลที่ได้จากการศึกษาในกลุ่มตัวอย่างเป็นตัวสะท้อนถึงลักษณะของประชากร โดยเป็นการอ้างอิง(Generalization)สู่กลุ่มประชากรที่ทำการศึกษา การศึกษารูปแบบเชิงพรรณนา ผลการศึกษาที่ได้จากกลุ่มตัวอย่างมักเป็นการประมาณค่า และเป็นค่าที่ดีที่สุดสำหรับกลุ่มประชากรที่ทำการศึกษา โดยนำเสนอผลการศึกษาในลักษณะของอัตราความชุก อุบัติการณ์ ค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐาน

การพิจารณาการคำนวณขนาดกลุ่มตัวอย่าง

          การคำนวณหาขนาดกลุ่มตัวอย่างในงานวิจัยเป็นขั้นตอนหนึ่งที่สำคัญในระเบียบวิธีวิจัย ซึ่งส่งผลต่อความน่าเชื่อถือและอคติที่อาจเกิดขึ้น การคำนวณหาขนาดกลุ่มตัวอย่างที่เหมาะสมและเพียงพอ ช่วยให้ผู้วิจัยสามารถเตรียมการ วางแผนและจัดการในขั้นตอนของการเก็บรวบรวมข้อมูลได้เป็นอย่างดี

หลักเกณฑ์ที่ใช้ในการพิจารณาสำหรับการคำนวณหาขนาดกลุ่มตัวอย่างมีดังนี้

  1. ระดับความเชื่อมั่น (Confidence level ) จากพื้นฐานทางทฤษฎีแนวโน้มเข้าสู่ส่วนกลาง

(Central limit theorem) มีแนวคิดหลักที่ว่าเมื่อประชากรถูกสุ่มซ้ำกันหลายครั้ง ค่าที่ได้จากการสุ่มในกลุ่มตัวอย่างจะมีค่าเท่ากับที่เป็นจริงในกลุ่มประชากรเสมอ นอกจากนี้ค่าที่ได้จากการสุ่มในกลุ่มตัวอย่างการกระจายแบบโค้งปกติ ซึ่งร้อยละ 95 ของค่าจริงในกลุ่มตัวอย่างอยู่ภายใต้สองส่วนของค่าส่วนเบี่ยงเบนมาตรฐานของค่าที่ได้จากกลุ่มประชากรจริง โดยทั่วไป ค่าพื้นที่ใต้โค้งปกติ (Z α/2หรือ Z 0.025) เท่ากับ 1.96

  1. ระดับความแปรปรวน (Degree of variability; P หรือ Ó)เป็นคุณลักษณะที่ถูกวัดกล่าวถึง

การกระจายในกลุ่มประชากร ในกรณีที่กลุ่มประชากรมีความแตกต่างกันมาก (Heterogeneity)ขนาดของกลุ่มตัวอย่างก็มากขึ้นด้วย ถ้าประชากรมีความแตกต่างกันน้อย (Homogeneity) ขนาดของกลุ่มตัวอย่างก็น้อยลง

3.ระดับความแม่นยำ (Precision level; e หรือ d)คือความคลาดเคลื่อนจากการสุ่ม (Sampling

error)เป็นค่าที่สำคัญในการประมาณค่าจริงของกลุ่มประชากรจากการศึกษาในกลุ่มตัวอย่าง กำหนดให้เป็นค่าร้อยละ (เช่น+ร้อยละ 5)และค่าดังกล่าวผกผันกับระดับความแม่นยำ (d2) การกำหนดค่าระดับความแม่นยำในการศึกษา โดยทั่วไปผู้วิจัยเป็นผู้กำหนดขนาดของความคลาดเคลื่อนว่าต้องการให้มีความคลาดเคลื่อนมากหรือน้อย

 

สูตรการคำนวณหาขนาดตัวอย่าง

การคำนวณหาขนาดกลุ่มตัวอย่างสามารถพิจารณาจาก 1) ระดับความเชื่อมั่น (Confidence

level) 2) ระดับของความแปรปรวน (Degree of variability; P หรือ Ó ) และ 3) ระดับความแม่นยำ (Precision level: e หรือ d) การเลือกใช้สูตรกาคำนวณหาขนาดตัวอย่างสามารถพิจารณาจากประเภทของการประมาณค่า ได้แก่ การประมาณค่าเฉลี่ยและการประมาณค่าสัดส่วน และแต่ละประเภทของการประมาณค่าจำแนกเป็น 2 ประเภทคือ กรณีทราบประชากร และไม่ทราบประชากร ดังนี้

เพื่อลดปัญหาของการตอบกลับของแบบสอบถามที่ไม่สมบูรณ์หรือน้อยกว่าที่กำหนด ทำให้ข้อมูล

มีการสูญหาย (Missing data) ทำให้เกิดอคติ (Information bias) ได้ ดังนั้นเพื่อเป็นการลดอคติดังกล่าวผู้วิจัยควรมีการทบทวนวรรณกรรมถึงอัตราการตอบกลับ (Response rate; R) จากงานวิจัยที่เกี่ยวข้องหรือใกล้เคียงกลับการศึกษามากที่สุด ซึ่งนำเสนอในรูปร้อยละและคำนวณปรับขนาดตัวอย่างด้วยสูตรดังนี้

 

5)      สูตรการปรับขนาดของกลุ่มตัวอย่าง

n = n   (5)

       1-R

 

 

ตัวอย่างการเลือกสูตรและวิธีการคำนวณ

          การศึกษาวิจัยทางสาธารณสุข โดยเฉพาะการศึกษาที่มีรูปแบบการวิจัยเชิงพรรณนา ผู้วิจัยควรมีการคำนวณหาขนาดตัวอย่างที่ถูกต้อง ดังตัวอย่าง

ตัวอย่างที่ 1จากการศึกษาเกี่ยวกับความพึงพอใจของประชาชนต่อการใช้น้ำประปาจากระบบประปาหมู่บ้าน ในพื้นที่ตำบลถ้ำลา ตำบลลานข่อย อำเภอป่าพะยอม จังหวัดพัทลุง จากการศึกษา กำหนดให้ตัวอย่าง คือประชาชนที่อาศัยอยู่ในพื้นที่บ้านถ้ำลา ตำบลลานข่อย อำเภอป่าพะยอม จังหวัดพัทลุง และมีการใช้น้ำประปาจากระบบประปาหมู่บ้าน นอกจากนี้การศึกษาครั้งนี้มีตัวแปรตามคือ ความพึงพอใจ ซึ่งมีระดับการวัดของข้อมูลแบบช่วงมาตรา (Interval scale) หรือตัวแปรต่อเนื่อง (Continous variable) ดังนั้นสูตรที่ใช้ในการคำนวณหาขนาดตัวอย่างในการศึกษาครั้งนี้คือ สูตรการประมาณค่าเฉลี่ย ในกรณีไม่ทราบประชากร สูตรที่ 1 เนื่องจาก การศึกษาดังกล่าวไม่ได้กล่าวถึงขนาดของจำนวนประชากร การคำนวณหาขนาดกลุ่มตัวอย่างโดยการกำหนดค่าที่สำคัญคือ

  • ระดับความเชื่อมั่น (Confidence level;Z เท่ากับ 96 )
  • ระดับความแปรปรวน (Degree of variability: Ó) จากการศึกษาครั้งนี้ได้ทำการทบทวน

วรรณกรรม และพบว่าค่าเฉลี่ยของคะแนนความพึงพอใจต่อการใช้น้ำประปาหมู่บ้านเท่ากับ 3.43 คะแนน และมีค่าส่วนเบี่ยงเบนมาตรฐานเท่ากับ 0.31 (ปวิตร ชัยวิสิทธิ์. 2548: 83-86)และ

  • ระดับความแม่นยำ ( Precision Level;eหรือd) จากการศึกษาครั้งนี้กำหนดระดับความแม่นยำ

หรือมีความผิดพลาดไม่เกินร้อยละ 5

 

เมื่อแท่นค่าในสูตรที่ 1 ดังนี้

 

1.962 X0.312

0.05 2

= 147.67

จากการศึกษาครั้งนี้ ได้ขนาดตัวอย่างในการศึกษาไม่น้อยกว่า 148 คน

ตัวอย่างที่ 2การศึกษาคุณภาพชีวิตของผู้สูงอายุ ตำบลแหลมตะโหนดอำเภอควนขนุนจังหวัดพัทลุง จากฐานข้อมูลทะเบียนประชากรของโรงพยาบาลส่งเสริมสุขภาพตำบลแหลมตะโหนด อำเภอควนขนุนจังหวัดพัทลุง พบว่า มีจำนวนผู้สูงอายุที่ได้รับการขึ้นทะเบียนจำนวน 713 ราย

โดยกำหนดตัวแปรตามคือ คุณภาพชีวิต ซึ่งมีระดับการวัดของข้อมูลแบบช่วงมาตรา

(Interval scale) หรือตัวแปรต่อเนื่อง (Continous variable) ดังนั้น สูตรที่ใช้ในการคำนวณหาขนาดตัวอย่างในการศึกษาครั้งนี้ คือสูตรการประมาณค่าเฉลี่ย ในกรณีทราบประชากร สูตรที่ 2 การคำนวณหากลุ่มตัวอย่างโดยการกำหนดค่าที่สำคัญคือ

1) ระดับความเชื่อมั่น (Confidence level;Z เท่ากับ 1.96 )

2) ระดับความแปรปรวน (Degree of variability: Ó) จากการศึกษาครั้งนี้ได้ทำการทบทวนวรรณกรรม และพบว่าส่วนเบี่ยงเบนมาตรฐานของคุณภาพชีวิตของผู้สูงอายุเท่ากับ 10.75 คะแนน (จันธณา สงนุ้ย. 2551:83-87) และ

3) ระดับความแม่นยำ ( Precision Level;eหรือd)จากการศึกษาครั้งนี้กำหนดค่าความคลาดเคลื่อนที่ยอมรับได้เท่ากับ 1.61 โดยกำหนดให้ความคลาดเคลื่อนของการศึกษาครั้งนี้แตกต่างจากค่าส่วนเบี่ยงเบนมาตรฐานจากการทบทวนวรรณกรรมร้อยละ 15

เมื่อแทนค่าในสูตรที่ 2 ดังนี้

=713×1.96 2 x10.75 2

[1.612(713-1)]+[ 1.962x10.752]

= 316,532.7137

2,289.5201

=138.52

การศึกษาครั้งนี้ ได้ขนาดตัวอย่างในการศึกษาไม่น้อยกว่า 139 คน

ตัวอย่างที่ 3จากการศึกษาพบว่าอัตราความชุกของอาการปวดทางโครงร่างและกล้ามเนื้อใน

คนงานโรงงานผลิตชิ้นส่วนสารกึ่งตัวนำในนิคมอุตสาหกรรมภาคเหนือ (วิลาวัลย์ ชัยแก่น. 2550 : 226-233)กลุ่มตัวอย่างคือ คนงานที่ปฏิบัติงานในโรงงานผลิตชิ้นส่วนสารกึ่งตัวนำในนิคมอุตสาหกรรมภาคเหนือ

จากการศึกษาครั้งนี้กำหนดให้ตัวแปรตามคือ อัตราความชุกของอาการปวดทางโครงร่างและ

กล้ามเนื้อ (Prevalence rate) ซึ่งมีระดับการวัดแบบนามบัญญัติ (Nominal scale)หรือตัวแปรแจงนับ (Categorical variable) ดังนั้นสูตรที่ใช้ในการคำนวณหาขนาดตัวอย่างในการศึกษาครั้งนี้คือ สูตรการประมาณค่าสัดส่วน ในกรณีที่ไม่ทราบประชากร สูตรที่ 3 การคำนวณหาขนาดกลุ่มตัวอย่างโดยการกำหนดค่าที่สำคัญคือ

1) ระดับความเชื่อมั่น (Confidence level;Z เท่ากับ 1.96 )

2) ระดับความแปรปรวน (Degree of variability: p) จากการศึกษาครั้งนี้ได้ทำการทบทวนวรรณกรรมที่เกี่ยวข้อง และพบว่าอัตราความชุกของการเกิดอาการปวดทางโครงร่างและกล้ามเนื้อเป็นร้อยละ 79.8 (p=0.798) (TaylorW.,2005 : U1629) และ

3) ระดับความแม่นยำ ( Precision Level;e หรือd)จากการศึกษาครั้งนี้กำหนดค่าความคลาดเคลื่อนที่ยอมรับได้เท่ากับ 0.05

เมื่อแทนค่าในสูตรที่ 3ดังนี้

=1.96 2 x0.798x(1-0.798)

                             0.052

=     0.6193

0.0025

= 247.70

การศึกษาครั้งนี้ ได้ขนาดตัวอย่างในการศึกษาไม่น้อยกว่า 248 คน

ตัวอย่างที่ 4จากการศึกษาปัจจัยที่มีความสัมพันธ์ต่อการออกกำลังกายของประชาชนตำบลแหลมโตนด อำเภอควนขนุน จังหวัดพัทลุง(ปุญญพัฒน์ ไชยเมย์. 2556 :38-48)กลุ่มตัวอย่างคือ ประชาชนตำบลแหลมโตนด อำเภอควนขนุน จังหวัดพัทลุง ที่มีอายุระหว่าง 20-60 ปี จากฐานข้อมูลประชากรทะเบียนราษฎร์โรงพยาบาลส่งเสริมสุขภาพระดับตำบลจำนวน 2,639 คน จาก 9 หมู่บ้าน

จากการศึกษาครั้งนี้กำหนดให้ตัวแปรตามคือการออกกำลังกาย โดยกำหนดให้มีพฤติกรรมการออกกำลังกายหรือไม่มี (มี/ไม่มี) ซึ่งมีระดับการวัดแบบนามบัญญัติ (Nominal scale)หรือตัวแปรแจงนับ (Categorical variable) ดังนั้นสูตรที่ใช้ในการคำนวณหาขนาดตัวอย่างในการศึกษาครั้งนี้คือ สูตรการประมาณค่าสัดส่วน ในกรณีที่ทราบประชากร สูตรที่ 4 การคำนวณหาขนาดกลุ่มตัวอย่างโดยการกำหนดค่าที่สำคัญคือ

1) ระดับความเชื่อมั่น (Confidence level;Z เท่ากับ 1.96 )

2) ระดับความแปรปรวน (Degree of variability: p) จากการศึกษาครั้งนี้ได้ทำการทบทวนวรรณกรรมที่เกี่ยวข้อง และพบว่าสัดส่วนของการเกิดพฤติกรรมการออกกำลังกายเป็นร้อยละ 75 (p=0.75)

(ศิริพร รุ่งเรือง. 2549 : 315-322) และ

3) ระดับความแม่นยำ ( Precision Level;e หรือd)จากการศึกษาครั้งนี้กำหนดค่าความคลาดเคลื่อนที่ยอมรับได้เท่ากับ 0.05

เมื่อแทนค่าในสูตรที่ 4 ดังนี้

 

= 2,639×1.96 2x0.75(1-0.75)

[0.05 2(2,639-1)]+[1.96 2x0.75(1-0.75)]

= 1,900.8717

7.3153

= 259.84

การศึกษาครั้งนี้ ได้ขนาดตัวอย่างในการศึกษาไม่น้อยกว่า 260 คน

ตัวอย่างที่ 5จากการศึกษาคุณภาพชีวิตของผู้สูงอายุ ตำบลแหลมโตนด อำเภอควนขนุน จังหวัดพัทลุง (ปุญญพัฒน์ ไชยเมล์. 2555 : 54-64) จากการคำนวณหาขนาดตัวอย่างโดยการประมาณค่าเฉลี่ยของประชากร ในกรณีทราบประชากร สูตรที่ 2 และจากการทบทวนวรรณกรรมพบจากการศึกษาปัจจัยที่มีความสัมพันธ์กับคุณภาพชีวิตของผู้สูงอายุในศูนย์ส่งเสริมภูมิปัญญาผู้สูงอายุเทศบาลเมืองพัทลุง จังหวัดพัทลุง พบว่าอัตราการตอบกลับของแบบสอบถามในกลุ่มผู้สูงอายุคิดเป็นร้อยละ 90 (จันธณา สงนุ้ย. 2551 : 83-87)

ดังนั้นการศึกษาครั้งนี้จึงปรับขนาดของกลุ่มตัวอย่างที่ใช้ในการศึกษาโดยใช้สูตรในการปรับขนาดสัดส่วน สูตรที่ 5 โดยกำหนดให้ค่าอัตราการสูญเสียเท่ากับร้อยละ 10 (R=1-0.90=0.10)

เมื่อแทนค่าในสูตรที่ 5 ดังนี้

n = n                                            

                 1-R

= 139

1-0.1

= 154

          ดังนั้น การศึกษาครั้งนี้ต้องเพิ่มขนาดกลุ่มตัวอย่างจำนวน 19 คน รวมเป็น 154 คน

การใช้โปรแกรมในการคำนวณขนาดของกลุ่มตัวอย่าง โดยใช้โปรแกรม PS sample size software

การใชโปรแกรม PS เพื่อคํานวณขนาดของกลุมตัวอยาง ( PS Sample Size software: online) หรือสามารถดาวโหลดโปรแกรมได้ทาง internet โปรแกรมนี้เหมาะสําหรับคํานวณงานวิจัยเชิงทดลอง กึ่งทดลอง แตไมเหมาะสําหรับ งานวิจัยเชิงบรรยาย )

ถางานวิจัยเปนการ เปรียบเทียบ 2 กลุม และผลลัพธหลักของการวิจัยเปนคาเฉลี่ย   วิเคราะหขอมูลโดยเลือก t-test   เปดใชโปรแกรมจะพบคําวา Out put : What do you want to know? ใหผูวิจัยเลือก Sample size   แลวจะถูกถามวา Paired or   independent ?     ถารูปแบบการวิจัยเปนการเปรียบเทียบในกลุมเดียวกันไมอิสระตอกัน หรือเก็บขอมูล กอนและหลังการให intervention ในกลุมตัวอยางกลุมเดียวกัน(one sample) ใหเลือก Sample Size Design: แบบ Paired                   ถาเลือก independent หมายถึง รูปแบบการวิจัยเปนการเปรียบเทียบตางกลุม หรือ กลุม ตัวอยางคนละกลุม มี อิสระตอกัน         Input : α (ความคลาดเคลื่อนชนิดที่ 1/ type I error) คือ โอกาสที่ผูวิจัยจะพบความแตก ตางของผลการวิจัยของประชากรที่ศึกษากับประชากรเปาหมายในขณะที่ความจริงนั้นไมมีความ แตกตาง (ไมมีความแตกตางระหวางผลการศึกษาระหวางกลุมประชากร) โดยทั่วไปมักกําหนดไวที่ ระดับ รอยละ 5 หรือ .05 นั่นเอง )

Power of test หมายถึง ความนาจะเปนของระดับความมั่นใจวาตัดสินใจไดถูกตองใน การ ปฎิเสธ สมมุติฐานศูนย เมื่อสมมุติฐานศูนยไมเปนจริง โดยทั่วไปนิยมกําหนดคา Power ให เทากับ รอยละ 80   (เวลาเติมคาในโปรแกรมใหใช =   0.80) (delta หรือΔ) หมายถึง คาความแตกตางของคาเฉลี่ย กรณีที่งานวิจัยใชเครื่องมือเดิม วิธีการเดิมใหใช คาเฉลี่ยลบกัน ( คาเฉลี่ยกอนลงinterventionลบดวยคาเฉลี่ยหลังไดรับ intervention แลว )                   ในกรณีที่งานวิจัยเปลี่ยนแปลงไปจากเดิม เปลี่ยนเครื่องมือใหมทําใหใชขอมูลเดิมไมได ก็ควรทํา Pilot study เพื่อหาคาความแตกตางของคาเฉลี่ยกอนหรือ อาจจะใชคาที่หนวยงานกําหนด เปาหมายไวหรือใชคา gold standard ที่ยอมรับกันในระดับสากล   σ (ซิกมา/Sigma) หมายถึง คาเบี่ยงเบนมาตรฐาน(Standard Deviation/SD) ใหใชคาSDที่ มากกวาคาSDตัวอื่นมาแทนคาในสูตรเพื่อทําใหไดขนาดกลุมตัวอยางจํานวนที่มากพอจะครอบคลุม การหาคําตอบ m หมายถึงอัตราสวนระหวางกลุมควบคุมและกลุมทดลอง โดย ถารูปแบบการวิจัยเปน Paired จะไมมีการระบุคา m เพราะใชตัวอยางกลุมเดียวแตวัดกอนและหลัง ถารูปแบบการวิจัยเปน independent ใหระบุอัตราสวนระหวางกลุมควบคุมและกลุมทดลอง เปน อัตราสวน 1 : 1 หรือ 2:1 แลวแตความตองการของผูวิจัย โดยระบุในชองเปน m