ความแตกต่างระหว่างความแปรปรวนของตัวอย่างและความแปรปรวนของประชากร ความแตกต่างระหว่าง
คำอธิบาย
ในสถิติการสุ่มตัวอย่าง หมายถึงการเลือกส่วนหนึ่งของข้อมูลสถิติรวมเพื่อให้ได้ข้อมูลที่เกี่ยวข้องทั้งหมด ข้อมูลสถิติหรือข้อมูลสถิติทั้งหมดเกี่ยวกับลักษณะเฉพาะของสมาชิกทุกคนที่อยู่ในการสืบสวนสอบสวนนี้เรียกว่า 'ประชากร' หรือ 'จักรวาล' (Das, N.G, 2010). ส่วนที่เลือกของประชากรที่ใช้เพื่อให้ได้ลักษณะของประชากรหรือเอกภพเรียกว่า 'ตัวอย่าง' ประชากรถูกนำมาทำเป็นหน่วยงานหรือสมาชิกแต่ละรายและหน่วยงานบางส่วนจะรวมอยู่ในกลุ่มตัวอย่าง จำนวนหน่วยของประชากรทั้งหมดเรียกว่าขนาดประชากรและของกลุ่มตัวอย่างเรียกว่าขนาดตัวอย่าง ประชากรและกลุ่มตัวอย่างสามารถมีขอบเขตหรือไม่มีที่สิ้นสุดและในทำนองเดียวกันพวกเขาสามารถมีอยู่หรือสมมุติได้
ความแปรปรวน:ความแปรปรวนเป็นค่าตัวเลขที่แสดงให้เห็นว่าตัวเลขแต่ละชุดในชุดข้อมูลกระจายตัวกันอย่างแพร่หลายว่ามีความหมายเท่าใด นั่นคือจำนวนที่ห่างไกลจากค่าเฉลี่ยและจากแต่ละอื่น ๆ ความแปรปรวนของค่าเป็นศูนย์หมายความว่าข้อมูลทั้งหมดเหมือนกัน ความแปรปรวนมากขึ้นค่าที่กระจายออกไปเกี่ยวกับค่าเฉลี่ยจึงเป็นจากกันและกัน ค่าความแปรปรวนน้อยลงค่าของค่าเฉลี่ยจะแตกต่างกันน้อยกว่าค่าเฉลี่ยดังนั้นค่าความแปรปรวนจึงไม่เป็นลบ ความแตกต่างระหว่างความแปรปรวนของประชากรและความแปรปรวนของกลุ่มตัวอย่างความแตกต่างหลักระหว่างความแปรปรวนของประชากรและความแปรปรวนของตัวอย่างมีความสัมพันธ์กับการคำนวณความแปรปรวน ความแปรปรวนถูกคำนวณในห้าขั้นตอน เราคำนวณค่าเบี่ยงเบนแรกจากค่าเฉลี่ยแล้วเบี่ยงเบนจากค่าเฉลี่ยและส่วนเบี่ยงเบนที่สามจะมีการยกกำลังสี่ส่วนเบี่ยงเบนที่สี่จะสรุปและผลรวมนี้หารด้วยจำนวนรายการที่มีการคำนวณความแปรปรวน ดังนั้นความแปรปรวน = Σ (xi-x -) / n ที่ไหน xi = ith. จำนวน x- = mean และ n = จำนวนรายการ …
ตอนนี้เมื่อคำนวณความแปรปรวนจากข้อมูลประชากร n จะเท่ากับจำนวนของไอเท็ม ดังนั้นถ้าความแปรปรวนของความดันโลหิตของคนทั้งหมด 1000 คนคำนวณจากข้อมูลความดันโลหิตของทุกคน 1000 คนแล้ว n = 1000 อย่างไรก็ตามเมื่อคำนวณความแปรปรวนจากข้อมูลตัวอย่าง 1 จะถูกหักออกจาก n ก่อนที่จะหารด้วย ผลรวมของความแปรปรวนกำลังสอง ดังนั้นในตัวอย่างข้างต้นถ้าข้อมูลตัวอย่างมี 100 รายการส่วนจะเป็น 100 - 1 = 99
ด้วยเหตุนี้ค่าความแปรปรวนที่คำนวณได้จากข้อมูลตัวอย่างสูงกว่าค่าที่สามารถตรวจพบได้โดยใช้ข้อมูลประชากร ตรรกะของการทำเช่นนั้นคือเพื่อชดเชยการขาดข้อมูลเกี่ยวกับข้อมูลประชากรของเรา เป็นไปไม่ได้ที่จะหาค่าความแปรปรวนของความสูงในมนุษย์สำหรับการขาดข้อมูลที่แท้จริงของเราเกี่ยวกับความสูงของสิ่งมีชีวิตทุกชนิดไม่ใช่การพูดถึงอนาคตแม้ว่าเราจะใช้ตัวอย่างหนึ่งในระดับปานกลางเช่นข้อมูลประชากรที่สูงขึ้นของทุกคนที่มีชีวิตอยู่ในสหรัฐฯมีความเป็นไปได้ทางร่างกาย แต่ค่าใช้จ่ายและเวลาที่เกี่ยวข้องกับเรื่องนี้จะพ่ายแพ้วัตถุประสงค์ของการคำนวณ นี่เป็นเหตุผลที่ทำให้ข้อมูลตัวอย่างถูกนำมาใช้เพื่อวัตถุประสงค์ทางสถิติส่วนใหญ่และข้อมูลนี้มีข้อมูลขาดจากข้อมูลส่วนใหญ่ เพื่อชดเชยค่านี้ค่าความแปรปรวนและส่วนเบี่ยงเบนมาตรฐานซึ่งเป็นรากฐานของความแปรปรวนจะสูงกว่ากรณีข้อมูลตัวอย่างมากกว่าความแปรปรวนจากข้อมูลประชากรสรุป:
ความแปรปรวนของประชากรหมายถึงค่าความแปรปรวนที่คำนวณได้จากข้อมูลประชากรและความแปรปรวนของตัวอย่างคือความแปรปรวนที่คำนวณได้จากข้อมูลตัวอย่าง เนื่องจากค่าของตัวหารนี้ในสูตรความแปรปรวนในกรณีของข้อมูลตัวอย่างคือ 'n-1' และเป็น 'n' สำหรับข้อมูลประชากร ผลที่ได้คือความแปรปรวนและส่วนเบี่ยงเบนมาตรฐานที่ได้จากข้อมูลตัวอย่างมากกว่าข้อมูลที่พบจากข้อมูลประชากร