ความแตกต่างระหว่างความถดถอยกลางกับการกระจายตัว

Anonim

การถดถอยและการกระจายตัวของภาคกลาง

ในสถิติเชิงพรรณนาและอนุมานดัชนีต่างๆใช้เพื่ออธิบายชุดข้อมูลที่ตรงกับศูนย์กลาง แนวโน้มการกระจายตัวและความคลาดเคลื่อน: สามคุณสมบัติที่สำคัญที่สุดที่กำหนดรูปร่างสัมพัทธ์ของการกระจายชุดข้อมูล

แนวโน้มกลางคืออะไร?

แนวโน้มกลางหมายถึงและตั้งศูนย์กลางของการแจกแจงค่า ค่าเฉลี่ยโหมดและค่ามัธยฐานคือดัชนีที่ใช้บ่อยที่สุดในการอธิบายแนวโน้มกลางของชุดข้อมูล ถ้าชุดข้อมูลเป็นแบบสมมาตรทั้งมัธยฐานและค่าเฉลี่ยของชุดข้อมูลจะตรงกับแต่ละชุด

เมื่อพิจารณาชุดข้อมูลค่าเฉลี่ยจะคำนวณโดยการรวมผลรวมของค่าข้อมูลทั้งหมดจากนั้นหารด้วยจำนวนข้อมูล ตัวอย่างเช่นน้ำหนักของ 10 คน (เป็นกิโลกรัม) วัดได้ 70, 62, 65, 72, 80, 70, 63, 72, 77 และ 79 แล้วน้ำหนักเฉลี่ยของ 10 คน (เป็นกิโลกรัม) อาจเป็น คำนวณดังนี้ น้ำหนักรวมคือ 70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79 = 710 Mean = (sum) / (จำนวนข้อมูล) = 710/10 = 71 (เป็นกิโลกรัม) เป็นที่เข้าใจว่าค่าผิดปกติ (จุดข้อมูลที่เบี่ยงเบนไปจากแนวโน้มปกติ) มีแนวโน้มที่จะส่งผลต่อค่าเฉลี่ย ดังนั้นในที่ที่มีค่าความผิดปกติอยู่คนเดียวจะไม่ให้ภาพที่ถูกต้องเกี่ยวกับศูนย์กลางของชุดข้อมูล

ค่ามัธยฐานคือจุดข้อมูลที่อยู่ตรงกลางของชุดข้อมูล วิธีหนึ่งในการคำนวณค่ามัธยฐานคือการสั่งให้จุดข้อมูลเรียงลำดับจากนั้นหาจุดข้อมูลที่อยู่ตรงกลาง ตัวอย่างเช่นหากเคยสั่งชุดข้อมูลก่อนหน้านี้ไว้เช่น 62, 63, 65, 70, 70, 72, 72, 77, 79, 80 ดังนั้น (70 + 72) / 2 = 71 อยู่ตรงกลาง จากนี้จะเห็นได้ว่ามัธยฐานไม่จำเป็นต้องอยู่ในชุดข้อมูล ค่ามัธยฐานไม่ได้รับผลกระทบจากการที่มีค่าผิดปกติ ดังนั้นมัธยฐานจะทำหน้าที่เป็นตัววัดที่ดีขึ้นของแนวโน้มกลางในการแสดงออกของค่าผิดปกติ

โหมดนี้เป็นค่าที่เกิดขึ้นบ่อยที่สุดในชุดข้อมูล ในตัวอย่างก่อนหน้านี้ค่า 70 และ 72 ทั้งสองเกิดขึ้นสองครั้งและดังนั้นทั้งสองโหมดเป็น นี่แสดงให้เห็นว่าในการแจกแจงบางส่วนมีค่ากิริยามากกว่าหนึ่งแบบ ถ้ามีเพียงหนึ่งโหมดชุดข้อมูลจะมีการ unimodal ในกรณีนี้ชุดข้อมูลเป็นแบบ bimodal

การกระจายตัวคืออะไร?

การกระจายตัวคือจำนวนการแพร่กระจายของข้อมูลเกี่ยวกับศูนย์กลางของการแจกจ่าย ช่วงและส่วนเบี่ยงเบนมาตรฐานเป็นมาตรการที่ใช้บ่อยที่สุดในการกระจายตัว

ช่วงเป็นค่าสูงสุดที่ลบค่าต่ำสุด ในตัวอย่างก่อนหน้าค่าสูงสุดคือ 80 และค่าต่ำสุดคือ 62 ดังนั้นช่วงคือ 80-62 = 18 แต่ช่วงไม่ได้ให้ภาพที่เพียงพอเกี่ยวกับการกระจายตัว

เมื่อต้องการคำนวณส่วนเบี่ยงเบนมาตรฐานก่อนคำนวณค่าเบี่ยงเบนของค่าข้อมูลจากค่าเฉลี่ย ค่าเบี่ยงเบนของรากสแควร์เรียกว่าค่าเบี่ยงเบนมาตรฐาน ในตัวอย่างก่อนหน้าค่าความเบี่ยงเบนจากค่าเฉลี่ยคือ (70 - 71) = -1, (62 - 71) = -9, (65 - 71) = -6, (72 - 71) = 1, (80 - (72 - 71) = 1, (77 - 71) = 6 และ (79 - 71) = 8. ผลรวมของ สี่เหลี่ยมเบี่ยงเบนคือ (-1) 2 + (-9) 2 + (-6) 2 + 1 2 + 9 2 + (-1) 2 + (-8) 2 + 1 2 + 6 2 8 2 = 366 ส่วนเบี่ยงเบนมาตรฐานคือ√ (366/10) = 6. 05 (เป็นกิโลกรัม) เว้นแต่ชุดข้อมูลจะเบ้อย่างมากจากนี้จะสามารถสรุปได้ว่าข้อมูลส่วนใหญ่อยู่ในช่วง 71 ± 6 05 และแน่นอนว่าในตัวอย่างนี้

อะไรคือความแตกต่างระหว่างแนวโน้มกลางกับการแพร่กระจาย?

•แนวโน้มกลางหมายถึงและตั้งศูนย์กลางของการกระจายค่า

•การกระจายตัวคือจำนวนการแพร่กระจายของข้อมูลเกี่ยวกับศูนย์กลางของชุดข้อมูล