ความแตกต่างระหว่างการถดถวน Linear กับ Logistic: การถดถอยเชิงเส้นกับการถดถอยโลจิสติก

Anonim

การวิเคราะห์เชิงเส้นและการถดถอยลอจิสติก

ในการวิเคราะห์ทางสถิติ ระบุความสัมพันธ์ระหว่างตัวแปรที่เกี่ยวข้องกับการศึกษา บางครั้งอาจเป็นเพียงจุดประสงค์ของการวิเคราะห์เท่านั้น เครื่องมือหนึ่งที่ใช้ในการสร้างความสัมพันธ์และระบุความสัมพันธ์คือการวิเคราะห์การถดถอย

รูปแบบการวิเคราะห์การถดถอยที่ง่ายที่สุดคือการถดถอยเชิงเส้นซึ่งความสัมพันธ์ระหว่างตัวแปรเป็นความสัมพันธ์เชิงเส้น ในแง่สถิติจะแสดงความสัมพันธ์ระหว่างตัวแปรอธิบายกับตัวแปรการตอบสนอง ตัวอย่างเช่นการใช้การถดถอยเราสามารถสร้างความสัมพันธ์ระหว่างราคาสินค้าโภคภัณฑ์กับปริมาณการบริโภคตามข้อมูลที่ได้จากตัวอย่างแบบสุ่ม การวิเคราะห์การถดถอยจะให้ฟังก์ชันการถดถอยของชุดข้อมูลซึ่งเป็นรูปแบบทางคณิตศาสตร์ที่เหมาะสมกับข้อมูลที่มีอยู่ นี้สามารถได้อย่างง่ายดายโดยเป็นพล็อตกระจาย การถดถอยแบบกราฟิกเท่ากับการหาเส้นโค้งที่เหมาะสมที่สุดสำหรับชุดข้อมูลที่กำหนด ฟังก์ชันของเส้นโค้งคือฟังก์ชันการถดถอย การใช้แบบจำลองทางคณิตศาสตร์การใช้สินค้าสามารถคาดการณ์ได้ในราคาที่กำหนด

ดังนั้นการวิเคราะห์การถดถอยถูกนำมาใช้กันอย่างกว้างขวางในการทำนายและคาดการณ์ นอกจากนี้ยังใช้เพื่อสร้างความสัมพันธ์ในข้อมูลทดลองในสาขาวิชาฟิสิกส์เคมีและในสาขาวิทยาศาสตร์ธรรมชาติและสาขาวิศวกรรมหลายแห่ง ถ้าความสัมพันธ์หรือฟังก์ชันการถดถอยเป็นฟังก์ชันเชิงเส้นกระบวนการนี้เรียกว่าการถดถอยเชิงเส้น ในพล็อตกระจายมันสามารถแสดงเป็นเส้นตรง ถ้าฟังก์ชันไม่ใช่ชุดค่าพารามิเตอร์เชิงเส้นการถดถอยเป็นแบบไม่เป็นเส้นตรง

การถดถอยโลจิสติกสามารถเทียบเคียงได้กับการถดถอยพหุคูณแบบหลายตัวแปรและจะสร้างแบบจำลองเพื่ออธิบายถึงผลกระทบของตัวทำนายหลายตัวแปรในตัวแปรตอบสนอง อย่างไรก็ตามในการถดถอยโลจิสติกตัวแปรผลลัพธ์สุดท้ายควรเป็นแบบแบ่งแยก (โดยปกติแบ่งออกเป็นสองส่วนผลลัพธ์ที่ได้เช่นความตายหรือความอยู่รอดแม้ว่าเทคนิคพิเศษจะช่วยให้สามารถแบ่งหมวดหมู่ข้อมูลได้มากขึ้น) ตัวแปรผลลัพธ์ต่อเนื่องอาจถูกแปลงเป็นตัวแปรประเภทที่ใช้สำหรับการถดถอยโลจิสติกส์ อย่างไรก็ตามการยุบตัวแปรต่อเนื่องในลักษณะนี้เป็นส่วนใหญ่ไม่ได้รับความสนใจเพราะลดความถูกต้อง

ซึ่งแตกต่างจากการถดถอยเชิงเส้นตรงกับค่าเฉลี่ยตัวแปรพยากรณ์ในการถดถอยลอจิสติกส์ไม่จำเป็นต้องถูกเชื่อมโยงเป็นเส้นตรงกระจายทั่วไปหรือมีความแปรปรวนเท่ากันภายในทุกกลุ่มเป็นผลให้ความสัมพันธ์ระหว่างตัวแปรทำนายและผลไม่น่าจะเป็นฟังก์ชันเชิงเส้น

ความแตกต่างระหว่าง Logistic กับ Linear regression?

•ในการถดถอยเชิงเส้นความสัมพันธ์เชิงเส้นระหว่างตัวแปรอธิบายและตัวแปรตอบสนองจะถูกสันนิษฐานและหาค่าพารามิเตอร์ที่เป็นไปตามแบบจำลองโดยการวิเคราะห์เพื่อให้ได้ความสัมพันธ์ที่แน่นอน

•มีการถดถอยเชิงเส้นสำหรับตัวแปรเชิงปริมาณและฟังก์ชันที่เกิดขึ้นเป็นเชิงปริมาณ

•ในการถดถอยโลจิสติกข้อมูลที่ใช้จะเป็นแบบแบ่งแยกหรือเชิงปริมาณ แต่ผลที่ได้จะเป็นเรื่องเด็ดขาด