การใช้การถดถอยกำลังสองน้อยที่สุดบางส่วน ในกรณีการละเมิดข้อสมมติของตัวแบบการถดถอย

Using partial least square regression in the case of violations of regression model assumptions

  • นพมาศ อัครจันทโชติและกิดาการ สายธนู
Keywords: การถดถอยกำลังสองน้อยที่สุดบางส่วน, ความสัมพันธ์เชิงส้นแบบพหุ, ตัวแปรแฝง, PLS-regression, Multicollinearity, Latent variable

Abstract

          การถดถอยกำลังสองน้อยที่สุดบางส่วนเป็นการสร้างตัวแบบแสดงความสัมพันธ์ระหว่างตัวแปรตามและกลุ่มของตัวแปรอิสระหรือตัวแปรทำนายโดยอยู่บนพื้นฐานของตัวแปรแฝงที่สร้างจากผลรวมเชิงเส้นของตัวแปรทำนาย โดยตัวแปรแฝงที่ได้ไม่มีความสัมพันธ์กันและมีความแปรปรวนร่วมกับตัวแปรตามสูง จึงเหมาะสมที่จะใช้ในการวิเคราะห์ข้อมูลกรณีที่มีจำนวนตัวแปรทำนายมากซึ่งตัวแปรทำนายเหล่านี้มักมีความสัมพันธ์เชิงส้นแบบพหุ เช่น ข้อมูลไมโครอาร์เรย์และข้อมูลจากการวัดสเปกตรัม ซึ่งหากใช้การถดถอยวิเคราะห์ข้อมูลดังกล่าวนี้จะเป็นการละเมิดข้อสมมุติของการวิเคราะห์การถดถอย เนื่องจากทำให้ความแปรปรวนของสัมประสิทธิ์การถดถอยมีค่าสูงและนำไปสู่การทำนายที่ไม่แม่นยำ ดังนั้นการถดถอยกำลังสองน้อยที่สุดบางส่วนจึงเป็นอีกทางเลือกหนึ่งในการศึกษาความสัมพันธ์ของตัวแปรตามและตัวแปรทำนาย

         Partial Least Squares Regression (PLS-regression) is a related modeling between dependent variable and group of independent or predictor variables basing on latent variables built from linear combination of predictor variables. These latent variables are uncorrelated and high covariance with the dependent variable so it is appropriate to the case of large number of predictor variables which having multicollinearity such as microarray and spectrum data. If regression analysis is analyzed in such those cases, it violates the assumptions of regression analysis because it leads to the high variance of regression coefficient also inaccurate prediction. Partial Least Squares Regression is therefore the alternative for studying relationship between dependent and predictor variables.

Published
2017-08-10