เนื้อหา
พล็อตกระจายเป็นกราฟที่แสดงความสัมพันธ์ระหว่างชุดข้อมูลสองชุด บางครั้งการใช้ข้อมูลที่มีอยู่ในพล็อตการกระจายเพื่อให้ได้ความสัมพันธ์ทางคณิตศาสตร์ระหว่างสองตัวแปร สมการของพล็อตการกระจายสามารถทำได้ด้วยมือโดยใช้วิธีหลักสองวิธี: เทคนิคกราฟิกหรือเทคนิคที่เรียกว่าการถดถอยเชิงเส้น
การสร้างแผนการกระจาย
ใช้กระดาษกราฟเพื่อสร้างพล็อตกระจาย วาดแกน x และ y ให้แน่ใจว่าพวกมันตัดกันและติดฉลากที่มา ตรวจสอบให้แน่ใจว่าแกนและแกน y นั้นมีชื่อที่ถูกต้องเช่นกัน จากนั้นพล็อตจุดข้อมูลแต่ละจุดภายในกราฟ แนวโน้มใด ๆ ระหว่างชุดข้อมูลที่ถูกพล็อตน่าจะชัดเจน
สายที่ดีที่สุดพอดี
เมื่อพล็อตกระจายถูกสร้างขึ้นสมมติว่ามีความสัมพันธ์เชิงเส้นระหว่างชุดข้อมูลสองชุดเราสามารถใช้วิธีกราฟิกเพื่อรับสมการ ใช้ไม้บรรทัดและวาดเส้นให้ใกล้ที่สุดเท่าที่จะทำได้เพื่อให้ได้คะแนนทั้งหมด พยายามตรวจสอบให้แน่ใจว่ามีคะแนนอยู่เหนือบรรทัดมากพอ ๆ กับที่อยู่ด้านล่างบรรทัด เมื่อวาดเส้นแล้วให้ใช้วิธีมาตรฐานเพื่อหาสมการของเส้นตรง
สมการของเส้นตรง
เมื่อวางแนวที่ดีที่สุดไว้บนกราฟกระจายมันจะตรงไปตรงมาเพื่อหาสมการ สมการทั่วไปของเส้นตรงคือ:
y = mx + c
โดยที่ m คือความชัน (ความชัน) ของเส้นตรงและ c คือจุดตัดแกน y ในการรับการไล่ระดับสีให้หาจุดสองจุดบนบรรทัด เพื่อประโยชน์ของตัวอย่างนี้สมมติว่าจุดสองจุดคือ (1,3) และ (0,1) การไล่ระดับสีสามารถคำนวณได้โดยรับผลต่างในพิกัด y และหารด้วยความแตกต่างในพิกัด x:
m = (3 - 1) / (1 - 0) = 2/1 = 2
การไล่ระดับสีในกรณีนี้เท่ากับ 2 ป่านนี้สมการของเส้นตรงคือ
y = 2x + c
ค่าสำหรับ c สามารถรับได้โดยการแทนที่ในค่าสำหรับจุดที่รู้จัก ตามตัวอย่างหนึ่งในจุดที่รู้จักคือ (1,3) เสียบเข้ากับสมการและจัดเรียงใหม่สำหรับ c:
3 = (2 * 1) + c
c = 3 - 2 = 1
สมการสุดท้ายในกรณีนี้คือ:
y = 2x + 1
การถดถอยเชิงเส้น
การถดถอยเชิงเส้นเป็นวิธีการทางคณิตศาสตร์ที่สามารถใช้ในการรับสมการเส้นตรงของพล็อตกระจาย เริ่มต้นด้วยการวางข้อมูลของคุณลงในตาราง สำหรับตัวอย่างนี้ให้เราสมมติว่าเรามีข้อมูลต่อไปนี้:
(4.1, 2.2) (6.5, 4.5) (12.6, 10.4)
คำนวณผลรวมของค่า x:
x_sum = 4.1 + 6.5 + 12.6 = 23.2
ถัดไปคำนวณผลรวมของค่า y:
y_sum = 2.2 + 4.4 + 10.4 = 17
ตอนนี้รวมผลิตภัณฑ์ของชุดข้อมูลแต่ละจุด:
xy_sum = (4.1 * 2.2) + (6.5 * 4.4) + (12.6 * 10.4) = 168.66
ถัดไปคำนวณผลรวมของค่า x กำลังสองและค่า y กำลังสอง:
x_square_sum = (4.1 ^ 2) + (6.5 ^ 2) + (12.6 ^ 2) = 217.82
y_square_sum = (2.2 ^ 2) + (4.5 ^ 2) + (10.4 ^ 2) = 133.25
สุดท้ายนับจำนวนจุดข้อมูลที่คุณมี ในกรณีนี้เรามีจุดข้อมูลสามจุด (N = 3) การไล่ระดับสีสำหรับเส้นที่ดีที่สุดสามารถรับได้จาก:
m = (N * xy_sum) - (x_sum * y_sum) / (N * x_square_sum) - (x_sum * x_sum) = (3 * 168.66) - (23.2 * 17) / (3 * 217.82) - (23.2 * 23.2) = 0.968
การสกัดกั้นสำหรับเส้นที่ดีที่สุดสามารถรับได้จาก:
c = (x_square_sum * y_sum) - (x_sum * xy_sum) / (N * x_square_sum) - (x_sum * x_sum)
= (217.82 17) - (23.2 168.66) / (3 * 217.82) - (23.2 * 23.2) = -1.82
ดังนั้นสมการสุดท้ายคือ:
y = 0.968x - 1.82