如何求出各資料點對應擬合線上的最短距離投影點?如下圖的各個藍色點:
以代數角度思考,每個資料點(xi,yi,1)(xi,yi,1)可以拆解成以下形式:
[xiyi1]=[ˆxiˆyi1]+di[exey0]
其中,(ˆxi,ˆyi,1)是最短距離投影點,而(ex,ey,0)是正規化後的誤差向量(長度為1,因為從幾何上得知,最短距離投影點對資料點的連線,正交於擬合直線,所以各點的誤差向量皆相同;各資料點之間唯一的差異是,誤差向量的放大倍率di因點而異,也就是資料點到擬合線的垂直距離
將上式帶入Part1解出的擬合線ax+by+c=0可整理出以下關係:
bi=[abc][xiyi1]=[abc][ˆxiˆyi1]+di[abc][exey0]=di[abc][exey0]
其中,(ˆxi,ˆyi,1)落在擬合線上,帶入擬合線方程式(a,b,c)為0,所以殘餘量bi完全是由誤差向量(ex,ey,0)內積於(a,b,c)再乘上di所貢獻;
分析至此,要求出的項目就顯而易見了,我們需要解出(1)(ex,ey,0)誤差向量,及(2)di,就可以解各資料點對應的投影點:
[ˆxiˆyi1]=[xiyi1]−di[exey0]
---------------------------
(1)解誤差向量(ex,ey,0)
這裏終究不敵幾何思考(嗚嗚),在二維平面上,誤差向量與擬和線向量垂直,特徵是相互內積為0,所以若擬合線方程式為ax+by+c=0,其方向的單位向量為:
(1√|ab|2+1,−ab√|ab|2+1,0)
與此直線垂直的單位向量,也就是誤差向量為(僅將上式元素1,2調換並變號,就能確保相互內積為0):
(ab√|ab|2+1,1√|ab|2+1,0)
---------------------------
(2)解di
單位誤差向量與擬合線係數相互內積:
[abc][ab√(ab)2+11√(ab)2+10]=√a2+b2
所以可知道di:
di=bi√a2+b2
---------------------------
最後再整理解形式:
[ˆxiˆyi1]=[xiyi1]−di[exey0]=[xiyi1]−bi√a2+b2[ab√|ab|2+11√|ab|2+10]=[xiyi1]−bi[aa2+b2ba2+b20]
結論是,所以在Part1求出的各資料點對應的bi好好留著,擬合線求出後,投影點其實也一併知道了
後記1:有投影點才能描繪出線段唷
沒有留言:
張貼留言