python 多元線性回歸刪除outlier 怎麼做 | Python 回歸 結果

結果長這樣,然後我就會去選最大標準殘差的data,回到表格去刪除他,然後再從第一步again again and again... https://ithelp.ithome.com.tw/upload/images/. 因為我比較 ...2python多元線性回歸刪除outlier怎麼做python資料分析spsspython3回歸分析sunnyyeh2020-03-2701:27:04‧2237瀏覽最近在做多元線性回歸分析,原先使用的是SPSS來做,但因為上頭指示刪除outlier的方式是「每跑完一次迴歸分析,刪除一個標準差最大的data,再做一次回歸分析,然後在刪除下一個標準差最大的data」,但這樣永遠都做不完阿...,拜託大家,我真的需要各位高手的幫助阿。

SPSS的作法是這樣做點選回歸分析加入因變數、自變數設定三個標準差的output出來結果長這樣,然後我就會去選最大標準殘差的data,回到表格去刪除他,然後再從第一步againagainandagain...因為我比較熟悉python,所以上網找python的相關辦法,但他都有另外設定訓練的方式,來計算回歸,這樣數值貌似會不一樣吧@@但最重要的是我需要一個一個的標準差,才可以慢慢刪除outlier,但我找到的好像都是直接輸出MSE...,希望各位高手可以幫幫我。

我有查到類似的網站https://www.itread01.com/content/1550422451.html如果data大概長這樣,「因變數」為成績,「自變數」為家庭人數、兄弟姊妹人數、歲數。

人名生日年分家庭人數兄弟姊妹人數歲數成績大華1999312156小白2000832013小明2002841891阿鼻2017105234琪琪19491812713我打的程式碼只讀了excel..,因為後續開始設x跟y就不太知道自變數跟因變數要設在哪裡,去讀了別人的說明,也不太知道形變量跟標籤值有等於這些嗎,萬分懇求各位幫幫我ˊˋimportpandasaspdimportnumpyasnpimportstatsmodels.apiassmimportmatplotlib.pyplotaspltdata=pd.read_excel("data.header=[0,1])拜託大家了!!真的非常感謝!感動得痛哭流涕阿QAQQ拜託拜託大家了回答1討論邀請回答追蹤檢舉×邀請回答輸入邀請回答者的帳號或暱稱Loading找不到結果。

已達邀請上限邀請回答{{result.user.nickname}}{{result.user.account}}已邀請的邦友{{invite_list.length}}/5取消邀請{{invite.nickname}}{{invite.account}}關閉登入發表討論1個回答2twyesiT邦新手4級‧2020-03-2710:01:17最佳解答我做過DataMining說一下看法(但我之前做的都是不用寫Code,只寫SQL,DMX)DMX:微軟的資料採礦延伸模組基本上你說你對Python熟,基本上對Python熟應該就可以解決所有問題了基本上作法就是,找一個Python的多元回歸套件(如果對回歸熟,甚至於可以自己寫回歸,因為那只是一些公式)套件中一定可以定義哪些是自變數X1,X2.....Xn,哪些是因變數y所謂的訓練模式就是因為跑回歸最重要的是甚麼?(1)建模,導出回歸公式(2)預測:預測才是最後的目地所以通常必須把一些樣本拿出一定百分比當訓練樣本,例如80%然後用其他的20%當驗證(有時候樣本還會分成3分,訓練,測試,驗證)所以當選完一定百分比的樣本當訓練樣本後跑完python回歸套件後理論上各套件應該會有一個函數,可以直接看每一個樣本的標準殘差你可以把這些樣本的標準殘差透過套件函數叫出來然後看哪一個樣本要刪除我是建議標準殘差超過3個標準差就將離群值刪掉跟你們主管講,不要刪除最大的,應該刪除超過3個標準差的你對python熟,應該有辦法將套件樣本中超過3個標準差的樣本刪掉然後寫一個迴圈,只要有樣本標準殘差超過3個標準差就將那些樣本刪掉然後再跑一次回歸,直到所有樣本標準殘差都在3個標準差內這樣就可以跑出回歸公式然後其實只跑回歸沒有意義,基本上重點就是要預測如果目的是預測就可以針對其他新增的樣本預測這才是回歸的目地當然,也有可能只是跑回歸,不預測,如果是這樣,你就將所有樣本都當訓練資料其實你們主管漏掉了一點,把離群值排掉沒問題但是X1,X2......xn這些自變數每一個都適合當自變數嗎?不一定,不適合的自變數也會影響到回歸如果選一個不適合的自變數去跑回歸模型,以後的預測也會離實際有差距因此自變數間最好要有檢定,看適不適合或者要看之


常見投資理財問答


延伸文章資訊