python 多元線性回歸刪除outlier 怎麼做 | Python 回歸結果

結果長這樣，然後我就會去選最大標準殘差的data，回到表格去刪除他，然後再從第一步again again and again... https://ithelp.ithome.com.tw/upload/images/. 因為我比較 ...2python多元線性回歸刪除outlier怎麼做python資料分析spsspython3回歸分析sunnyyeh2020-03-2701:27:04‧2237瀏覽最近在做多元線性回歸分析，原先使用的是SPSS來做，但因為上頭指示刪除outlier的方式是「每跑完一次迴歸分析，刪除一個標準差最大的data，再做一次回歸分析，然後在刪除下一個標準差最大的data」，但這樣永遠都做不完阿...，拜託大家，我真的需要各位高手的幫助阿。

SPSS的作法是這樣做點選回歸分析加入因變數、自變數設定三個標準差的output出來結果長這樣，然後我就會去選最大標準殘差的data，回到表格去刪除他，然後再從第一步againagainandagain...因為我比較熟悉python，所以上網找python的相關辦法，但他都有另外設定訓練的方式，來計算回歸，這樣數值貌似會不一樣吧@@但最重要的是我需要一個一個的標準差，才可以慢慢刪除outlier，但我找到的好像都是直接輸出MSE...，希望各位高手可以幫幫我。

我有查到類似的網站https://www.itread01.com/content/1550422451.html如果data大概長這樣，「因變數」為成績，「自變數」為家庭人數、兄弟姊妹人數、歲數。

人名生日年分家庭人數兄弟姊妹人數歲數成績大華1999312156小白2000832013小明2002841891阿鼻2017105234琪琪19491812713我打的程式碼只讀了excel..，因為後續開始設x跟y就不太知道自變數跟因變數要設在哪裡，去讀了別人的說明，也不太知道形變量跟標籤值有等於這些嗎，萬分懇求各位幫幫我ˊˋimportpandasaspdimportnumpyasnpimportstatsmodels.apiassmimportmatplotlib.pyplotaspltdata=pd.read_excel("data.header=[0,1])拜託大家了!!真的非常感謝!感動得痛哭流涕阿QAQQ拜託拜託大家了回答1討論邀請回答追蹤檢舉×邀請回答輸入邀請回答者的帳號或暱稱Loading找不到結果。

已達邀請上限邀請回答{{result.user.nickname}}{{result.user.account}}已邀請的邦友{{invite_list.length}}/5取消邀請{{invite.nickname}}{{invite.account}}關閉登入發表討論1個回答2twyesiT邦新手4級‧2020-03-2710:01:17最佳解答我做過DataMining說一下看法(但我之前做的都是不用寫Code,只寫SQL,DMX)DMX:微軟的資料採礦延伸模組基本上你說你對Python熟,基本上對Python熟應該就可以解決所有問題了基本上作法就是,找一個Python的多元回歸套件(如果對回歸熟,甚至於可以自己寫回歸,因為那只是一些公式)套件中一定可以定義哪些是自變數X1,X2.....Xn,哪些是因變數y所謂的訓練模式就是因為跑回歸最重要的是甚麼?(1)建模,導出回歸公式(2)預測:預測才是最後的目地所以通常必須把一些樣本拿出一定百分比當訓練樣本,例如80%然後用其他的20%當驗證(有時候樣本還會分成3分,訓練,測試,驗證)所以當選完一定百分比的樣本當訓練樣本後跑完python回歸套件後理論上各套件應該會有一個函數,可以直接看每一個樣本的標準殘差你可以把這些樣本的標準殘差透過套件函數叫出來然後看哪一個樣本要刪除我是建議標準殘差超過3個標準差就將離群值刪掉跟你們主管講,不要刪除最大的,應該刪除超過3個標準差的你對python熟,應該有辦法將套件樣本中超過3個標準差的樣本刪掉然後寫一個迴圈,只要有樣本標準殘差超過3個標準差就將那些樣本刪掉然後再跑一次回歸,直到所有樣本標準殘差都在3個標準差內這樣就可以跑出回歸公式然後其實只跑回歸沒有意義,基本上重點就是要預測如果目的是預測就可以針對其他新增的樣本預測這才是回歸的目地當然,也有可能只是跑回歸,不預測,如果是這樣,你就將所有樣本都當訓練資料其實你們主管漏掉了一點,把離群值排掉沒問題但是X1,X2......xn這些自變數每一個都適合當自變數嗎?不一定,不適合的自變數也會影響到回歸如果選一個不適合的自變數去跑回歸模型,以後的預測也會離實際有差距因此自變數間最好要有檢定,看適不適合或者要看之

常見投資理財問答

延伸文章資訊
python 多元線性回歸刪除outlier 怎麼做 | Python 回歸結果
結果長這樣，然後我就會去選最大標準殘差的data，回到表格去刪除他，然後再從第一步again again and again... https://ithelp.ithome.com.tw/upload/images/. 因為我比較 ...
利用python输出规范的回归结果 | Python 回歸結果
利用python输出规范的回归结果。比如系数可以选择输出标准误se、t值还是p值，可以导出为excel或者csv文件，甚至支持linearmodels库所提供的面板回归 ...
Python-迴歸分析 | Python 回歸結果
線性迴歸也被稱為最小二乘法回歸（Linear Regression, also called Ordinary Least-Squares (OLS) ... sklearn,statsmodels計算之結果是相同的.
python回归分析结果怎么看 | Python 回歸結果
Python数据分析学习笔记，今天分享下利用Python对业务进行数据预处理，并利用线性回归进行数据预测。壹数据导入Python下载及环境配置这里就不赘述了哈，网上教程非常多 ...
python資料分析：迴歸分析 | Python 回歸結果
ps：. 如果有多個自變數的話R2代表的這兩個自變數共同影響的結果。假如線上性迴歸中 ...
利用Python 編寫線性迴歸 | Python 回歸結果
具體而言，如果對徵收的更高保護是衡量制度質量的指標，那麼更好的制度似乎與更好的經濟結果正相關（人均GDP 更高）。鑑於這種情節，選擇線性模型來描述 ...
[Python 實作] 迴歸模型Regression | Python 回歸結果
本單元，我們將帶大家一起用Python實作迴歸模型。歡迎大家跟著影片一起練習， ... 從結果我們也可以看到，三次方(含)以上的多項式比較符合這組資料。
Python 中的多重回歸 | Python 回歸結果
本教程演示瞭如何在python 中執行多元線性迴歸。 ... summary() 函式允許我們列印迴歸的結果和係數。 R-Squared 和 Adjusted R-Squared 告訴我們迴歸 ...
Python學習筆記-StatsModels 統計迴歸（1）線性迴歸 | Python 回歸結果
OLS() 建立普通最小二乘模型，最後用model.fit() 就能實現線性迴歸模型的擬合，並返回擬合與統計分析的結果摘要。 X = sm.add_constant(x1) # 向x1 ...
python statsmodel 回归结果提取（回归系数、t值、pvalue、R ... | Python 回歸結果
提取statsmodel里模型结果的各个元素以OLS回归结果为例相关函数官网链接：https://www.statsmodels.org/stable/search.html?q=OLSResults ...

python 多元線性回歸刪除outlier 怎麼做 | Python 回歸 結果

常見投資理財問答

python 多元線性回歸刪除outlier 怎麼做 | Python 回歸結果