機器學習-特徵工程-降維| Taroballz StudyNotes
文章推薦指數: 80 %
降維不是將array的維度減少(3D陣列->2D陣列),而使指將特徵的數量減少數據降維通常有兩種方式:從所有的特徵中,選擇出有意義的或對模型有幫助的特徵,通常須人為的挑選,同時也必須了解相關業務知識選擇後的特徵維數肯定比選擇前小,特徵在選擇和選擇後可以改變值刪除所有低方差的特徵當特徵為二分類時,特徵的取值就是伯努利分布(取值非0即1)其分布的方差可以計算:假設 $p$ = 0.8 ,表示二分類特徵中某種分類佔到80%以上時就刪除特徵降維的目的在於得到一組"特徵間相互獨立(不相關)"主變量的過程,因此得知特徵之間的相關性是極重要的相關係數(r)值