降維- 維基百科,自由的百科全書 - Wikipedia
文章推薦指數: 80 %
在機器學習和統計學領域,降維是指在某些限定條件下,降低隨機變量個數,得到一組「不相關」主變量的過程[1]。
降維可進一步細分為變量選擇和特徵提取兩大方法。
變量選擇假定數據中包含大量冗餘或無關變量(或稱特徵、屬性、指標等),旨在從原有變量中找出主要變量。
現代統計學中對變量選擇的研究文獻,大多集中於高維回歸分析(英語:High-dimensional_statistics),其中最具代表性的方法包括:
特徵提取可以看作變量選擇方法的一般化:變量選擇假設在原始數據中,變量數目浩繁,但只有少數幾個真正起作用;