摘要: 針對鐵水KR脫硫生產(chǎn)工序中參數(shù)維度高、特征冗余性強(qiáng)以及目標(biāo)變量與特征間相關(guān)性較弱的問題,提出了一種基于重要性度量的集成式特征選擇方法IMFS(Feature selection based on importance measure)。在過濾式預(yù)篩選階段,通過最大互信息系數(shù)(MIC)度量各參數(shù)與目標(biāo)變量的關(guān)聯(lián)性以及各參數(shù)之間冗余性,并根據(jù)最大相關(guān)、最小冗余準(zhǔn)則縮小候選參數(shù)規(guī)模;在嵌入式精選階段,引入LightGBM算法作為量化信息貢獻(xiàn)度與數(shù)據(jù)敏感度的依托模型,采用熵權(quán)法對雙重度量結(jié)果進(jìn)行賦權(quán)融合;最后,根據(jù)特征重要性系數(shù),結(jié)合GBT序列向前搜索策略優(yōu)化特征子集。試驗(yàn)結(jié)果表明,IMFS相較于其他方法,在消除冗余特征和提升預(yù)測準(zhǔn)確性方面具有顯著優(yōu)勢,并且能夠有效平衡特征數(shù)量與預(yù)測精度。