随机森林:一种集成学习(ensemble learning)方法,通过训练许多决策树并将它们的预测结果进行投票(分类)或取平均(回归),以提升模型的准确性与稳定性,并降低过拟合风险。(在非技术语境中也可按字面理解为“随机的森林”,但最常见用法指机器学习算法。)
/ˈrændəm ˈfɔːrɪst/
Random forest works well even when the data is noisy.
随机森林即使在数据含噪较多时也常常表现良好。
After tuning the hyperparameters, the random forest model improved our fraud-detection accuracy without sacrificing interpretability too much.
在调整超参数后,随机森林模型提升了我们的欺诈检测准确率,同时又没有过度牺牲可解释性。
“Random”意为“随机的”,“Forest”原意为“森林”。该术语把“许多树(trees)组成森林”的意象借用到机器学习中:随机森林由大量决策树组成,并通过对样本与特征的随机抽样来增加多样性,从而让整体预测更稳健。