| 【论文摘要】 |
统计学习在科学研究、工程技术以及其它诸多的应用领域具有广泛而重要的价值。它利用有限数量的观测来寻求待求的依赖关系,目标是在未来样本上的预测越准确越好。在选择最终的模型时,需要在降低训练样本集的经验风险和控制学习模型的复杂性之间做一个最优的折衷,才能获得最好的总体预测效果。因此,对统计学习模型的复杂性给出评价与选择的准则,一直是一个核心问题。有众多的比较研究的文献指出,采用VC维作为统计学习模型复杂性的显式评价,并依据V-C理论中的结构风险最小化(SRM)原则进行模型选择,在很多场合其效果要优于其它各种的模型评价与选择方法。可惜的是,除了对于极少的几类学习机器,大多数学习机器的VC维很难根据其定义推导出解析的表达式。如Vapnik在文献中指出的,对于更高级的学习机器,唯一可行的方式是通过设计精巧的模拟计算实验,来经验地估计相应函数集的VC维。但是,原有的估计计算的方法仍有一定的局限性,特别是,需要测量任一个样本集上函数集经验风险的下确界。本文在Vapnik方法的框架下,提出一种新的实验过程与估计公式,对原先的估算方法进行了改进。由理论的VC维已知的标准对照实验上的测试结果可以看出,新的估计方法具有与老... |