第三门课主要讲了机器学习的一些策略,也就是在你做项目的时候,应该要具体根据什么来改进你的模型。
在设计过程中,最好是保证几个变量相互独立,也就是正交。就好比你在开车的时候,油门和方向盘是相互独立的。如果方向盘和油门不独立,当你调整方向盘的时候速度也在变化,就很难受了。
所以在监督学习中,以下几个应该正交:
在训练模型中,当然需要一种指标来评估一下模型是不是好的。
一般使用两个参数:
一般用F1 Score把两个指标给统一起来:
$$F1-Score = \frac{2}{\frac{1}{p} + \frac{1}{r}}$$
一般,满足指标都是一个区间范围,比如时间上只要小于100ms就可以,这样子,就在满足满足指标的情况下,选择最优指标(如精确度最高)最好的那个模型。
应该使验证集和测试集的数据满足统一分布。
可避免的偏差
我们训练出来的结果,应该和人类表现作比较,如果差距比较小,那么说明很接近了,如果差距比较大,应该着重优化缩小这个可避免的偏差。
如图,左边说明应该着重减小bias,右边应该着重减小variance
减少bias:
减少variance: