数据及其分布的偏移

这里说了很多我觉得是数据的偏移,然后给了许多例子,然后如何纠正,主要是关于清洗数据的一些思考。

interesting example, 一个穿牛津鞋的和一个穿梅杜斯邦特运动鞋的人,在放贷模型的训练集里面,会发生什么?

分布偏移的类型:
协变量偏移,标签偏移,还有概念偏移。
还有大量的例子, 通常情况下大量的例子,会帮助更好了解这些偏移的背后的数学原理。

大学生的血液样本和病人。
猫狗分类器以及tom猫和jerry鼠
自动驾驶游戏仿真与真实路况
广告模型不知道apple vision
垃圾邮件spam,但是新型的垃圾邮件出现
产品推荐,但是圣诞节过去了还在推荐圣诞帽子
人脸分类器,但是对于人脸特写无法识别
美国各州对软饮称呼的变化

再者有些有趣的学习方式也出现
批量学习
在线学习
强化学习
ect

还有提到的一个 反馈循环失控的问题。