1. 统计出当前各个title类型对应的员工当前薪水对应的平均工资。
表结构:
思路:
INNER JOIN
的使用GROUP BY
+AVG( )
的使用
表结构:
思路:
INNER JOIN
的使用GROUP BY
+ AVG( )
的使用模型是使用离散特征还是连续特征,其实是一个“海量离散特征 + 简单模型” 同 “少量连续特征 + 复杂模型”的权衡,既可以离散化用线性模型,也可以用连续特征加深度学习。就看是喜欢折腾特征还是喜欢折腾模型了。通常来说,前者容易,可以n个人一起并行做,有成功经验;后者目前看起来很赞,能走多远还需拭目以待。
——李沐
在CTR预估中,通常都会用到离散特征特征 + LR,很少直接将连续值作为逻辑回归模型的特征输入,而是将连续特征离散化为一系列0、1类别特征交给逻辑回归模型,这样做的优势主要有以下几点:
前一阵子参加了天池比赛气象数据领航无人飞行器线路优化大赛,凭借着初赛一步步的稳扎稳打以及最后时刻的一波套磁 + 人品爆发,以第三名的成绩进入了决赛。但在决赛阶段,我们所遇到的最大问题并不是此次赛题中的两个重点:气象数据回归或路径规划算法,令我们差点止步前 10 的是提交路径之后,由于不同路径之间的各种组合导致的无法推知到底是哪些路径成功抵达。后来我们用了一些巧妙的解法在某种程度上解决了这个问题(并没有完全解决,下文会细讲),因此,这也是此篇博客诞生的原因,想要记录下解决这一个问题的思路。