收藏
回答

测试集中出现的用户为什么大部分都没有在训练集中有行为数据?

交流区的原问题以及回答如下:

6. 冷启动用户占比多少?
  赛题为了突出基于用户行为建模去预测互动目标,所以所有测试集出现的用户均在训练数据集上有行为数据,区别在于训练数据集中用户的活跃程度有所不同。  


但是现在发现,测试集中出现的userId远超训练集中的userId的范围,即大部分用户都没有出现在训练集中,这是否与这个回答相悖?

回答关注问题邀请回答
收藏

1 个回答

  • 微信-Perry
    微信-Perry
    2021-06-07

    我们这边统计过,测试集中的userid都是在训练集user_action.csv中有行为数据的。你这边是不是搞错了?可以把你统计的方法/代码贴出来,我们看看。

    2021-06-07
    有用 2
    回复
登录 后发表内容