杨超
- 作品数:1 被引量:14H指数:1
- 供职机构:北京工商大学计算机与信息工程学院更多>>
- 发文基金:教育部人文社会科学研究基金北京市自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 互联网广告点击率预估模型中特征提取方法的研究与实现被引量:14
- 2017年
- 互联网广告是一个具有上千亿元规模的市场,广告的点击率(CTR)是互联网广告投放效果的重要指标。在广告点击率预估模型中,特征提取是关键因素,特征的好坏直接影响到最终模型的效果。针对如何提高广告点击率预估效率问题,在Hadoop大数据平台环境中,提出了基于梯度提升决策树(gradient boost decision tree,GBDT)模型的多维特征提取方法。该方法利用原始数据构建多维基础特征库,并将基础特征库中除ID类特征以外的其余特征输入GBDT模型进行特征刷选,得到高层特征,进一步进行分类。该方法的使用不仅减少了特征提取的人工成本和时间成本,也在很大程度上提升了模型的精度。
- 田嫦丽张珣潘博杨超许彦茹
- 关键词:特征提取互联网广告