“业务、数据、算法”三位一体的闭环体系
桃树数据科学七剑
1.问题定义
   
    
选择适合用数据模型解决的问题,将特殊的业务问题转化为数据科学问题
2.数据准备
    
从多个数据源抽取关键数据,对关键数据进行清洗、处理和加工
3.算法调优
    
选择适用于特定数据的算法,自动寻找最优参数,建立高效率的数据模型
4.知识发现
    
将数据模型转化为决策依据,从数据中发现业务经验以外的新知识
5.效果分析
    
基于不同的效果衡量指标分析模型效果及计算效率,评估模型的业务价值
6.线上部署
    
规范模型输入输出,让模型与业务系统无缝对接,从海量数据中自动学习
7.模型更新
    
监控模型稳定性、模型效果、模型逻辑与数据变化,收集反馈数据,持续更新模型
MORE+