小帆的算法为什么要升级呢?
在消费升级的大背景下,用户行为不断裂变,用户需求与行为也更加碎片化;同时二、三线及以下城市的网民快速增长,互联网网民结构正在发生变化,伴随着以上,市场竞争已经逐渐在存量市场中展开,愈发激烈,技术化的竞争手段更是有着五花八门的升级;在持续迭变的市场中,一成不变的算法体系无法持续真实的描绘出瞬息万变的互联网用户行为; 另一方面,移动端技术生态环境发生变化,原生操作系统开放程度不断下降,终端厂商自主研发的操作系统的多样化,导致用户行为监测的技术手段要发生相应的变化,而机器学习、人工智能技术的不断完善,使更科学的算法成为可能性。 为此,易观千帆革命性地推出了全新的AI算法机器人“小帆A3”,“小帆A3”在原有的算法基础上引入了机器学习的方法,以不断提高指标数据的准确度; “小帆A3 ”算法机器人的训练数据集包括易观自有的SDK数据及外部数据的混合数据源,使易观千帆的数据更加准确地还原用户的真实行为、更加客观地评价产品的价值。
整个算法的升级涉及到数据采集、清洗、计算的全过程
采集端:升级SDK以适应安卓7.0以上操作系统的开放API;通过机器学习算法,升级“非用户主观行为”(包括:APP后台请求、应用相互拉起、应用弹屏等)的过滤算法,在更准确识别的同时,避免“误杀” 数据处理端:通过机器学习算法,升级设备唯一性识别算法、增加异常设备行为过滤算法 算法模型:引入外部数据源结合易观自有数据形成混合数据源,训练AI算法机器人,部分指标的算法也进行了调整
A3算法升级的整体计划
1、新算法发布:
发布时间 : 2017年7月15日~2017年7月20日之间
时间范围 : 优先追溯2017年4月、2017年5月、2017年6月及2017年7月的日度指标
时间维度 : 日、周、月、季
指标维度 : 活跃人数、启动次数、使用时长、APP排名、日均活跃人数、日均启动次数、日均使用时长、相对活跃渗透率、绝对活跃渗透率、24时点活跃人数分布、24时点启动次数分布、24时点使用时长分布、24时点相对渗透率分布、24时点绝对渗透率分布、24时点人均启动次数分布、24时点人均使用时长分布、重合用户、独占用户、领域独占率等
2、历史数据追溯:
时间范围 : 接下来的几个月会相继追溯至2014年1月
时间维度 : 优先追溯日度、月度
指标维度 : 所有指标
3、算法调优:
在7月~9月会陆续对部分已更新的数据做调整优化,也欢迎大家能够提出并反馈您的建议,帮助我们更好的将最接近真实的数据呈现出来
4、领域调整:
在7月~9月期间,小帆会根据快速的行业裂变不断调整领域分类,进而实现符合当下互联网环境的领域结构;数据也会根据调整后的领域计算