信息摘要:
事件营销之百度事件脉络的算法详解:百度事件脉络在关键词上的展示会随着事件的转发量而增加,当然,如果事件的热度下降了,展现的广度也会随着缩小。新闻事件距离,新闻集合去噪,时间片类聚,代表新闻选取,可以轻轻松松的了解到整个事件发展的全过程,有效的提高获取
如果你在百度之中输入“黄海波”、“巴西世界杯”等热门词汇时会发现,右侧首次出现一条时间轴信息图,这就是事件脉络。这是百度新推出的一种搜索效果,它是按照时间的顺序将整个事件的发展过程,按照时间轴的组织方式呈献给用户,让用户迅速的掌握一个事件的来龙去脉。
百度事件脉络在关键词上的展示会随着事件的转发量而增加,当然,如果事件的热度下降了,展现的广度也会随着缩小。下面,让我们朗创网络营销一起来了解一下百度事件脉络的算法:
新闻事件距离:在新闻发布高峰期间隔1小时,要比在新闻发布的低谷期间隔一小时,造成的时间跨度更长。一般上午是新闻发布的高峰,下午两点到四点也是。对不同时间段的新闻发布数量进行统计,可以帮助到后续的时间片聚类。
新闻集合去噪:不同媒体对事件的报到的时效性是不一样的,进行时间片聚类之前,还应该去除掉相似的新闻,为了避免同一类新闻太过相似,比较特征向量,利用该特征向量,如果新闻集合太大,就应该利用站点的权威性进行过滤。
时间片类聚:每一篇新闻,抽取发布时间;根据发布时间,把一个新闻事件集合内的新闻进行排列。将新闻按照发布时间投放到时间轴上,如果事件的发展比较明显,就能在时间轴上看到一些新闻比较密集的区域,这个区域就是我们想要获得的新闻发展的个个阶段。
代表新闻选取:新闻来源的站点的权威性如何,该新闻是否在第一时间进行发布,新闻的转载量如何等等。
通过对具体例子进行分析我们也可以发现事件脉络中展现的额信息发布日期,即时间脉络中的日期,误差多不会超过一天;发布时间一般会集中在早上8点~11点,以及下午13~16点且转发量较大,基本在500以上。
事件脉络是以时间为主线的方式来进行呈现的,这样用户就不用再自我梳理,可以轻轻松松的了解到整个事件发展的全过程,有效的提高获取信息的效率,并且对用户进行深入引导。
搜索引擎的目的在于满足人们的需求,能够更好地对搜索结果进行匹配与分类,与用户之间形成完美的互动,这就是搜索引擎发展的大趋势。