本月,《纽约时报》(The New York Times)推出了一个新的、名为“机器学习”的个人科技专栏。而在幕后,这家报社正进行着真正的机器学习。这是为了一个重要的目的:在读者退订之前,预测谁将退订。

《纽约时报》已聘请了哥伦比亚大学(Columbia University)的应用数学家克里斯–威金斯(Chris Wiggins)作为它的首位“首席数据科学家”。威金斯曾创建可确定病毒来源的预测性计算机模型。他现在将领导一个小组,试图运用数学来帮助这家有 162 年历史的出版商保持或拓展其订阅者人群。

威金斯说他之所以接受这份兼职工作,是因为他是《纽约时报》的忠实粉丝,并希望能帮助《纽约时报》的 1,200 名编辑和记者保住工作。他认为数据科学(Data Science)可以帮助“一个已被严重扰乱的商业模式。”

问题是广告客户所购买的报纸广告越来越少。根据皮尤(Pew)发布的《美国新闻媒体现状》,美国报纸印刷品广告的销售额从 2005 年的 470 亿美元,锐减为 2012 年的 190 亿美元。在线广告还远不足以弥补这一差额。

为应对这一情况,现在《纽约时报》更多的依赖于订阅。它已调高了纸质报纸的价格。并且在约 3 年前推出的成效显著的电子付费墙的帮助之下,销售电子版报纸的订阅。二月份,在报告不容乐观的年度业绩时,纽约时报公司(The New York Times Company)指出,仅订阅其电子版的订阅者在 2013 年增长了 19%。

纽约时报公司在信息技术、科技和编程领域,雇佣了约 500 名员工。纽约时报公司的首席信息官马克–弗龙斯(Marc Frons)指出,一年前公司整合了分散于“各种筒仓”中的信息,并组建了一个商业智能团队开始利用这些信息。这是公司更直接的运用数据来指导商业决策,这一大趋势的一部分。

威金斯将领导一个三四人组成的团队,试验并确定《纽约时报》的商业问题能否用机器学习来解决。机器学习指的是,使用现有数据以做出关于类似情况的预测的一系列统计学方法。

《纽约时报》不缺少数据。它的读者每天访问其主页九百万次。“但我们确实需要有人提供关于为什么人们订阅报纸以及如何留住他们的深刻见解”,弗龙斯说。“在人们打电话来取消订阅之前,你可以通过他们的行为模式,如登陆网站不如以前频繁,来预测他们可能将会取消订阅。”

相比那些最大的互联网公司,《纽约时报》的努力在范围上还相对较小。谷歌(Google)今年花费 4 亿美元收购了一个机器学习的创业公司。亚马逊(Amazon)不但已雇佣了大批的机器学习科学家,而且目前还在招募 40 名研究此领域的科学家。

很值得注意的是,传统的新闻媒体组织正在如何迎头赶上。在十月份,《华尔街日报》的出版商新闻集团,聘请了另一位哥伦比亚大学的统计学家蕾切尔–舒特(Rachel Schutt),担任其主管数据科学的高级副总裁。她专门研究组织网络。高级副总裁一职是新创立的职务。舒特在一封邮件中写道,她将“整合一系列现有的机器学习和预测建模项目”。

大出版商也在试图跟上新创立的新闻媒体公司的步伐。这些公司中,有一些已经在雇佣威金斯的学生。就像既发布愚蠢新闻也发布严肃新闻的出版商 BuzzFeed,这些网站表明数学模型可以帮助增强新闻报道的“病毒传播力” —— 这是用来衡量新闻内容在网上被分享的广泛程度的指标。像 BuzzFeed 和赫芬顿邮报(the Huffington Post)这类的网站,虽然雇员的人数要比《纽约时报》少的多,但却拥有更大的网页浏览量。

《纽约时报》声称,它所追求的并非更大的网页浏览量。“《纽约时报》所希望建立的,并维系其经营的关系,不是像 BuzzFeed 那样发布病毒式传播、点击率高的内容”,威金斯说。“《纽约时报》将报纸订阅视为其商业模式的核心,而非病毒式传播的内容。”

———————————————

本文由「麻省理工科技评论」官方授权供稿。

更多文章请访问:麻省理工科技评论中文官方网站

分享到