这是个很有意思的题目。如果这是题主的某个作业的话是完全可行的,但如果是一篇正规的学术论文的话,可能还需要加强数据的严谨性和可靠性。
具体来讲,如果按照题主的想法,被解释变量可以是人均消费,解释变量按照楼主所说的几个变量也完全行得通。但是有一点需要注意的是,人均消费还受菜单价格的影响。比如某个早点店评价非常高,人均消费可能也就5-10元,而一家高档的西餐店,评价非常差,人均消费也可能上百,因此题主在建立模型的时候要注意加入控制餐厅的消费档次的变量,其中可能还要加入地点的因素。
然后如果要有质疑的话,可能就是在数据的严谨性上。最大的问题就是数据是否是有偏(biased)的?大众点评网上收集到的数据是否是随机分布的,人均消费是否能真实反映该店真正的人均消费?因为存在一种可能性,那就是对某家店体验特别好和特别差的人最有可能上网点评,因此大众点评网上的人均消费数据就不一定包括了一大批感觉“不好不坏”的消费者。还有一种可能性,就是竞争对手派枪手去恶意点评某一个店家,或者商家自己点评自己,同样也会导致收集的数据不准。再者,大众点评网收集到的数据时间跨度很大(比如几年),这其中可能会涉及到菜单价格的变动,而题主可能并无法获得人均消费的时点数据,这就存在通胀率调整的问题,同样会使得数据的可信度降低。
总之,如果这只是题主的一次计量经济学作业或者课程论文,这将是一个有益的尝试,否则建议楼主在数据精度上多动动脑筋。
若有偏误,恳请指正。
来源:知乎 www.zhihu.com
作者:徐惟能
【知乎日报】千万用户的选择,做朋友圈里的新鲜事分享大牛。
点击下载
此问题还有 3 个回答,查看全部。
延伸阅读:
大众点评网的团购可以看到用户对店铺的评论,对用户下单的影响和利弊分析?
百度大力发展 LBS 会对大众点评等造成什么影响?