以前的说的都是客套话,但这次真的感谢,这个问题勾起了我的回忆。

我在很久以前思考过这个问题,时间是2008年底到2009年底。2010年1月本来是打算继续的,但是那是准备要毕业,确实没有时间了。之后就不再进行这方面工作,更具体的原因后面会说到。而看到 @nbht 发的图,发现真的是落后时代太多,现在的人做得比我当年好多了。

我已经没有在这方面下功夫了,所以我只能给大家讲讲我曾经干过的事情,仅作参考。

有些关注我的朋友可能会发现我对Excel的问题也很有兴趣,开始关注起Excel,也是因为这件事。说真的,那一年的尝试让我获益良多,我想很多宅都和我有过类似的经历(当然做的事情会很不一样),以此答案和同好们共勉。

PS:本答案中提及的过往内容都在我以前的博客中发布过,但是链接太久远我就不翻了,有兴趣去看的请自己爬:http://hexun.com/zecy/default.html

先来说说一切的起因。

2009年初,我做了个2008年新番盘点,对整年的新番进行了一次回顾的简评。当时,我对《闪电11人》是这样写的:

NDS热门游戏的动画化。由于10月的大作实在太多,这部并没有受到太多的关注,加上本身就是少年向,没太多人会感兴趣吧。动画本身而言是做的挺不错的,少年向动画的要素齐全,除了角色以高中或者大学生的眼光来看比较无力以外。

然后,有人反驳我说,《闪电11人》原作的NDS游戏是相当火的,玩的人很多,动画肯定也很受欢迎,说「没有受到太多的关注」纯属信口开河。

好吧,我确实是信口开河,因为我确实没有调查过《闪电11人》是不是没有受到什么关注。但我对自己的眼光有信心,所以我决定用事实去打这个人的脸

那么要怎样做呢?这就是题主问的问题。

我考虑过几个渠道:

  1. 调查搜索引擎上面的搜索量
  2. 调查门户网站 / 论坛的投票
  3. 网络社区的话题

但是,这几个渠道都有代表性的问题。

关于搜索引擎:

  • 搜索引擎太模糊,当时我还没有能去精确筛选出动画、游戏的信息。比如《闪电11人》,你怎么确定搜索出来的条目数完全是动画相关,没有混入游戏内容呢?
  • 你怎么确定使用搜索引擎搜索过这些关键词的人有持续关注这部作品,而不是了解一下就算了?

关于投票:

  • 你怎么确定看这个动画的人都会到这个门户网站 / 论坛投票?

关于网络社区:

  • 你怎么确定看这个动画的人都会到网上进行交流?

关于代表性的问题,知乎上面其实出现过,我也根据这个理解回复过,比如这个问题:关于Infinite Stratos口碑和销量的一些疑问?

我在答案中没写太多内容,请参考评论。

也就是说,在无有效手段确定代表性的时候,这个渠道的数据都无法说明问题。

所以,我换了个思路。在日本,判别作品受欢迎程度有两个指标,收视率和盘片销量。因为深夜档动画的特性(比起熬夜看,更多人喜欢录影之后随时看),收视率往往没什么代表性(因为大家都不怎么高),所以主要的考察数据是盘片的销量。

那么盘片销量反映的是什么?以我在2008年的理解,是反映了愿意看这部作品的人的数量(现在来看,当时的理解考虑得不够周全)。

所以,我应该找到一个指标,来反映在中国,愿意看这部作品的人的数量。

在当时(2008年),看新番的主要方式是通过BT下载,在线视频开始兴起,A站刚上轨道,B站还没有,在线看视频远没有今天来得普及。

于是,统计下载量就是很容易想到的一个方案。那么,问题又来了:我应该统计哪些网站的下载量数据?

当时比较有名的下载网站是极影、贪婪大陆、漫游和动漫花园。其实应该还有一些的,比如字幕组自己的下载页面,但是当时因为精力有限,都没有管了。

我只有一个人,我评估了一下,我自己来完全统计全部网站是不可能的,我希望可以只统计一个网站。所以第一步,我必须确定,这些网站的下载量是成比例的。

于是我做了一个简陋的初步调查,当时的调查报告我这样描述这这个初步调查:

调查比较了极影(http://bt.ktxp.com)、贪婪大陆(http://bt.greedland.net)、漫游(http://bt.popgo.net)和动漫花园(http://share.dmhy.org)四个常用的BT发布页,以漫游字幕组的《Gundam00》第14、15话(rmvb),澄空字幕组的《Clannad After Story》(rmvb)第13、14话的下载量作为比较标准。结果如图1所示。

图1

即便在动漫花园发布页没有找到《Clannad》13话的数据,还是看出极影发布页的下载量明显高于另外3个发布页,4集动画都显示出了同样的趋势。因此可以认为,极影发布页在新番下载量方面是最具有代表性的,能作为参照指标。

于是我就兴高采烈地开始干活了,我当时是这样干的:

2 新番下载量调查

2.1 统计方法
2.1.1时间段选择
笔者从2009年1月19日开始,分别统计10月新番第1话至第13话的下载完成量,即极影发布页“完成”标签下的数值,截至2009年1月22日统计完成。以13话作为分割是由于一季长度的新番一般会于11-13话完结,而由于日本新年动画停播的惯例,二季长度的动画第13话之后也会停播1周。因此从停播到统计时间长度有2周,足够下载完成量稳定,尽量降低误差。

2.1.2资源选择及取舍
统计目的是反映“有多少人追此作连载”,以评估其受欢迎程度。因此统计选择的是各字幕组最早发布的资源,以“天”为单位,2日00:01及2日23:59视为同时发布,2日23:59及3日00:01视为不同时。

以资源是否会分走另一个资源的下载完成量为取舍原则。同日或次日发布的资源同时统计,第三天或之后发布的资源不进行统计。考量方式为:字幕组于10月1日发布了资源A,下载者甲在1日完成了下载。字幕组于10月2日发布了修正版 Av2,甲认为A可正常观看故不下载v2,而下载者乙于2日发现更新,出于更好看片的考量,选择下载v2。1月3日,字幕组发布了高清版本Amkv,甲和乙出于收藏刻盘的目的,下载了mkv。

对于连载量少于13话,有2话及以上缺损或者只发布合集的字幕组资源,前者为不影响实际用于比较的均值,后者由于不能反映动画受欢迎程度,皆不进行统计。而中途以合集形式发布(如7-9话),合集完成量视为各话完成量,如合集A(7-9)完成量为100,视为动画A的完成量第七话为100,第八话为100,第九话为100。已完结动画最终话以合集发布的,视情况而定。合集完成量在平均下载量2倍以内的,则作最终话计算,否则视最终话完成量为0。如A平均下载量为100,合集下载量为150,视最终话完成量为150,合集下载量为200,视最终话完成量为0。“平均下载量”的计算方式见下文。

上述取舍方法忽略了“部分观众于每周周末才会进行下载”“某字幕组虽然没有完成下载,但是之前发布的资源也分走了不少下载完成量”之类的情况,使统计存在一定误差,并且笔者碍于能力不知道误差会有多大,请读者注意。同时希望有熟悉统计方法的朋友提供更好的选择方式。

2.1.3数据处理
由于部分新番只有11话或12话,因此设立“平均下载量”,计算方式为:每话完成量之和÷总话数,不保留小数,反映每个字幕组平均每话有多少人下载。

同时设立“每话总数”,计算方式为:字幕组该话完成量之和,反映一部动画每话有多少人进行了下载,第一话的“每话总数”将用于排行。所有“每话总数”之和除以总话数得到该动画的“平均下载量”,动画的下载量排行将以此为标准。

另设立“占总数百分比”,计算方式为:各字幕组的平均下载量÷每话总数的平均下载量,反映字幕组作品的受欢迎程度,以百分比表示,保留两位小数。该数据将会在接下来的字幕组部分出现,请留意。

另外,我还顺便考察了字幕组的情况:

3 字幕组作品量调查
本次参与或曾经参与10月番字幕制作及发布的字幕组一共有65个,有的是大家耳熟能详的知名大组,有的可能是你连名字都未见过的小作坊。这些组之中,有的广撒网,频太监;有的兢兢业业,冷门作品都一话不落地做完;还有的组数量与质量兼备,显尽大组风范。下面将会公布这65个字幕组的作品情况,并做出排名。

3.1统计方法
凡发在极影上发布作品的字幕组都会进行记录,除了个人发布及不作翻译只作压缩转帖的发布者。不少作品是由2-3个组合做的,由于这些组都参与了制作,因此这些组将分别计算在内。比如动画由甲、乙、丙三组合做,那么动画A的字幕组参与数为3,而动画A分别算进三组的作品数内。

如果某字幕组缺少某部动画的任意一话或更多,并没有在合计中补上,那么将视为太监。对于未完结动画,话数少于13话的也视为太监。本次调查至2009年1月22日为止,不考虑字幕组在此日期之后发布的情况。

3.2各字幕组相关排行
3.2.1最受字幕组关注新番
哪部新番最受字幕组的青睐呢?本项目统计了每部新番的参与字幕组数,分别有总数“关注字幕组数”,一直坚持连载的“连载字幕组数”,还有“太监字幕组数”,显示这些字幕组中有多少是没能坚持下去的。

图2

关注《Clannad AS》的字幕组居然有18组之多,虽然有4组在中途放弃了,不过14个字幕组投身到这部动画中足以说明字幕组对这部作品的重视程度了。《地狱少女 三鼎》居然有12个组在做这确实是出乎我意料之外。《Gundam00》只有8组并不奇怪,高达作品基本只有大组在做,名不见经传的字幕组做了也没人下,何必呢。

3.2.2最多产的字幕组
很直观,不必多说了,请看图。

图3

注意后面那些红蓝一样高的家伙,他们做了几部太监了几部……

3.2.3领头羊字幕组
哪个字幕组是其所做新番中的领头羊呢,是哪个字幕组包揽了所作新番的大把下载量呢,哪个字幕组是最收观众欢迎,作品被争相下载的呢?这个并不是排行榜,只是列出每部新番中最强大的字幕组,你下的是这个字幕组的作品么?(100%表示只有一个组在做)

表4

当时做出来的成果,现在回头看看,先不管准确性,还是很有意思的。当时是用表格发的,就不重新弄了,给个截图大家感受一下:

之后,在2009年一整年的新番,我都做了类似的统计。实际上都是属于探索式的尝试,数据准确率还是无很强的说服力。

2009年1月新番

开始尝试考察在线和下载的关系。一个可喜的发现是,在线的趋势和下载趋同,增强了下载量统计的可信性。但是也有《棒球大联盟》这样的特例。当时我并没有太多精力去考察出现特例的原因。

在2008年10月番的统计中,我统计的是主要rmvb的数量(如果只有mp4或者mkv的才统计mp4和mkv)。有人提出质疑,认为只统计rmvb是不正确的。所以在这次统计中,我特意考察了rmvb数目和总数目的关系。结果让我松了一口气。

重新看看当时我自己做的说明,发现我自己的想法原来在那么早以前就已经确立了,我在这个问题中也表达了同样的观点,而且有了进步,让我很高兴。

这份为原始数据,直接从极影BT发布页(http://bt.ktxp.com)和优酷(http://www.youku.com/)搜集而来,方式为人肉收集。BT数据截至北京时间2009年4月9日为止,优酷数据截至北京时间2009年4月11日11:00am为止。

本统计直接反映的只是一部动画在极影BT发布页上的下载完成量,这个数字并不能直接代表:
1.这部动画的“好”与“坏”,除非你把“好”与“坏”定义为下载完成量的“多”与“少”;
2.关于字幕组的统计数字并不直接代表字幕组的“好”与“坏”,除非你把“好”与“坏”定位为作品的“多”与“少”。
而作者认为,本统计中的统计数字能够间接反映:
1.一个下载量表示有一人次观看了该资源;
2.动画的受欢迎程度,因为越多的人观看代表动画越为观众接受。

也给大家看看当时的统计结果。这次的表稍微好看点了。

2009年4月新番

这一期,我开始对一个很传统的问题进行考察:就BT下载而言,发布得早的字幕组下载量就一定会多吗?

这个报告比较长,我就不贴了,而且也离题,就说一下结论:

4 总结

整体而言,我并未看到预想中的结果:减去同时发布,情况A出现的次数要明显多于其他情况。我个人的期望是起码多出50%,但事实上提早发布并没有确实地提高下载量,有的时候确实提高了,有的时候会没有影响,有的时候下载量反而会下降了,这些情况出现的几率是差不多的。

对于某些动画,比如《战场女武神》而言,发布时间早有可能会对下载量有所帮助,但这显然不是单纯由于发布时间带来的结果,还受到很多其他因素在影响。

《潘多拉之心》的例子很能说明问题,所谓的先行版实际上是对于字幕组内部而言的,某个组的先行版可能比另一个组的正式版发的还要晚,直接导致的结果就是下载人数的减少,毕竟已经有了正式版,就没有理由去下质量较差的先行版了。如果不发布先行版,而是发布正式版,情况很可能会大不一样。而发布时间早的先行版也不见得就能取得更好的成绩。

《钢炼FA》可以说是一个完全的反例,由于这里统计的只有前13话,造成这个情况的原因很可能是因为这些话数都是在复习,并没有追看的必要。以上这两个例子说明了资源本身的特性往往会淡化发布时间的影响。

下载量的影响因素比之前考虑的要复杂得多,时间的影响是存在的,但往往会被其他因素所抵消掉。下载者同时看到几个字幕组的作品,他会下载哪一个完全是这位下载者的主观意志决定的,当下载者是一群人的时候,这个选择就变得随机化了。

大部分的观众显然更关心资源整体上的品质,包括片源质量、翻译质量,种子数、链接数,这个组会不会断尾等。这里种子和链接数当然会受到时间的影响,可是一个服务器高速种往往就能把这个因素消除掉。片源也会,因为好的片源可能会晚一些,但只要不是晚上几天甚至1周,画质的优势比时间的优势会大得多,这点在《潘多拉之心》就能够看出来了。

所以,综合实力强的字幕组往往有很高的占有率,他们能找到很好的片源,能组织足够的人力在保证质量的前提下提高效率,很可能还有很好的硬件设施等等。所有的这些因素都会消除掉发布时间带来的影响。

至此,已经能得出结论:发布时间并不是影响资源下载量的主要因素。

再贴下当时的统计结果:

2009年7月新番

这一次,我开始把中心往图表美化方面倾斜。当时觉得还是做得挺漂亮的,但是现在看看,真是太俗了。

2009年10月新番

本次从简了。我当时一定是脑袋出了什么问题才会做那样一个柱状图……

当时的图表说明:

QB2依旧被删片,下载量无从统计,根据本季的质量来看,应该不会太高了。第一位是《学生会的一己之见》,出乎意料的热门,大家都开始能看懂这类动画了?《圣剑锻造师》整体挺老套的,属于知道了剧情就没兴趣看的那种动画,小说还能有趣,不过看了小说就没啥动力看动画了,动画我个人的感觉是普通。之后是本季杀必死神片,比起QB那种坦荡荡的暴露,犹抱琵琶式的杀必死显然更实用,不过这部居然没能车飞《学生会》倒是让我很意外。第四位是本季CV最强番《肯普法》,集杀必死、后宫、neta、性转换、百合等各种流行元素于一体。头四位全部被萌片肉片,而且各有千秋,偏重neta的、偏重剧情的、偏重杀必死的、偏重后宫的,这类动画能有的基本都齐全了……

最让人的意外的是网上人气超高的《黑之契约者2》居然比《恋姬无双》还要少。虽然从品质上本季最强番当之无愧,但是故事类的作品没有什么市场也是事实。高达是传统热门、《钢炼》有超火的前作,《黑之契约者》却只有一部口碑不错的前作,想要在首话突破还是比较难的。故事类多半慢热,漫游第二话的下载量已经有第一话的近两倍,我相信后来居上不是难事。

最后说说最底的《空中秋千》,这部和《天使特警2》前两天才发布的,极影自己发布的版本是昨天,到今天居然有15W的下载量(直到发文位置,已经不止这个数了)。我个人对这个数据存疑,动画本身虽然不错,但这部绝对不是能够热到这个程度的作品,对比异域和wolf的数据就知道只能是部冷门番。而漫游和贪婪等发布页是没有这个资源的,请留意。

统计下载量的问题

2010年之后,我没有再做这一类的统计了。毕业方面的压力是个契机,但是我干脆放弃的原因有以下几个:

  1. 不准确。单极影一个网站的统计是不准确的。虽然大体上的趋势我相信是没有问题,但是数字上确实存在不准确的地方。比如数字更新的缓慢、BT技术上造成的数据错误等。这些问题需要从BT这个技术的层面上来考量是不是有办法解决,但是我完全没有这样做的精力。
  2. 那个时期,实际上在线已经兴起了,尤其是主打新番的B站。另外还有网盘方式的流行。观众开始向B站流动。我也看到网上有人开始统计B站的点击数。所以,BT的数据是不是还具有代表性已经存疑了,如果要继续做,在解决BT技术问题的基础上,还必须再次考察BT下载是不是还具有代表性。
  3. 我不做新番扫雷了。由于在线的便捷性,实际上扫雷的必要性已经很低了,好不好,大家网上看看就好了,方便快捷。所以我的中心开始向新番介绍方面转移。而新番介绍是用不上,也不可能用上这种统计数据的。

所以在2010年初,我就已经不再去考虑「如何科学地衡量一部日本动画在中国的人气」的问题。但是,根据我过往的经验,我可以说,统计下载量已经行不通了——起码单纯地统计是行不通的。多方面的考察是必然的要求。而且由于目前国内的环境,各大版权视频商的割据,B站的资源已经出现缺口,光考察单个站点显然已经不现实。热门资源分散在各个视频商、某些大尺度资源要下载、某些视频商的广告太长使得某些作品反而下载看的比较多……不一而足。

可以说现在的状况比以前复杂得多。不过,我的那个时候没有微博,没有百度指数,这些事情做起来很麻烦,现在的话,已经看到可能性了。

再进一步的,我希望看到的是日本数据和中国数据的比较。对于动画分析、中国御宅族群体分析,这是很有意思的数据,对于动画评论,我认为也是有利的。

感谢看到这里的朋友。

— 完 —

本文作者:知乎用户(登录查看详情)

【知乎日报】
你都看到这啦,快来点我嘛 Σ(▼□▼メ)

此问题还有 14 个回答,查看全部。
延伸阅读:
对大陆 80 后影响最大的一部日本动漫是?
应该从哪些方面分析一部动画片?

分享到