数据新闻记者的数据素养

点赞:30551 浏览:143383 近期更新时间:2024-04-12 作者:网友分享原创网站原创

如果新闻记者不具备良好的数据新闻素养,一是会造成重要信息的遗漏,二是会得出错误的结论而误导受众.

数据新闻强调从数据资料的挖掘中发现具有新闻价值的事实.如果新闻记者不具备良好的数据新闻素养,一是会造成重要信息的遗漏,二是会得出错误的结论而误导受众.因此,具备良好的数据新闻素养,是数据新闻记者应该具备的首要能力.数据新闻记者不需要对具体行业有较深的数据积累,但必须有效地发现数据和寻找数据,一旦选题确定,要能运用各种途径和方法获取所需数据,同时也要在机构内部建立一个长期积累的数据库.笔者将数据新闻记者应具备的素养总结为以下三点.

有效地获取数据

精确新闻学的创始人菲利普梅耶在《数据新闻手册》里写道:“在信息量不足的时代,记者主要的精力在于寻找和获取信息,然而处于信息丰富的今天,信息处理的过程就显得尤其重要.”数据新闻的出现,某种程度上顺应了全球开放数据发展的进程,同时也是在一个社会化媒体高度发展,数据高度饱和的时代下,新闻业自身发展的一个变革.数据并不稀缺,真正稀缺的是对数据里蕴含的资讯和事实的解读.

数据新闻记者的数据素养参考属性评定
有关论文范文主题研究: 关于新闻记者的论文范文集 大学生适用: 函授论文、专科毕业论文
相关参考文献下载数量: 19 写作解决问题: 写作参考
毕业论文开题报告: 论文提纲、论文选题 职称论文适用: 技师论文、职称评副高
所属大学生专业类别: 写作参考 论文题目推荐度: 经典题目

国外媒体之所以能做出很多有社会意义的数据新闻,一定程度上跟国外数据开放的政策和完善的数据开放管理机制有关.国内在这方面还处于起步阶段,很多政府数据并没有开放,开放的数据也没有统一的管理和发布平台.不过我们很欣慰地看到国家统计局网站改版和在数据开放方面的一些探索.我们一方面寄希望于国内开放数据领域的发展,另一方面也要不断加强记者自身获取数据的能力.除了来自的、第三方机构的开放数据,另外还有几种常见的获取数据的途径:调查、众包和引用.

1.调查是新闻记者在没有现成数据来源时采用的一种数据收集手段,主要以问卷或是街头访问的方式进行.这种方式最大的问题就是没有经过科学的抽样,样本并不具备推及总体的代表性.我们经常能在新闻里见到“经过记者的调查,60%的民众等”这样的结论,但是并没有说明数据是如何收集、如何得出的.通过街头拦截或是网上问卷调查得来的数据结果,严格意义上讲都不具备总体代表性,因此不能简单粗暴地认为是总体的意见和看法.

2.众包是随着互联网技术的发展而产生的一种新生产组织形式.其目的就是将一项需要耗费大量人力和成本的工作,通过互联网的控制分发给网络上的“志愿者大军”,通过他们贡献的业余时间和业余精力来完成一项巨大的工程.通过众包的方式来完成的最典型案例就是以维基百科为代表的网络百科工程.

当然,新闻记者也可以通过这种方式来完成一些仅仅依靠新闻机构本身很难去完成的任务,比如全国各地水质、空置房、闲置土地、物价等空间和时间跨度大的调查项目.英国《卫报》就通过这种方式,让读者帮助他们完成45万份记录有国会议员开销的文件.众包项目在一定程度上能够帮助新闻机构完成大数据量的数据收集和整理,但数据质量的高低和项目效果的好坏,取决于项目管理和控制.

3.还有一种在新闻里常见的数据获取方式――引用.为了证明新闻报道里的观点,我们经常会引用第三方报告、论文、年鉴等资料里的数据.当我们在引用这类数据的时候,最经常犯的错误是被找到数据的喜悦冲昏头脑,以至于忘了去质疑和证实数据的有效性.于是我们经常看到“×××数据显示,过去3年,北京电视机开机率从70%下降到30%”,“中国内地用户月均上网费用是美国的4倍、韩国的20多倍”等一些不实的报道.求证和质疑是数据新闻素养最基本的要求,如果无法证明数据的准确性,最好的处理办法是不用;如果一定要用的话,要注明数据的来源和出处,最好是能给出链接或者文件名称,方便受众去质疑和求证.

由于不能有效地获取数据,而造成一些虚检测不实报道产生,会大大降低新闻媒体的公信力.为此,2011年国家发布《关于严防虚检测新闻报道的若干规定》,其中有两条应该作为数据新闻记者获取数据时的标准:刊播涉及民意调查的报道,要使用权威规范的数据来源,谨慎使用网络调查、民间调查、市场随机访问等调查数据,报道中要说明调查的委托者、执行者、调查目的、调查总体、抽样方法、样本数量等,客观反映调查结果.

科学地分析和解读数据

哥伦比亚大学新闻学院数据新闻研究中心的Jonathon Stray教授认为,数据不会自己说话,需要被解读,在数据解读的每一个过程中都有可能出错,最后导致一个错误的结论或新闻故事.分析数据的第一步是理解数据,为了理解数据,我们必须对新闻选题的背景有所了解,对选题里涉及的概念有清晰的认知.比如不了解收视率的背景,可能会觉得10%的收视率是一个很低的数值,但实际上它是一个很不错的收视表现.数据本身并没有意义,只有当它置于一定的情景之中,才被赋予特殊的含义.

在理解了数据的含义之后,就可以开始分析数据.数据新闻强调从数据资料中挖掘出有价值的新闻事实,需要新闻记者掌握一定的统计和数据分析知识.举一个例子来说明统计知识在解读数据时的重要性,这个例子来自一本统计学教材,笔者将这个例子进行了改编.检测如我们提出一个新闻选题:高校在录取研究生的时候是否存在性别偏好或是性别歧视?为了解答这一问题,记者收集了六所高校的研究所录取数据,其中2691名男生和1835名女生通过了初试,进入了研究生招生的面试,最后统计的结果是男生的录取率为45%,女生的录取率为30%.到这里,似乎已经得出结论,可以开始写稿了:女生的录取率低于男生,高校研究生录取存在性别歧视.这是我们经常容易见到的一类报道,而且由于贴近社会,往往会引起强烈的社会反响.但是当具体查看这六所高校的男女录取率的时候,我们却并不能发现哪所高校在录取的问题上存在明显的女性歧视,相反,似乎更多发现的是对男生的歧视(见右表).这个例子是统计学里讲到混杂因素时的一个例子,仅仅为了说明不同的数据解读,为何得出完全不同的结论.

新闻记者最容易犯的两个统计错误是:把随机化结果当做规律性结论、有相关关系即认为有因果关系.一次调查发现的结果,是否就能说明发现了某种规律?15%的差异在统计学意义上是否具有显著性?菜刀销售量的升高与砍杀暴力犯罪的增加具有显著的相关性,是否就能说明应该实行购刀实名制? 种种诸如此类的问题,都需要通过专业的统计分析和实验去证明.数据新闻的前身是精确新闻学,精确新闻强调社会科学研究方法在新闻报道中的使用,以提高新闻报道的客观性和准确性.

准确直观地传达数据

数据新闻往往最后选择用可视化的方式来呈现,这样做的初衷当然是为了更简单、直观地传达信息.信息的呈现有多种方式,目前数据新闻主要的呈现方式有传统的文字报道、静态信息图、可视化的视频作品、交互式的网页新闻以及新闻客户端等.选择哪种方式来呈现报道,应该根据选题的内容和数据的类型来定,绝不能为了可视化而可视化,导致画面很炫,信息表达却很复杂.

可视化通过将信息直接映射到人体感官系统的方式,减轻人体感知信息的成本,缩短信息解读的路径,是一种非常友好的表达方式.但是我们也不能忽略一点,人的眼睛很容易被欺骗.统计会说谎,统计图表和可视化呈现也会“说谎”.这种谎言可能是故意的,也有可能是无意的.比如纵坐标的起点不为0,以此来凸显差异;将数据赋值给圆的半径,然后通过圆的面积来表现数据的大小,却不知这样的处理已经将数据变成了平方后的数据.

在数据的表达上,我们不能刻意去追新、追炫、追好玩,而应该以受众体验为导向,创作出受众乐于接受同时能准确传达信息的数据新闻作品.这需要数据新闻记者有意识地去思考,并与设计师、制图师等一起讨论和积累经验.


国内高校开展的新闻教育,主要以文科类课程为主,培养的是学生采写编评等新闻基础素养和能力.在数据新闻素养的培养方面,大多是开设研究方法类的选修课或开展实习实践活动.在大数据时代,数理统计、计算机编程等理工类课程也应纳入到新闻教育课程体系中来.华东政法大学人文学院高雁老师在反思大数据时代的新闻教育时,也认为新闻专业课程里应该增设如“网络新闻”、“计算机辅助报道”、“数据挖掘”、“新媒介基础技巧”、“新媒介先进技术”、“数据可视化”等课程,而且在条件允许的情况下,还应该建立实验室等平台让学生进行实践.

已经选择了新闻职业,并且有志于往数据新闻方向发展的新闻记者,首先要有提高自身数据新闻素养的意识,然后可以通过自学或培训等方式来逐渐提升自己这方面的知识和能力.目前网络上有大量跟数据新闻相关的公开课和学习资料,也有一些机构和组织在推广类似数据新闻hackathon(马拉松)之类的活动.通过参加这类活动,可以认识在业内有很多实践经验的同行,通过交流,迅速积累经验、提升能力.

(沈浩:中国传媒大学新闻学院教授;谈和:中国传媒大学新闻学院硕士生;文蕾:中国传媒大学传播研究院硕士生)