【纽约时报数据新闻可视化的专业规范分析案例14000字】_第1页
【纽约时报数据新闻可视化的专业规范分析案例14000字】_第2页
【纽约时报数据新闻可视化的专业规范分析案例14000字】_第3页
【纽约时报数据新闻可视化的专业规范分析案例14000字】_第4页
【纽约时报数据新闻可视化的专业规范分析案例14000字】_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《纽约时报》数据新闻可视化的专业规范分析案例目录TOC\o"1-3"\h\u16648《纽约时报》数据新闻可视化的专业规范分析案例 126852第一节数据新闻可视化的客观性 231190第二节数据新闻可视化的透明性 1029151第三节数据新闻可视化的清晰度 15移动互联网时代,传统新闻业的新闻报道和解释权威面临竞争,新闻业的边界变得模糊。陈楚洁,袁梦倩.新闻社群的专业主义话语:一种边界工作的视角[J].新闻与传播研究,2014,21(05):55-69+127.记者逐渐难以维持对新闻业的排他性管辖,新闻业进入“去专业化”的过程。陈楚洁,袁梦倩.新闻社群的专业主义话语:一种边界工作的视角[J].新闻与传播研究,2014,21(05):55-69+127.白红义.塑造新闻权威:互联网时代中国新闻职业再审视[J].新闻与传播研究,2013,20(01):26-36+126.然而此前多项研究认为,许多媒体的数据新闻生产并未遵循系统的专业规范,比如数据来源、数据分析方法不透明,ZamithR.Transparency,Interactivity,Diversity,andInformationProvenanceinEverydayDataJournalism[J].DigitalJournalism,2019,7(4):470-489.数据新闻发展始终伴随质疑。有研究证实,统计数据、公式、图表等非语言元素会使新闻报道更具说服力,TalA,WansinkB.Blindedwithscience:Trivialgraphsandformulasincreaseadpersuasivenessandbeliefinproductefficacy[J].PublicUnderstandingofScience,2016,25(1):117-125.因此受众可能更难以发现数据新闻中的误导,长期存在的刻板印象可能对社会造成危害,对媒体的权威性产生负面影响。ZamithR.Transparency,Interactivity,Diversity,andInformationProvenanceinEverydayDataJournalism[J].DigitalJournalism,2019,7(4):470-489.TalA,WansinkB.Blindedwithscience:Trivialgraphsandformulasincreaseadpersuasivenessandbeliefinproductefficacy[J].PublicUnderstandingofScience,2016,25(1):117-125.知识可分为知晓性和解释性两种,帕克提出,新闻是一种知识类型,如今的数字新闻一部分偏向于知晓型知识,另一部分则得益于交互等新技术的运用,越来越具有解释性。白红义.当新闻业遇上人工智能:一个“劳动—知识—权威”白红义.当新闻业遇上人工智能:一个“劳动—知识—权威”的分析框架[J].中国出版,2018(19):26-30.Borges-ReyE.UnravellingDataJournalism[J].JournalismPractice,2016,10(7):833-843.夏倩芳,王艳.从“客观性”到“透明性”:新闻专业权威演进的历史与逻辑[J].南京社会科学,2016(07):97-109.一般而言,界定何为“专业的”,是通过认定“不(够)专业”达成的,陈楚洁陈楚洁,袁梦倩.新闻社群的专业主义话语:一种边界工作的视角[J].新闻与传播研究,2014,21(05):55-69+127.应当说明的是,本章重点剖析该板块不符合专业规范的个案,不代表该板块数据新闻可视化的总体水平。实际上,“TheUpshot”板块的数据新闻可视化能够体现出一定的规范性,明显不符合专业规范的数据可视化是少数,根据内容分析的编码结果和笔者对大部分样本的浏览,发现其在一定程度上遵循了目前公认的客观性、透明性、清晰度要求,例如绝大多数遵循了可视化设计的基本规则(82.8%)、交代数据来源(83.2%)、信息复杂程度适中(87.3%)。第一节数据新闻可视化的客观性新闻客观性自诞生以来就伴随诸多争议,却从未被颠覆过。传统新闻中,受制于报道者个人和组织的文化背景、新闻价值观、语言修辞,以及日常生产中的时间、空间等方面影响,客观性难以实现,但新闻生产仍会不断追求接近客观性,以维持新闻的专业性和权威性。BoudanaS.Adefinitionofjournalisticobjectivityasaperformance[J].Media,Culture&Society,2011,33(3):385-398.理想层面上的新闻客观性,指记者排除个人偏见如实报道;操作层面上的客观性,指用来防止记者主观性介入的一系列新闻常规,如倒金字塔结构、使用引语等;文本层面上的客观性,指“客观报道”的写作样式,包括将事实与观点分离、消息源可靠、中立的叙事等。夏倩芳,王艳.从BoudanaS.Adefinitionofjournalisticobjectivityasaperformance[J].Media,Culture&Society,2011,33(3):385-398.夏倩芳,王艳.从“客观性”到“透明性”:新闻专业权威演进的历史与逻辑[J].南京社会科学,2016(07):97-109.科瓦齐,罗森斯蒂尔.新闻的十大基本原则:新闻从业者须知和公众的期待[M].刘海龙,连晓东,译.北京:北京大学出版社,2011:99.理想状态下,从数据中提取信息是一个客观的过程,结果应该具有可复现性,但对于任何给定的数据集而言,都不仅有一种恰当的可视化效果,KoKosaraR.TheUnbearableSubjectivityofVisualization[EB/OL].(2008-05-28)[2020-06-25]./blog/2008/subjectivity-of-visualization.一、反常规设计扭曲数据数据可视化设计中一些惯例使其在视觉上具有客观性,例如二维视点、几何形状、包含数据源等。KennedyH,HillRL,AielloG,etal.Theworkthatvisualisationconventionsdo[J].InformationCommunication&Society,2016,19(6):715-735.但数据可视化设计并非总是符合惯例的,由于数据自身特征、版面布局或其它方面的要求,设计者不可避免地对惯例的设计进行修改,由此出现反常规的设计,可能影响数据呈现的客观性。KennedyH,HillRL,AielloG,etal.Theworkthatvisualisationconventionsdo[J].InformationCommunication&Society,2016,19(6):715-735.反常规设计通常包括反方向坐标轴、掩盖纵轴0刻度、双y轴等。基于坐标系的图表通常采用向右的x轴,向上y轴,符合从左到右、从上到下的思维习惯,例如习惯用从左到右表示时间的增加,而有些图表可能进行相反的坐标轴设计;如果有合理的理由不以0为起点,要从0开始标尺,在轴线上做一个缺口,否则可能夸大数据的波动。琼斯.谁说图表不会说谎[M].罗利斌,李东博,译.海口:南方出版社,2011:47,99琼斯.谁说图表不会说谎[M].罗利斌,李东博,译.海口:南方出版社,2011:47,99.易造成数据呈现不客观的反常规设计之一是纵坐标轴未从0开始,可能夸大数据的波动或差距。如图5-1,显示了自2015年以来因毒品被捕的人数再次上升的事实,但是图中纵坐标轴初始刻度为135万,视觉上放大了数据随时间的波动情况,可能导致用户解读不准确。图5-1因毒品被捕人数再次上升/2019/11/05/upshot/is-the-war-on-drugs-over-arrest-statistics-say-no.html?searchResultPosition=46/2019/11/05/upshot/is-the-war-on-drugs-over-arrest-statistics-say-no.html?searchResultPosition=46由于有些数据值永远不可能为0,且并非所有的比较都需要将0作为起点,尤其是当数据基数较大时,y轴从0开始可能导致数据波动趋势过小,无法呈现有效的信息,还会使得版面大片空白、不美观,因此有时截断y轴是必要的。但可视化的规则要求,y轴仍需从0开始,需在y轴0以上的位置设计一个断点,再从合适的基点开始显示数据。琼斯.谁说图表不会说谎[M].罗利斌,李东博,译.海口:南方出版社,2011:琼斯.谁说图表不会说谎[M].罗利斌,李东博,译.海口:南方出版社,2011:47,99.此外,还有个别报道在横纵轴的刻度划分上存在反常规设计。如图5-3,为了视觉效果的清晰,并未均匀划分横纵坐标轴的刻度,使散点的分布能在图中较为均匀、清晰。但毕竟扭曲了数据分布的视觉效果,因此有必要提醒、告知用户,否则可能造成用户的困惑。图5-3政府对枪支暴力研究的资助较低/2019/04/17/upshot/gun-research-is-suddenly-hot.html?searchResultPosition=125/2019/04/17/upshot/gun-research-is-suddenly-hot.html?searchResultPosition=125没有采用明显反常规设计的图表不意味着客观,出现反常规设计也并不意味着图表不客观。反常规设计可能是记者出于数据呈现需要而进行的定制化生产,不存在规范问题,体现了可视化的创新性,达到更出色的呈现效果,能够避免用户的审美疲劳,增强视觉吸引力。二、注释说明隐含记者观点信息图的相关注释说明中也可能携带制作者的观点。本研究统计了可视化注释中或位于信息图上的文本说明,包括(1)对数据规律、要点的说明,(2)读图说明,(3)两者均存在;占比分别为50.9%、7.8%、9.4%,总占比为68.1%,一定程度上形成了常规。其中,对数据规律、要点的概括通常位于图表标题中或标题下,用简短的文字概括数据的趋势、规律,或者点出图像中的异常,最有可能隐含观点,影响客观性。对读图说明是指对可视化中使用的符号等进行解释,辅助用户读图,通常位于底部注释中,不涉及对数据本身的说明。在“TheUpshot”板块数据新闻中,对数据规律、要点的概括,以文字的形式将数据中的规律、要点直接告知用户,可能会引导用户将关注点集中在图表的特定区域,强调或忽视某些数据,由此模糊事实与观点的界限,将隐含的观点传达给受众。数据可视化中语言和图像的关系可分为图像统摄、语言统摄、语图互补以及语图协商。张超.释放数据的力量:数据新闻生产与伦理研究[M].北京:中国人民大学出版社,2020:159-168.张超.释放数据的力量:数据新闻生产与伦理研究[M].北京:中国人民大学出版社,2020:159-168.张超.释放数据的力量:数据新闻生产与伦理研究[M].北京:中国人民大学出版社,2020:165.在传统新闻报道中,在截稿时间的要求下,针对客观性的一些操作可被看作保护记者免受批评的一种策略仪式,包括分离事实与价值、使用引号等。TuchmanG.Objectivityasstrategicritual:Anexaminationofnewsmen'snotionsofobjectivity[J].AmericanJournalofsociology,1972,77(4):660-679.但在数据新闻中,在图表的标题中、标题下提出观点、隐藏观点,同样可能成为一种避免主观性的策略。TuchmanG.Objectivityasstrategicritual:Anexaminationofnewsmen'snotionsofobjectivity[J].AmericanJournalofsociology,1972,77(4):660-679.例如上图5-1,便存在对数据规律的概括说明,图表标题下说明“2006年至2015年,全国因毒品被捕总人数持续下降,随后小幅上升”,但标题中仅强调“因毒品被捕人数再次上升”,且忽略了图中上升速度正放缓的事实。因此,为了维持客观性,可视化制作者在附属于图表的注释或标题、副标题中给出文本说明时,应当克制偏见或观点,对可视化中数据的概括说明应全面。三、数据完整性说明缺失采纳官方信源是传统新闻生产的常规之一,在“TheUpshot”板块的数据新闻中,也大量使用政府数据、非盈利组织数据,除了易于获取,更可表明数据源的权威性,减轻记者在日常生产中核实数据的压力。这些数据在最初被收集时,是为特定机构服务的,数据的结构、组织方式等都是从机构的角度来完成的,而不是从记者报道新闻的角度来完成。D'IgnazioC.Puttingdatabackintocontext:WhycontextishardD'IgnazioC.Puttingdatabackintocontext:Whycontextishard[EB/OL].(2019-04-04)[2021-03-15]./read/longreads/putting-data-back-into-context.D'IgnazioC.Puttingdatabackintocontext:Whycontextishard[EB/OL].(2019-04-04)[2021-03-15]./read/longreads/putting-data-back-into-context.在样本中,数据完整性说明并不常见。数据完整性说明通常在可视化有缺失数据的情况下出现,对“数据说明”这一变量的统计发现,对缺失值或不确定值进行说明的有57组,占比11.9%;图中存在空缺值的共21组,其中没有对缺失值做出任何说明的有17组。如图5-4,图中可见1940-1950之间的数据有缺失,但并未给出说明,注释中仅标注“1948年之前的历年数据为估算值”,并未解释1948年当年的数据如何,且未给出估算的依据。根据格式塔理论,受众可能在视觉上将缺失的值补全成连续的折线,而忽视真实的数值。数据可视化应当完整、准确地呈现数据的结果,不能因设计缺陷导致数据被误读,张超张超.论数据新闻的实用主义客观性原则[J].中州学刊,2018(09):166-172.当数据集整体上较为完整,仅少量或个别数据缺失时,应该回到数据收集的语境中,探究元数据,D'IgnazioC.Puttingdatabackintocontext:D'IgnazioC.Puttingdatabackintocontext:Whycontextishard[EB/OL].(2019-04-04)[2021-03-15]./read/longreads/putting-data-back-into-context.图5-4历年失业率/2020/04/03/upshot/coronavirus-jobless-rate-great-depression.html/2020/04/03/upshot/coronavirus-jobless-rate-great-depression.html此外,有时获取的数据集本身是完整的,记者可能也会由于某些原因不使用完整数据,不意味着报道不客观,此时应详细交代原因。例如有些数据涉及个人信息,要求记者保护个人数据,避免数据的过度挖掘,避免侵犯隐私。如图5-5,以表格的形式展示了2016年-2018年参加特殊入学考试及收到通知书的学生人数分布情况,注释中标明“为了保护隐私,2017年的数据被隐藏了”,但是在报道正文中并未具体说明为何仅2017年的数据涉及隐私,隐藏之后对数据的结果产生了怎样的影响等,导致表格中的结果可能并不客观。图5-5哪些学生参加了特殊入学考试/interactive/2019/06/17/upshot/nyc-schools-shsat-504.html?searchResultPosition=72/interactive/2019/06/17/upshot/nyc-schools-shsat-504.html?searchResultPosition=72四、对客观性规范的评价本节结合个案,分析了“TheUpshot”板块数据新闻可视化在操作层面和文本层面的客观性,包括反常设计扭曲数据、注释说明中隐含观点以及数据完整性说明缺失,其中前两者属于文本层面的客观性,最后一点属于操作层面的客观性。数据新闻可视化中不可避免记者选择事实和报道中的主观性,例如视觉修辞、程序修辞技巧,但仍需尽量维持方法上的客观性。数据新闻可视化应遵循可视化设计的准则,尽量不使用反常规设计。在可视化设计领域,常提及一些容易产生欺骗性的操作,这些操作在“TheUpshot”板块数据新闻可视化中并未全部出现,可见记者在进行可视化设计时,有意识地遵循一些可视化领域的规范。比如坐标轴裁剪(不从0开始)、坐标轴缩放(夸大或隐藏数据变动趋势)、分类过多的或三维的饼图、暗示两者关系的双轴图等都是可视化设计领域常见的反常规、不规范设计,FortneyK.5WaysDataVisualizationscanLieFortneyK.5WaysDataVisualizationscanLie[EB/OL].(2017-05-27)[2021-03-15]./5-ways-data-visualizations-can-lie-46e54f41de37.“TheUpshot”板块的数据新闻可视化中,在可视化标题、注释说明中,常用简短的语言引导用户重点关注某一类别或某些值。数据可视化能够让大量数据在视觉的瞬间被解码,文字说明可能不利于图像对数据的全面呈现。该板块数据新闻可视化常单独在图表标题中提炼某些异常的数据,可能是为了强调数据与读者的相关性或说明当前情况的严重性,突出数据的新闻价值,起到吸引眼球的作用。在图表标题中,应以简洁的语言描述图表的全部含义,例如“纽约新冠病毒死亡人数的五种不同预测”/interactive/2020/04/22/upshot/coronavirus-models.html,且尽量不使用不必要的形容词、程度词来描述数据,例如“惊人的上升”,而应让用户通过读图,自行感受数据的异常程度。ChoudhuryS.HowtoEffectivelyuseTextinaDataVisualization?[EB/OL].(2014-06-11)[2020-3-14]./blog/how-to-effectively-use-text-in-a-data-visualization/./interactive/2020/04/22/upshot/coronavirus-models.htmlChoudhuryS.HowtoEffectivelyuseTextinaDataVisualization?[EB/OL].(2014-06-11)[2020-3-14]./blog/how-to-effectively-use-text-in-a-data-visualization/.可视化设计领域主张最小化文本数量、最大化视觉元素,在线可视化工具Piktochart的营销主管玛塔·奥尔森斯基(MartaOlszewska)曾表示,在为可视化添加文本时应考虑,“可以不添加吗?可以仅通过图像来形象化我想说的吗?”Lin.Minimalyetpowerful:Improvingthetextonyourinfographics[EB/OL].(2019-02-21)[2021-03-15]./minimal-yet-powerful-improving-the-text-on-your-infographics/.Lin.Minimalyetpowerful:Improvingthetextonyourinfographics[EB/OL].(2019-02-21)[2021-03-15]./minimal-yet-powerful-improving-the-text-on-your-infographics/.张超.释放数据的力量:数据新闻生产与伦理研究[M].北京:中国人民大学出版社,2020:165.传统新闻报道中,要求记者全面报道事实,数据新闻中,对于可视化呈现的数据是否完整,记者也应予以说明,以表明并未在原始数据中增删数据,表明中立的立场。当数据不完整时,应说明缺失数据的处理方式,表达处理方式本身的客观性、可复现性。“TheUpshot”板块的数据新闻可视化在完整性说明上并未形成统一的标准。对于大量数据中存在的极个别空缺值,数据记者一般不会在注释中说明。这可能是由日常数据新闻生产中的快节奏导致的,数据记者受制于截稿压力和个人能力,主要关注数据的易访问性和易用性,而非数据集的准确性或底层结构,LowreyW,BroussardR,SherrillLA.Datajournalismandblack-boxeddatasets[J].NewspaperResearchJoumal,2019,40(1):69-82.因此无法针对个别缺失值去探究数据的语境,寻找缺失的原因,报告数据的质量。此外,在可视化中声明数据完整性也受数据源影响。例如美国联邦数据和各州数据即便均为官方数据,在完整性上也有较大差别,联邦数据往往较为完整,而各州数据可能存在格式、类目、时间不统一的情况,进一步加大了声明数据完整性的难度。LowreyW,BroussardR,SherrillLA.Datajournalismandblack-boxeddatasets[J].NewspaperResearchJoumal,2019,40(1):69-82.第二节数据新闻可视化的透明性透明性与客观性有着紧密的联系,透明性可视为表明报道客观性的一种手段。在客观性遭遇挑战的现实下,强调开放、诚实的透明性成为新闻客观性的推动力,以提高媒体公信力。夏倩芳,王艳.从“客观性”到夏倩芳,王艳.从“客观性”到“透明性”:新闻专业权威演进的历史与逻辑[J].南京社会科学,2016(07):97-109.科瓦齐,罗森斯蒂尔.新闻的十大基本原则:新闻从业者须知和公众的期待[M].刘海龙,连晓东,译.北京:北京大学出版社,2011:83.AllenDS.Thetroublewithtransparency:Thechallengeofdoingjournalismethicsinasurveillancesociety[J].JournalismStudies,2008,9(3):323-340.GadePJ,DastgeerS,DeWaltCC,etal.Managementofjournalismtransparency:Journalists’perceptionsoforganizationalleaders’managementofanemergingprofessionalnorm[J].InternationalJournalonMediaManagement,2018,20(3):157-173.假新闻泛滥、信任危机,是近年来新闻业一直面临的困境,2020年9月的皮尤(Pew)报告发现,只有不到一半的美国成年人相信记者的行为符合公众的最大利益,越来越多的人相信新闻业会损害民主而不是保护民主。MayerJ.Here’swhatPewsayspeoplethinkofjournalism—andwhatyoucandoaboutit[EB/OL].(2020-09-02)[2021-03-15]./trusting-news/heres-what-pew-says-people-think-of-journalism-and-what-you-can-do-about-it-8a2551d452cf.披露新闻生产的过程,可以声明专业媒体机构的权威性和可信度。与传统新闻相比,数据新闻涉及数据采集、数据分析、代码等,不具备相关专业知识的公众难以理解生产过程,不透明因素更多,因此更需要记者主动披露。且数据新闻诞生于开源和开放数据运动的背景下,MayerJ.Here’swhatPewsayspeoplethinkofjournalism—andwhatyoucandoaboutit[EB/OL].(2020-09-02)[2021-03-15]./trusting-news/heres-what-pew-says-people-think-of-journalism-and-what-you-can-do-about-it-8a2551d452cf.张超,钟新.新闻业的数据新闻转向:语境、类型与理念[J].编辑之友,2016(01):76-83.透明性包括披露透明性和参与透明性,前者指新闻生产过程的透明,后者指受众在新闻生产中的参与程度。KarlssonM.RKarlssonM.Ritualsoftransparency[J].Journalismstudies,2010,11(4):535-545.一、数据来源的交代未统一提供可追溯性的数据源,鼓励用户探索数据,是可视化生产的常规,也是修辞行为,表明制作者相信数据是准确的,用户无需检查。KennedyH,HillRL,AielloG,etal.Theworkthatvisualisationconventionsdo[J].InformationCommunication&Society,2016,19(6):715-735.本研究纳入统计的数据源既包括在图表下方注释里给出的,也包括正文中提及的,以及文后的其它报道说明中的数据源。样本中数据来源交代情况见表5-1,83.2%的数据新闻具有公开数据源,说明交代数据源已经成为一种常规,但实际的数据源透明情况仍不容乐观:直接给出数据源下载方式的可视化占比不足三成;近半数数据源交代模糊,仅列出机构名,没有给出网站和任何其它获取方式;有16.8%的可视化未交代任何数据源。KennedyH,HillRL,AielloG,etal.Theworkthatvisualisationconventionsdo[J].InformationCommunication&Society,2016,19(6):715-735.表5-1数据来源交代情况数据来源交代编码单元数(组)占比无交代8016.8%模糊23048.2%一般清楚347.1%清楚13327.9%总计477100%本研究在编码时认为,只要提供了用户可直接获取的数据源,即为交代“清楚”。在所统计的样本中表现为两种主要的方式,一是给出数据源的链接,用户点击链接即可获得在线的原始数据;二是给出文档的下载链接,通常在可视化下方注释中标记为“Getthedata”的超链接,点击即可将原始数据下载到本地,通过可视化工具Datawrapper中的功能实现。其中,有些报道会将原始数据的链接统一放在页面最低端,并不针对某一图表单独给出。“一般清楚”是指给出具体文章名、作者,或给出数据源机构链接,都需要用户自行搜索,用户可能无法直接获取,需要付出一定成本。比如某些学术论文中的数据需要进入特定数据库下载,非机构用户或非付费用户没有权限下载;有些只给出机构网站的链接,而机构网站涉及大量数据,具体可视化中使用的数据需要用户自行查找。“模糊”是指仅给出数据来源的机构名称,不共享原始文档,不鼓励用户探索原始数据,例如“Sources:BureauofLaborStatistics”,用户很难寻找报道中使用的具体数据。此类数据来源交代情况占比接近一半,只是借由官方机构的权威性光环来为报道增加可信度,可能被常规化为“透明性的策略仪式”,即通过提升一小部分透明性来抵消更大程度的透明性。ZamithR.Transparency,Interactivity,Diversity,andInformationProvenanceinEverydayDataJournalism[J].DigitalJournalism,2019,7(4):470-489.ZamithR.Transparency,Interactivity,Diversity,andInformationProvenanceinEverydayDataJournalism[J].DigitalJournalism,2019,7(4):470-489.有研究者访谈发现,是否给出数据源以及如何给出,可能“取决于它是什么样的数据”,即数据来源的类型影响其透明程度。KennedyH,WeberW,EngebretsenM.Datavisualizationandtransparencyinthenews[J].DataVisualizationinSociety,2020:169-185.本研究也发现,来源于国家机构的数据通常仅给出机构名称或链接到机构主页,而不是具体的数据集,来源于学术论文的数据通常会给出标题及作者。KennedyH,WeberW,EngebretsenM.Datavisualizationandtransparencyinthenews[J].DataVisualizationinSociety,2020:169-185.二、数据分析方法的说明未统一数据新闻中数据分析方法直接影响可视化呈现的效果,影响事实的准确性,因此说明数据分析方法也是披露透明度的要求,是声明数据新闻生产过程与结果可复现性的一种方式。样本中给出方法说明的可视化共107组(22.4%)。由于一篇报道中的不同可视化背后可能涉及不同的数据分析方法,也可能是相同的方法,单独针对某一图表判断是否公开方法较难实现,因此本研究在编码时规定,若在页面底部出现了说明,则认为该篇报道中所有可视化均包含方法说明,所以实际存在方法说明的可视化占比小于22.4%。大部分方法说明位于可视化注释中,极少部分在报道的页面底部给出。两者各有利弊,前者能够将方法与具体可视化相对应,但受限于版面,往往以简短的语言概括方法;后者则可以较少受版面限制,且能够从整篇报道的角度说明数据分析方法,更具有系统性,但有时难以与具体的某一图表所用方法相对应。不论以何种方式给出,上述数据都可证明,“TheUpshot”板块的数据新闻生产在方法说明上并未形成统一的规范。样本中有极少数可视化通过超链接保证了数据分析方法的透明。例如在题为《有偏见的新闻媒体还是有偏见的读者?一项信任实验》/2018/09/26/upshot/biased-news-media-or-biased-readers-an-experiment-on-trust.html?searchResultPosition=27的报道中,作者在页面低端对核心方法进行简单说明之后,使用提供云内容管理服务的Box共享了原始数据、清洗后的数据等多个文档,并在作者个人GitHub账号上发布了开源代码。/2018/09/26/upshot/biased-news-media-or-biased-readers-an-experiment-on-trust.html?searchResultPosition=27数据记者为了实现某种可视化的效果可能会应用多种工具,经历多步骤的复杂操作、尝试多种方法,从数据采集到分析再到可视化,生产流程中某一个方法的细微变化可能都会影响最终的可视化效果。因此,使用的数据分析方法越复杂,记者越应当公开可视化的生产过程,保证可复现性。一些数据新闻可视化生产涉及算法,此时应保证算法透明。新闻业作为公共服务,旨在维护公共利益,公众有权了解算法的运行机制。张超.释放数据的力量:数据新闻生产与伦理研究[M].北京:中国人民大学出版社,2020:215.张超.释放数据的力量:数据新闻生产与伦理研究[M].北京:中国人民大学出版社,2020:215.厄舍.互动新闻:黑客、数据与代码[M].郭恩强,译.北京:中国人民大学出版社,2020:217.但矛盾点在于,生产过程越复杂的数据可视化,详细公开过程也越复杂,会面临更多困难。比如使用Excel进行数据清洗或分析,为了得出结论而采取的步骤通常会在一步步的操作中被掩盖,比如复制单元格时往往只复制到数值,而不是公式,因此很难回顾得出结论的具体步骤。提供细致的方法说明和源代码可能增加记者的任务量,且涉及核心产品的版权保护工作,在截稿时间的要求下,公开详细的数据分析方法和算法有时难以实现。厄舍.互动新闻:黑客、数据与代码[M].郭恩强,译.北京:中国人民大学出版社,2020:216.厄舍.互动新闻:黑客、数据与代码[M].郭恩强,译.北京:中国人民大学出版社,2020:216.三、提升透明性的平台和技术随着新技术的应用,数据新闻可视化的透明性或许会进一步提高。除了在报道中以说明、链接等方式介绍数据来源或数据分析方法,《纽约时报》还借助多种平台和技术来增加透明性。由于数据可视化领域本就有共享数据源的要求,有些“零代码”的可视化工具自带共享数据的功能,使得可视化领域的规范性迁移到新闻领域,提升透明性。例如“TheUpshot”板块的数据可视化,凡是在可视化底部注释部分添加了下载链接的,均标记为蓝色小字“Getthedata”,使用Datawrapper制作完成。因此,可视化工具不仅节省了记者设计图表的时间,也在一定程度上提升了可视化的透明性。与数据新闻生产相关的技术、工具的发展,会降低数据分析方法公开的成本。有研究者指出,《纽约时报》等几家媒体正采用JupyterNotebook来进行“文字编程”(literateprogramming),提供的文档既能符合人类的逻辑、保证人类可读,也可由机器执行,因此可记录操作过程帮助简化透明性的流程。《纽约时报》还使用过专门的数据新闻工具Workbench,该工具不仅服务于数据可视化,而是服务于数据新闻生产的全流程。Workbench更进一步在JupyterNotebook的基础上简化了代码,能够完成从数据抓取、清洗到数据分析、可视化的全流程,且每项操作都会被记录下来,数据记者还可以添加注释,使过程更加清晰,从而将工作流程转变为JupyterNotebook样式的数据文档。虽然可以根据需要使用Python代码,但Workbench中大多数任务无需代码,旨在使不具备技术基础的读者、编辑和记者可以理解。WorkbenchWorkbench.Adifferentapproachtotransparentdatajournalism.[EB/OL].(2018-06-07)[2021-03-15]./@Workbench/a-different-approach-to-transparent-data-journalism-a019d23595f2此外,《纽约时报》开通了增加透明性的官方渠道,不局限于“TheUpshot”板块。一是“NYTOpen”博客,供员工发布介绍如何设计和构建数字新闻产品的文章,其中较少涉及具体某一篇报道的介绍,主要内容为该报为提升用户体验所做的背后工作。二是《纽约时报》的GitHub账号,主要提供该报为提升用户体验所用源码,也提供个别数据新闻所用的数据。如新型冠状病毒疫情的数据库,包含死亡数据、口罩使用数据等,数据库持续保持更新,同时涉及数据的统计方法、数据范围、更正情况介绍等。四、对透明性规范的评价在美国新闻业危机的当下,新闻客观性又争议颇多,认同感降低,且受众借由社交媒体的兴起具有了更大的发声权力,受众与专业媒体的关系发生转变,自带“精确”光环的数据新闻业,更需要在透明性上探索,建立与用户之间相互尊重的关系,赢得用户信任。可视化的生产包含从数据采集、清洗到分析的多个流程,涉及多种决策,核实更加困难,因此,数据新闻可视化的透明性不应成为一种“策略仪式”,而应当起到实际的作用。本节主要讨论了内容维度的透明性,张超.张超.“后台”前置:新闻透明性的兴起、争议及其“适度”标准[J].国际新闻界,2020,42(08):88-109.超8成的可视化以不同方式标注了数据来源,可以看出“TheUpshot”板块的数据记者基本具有公开数据来源的共识,但公开的方式各不相同,近半数都仅给出了模糊的机构名称,只是在形式上声明了数据源的透明性。有访谈发现,即便记者将报道中使用的所有数据汇总,放入一份共享文档中,也不认为这些数据会被读者广泛阅读。KennedyH,WeberW,EngebretsenM.Datavisualizationandtransparencyinthenews[J].DataVisualizationinSociety,2020:169-185.新闻生产的截稿时间要求与数据新闻生产复杂流程之间的矛盾,或许是影响数据新闻透明性的主要原因。KennedyH,WeberW,EngebretsenM.Datavisualizationandtransparencyinthenews[J].DataVisualizationinSociety,2020:169-185.数据来源的提供应当尽量方便用户获取,针对具体的图表给出所用的原始数据,自证没有进行数据的篡改以及数据源的公正性。理想的数据源交代应既给出数据源链接,又提供可下载文档。告知用户数据的来源及语境,保证用户下载的是机构的原始数据,未经任何改动;告知用户在可视化生产中具体所用的数据,并允许用户下载分析。此外还应包括数据采集的时间,若数据采集方法特殊,也应介绍采集方法。数据分析方法影响可视化的呈现效果,但“TheUpshot”并未在数据分析方法公开上形成统一的规范。数据处理和分析方法的透明性要求记者介绍影响可视化结果的关键步骤。在实际生产中,数据分析方法的透明性难以实现的原因可能是,详细说明复杂的处理、分析方法,会大大增加记者的工作量。并非所有的可视化都需要给出分析方法说明,日常数据新闻生产中大部分并没有用到复杂的方法,只是对原始数据进行可视化呈现,此时仅需给出数据源,便能够保证可视化的透明性。而有些数据新闻应用了复杂的或者不常见的数据处理、分析方法,甚至应用了算法,此时便应详细说明,可使用超链接实现。数据新闻工具和技术的发展有助于提升透明性。若记者有较强的数据可视化生产过程公开意向,应尽量避免使用会掩盖操作流程的工具,可以使用JupyterNotebook、Workbench等工具,便于记录数据分析的全流程,为公开提供便利;当需要对源代码进行公开时,可以利用GitHub进行共享,便于有需要的用户查看,避免繁杂的信息占据版面空间。第三节数据新闻可视化的清晰度通常而言,可视化中的详细信息越多,图表看起来就越有科学性和权威性。KhanZ.Thecaseforchoosingclarityovercomplexityindatavisualizations.[EB/OL].(2019-10-23)[2021-03-15].https://blog.datawrapper.de/choosing-clarity-over-complexity/.但塔夫特提出的优秀可视化的标准反驳了这一观点,即可视化的目的在于把复杂的数据清晰、直观呈现出来,设计的简单性和数据的复杂性是优秀可视化设计的两个要素。KhanZ.Thecaseforchoosingclarityovercomplexityindatavisualizations.[EB/OL].(2019-10-23)[2021-03-15].https://blog.datawrapper.de/choosing-clarity-over-complexity/.TufteER.TheVisualDisplayofQuantitativeInformation[M].GraphicsPress.2001:177.JorgensenSL.Abundanceofinformationnarrowsourcollectiveattentionspan.[EB/OL].(2019-04-15)[2021-03-15]./pub_releases/2019-04/tuod-aoi041119.php.影响清晰度的包括可视化的视觉表现力、数据本身的复杂性,以及附着于可视化的各类文本说明。由于可视化的清晰度与具体数据及新闻内容等均有较大的关系,内容分析法的编码难以衡量每一样本的特性,因此本节对清晰度的讨论主要通过个案分析进行,通过“不(够)专业”的案例界定何为“专业的”。陈楚洁,袁梦倩.新闻社群的专业主义话语:一种边界工作的视角[J].新闻与传播研究,2014,21(05):55-69+127.一、部分可视化视觉表现力不足可视化编码由两方面组成:点、线、面等图形元素标记,以及位置、大小、颜色等用于控制标记视觉特征的视觉通道,标记和视觉通道影响着视觉表现力。判断视觉通道表现力的标准包括精确性、可辨性、可分离性、视觉突出四个方面。陈为陈为.可视化导论[M].北京:高等教育出版社,2019:44-45,56.精确性用于衡量原始数据与受众对可视化的判断结果的一致程度。陈为陈为.可视化导论[M].北京:高等教育出版社,2019:56-59.但交互性仅是提高视觉精确性的方式之一,可视化设计还需根据不同数据的类型、特点恰当选择视觉通道,精确性的提高需要多种元素的配合。例如颜色对于区分不同类别的数据非常有效,但在编码数值型数据时,可能不够精确;在编码定量数据时,坐标轴位置、长度等视觉通道的精确性均大于面积,尤其是当数值差距较小时,使用面积编码可能使受众难以观察数据的差别。陈为.可视化导论[M].北京:高等教育出版社,2019:110-111.如图5-6,显示了学生参加SAT考试的情况,注释中解释称更大的圆圈表示更多的应试者,但图中所有圆的面积都较小,尤其是中间的圆面积区分度不大,若用户忽视了注释中的提示,甚至可能忽略圆圈大小的差异,且该图不可交互,受众不能得知每个圆圈所代表的具体数值,影响了视觉表现的精确性。可辨认性描述如何在给定的取值范围内,选择合适数目的不同取值,使人能够轻易区分不同数值。陈为.可视化导论[M].北京:高等教育出版社,2019:56-59.在样本中,主要通过配色实现。可视化数值区间划分范围及表现陈为.可视化导论[M].北京:高等教育出版社,2019:56-59.图5-6SAT重考中的左数字偏差/2018/08/27/upshot/a-surprisingly-simple-way-to-help-level-the-playing-field-of-college-admissions.html?searchResultPosition=82/2018/08/27/upshot/a-surprisingly-simple-way-to-help-level-the-playing-field-of-college-admissions.html?searchResultPosition=82如图5-7,使用对数标度绘制了各国的死亡人数变化曲线,随着时间的增加,各国增长趋势放缓,右上角图例中使用多个颜色表示死亡人数倍增时间,划分为4、7、20等大小不一的范围,但是浏览图中各国情况发现全部为绿色和蓝色,红、橙、黄等颜色并未体现在图中,说明区间划分不够合理,影响了各国死亡人数增长情况的可辨认性。图5-7各国新冠肺炎累计死亡人数/interactive/2020/03/21/upshot/coronavirus-deaths-by-country.html/interactive/2020/03/21/upshot/coronavirus-deaths-by-country.html可分离性是指一个视觉通道的存在可能会影响受众对其它视觉通道的正确感知,从而影响信息获取的效率和准确性。陈为陈为.可视化导论[M].北京:高等教育出版社,2019:56-59.例如图5-8,通过Google搜索热度来反映失业情况,用不同的颜色代表不同地区,但颜色数量多,线条位置又较接近,且该图无交互性,导致颜色通道和由线连接的点的位置通道互相干扰,不便于查看某一地区在某一时刻的情况。图5-8Google每天针对“失业档案”的搜索热度/interactive/2020/04/01/upshot/coronavirus-jobless-claims-forecast-predictions.html/interactive/2020/04/01/upshot/coronavirus-jobless-claims-forecast-predictions.html视觉突出是指受众在短时间内仅依靠感知的前注意力即可察觉某一对象和其它对象的不同之处,从而快速定位关键信息。陈为陈为.可视化导论[M].北京:高等教育出版社,2019:56-59.但增加交互性并不总是能起到视觉突出作用,可视化设计中需多元素配合。如图5-9,显示了美国保险公司为医疗护理支付了更多费用,上图为初始视图,下图为鼠标悬浮指向“澳大利亚”数据后的效果,除美国使用红色表示,其它国家均使用明度高而纯度低的颜色,难以区分清楚不同颜色,即便增加交互性,也没有足够的视觉突出。导致这一失范的原因可能是使用了高度封装可视化工具中的默认设置,制作者未根据新闻的清晰度要求进行个性化更改配色等默认设置。图5-9美国保险公司为医疗护理支付了更多费用/2019/12/27/upshot/expensive-health-care-world-comparison.html?searchResultPosition=42/2019/12/27/upshot/expensive-health-care-world-comparison.html?searchResultPosition=42.二、文本说明提高清晰度可视化设计不仅通过视觉元素传达信息,围绕视觉元素的解释、注释等文本也是可视化表意的一部分。与可视化直接相关的文本说明主要包括对数据规律、要点的概括;对可视化的说明;说明数据范围或意义。可视化的图像及其文本说明可视作一种多模态话语,多模态之间的关系之一是互补关系,是指一种模态不能充分表达意义,需由另一种来补充,分为强化关系和非强化关系,强化关系指以一种模态为主要形式,另一种仅提供背景信息,非强化关系指两种模态缺一不可。张德禄.多模态话语分析综合理论框架探索[J].中国外语,2009,6(01):24-30.张德禄.多模态话语分析综合理论框架探索[J].中国外语,2009,6(01):24-30.对数据规律、要点的概括在论述客观性时已经提及,其目的主要是用文本和图像两种方式同时对数据进行解释,使表意更准确。样本中共325组(68.1%)可视化给出了此类说明,基本成为一种常规。由于语言指涉具有明确性,意义是确定的,而图像的意义基础依靠联想,意义是浮动的,刘涛.语图论:语图互文与视觉修辞分析[J].新闻与传播评论,2018,71(01):28-41.刘涛.语图论:语图互文与视觉修辞分析[J].新闻与传播评论,2018,71(01):28-41.对读图方式的说明主要指向用户解释可视化中具体视觉元素的含义,引导阅读或交互。提高清晰度的首要策略是使用用户熟悉的图表,有研究发现,仅63%的人能够正确理解散点图,高中及以下学历的人群中,能理解散点图的仅有一半多。AlmossawiA.FiveIdeasforAchievingClarityinDataVisualization.[EB/OL].(AlmossawiA.FiveIdeasforAchievingClarityinDataVisualization.[EB/OL].(2015-10-19)[2021-03-15]./@almossawi/five-ideas-for-achieving-clarity-in-data-visualization-7832b3b36d52.说明读图方式在该板块并未形成常规。样本中共82组(17.2%)对读图方式进行了说明。统计图表类型与可视化说明的关系,发现所有气泡图和92.9%的区间图含有读图方式说明,气泡图由于含有三个变量,横纵坐标轴只能显示两个变量,气泡大小所代表的变量通常会在注释中给出单独的说明;区间图或许是因为不够常见,提供可视化说明可帮助受众理解。不仅是区间图,一些定制可视化也可能让受众产生陌生感,应当尽可能给出对读图方式的说明,但54组定制可视化中仅13组(24.1%)提供了此类说明。说明数据范围或意义,主要指数据的时空范围,数据的内涵、概念,让受众明晰数据的意义,也可提高清晰度。如图5-10,显示部分地区了面临驱逐的租房者欠款数据,注释中说明:“只显示导致金钱判决的驱逐文件。州数据不包括无法将记录与第二个来源进行比较的县。”含有此类说明的可视化共141组(29.6%),是否需要提供此类说明,由数据本身决定,因此难以衡量该板块总体是否形成了一定的专业规范。图5-10面临驱逐的租房者欠款数据/2019/12/12/upshot/eviction-prevention-solutions-government.html?searchResultPosition=10/2019/12/12/upshot/eviction-prevention-solutions-government.html?searchResultPosition=10三、可视化的信息复杂度适中优秀的可视化以清晰的形式,承载复杂的数据。作为面向大众的新闻,数据新闻可视化既不应过于单调,也不应过于复杂。若信息较少,且采用公众常见的可视化类型,很难形成视觉吸引力,但若信息过多,用户又可能错过重要的信息,阅读效果有限。有学者对可视化设计师进行了访谈,发现清晰度和吸引力被认为是最重要的标准,当清晰度和视觉吸引力冲突时,应当优先满足清晰度的要求,不能让读者因为图表复杂或不知道从哪里开始阅读而放弃读图。QuispelA,MaesA,SchilperoordJ.Aestheticsandclarityininformationvisualization:Thedesigner’sperspective[C]//Arts.MultidisciplinaryDigitalPublishingInstitute,2018,7(4):72.QuispelA,MaesA,SchilperoordJ.Aesthetics

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论