版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
湖南商务职业技术学院毕业设计
目录
1引言1
1.1项目背景1
1.2开发环境与工具1
1.2.1Python简介1
1.2.2MapReduce简介2
1.2.3Pandas简介2
1.2.4Pyecharts简介2
2需求分析3
2.1可行性需求分析3
2.2采集目标功能分析3
2.3关键技术分析3
2.3.1网络爬虫技术3
2.3.2文件存取技术4
2.3.3可视化技术4
3数据采集4
3.1采集页面分析4
3.2字段分析6
3.3编程实现8
4数据清洗与处理11
4.1数据清洗11
4.2数据存储12
4.3编程实现12
5数据统计与分析15
5.1数据准备15
5.2数据展示16
5.2.1依据新闻来源进行统计16
5.2.2依据新闻发布日期进行统计17
I
湖南商务职业技术学院毕业设计
5.2.3依据新闻类型进行统计18
5.2.4依据责任编辑发布新闻数量进行分析19
5.3综述19
6小结20
参考资料22
II
湖南商务职业技术学院毕业设计
中国日报新闻数据采集与分析
1引言
随着信息时代的快速发展,新闻传播已成为人们获取信息、了解世界的重
要途径之一。中国日报作为中国主流的英文新闻媒体之一,承载着向世界传递
中国声音、展示中国形象的使命。为了更好地了解中国日报的新闻报道情况和
受众反馈,本项目旨在进行中国日报新闻数据的采集与分析。
本项目将采用多种技术手段,包括网络爬虫、数据清洗、数据分析等,对
中国日报网站的新闻内容进行全面、系统的采集和分析。通过对新闻数据的收
集和整理,将能够获取中国日报新闻报道的全貌,了解其报道的主题、频率、
受众反馈等情况。
1.1项目背景
随着信息技术的不断发展和新闻传播方式的多样化,新闻媒体在信息传递
和舆论引导中发挥着日益重要的作用。中国日报作为中国面向国际的英文媒体,
承担着向世界传递中国声音、展示中国形象的重要使命。为了更好地了解和分
析中国日报的新闻报道情况,及时了解新闻热点和受众反馈,有必要进行新闻
数据的采集与分析项目。
基于信息技术的发展和新闻媒体运营的需求,进行中国日报新闻数据的采
集与分析项目具有重要的现实意义和发展价值。通过该项目的实施,可以更好
地理解和应用新闻数据,推动新闻传播的创新和发展。
1.2开发环境与工具
1.2.1Python简介
Python是一种高级编程语言,具有简单易学、功能丰富、开源免费等特点,
被广泛应用于数据分析、人工智能、Web开发等领域。Python语法简洁清晰,
易于学习和理解,适合初学者入门。其简洁的语法结构使得编写代码更加高效,
大大提升了开发效率。Python是开源的编程语言,拥有庞大的社区支持和活跃
的开发者社区,提供了丰富的第三方库和工具,可以满足各种需求,而且完全
免费使用。
在中国日报新闻数据采集与分析项目中,Python技术被广泛应用于数据采
1
湖南商务职业技术学院毕业设计
集、清洗、分析和可视化等环节。通过Python编程,可以利用各种库和框架,
快速高效地完成数据处理和分析任务,为项目的顺利实施提供了技术支持和保
障。
1.2.2MapReduce简介
MapReduce是一种用于大规模数据处理的编程模型和并行计算框架,由
Google提出并在分布式计算系统中得到广泛应用。其核心思想是将数据处理任
务分解为Map阶段和Reduce阶段,实现数据的分布式并行处理。
在MapReduce模型中,Map阶段负责将输入数据集映射成一系列键值对,
然后按照键进行分组,将相同键的数据集合在一起。Reduce阶段则对每组数据
进行处理和汇总,生成最终的输出结果。
在中国日报新闻数据采集与分析项目中,利用MapReduce技术进行数据清
洗,可以实现大规模数据的分布式处理和并行计算,提高了数据处理效率和可
靠性,为项目的顺利实施提供了技术支持。
1.2.3Pandas简介
Pandas是一个基于Python语言的数据处理库,专门用于数据操作和分析,
提供了快速、灵活、便捷的数据结构和工具。它主要包含两种数据结构:Series
(序列)和DataFrame(数据帧),可以用来处理结构化数据、时间序列数据
等各种数据类型。Pandas提供了丰富的数据结构和方法,能够灵活处理不同形
式的数据,包括数值型、字符串型、时间序列等,满足各种数据处理需求。也
丰富的数据操作方法和函数,包括数据过滤、排序、分组、合并等功能,能够
快速高效地进行数据处理和转换。
在中国日报新闻数据采集与分析项目中,Pandas技术被广泛应用于数据清
洗、数据处理、数据分析和数据可视化等环节,为项目提供了强大的数据处理
和分析能力,为项目的顺利实施和结果呈现提供了有力支持。
1.2.4Pyecharts简介
Pyecharts是一个基于Python的交互式可视化库,用于生成各种图表和图
形,包括折线图、柱状图、饼图、地图等。Pyecharts基于Echarts和JavaScript
库开发,通过Python代码生成JavaScript代码,实现了数据可视化的快速开
发和定制。它支持多种图表类型和样式,可以满足不同数据展示需求,包括基
本的统计图表、地理信息图、实时更新图等。
2
湖南商务职业技术学院毕业设计
在中国日报新闻数据采集与分析项目中,Pyecharts技术被广泛应用于数
据可视化环节,通过生成各种图表和图形,直观展现新闻数据的特征和趋势,
为项目的数据分析和结果展示提供了强大的支持。
2需求分析
2.1可行性需求分析
1.技术可行性
采用Python、Pandas和Pyecharts等成熟技术,这些技术在数据处理和可
视化方面具有广泛的应用经验和技术支持。Python作为一种高效的编程语言,
能够轻松处理数据,Pandas提供了强大的数据结构和数据分析工具,Pyecharts
则可用于绘制各种图表和可视化展示,这些技术能够满足项目需求,并提供丰
富的功能和可定制性。
2.项目可行性
项目旨在对中国日报的新闻数据进行采集和分析,以了解新闻报道的热点、
趋势和受众反馈。通过分析新闻数据,可以为新闻内容优化和运营策略调整提
供数据支持。项目目标明确,易于实施和评估,有助于提升中国日报的新闻报
道质量和读者满意度。
2.2采集目标功能分析
通过爬虫程序采集中国日报网站上的新闻数据,包括但不限于新闻标题、
来源、发布时间、内容等信息。通过对新闻网站的爬取,获取最新发布的新闻
内容,确保数据的及时性和完整性。这一步骤是项目的基础,为后续的数据分
析和挖掘提供了必要的数据源。
2.3关键技术分析
2.3.1网络爬虫技术
中国日报新闻数据采集与分析项目的网络爬虫技术主要基于Python语言
的相关库和框架,如Requests、BeautifulSoup和Scrapy等。这些工具能够
模拟浏览器行为,从中国日报网站上抓取新闻页面的HTML源码,并提取其中的
关键信息。
使用Requests库向中国日报网站发送HTTP请求,获取新闻页面的HTML源
3
湖南商务职业技术学院毕业设计
码。然后,利用BeautifulSoup库解析HTML源码,提取出新闻标题、来源、
发布时间、内容等信息。通过分析页面结构和标签属性,编写相应的解析规则,
实现对不同类型新闻页面的准确抓取和信息提取。
网络爬虫技术在中国日报新闻数据采集与分析项目中起着至关重要的作
用,通过自动化的方式实现对新闻数据的快速、准确地采集,为后续数据处理
和分析提供了丰富的数据源。同时,合理设置爬虫策略和频率,遵守网站的爬
取规则和法律法规,确保项目的合法性和可持续性。
2.3.2文件存取技术
中国日报新闻数据采集与分析项目的文件存储技术主要涉及到数据的持久
化存储和管理。项目中可以采用多种文件存储技术,包括文本文件、CSV文件、
JSON文件、数据库等形式。可以将原始的新闻数据以文本文件或CSV文件的形
式存储在本地或服务器上,每条新闻数据为一行记录,包含新闻标题、来源、
发布时间、内容等字段,便于后续的数据处理和分析。
文件存储技术在中国日报新闻数据采集与分析项目中具有重要意义,能够
有效地存储和管理海量的新闻数据,保障数据的安全性和可靠性,并为后续的
数据处理和分析提供良好的数据基础。同时,合理的存储方案和数据结构设计,
能够提高数据的存取效率和系统的性能表现。
2.3.3可视化技术
中国日报新闻数据采集与分析项目的可视化技术主要采用Pyecharts库进
行数据可视化展示。Pyecharts是基于Python语言的交互式可视化库,能够生
成各种图表和图形,包括折线图、柱状图、饼图、地图等,以直观的方式展现
数据分析结果。
3数据采集
3.1采集页面分析
数据采集的网站是中国日报中文网,该网站内容涵盖国内外政治、经济、
社会、文化等多个领域,中国日报中文网试图为读者提供丰富多样的信息服务。
该网站首页如下图3-1所示。
4
湖南商务职业技术学院毕业设计
图3-1中国日报中文网
本项目主要采集网站的时政板块,时政板块中有'时政要闻','评论频道',
'学习时代','理论频道','两岸频道'5个子版块,时政板块分类如下图3-2
所示。
图3-2时政分类板块
点击进入时政的第一个时政要闻板块,跳转到时政要闻的详情页,如下图
3-3所示。
图3-3时政要闻详情页
5
湖南商务职业技术学院毕业设计
时政要闻模块中每一页包含了30条新闻,将页面滑动到底部,可以看到翻
页按钮,翻页选项栏如下图3-4所示。
图3-4翻页选项栏
点击第2页,观察到网站url增加了page参数,由此可知page参数网站
页面的翻页参数,后续在代码开发的过程中,可以根据控制page参数实现翻页
的功能。url如下图3-5所示。
图3-5url参数
通过大量的分析和测试,发现时政中'时政要闻','评论频道','理论频道
'子模块的详情页的网站结构相同,在代码中可以共用一套数据解析逻辑,学习
时代和两岸频道模块的网页结构比较特殊,新闻所在的html标签位置与前三个
模块不一致,所以需要另外特殊处理。
3.2字段分析
使用谷歌浏览器打开中国日报网站,按F12调出开发者工具,使用该工具
的网页检查工具即可获取所需要采集字段所在的标签。检查时政模块中子模块
所在的html标签,如下图3-6所示。
图3-6时政子模块所在的html标签
从图中可以看到,属性为Top_MenuLevel_Div的div标签下的div标签都
对应着一个子模块,其中a标签href属性为子模块的详情页url,a标签的属
性值为子模块的名称。
点击进入时政要闻模块,使用谷歌开发者工具检查网站的html结构,找到
6
湖南商务职业技术学院毕业设计
每条新闻对应的html标签树结构,如下图3-7所示。
图3-7每条新闻对应的html标签
从图中可以看到,属性为container-left2的div标签下的div标签都对
应着一条新闻,div标签下的h3标签下的a标签中包含了新闻的标题,其中href
属性为新闻的详情页链接,在后面的代码中根据href属性可以拼接出完整的新
闻详情页url。
点击页面的第一条新闻,跳转到新闻的详情页,如下图3-8所示。
图3-8新闻详情页
新闻详情页中包含了新闻标题、新闻来源、新闻发布时间,在页面的底部
可以包含了责任编辑字段,如下图3-9所示。
图3-9责任编辑字段
同样的,使用谷歌浏览器的开发者工具检查网页的html结构,如下图3-10
7
湖南商务职业技术学院毕业设计
所示。
图3-10新闻详情页采集字段所在标签
在代码中编写每个字段对应xpath路径,即可逐一获取到每条新闻中的采
集字段。
3.3编程实现
编写start方法,该方法是爬虫程序的入口方法,start方法主要功能是获
取时政模块中各个子模块的名称和url,start方法如下图3-11所示。
图3-11start方法
Start方法用于爬取中国日报中文网站某个页面上各个分类新闻的函数。在
函数中,它首先获取了中国日报中文网站首页的内容,然后提取了各个新闻分
类的链接和名称,并构造了完整的分类链接列表。接下来,它迭代这些分类链
接,对每个分类链接调用spider_route()函数进行进一步的爬取操作。
spider_route()是一个路由函数,在采集不同时政模块是调用不同的数据
解析方法,spider_route()方法如下图3-12所示。
图3-12spider_route方法
方法中,根据不同的新闻分类名称执行不同的爬取操作。具体来说,如果
8
湖南商务职业技术学院毕业设计
daily_cate_name是'时政要闻','评论频道','理论频道'中的任何一个,
它将调用get_next_page函数进行处理;如果是'学习时代',它将调用
get_learn_era函数进行处理;如果是'两岸频道',它将调用get_both_sides
函数进行处理。
中国日报网站中只有'时政要闻','评论频道','理论频道'板块中有翻页
的功能,其他两个模块只有一页内容,所以对于这三个板块需要编写翻页逻辑,
翻页使用get_next_page方法完成,如下图3-13所示。
图3-13get_next_page方法
get_next_page函数中,它接受两个参数:daily_cate_url表示当前分类
的URL,daily_cate_name表示当前分类的名称。函数通过循环遍历页码,从1
到99,构造每一页的URL,然后调用get_important_news函数对每一页进行
采集操作。
在使用正则表达式替换URL时,使用了re.sub函数将URL中的.html或
/page_\d+部分替换为空字符串,从而生成下一页的URL。这样的操作通常用
于从当前页面的URL中推导出下一页的URL。这种做法在很多网站上是常见的,
但是具体实现要根据目标网站的URL规则来确定。
编写get_important_news方法,用于获取具体的新闻详情页url和新闻标
题,该方法代码如下图3-14所示。
图3-14get_important_news方法
get_important_news函数接受两个参数:daily_cate_url表示当前分类的
URL,daily_cate_name表示当前分类的名称。函数通过发起HTTP请求获取目
9
湖南商务职业技术学院毕业设计
标页面的HTML内容,然后使用XPath表达式提取新闻列表的信息。具体来说,
函数首先使用XPath表达式/html/body/div[3]/div[1]/div/div定位到了新闻
列表的每一个新闻项,然后对每一个新闻项进行遍历。在遍历的过程中,函数
提取了新闻的标题和详情链接,然后调用get_news_detail函数对每一个新闻
项进行详细信息的获取。
编写get_news_detai方法,用于获取每条新闻具体的字段,字段主要有新
闻标题、新闻来源、新闻发布时间、新闻的第一段内容、新闻的责任编辑。该
方法代码如下图3-15所示。
图3-15get_news_detail方法
news_detail_url表示当前新闻详情页的URL,daily_cate_name表示当前
分类的名称,news_title表示当前新闻的标题。
该函数的主要功能是根据提供的新闻详情页URL获取新闻的详细信息,并
将其拼接成一个字符串,然后打印出来并调用save_news函数保存。
在获取新闻详细信息的过程中,函数首先使用XPath表达式从页面中提取
新闻的来源、日期、内容和编辑等信息。然后,它根据所提取的信息拼接成一
个字符串news_details_combined,其中包含了分类名称、新闻标题、新闻来
源、新闻日期、新闻内容和编辑等信息。最后,函数会打印这个拼接好的字符
串,并将其传递给save_news函数保存。
调用爬虫的入口程序start方法,运行爬虫程序。爬虫程序的运行日志如
下图3-16所示。
10
湖南商务职业技术学院毕业设计
图3-16爬虫运行日志
爬虫程序运行结束之后,当前目录下会生成news_details.txt,该文件中
的内容如下图3-17所示。
图3-17news_details.txt文件
从图中可以看到news_details.txt文件中一共有5千多行数据,已经满足
了数据分析的要求。
4数据清洗与处理
4.1数据清洗
数据清洗是数据处理中至关重要的一步,通过清洗可以确保数据的质量和
一致性,为后续的分析和应用提供可靠的基础。针对采集下来的新闻数据,可
以使用MapReduce程序进行数据清洗,主要包括剔除空格等特殊字符,将日期
字段统一化等操作。在Map阶段,可以将每一条新闻数据作为输入,对数据进
行初步的处理。针对每个字段,可以使用正则表达式或字符串处理函数去除多
余的空格、换行符和其他特殊字符。
通过MapReduce程序进行数据清洗,可以有效处理大规模的数据集,并且
具有良好的扩展性和并行处理能力。清洗后的数据将为后续的数据分析和挖掘
提供可靠的基础,帮助用户更好地理解和利用新闻数据,从中发现有价值的信
息和见解。具体的数据清洗需求如下所示:
11
湖南商务职业技术学院毕业设计
1)剔除新闻来源中的“来源:“字符串。
2)剔除新闻发布日期中多余数值。如“2024-03-2709:56“处理之后为”
2024-03-27“。
3)提取责任编辑字段中具体的姓名。如“【责任编辑:徐锟】“处理后”徐锟
“。
4.2数据存储
在使用MapReduce对中国日报新闻数据进行数据清洗后,我们需要将清洗
后的结果文件保存到txt文件中。Txt文件是一种简单的文本文件格式,可以
被几乎所有的文本编辑器和数据处理工具轻松打开和读取。它具有通用性强、
易于处理和存储的特点,适合用于存储结构化和非结构化的数据。
在数据存储方面,Txt文件可以作为一种简便的临时存储方式,用于存储数
据清洗、处理和分析的结果。同时,Txt文件也可以作为数据共享和交换的标
准格式,方便不同系统和平台之间的数据交互和传输。
将MapReduce清洗后的中国日报新闻数据保存到txt文件中,既方便了数
据的后续处理和分析,又保证了数据的通用性和可访问性,为数据应用和应用
程序的开发提供了便利。
4.3编程实现
编写MapReduce程序的map方法,map方法是Mapreduce程序的核心部分,
用于处理读取到的每一行数据,map方法如下图4-1所示。
图4-1map方法
这段代码是一个Map任务的实现,用于处理输入的文本数据。在Map函数
中,每个输入的键值对(LongWritable类型的key和Text类型的value)代表
12
湖南商务职业技术学院毕业设计
一行文本数据。将文本数据转换为字符串形式,并使用逗号分隔符将其拆分为
字段数组。代码对字段数组进行简单的处理,包括检查字段数量是否满足要求,
然后分别提取字段值,并对部分字段进行清洗操作,如清洗新闻来源、日期和
编辑等字段。清洗操作可能涉及去除多余的空格、特殊字符或格式化日期等。
处理完各个字段后,代码将清洗后的字段重新拼接为一行文本,并打印到
控制台上。接着,将清洗后的文本数据封装为Text类型,并写入MapReduce任
务的上下文中,以供后续的Reduce阶段处理。
编写clean_news_source方法,用于处理新闻来源字段,该方法如下图4-2
所示。
图4-2clean_news_source方法
编写clean_news_date方法,用于处理新闻发布时间字段,clean_news_date
方法如下图4-3所示。
图4-3clean_news_date方法
该方法接受一个字符串参数news_date,表示原始的新闻日期。在方法内部,
首先使用正则表达式模式\d{4}-\d{2}-\d{2}编译成一个Pattern对象,该模式
用于匹配形如"yyyy-MM-dd"格式的日期字符串。然后使用该模式创建一个
Matcher对象,并将要清洗的新闻日期字符串传递给Matcher对象进行匹配操
作。如果在新闻日期字符串中找到了匹配的日期模式,即满足"yyyy-MM-dd"格
式的日期字符串,Matcher对象调用find()方法将返回true,然后调用group()
方法获取匹配的结果,即清洗后的日期字符串。如果新闻日期字符串中没有找
到匹配的日期模式,则Matcher对象调用find()方法返回false,此时返回一
个默认的日期字符串"9999-12-31",表示该日期未知或无效。
编写clean_news_edit方法,用于处理责任编辑字段,clean_news_edit方
法如下图4-4所示。
13
湖南商务职业技术学院毕业设计
图4-4clean_news_edit方法
在方法内部,首先使用正则表达式模式"【责任编辑:(.*?)】"编译成一
个Pattern对象,该模式用于匹配形如"【责任编辑:XXX】"格式的编辑信息。
其中(.*?)表示一个非贪婪匹配,用于匹配编辑姓名部分。然后使用该模式创
建一个Matcher对象,并将要清洗的新闻编辑信息字符串传递给Matcher对象
进行匹配操作。
Map类的实现类编写完成之后,还需要编写Mapreduce的入口程序main方
法,main方法如下图4-5所示。
图4-5main方法
运行Mapreduce程序,观察日志,发现输入了5473行数据,输出了5459
行数据,说明被剔除了14行数据,这14行数据是不完整的脏数据。运行日志
如下图4-6所示。
图4-6mapreduce运行日志
程序运行结束之后会自动在指定的目录中创建output目录,该目录中的
part-r-00000文件为数据清洗的结果文件。
14
湖南商务职业技术学院毕业设计
该文件内容如下图4-7所示。
图4-7part-r-00000文件
5数据统计与分析
5.1数据准备
使用python第三方库pandas进行数据分析,使用pandas的read_csv方
法读取part-r-00000文件文件,read_file方法如下图5-1所示。
图5-1read_file方法
读取文件生成df对象,在对df进行数据分析之前,还需要对news_date
字段进行处理,保证在后面的数据分析中不会报错,方法如下图5-2所示。
图5-2clean_data方法
日期字段处理完毕之后,就可以对数据进行分析了,使用analyze_data方
法来完成,analyze_data方法如下图5-3所示。
图5-3analyze_data方法
该方法的主要作用是对新闻数据的DataFrame进行分析,具体分析内容包
括统计不同新闻来源的新闻数量、统计2024年每天发布的新闻数量、统计每个
15
湖南商务职业技术学院毕业设计
新闻分类的新闻数量以及统计每个责任编辑发布的新闻数量。
编写main方法,将上面的方法完整的组合起来,main方法如下图5-4所示。
图5-4main方法
数据分析程序运行结束之后,会在指定目录下生成数据分析的结果文件,
后续可以读取这些文件进行数据可视化。如下图5-5所示。
图5-5数据分析结果文件
5.2数据展示
5.2.1依据新闻来源进行统计
根据新闻来源统计新闻的数量,并利用pyecharts绘制柱状图,代码见附
件。柱状图如下图5-6所示。
图5-5新闻来源数量分布柱状图
主要新闻来源:通过观察新闻数量排名,可以看出中国日报网、新华社、
16
湖南商务职业技术学院毕业设计
人民网等传统媒体仍然是主要的新闻来源,这些媒体在新闻报道中具有较大的
影响力和知名度。传统媒体占比:传统媒体如中国日报网、新华社、央视网等
数量占据了前列,这反映了传统媒体在新闻报道中的重要地位。这些媒体通常
具有更多的资源和影响力,能够覆盖更广泛的新闻话题。数字媒体崛起:一些
数字媒体如央视新闻客户端、新华网客户端等也在排行榜上占据一席之地。这
表明随着移动互联网的发展,数字媒体在新闻报道中的影响力逐渐增强,受到
了越来越多的关注。
国际媒体报道:人民网-国际频道、中新网等国际媒体在榜单上也有一定的
位置,显示了中国媒体在国际舞台上的发展和影响。新媒体影响:人民日报客
户端、新华网客户端等新媒体平台在排行榜上也有一定位置,这说明新媒体在
新闻报道中的地位逐渐上升,受到了更多读者的青睐。
5.2.2依据新闻发布日期进行统计
统计2024年每天中文日报中文网发布新闻的数量,并绘制折线图。折线图
如下图5-6所示。
图5-62024年每天新闻发布的数量
2024年每天新闻发布数量呈现出一定的波动性和变化趋势。从数据中可以
观察到,有些日期新闻发布数量较高,而有些日期则较低,整体呈现出波动上
升的趋势。在观察数据中,可以看到存在一些高峰期和低谷期。例如,2024年
1月10日,新闻发布数量达到了23条,而在1月23日和1月24日,新闻发
布数量仅为1条或2条,出现了明显的低谷期。
在某些日期,如假期或节假日,新闻发布数量明显减少,这可能是因为新
17
湖南商务职业技术学院毕业设计
闻机构放假或者报道主题相对较少的缘故。例如,2024年1月1日,新闻发布
数量仅为3条,可能受到元旦假期的影响。从整体上看,新闻发布数量在每个
月之间也有所变化。在2024年3月,新闻发布数量明显增加,达到了27条的
峰值,而在1月和2月,则较为平稳,整体呈现出波动上升的趋势。在数据中,
有些日期缺乏新闻发布数量的记录,这可能是因为数据收集或记录的不完整导
致的。因此,在进行数据分析时,需要考虑到数据缺失可能会影响到分析结果
的准确性。
5.2.3依据新闻类型进行统计
统计每种新闻类型的新闻数量,并绘制饼图。新闻时政类型分布饼图如下
图5-7所示。
图5-7新闻类型分布饼图
时政要闻板块的新闻数量最多,达到了2944条。这表明时政要闻是读者关
注度较高的新闻板块之一,通常涵盖了国家政治、经济、外交等方面的重要报
道,受到了广泛关注。评论频道的新闻数量为1485条,相较于时政要闻稍低,
但仍然居于较高的水平。评论频道通常会对时事事件进行深度解读和评论,为
读者提供多角度的思考和观点,因此也备受关注。
理论频道的新闻数量为990条,位于时政要闻和评论频道之间。理论频道
通常会发布一些理论研究、学术讨论或思想探索类的文章,针对国家发展战略
和政策进行深入剖析和探讨。两岸频道的新闻数量较少,仅有18条。这表明两
岸问题在当期时间内并未成为主要的关注焦点,可能是因为当时没有重大的两
岸事件或热点新闻发生。学习时代的新闻数量最少,仅有10条。这可能是一个
18
湖南商务职业技术学院毕业设计
专门用于学习、教育、知识分享等方面的板块,主要发布一些学习资讯、教育
政策或者学术成果等内容,针对特定读者群体。
5.2.4依据责任编辑发布新闻数量进行分析
统计责任编辑发布新闻的数量,并绘制柱状图。柱状图如下图5-8所示。
图5-8责任编辑新闻数量柱状图
从数据中可以看出,各个责任编辑发布新闻的数量存在较大的差异。例如,
吕佳珊和王晗分别发布了971条和894条新闻,居于数量前列,表明他们在新
闻报道中的活跃度较高。一些责任编辑发布的新闻数量较多,如许聃、徐锟等,
这可能反映了他们在新闻编辑工作中的积极性和活跃度较高,贡献了大量的新
闻内容。一些责任编辑发布的新闻数量较少,如舒靓、高琳琳等,这可能是因
为他们在新闻编辑工作中的参与度较低,负责的新闻报道数量相对较少。数据
中还包括一些未知责任编辑和人民网,这可能是由于新闻来源不明确或者由多
人共同编辑发布等情况导致的。
根据每个责任编辑发布新闻的数量数据,可以对各个编辑在新闻编辑工作
中的活跃程度、参与度等情况进行初步了解,这有助于了解编辑团队的运作情
况和编辑在新闻报道中的贡献程度。
5.3综述
根据上面的四组数据,可以深入了解2024年的新闻报道情况以及中国日报
网的运营状况。
从不同新闻来源的数量统计中可以看出,中国日报网作为主流新闻媒体,
19
湖南商务职业技术学
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 护理职业素养提升与就业准备
- 护理技术操作培训:基础护理技能
- 护理管理中的财务管理
- 护理人力资源管理与员工关系
- 部编版二年级语文下册《祖先的摇篮 第2课时》
- 护理教学比赛资源整合
- 护理礼仪的团队协作
- 客户服务经理职场新人面试宝典
- 快消品行业区域经理工作全解析
- 快消品市场策划面试要点及技巧
- 新版统编版一年级道德与法治下册全册教案(完整版)教学设计含教学反思
- 公共管理学:理论、实践与方法 课件汇 汪大海 第1-9章 公共管理与公共管理学- 公共管理的危机
- 中国工商银行个人住房借款抵押合同
- 行政事业单位内部控制
- 2024四川天府环境管理股份有限公司招聘笔试参考题库附带答案详解
- 新版医疗机构消毒技术规范
- 第14课《我与动物亲密有间》教学设计
- 动物摄影和野生摄影的技巧与挑战
- 报价单(报价单模板)
- 2022海洋磁力测量技术规范
- 周三多《管理学(第五版)》全套PPT课件(完整版)
评论
0/150
提交评论