人工智能通识 实践任务报告 chap 2电影数据处理_第1页
人工智能通识 实践任务报告 chap 2电影数据处理_第2页
人工智能通识 实践任务报告 chap 2电影数据处理_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《人工智能通识》实验任务报告实验章节:学生姓名: 专业班级: 学号: 机械工业出版社《第二章大数据与人工智能》课程实验姓名学号班级实验地点指导教师时间实验任务一(如有任务二自行复制同样的表格,如没有,请把“一”字删除)1、任务名称(宋体五号字,1.5倍行距。)示例:爬取豆瓣网电影数据,并完成数据清洗和预处理2、任务目标(宋体五号字,1.5倍行距。)明确本次实验期望达成的核心目标。如:(1)掌握2种网络爬虫工具,如八爪鱼、ContentGrabber等的使用方法(2)学会运用数据清洗和预处理技术,去除爬取数据中的噪声、重复内容,处理缺失值、异常值等,将原始数据转化为规范、可用的格式,为后续数据分析奠定基础。(3)理解数据爬取过程中的网站规则和法律法规,培养合法合规的数据采集意识3、具体任务内容(宋体五号字,1.5倍行距。)详细列举学生在实验过程中需要完成的各项任务。示例如下:(1)选定一种本次实验使用的爬取工具,数据清洗工具,并说明原因。(2)用选定的工具,爬取豆包电影中以“哪吒”为关键字搜索出的全部电影信息。(3)电影信息字段包括:导演、编剧、主演、类型、制片国家/地区、语言、上映日期、片长、又名、评分、评价数。(4)对数据进行清洗,处理缺失值,异常值等,将时间字段转换为统一的日期时间格式。4、成果要求(宋体五号字,1.5倍行距。)(1)实验报告一份,按照实验报告模板撰写,详细描述实验过程、遇到的问题及解决方案、实验结果等。(2)数据结果一份,保存为CSV文件。(3)程序代码一份。要求注释大于50%。实验报告实验任务爬取豆瓣网电影数据,并完成数据清洗和预处理2、实验环境(宋体五号字,1.5倍行距。)列出实验使用的硬件配置(如CPU、内存等)和软件工具(包括Python版本、爬虫框架、数据处理库等)及版本号。说明选择xx工具(环境)的原因:3、任务完成及步骤【分解任务1】:爬取豆包电影中以“哪吒”为关键字搜索出的全部电影信息。实验步骤:(1)详细记录数据爬取实验过程,包括代码片段、操作步骤、关键参数设置等。(2)xxxxxx实验结果:(1)xxxxxx实验总结:(1)遇到xx问题,解决方法;总结xx经验【分解任务2】:“哪吒*”电影信息数据的清洗实验步骤:(1)详细记录数据清洗实验过程,包括代码片段、操作步骤、关键参数设置等。(2)xxxxxx实验结果:(1)xxxxxx实验总结:(1)遇到xx问题,解决方法;总结xx经验。如对比数据清洗和预处理前后的差异;分析数据处理过程中遇到的问题及解决方案,评估数据处理效果是否达到预期。【分解任务3】:“哪吒*”电影信息数据的预处理实验步骤:(1)详细记录数据清洗实验过程,包括代码片段、操作步骤、关键参数设置等。(2)Xxxxxx实验结果:(1)xxxxxx实验总结:(1)遇到xx问题,解决方法;总结xx经验。总结xx经验。如对比数据清洗和预处理前后的差异;分析数据处理过程中遇到的问题及解决方案,评估数据处理效果是否达到预期。4、实验总结总结实验成果,分析实验过程中的不足和改进方向,思考数据爬取与处理技术在实际

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论