【MOOC】《用Python玩转数据》(南京大学)期末考试慕课答案_第1页
【MOOC】《用Python玩转数据》(南京大学)期末考试慕课答案_第2页
【MOOC】《用Python玩转数据》(南京大学)期末考试慕课答案_第3页
【MOOC】《用Python玩转数据》(南京大学)期末考试慕课答案_第4页
【MOOC】《用Python玩转数据》(南京大学)期末考试慕课答案_第5页
免费预览已结束,剩余5页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

【MOOC】《用Python玩转数据》(南京大学)期末考试慕课答案

有些题目顺序不一致,下载后按键盘ctrl+F进行搜索《用Python玩转数据》期末测试1.单选题:【情感分析第2题】语料文本中的标注“picture[+3]”代表的含义是如下哪一项?

选项:

A、产品特征+褒义+褒义评价值

B、产品特征+贬义+贬义评价值

C、产品特征+褒义+褒义评价次数

D、产品特征+贬义+贬义评价次数

答案:【产品特征+褒义+褒义评价值】2.单选题:NLTK中收录了许多语料,以下问题基于选择合适的语料库构建一个小型项目的思路。例如其中有两份语料分别名为“product_reviews_1”和“product_reviews_2”,假设我们来观察前一份语料,打开NLTK存放语料的目录(“nltk_data\corpora\product_reviews_1”)我们发现其中有一个文件readme.txt,文件中说明本语料与评论产品某个特征(如相机本身或相机镜头)的情感(褒义或贬义)有关,打开文件“Canon_G3.txt”,显然这是关于佳能相机G3本身和其各类特征的评价,形如:picture[+3]##thehighestopticalzoompicturesareperfect.menu[+1],button[+1]##themenusareeasytonavigateandthebuttonsareeasytouse.camera[+3]##itisafantasticcameraandwellworththeprice.flashphoto[-3],noise[-2]##wellflashphotosarenevergreat,andtherewasstillalotofnoise.##youcaneventakeapictureofyourselfwhilelookingatthelcd.dial[-1]##*maindialisnotbacklit.观察你本地相应目录下的文件(包括readme.txt)或以上的语料片段,回答以下问题。【情感分析第1题】语料中每一条评论句是以以下哪种形式开始的?

选项:

A、"["

B、"]"

C、"*"

D、"##"

答案:【"##"】3.单选题:定义函数如下:defcompute(*numbers):s=1forninnumbers:s=s*n+nreturns以下哪些选项的输入可以得到21的结果?

选项:

A、compute([3,3])

B、nums=[1,2,3];compute(nums)

C、compute([3,2,1])

D、nums=(3,3);compute(*nums)

答案:【nums=(3,3);compute(*nums)】4.单选题:对于一个列表aList和一个元组bTuple,以下函数和对象方法使用错误的选项是哪一个?

选项:

A、aList.sort()

B、bTuple.sort()

C、sorted(aList)

D、sorted(bTuple)

答案:【bTuple.sort()】5.单选题:【情感分析第5题】接下来就是真正的分析处理过程了,当然这里需要你补充情感分析的相关知识,例如用什么方式抽取评论句中的产品或产品特征(例如最简单的可以先将句子分词,然后利用结合句子中词性的CRF模型抽取特征,Python中有现成的函数可用),用什么方式判断句子中的情感,选择NLTK(例如NLTK中有sentiwordnet库)或其他可以进行数据挖掘的模块(如scikit-learn)处理。对于以下给出的可以用来简单判断产品/某个特征的情感倾向的资源中你觉得最合理的是哪一项?情感分析要想获得高的精确率还要考虑很多复杂的问题,例如“看某场电影时睡着了”这样的句子很难通过简单的方式获得评价的情感倾向。这个例子只是给大家一个用Python实现数据处理分析的思路,如果觉得这个产品评论情感分析比较难的话,可以先从简单的单篇电影评论情感分析开始,语料可使用NLTK中的“movie_review.txt”,具体的还需要大家进一步的学习和实践。

选项:

A、包含褒义词/贬义词列表的情感词典

B、包含褒义词/贬义词列表的情感词典,否定词词典(可用列表实现)

C、形容词词典

D、形容词词典,否定词词典(可用列表实现)

答案:【包含褒义词/贬义词列表的情感词典,否定词词典(可用列表实现)】6.单选题:以下关于Python自带数据结构的运算结果中正确的是哪一项?

选项:

A、l=[1,2,3,4,5];dell[2:4];则运算之后l为[1,2,3]。

B、l=[2,1,3,5,4];l.remove(3);l.sort();则运算之后l为[1,2,4,5]。

C、basket=['apple','banana','apple','orange'];fruit=set(basket);len(fruit)的运算结果是4。

D、basket=['apple','banana','apple','orange'];fruit=set(basket);fruit2=set(['apple','melo']);len(fruit|fruit2)的结果是5。

答案:【l=[2,1,3,5,4];l.remove(3);l.sort();则运算之后l为[1,2,4,5]。】7.单选题:以下关于Python自带数据结构的运算结果中错误的是哪一项?

选项:

A、l=[1,2,3,4];l.insert(2,-1);则l为[1,2,-1,4]。

B、l=[1,2,3,4];l.reverse();则l[1]为3。

C、l=[1,2,3,4];l.pop();则l.index(3)结果为2。

D、l=[1,2,3,4];l.pop(1);则l结果为[1,3,4]。

答案:【l=[1,2,3,4];l.insert(2,-1);则l为[1,2,-1,4]。】8.单选题:以下关于Fibonacci数列的函数中_________表示数列的第n项(假设第0项是0,第1项是1)?deffib(n):a,b=0,1count=1whilecount<n:a,b=b,a+bcount=count+1

选项:

A、a

B、b

C、a+1

D、b+1

答案:【b】9.单选题:以下关于Python的说法中正确的是哪一项?

选项:

A、在Python中,一个算法的递归实现往往可以用循环实现等价表示,但是大多数情况下递归表达的效率要更高一些。

B、递归调用语句不允许出现在循环结构中。

C、Python中函数的返回值如果多于1个,则系统默认将它们处理成一个字典。

D、可以在函数参数名前面加上星号*,这样用户所有传来的参数都被收集起来然后使用,星号在这里的作用是收集其余的位置参数,这样就实现了变长参数。

答案:【可以在函数参数名前面加上星号*,这样用户所有传来的参数都被收集起来然后使用,星号在这里的作用是收集其余的位置参数,这样就实现了变长参数。】10.单选题:在Python中,以下关于函数的描述错误的是哪一项?

选项:

A、在Python中,foo为一个函数,执行map(foo,lst)则可将foo函数映射到lst中的每一个元素上。

B、在Python的函数中,有且只能有一个return语句。

C、在Python中,函数的return语句可以以元组tuple的方式返回多个值。

D、在Python中,默认参数的值可以修改。

答案:【在Python的函数中,有且只能有一个return语句。】11.单选题:对于函数ask,以下调用错误的是哪一项?defask(prompt="DoyoulikePython?",hint="yesorno"):whileTrue:answer=input(prompt)ifanswer.lower()in('y','yes'):print("Thankyou")returnTrueifanswer.lower()in('n','no'):print("Whynot")returnFalseelse:print(hint)

选项:

A、answer.lower()是调用了字符串自带的函数lower(),将输入转换为小写字母。

B、函数调用ask("DoyoulikePython?")与ask()效果一致。

C、调用函数ask(),在交互页面输入N,则会继续打印yesorno提示你继续输入。

D、调用函数ask(),在交互页面输入x,则会打印yesorno,如果继续输入y,则会打印Thankyou并退出ask()函数的执行同时返回值True。

答案:【调用函数ask(),在交互页面输入N,则会继续打印yesorno提示你继续输入。】12.单选题:以下关于列表表述中错误的是哪一项?

选项:

A、列表与字符串一样都是不可变的。

B、“+”号可以用来拼接两个列表。

C、可以用“==”比较两个列表是否相同。

D、Python的列表可以嵌套,形成二维列表。

答案:【列表与字符串一样都是不可变的。】13.单选题:结构化程序设计的三种基本的控制结构不包括以下哪一项?

选项:

A、递归

B、选择

C、顺序

D、循环

答案:【递归】14.单选题:以下关于数据规约的说法中错误的选项是哪一个?

选项:

A、PCA是一种常见的属性规约方法。

B、直方图常用来做数值规约。

C、z-score是一种常见的数值规约方法。

D、抽样常用来做数值规约。

答案:【z-score是一种常见的数值规约方法。】15.单选题:面向对象思想的程序设计中通常的使用顺序是以下哪一项?

选项:

A、定义类—创建实例—通过实例使用属性或方法

B、创建实例—定义类—通过实例使用属性或方法

C、创建实例—通过实例使用属性或方法—定义类

D、定义类—通过实例使用属性或方法—创建实例

答案:【定义类—创建实例—通过实例使用属性或方法】16.单选题:以下关于SciPy中常见数据结构的描述中错误的是哪一项?

选项:

A、SciPy包括NumPy,Matplotlib,pandas等组件,其中NumPy是高性能计算分析的基础包,是其后高级工具的构建基础。

B、ndarray是NumPy的多维数组对象,importnumpyasnp;matrix=np.ones((3,4))创建了一个3*4的二维数组ndarray对象。

C、Series可以看作pandas中对Python原生字典的加强,所以一个Series对象内部每一个元素的索引不能相同。

D、DataFrame可以看成共享同一个index的Series集合。

答案:【Series可以看作pandas中对Python原生字典的加强,所以一个Series对象内部每一个元素的索引不能相同。】17.单选题:以下不能作为字典的key的是哪一个选项?

选项:

A、123

B、'num'

C、listA=['className']

D、tupleA=('sum')

答案:【listA=['className']】18.单选题:以下描述中错误的是哪一项?

选项:

A、Python中的同一种序列互相之间可以进行比较,按照字典序进行排序,例如(1,2,3,4)<(1,2,4)的运算结果是True。

B、字符串的格式化,'{:.2f}'.format(math.pi)与'%.2f'%math.pi在运算结果上相同。

C、打开一个文本文件,再对其进行读取,f=open('test.txt','r+');f.read();read函数内不带参数是读取整个文本文件内容并返回。

D、打开一个文本文件,f=open('test.txt','r+');则f.seek(5)表示在打开的文件里寻找数字5。

答案:【打开一个文本文件,f=open('test.txt','r+');则f.seek(5)表示在打开的文件里寻找数字5。】19.单选题:以下描述中错误的是哪一项?

选项:

A、当在序列中循环访问元素时,如果要同时获取元素的下标,可以使用enumerate()函数,例如forxinenumerate(lst)。

B、如果要倒序遍历访问序列中的元素,可以对该序列使用reversed()函数,例如foriinreversed(list)。

C、在遍历列表的同时可以修改列表本身,例如如下的代码可以做到。words=['I','love','Python']forwinwords:iflen(w)>4:words.insert(0,w)

D、对字典进行遍历访问时,可以通过items()函数同时得到key,value值。例如fork,vinscores.items()。

答案:【在遍历列表的同时可以修改列表本身,例如如下的代码可以做到。words=['I','love','Python']forwinwords:iflen(w)>4:words.insert(0,w)】20.单选题:以下关于Python自带数据结构的运算结果中正确的是哪一项?

选项:

A、scores={'Jack':90,'Mike':80,'Jay':85,'Bill':60};delscores['Bill'];len(scores)的结果是6。

B、scores={'Jack':90,'Mike':80,'Jay':85,'Bill':60};s=dict(Jack=90,Mike=80,Jay=85,Bill=60);则scores==s判断结果是False。

C、scores={'Jack':90,'Mike':80,'Jay':85,'Bill':60};无法执行命令scores['Bill']=90;因为原来的字典中已经有了一个值为90了。

D、scores={'Jack':90,'Mike':80,'Jay':85,'Bill':60};sorted(scores.keys())的运算结果是['Bill','Jack','Jay','Mike']。

答案:【scores={'Jack':90,'Mike':80,'Jay':85,'Bill':60};sorted(scores.keys())的运算结果是['Bill','Jack','Jay','Mike']。】21.单选题:以下关于字符串处理正确的是哪一项?

选项:

A、+号可以用来拼接两个字符串,对于以下代码的输出字符串是Python>>>prefix="Py">>>prefix+'thon'

B、字符串是自带索引的,对变量word="Python",word[1]是字符y,但是word[-1]会报越界错误。

C、字符串的索引有两个边界,前边界和后边界都是包括的。

D、对于字符串"apple",3*"apple"的结果为"3apple"。

答案:【+号可以用来拼接两个字符串,对于以下代码的输出字符串是Python>>>prefix="Py">>>prefix+'thon'】22.单选题:以下关于字符串处理的描述错误的是哪一项?

选项:

A、被单引号('...')或者双引号("...")包围的都是字符串。

B、"\"符号可以被用来表示转义符号,例如'doesn\'t'和"doesn't"都表示字符串doesn't。

C、打印语句print('C:\file\time')的输出结果是C:\file\time。

D、如果字符串赋值的时候,内部有单引号或双引号时如果不想使用转义字符常常可以使用r运算符来表示。

答案:【打印语句print('C:\file\time')的输出结果是C:\file\time。】23.单选题:以下关于Python数值运算描述错误的是哪一项?

选项:

A、%运算符表示运算对象取余。

B、Python内置支持复数运算,可以使用j或者J来表示。

C、Python支持+=、%=这样的增量赋值操作符。

D、在Python3.x中,10/3==3的判别结果是True。

答案:【在Python3.x中,10/3==3的判别结果是True。】24.单选题:在做二维表数据定性分布分析时常用value_counts()方法或条形图来展现数据的分类比例。

选项:

A、正确

B、错误

答案:【错误】25.单选题:对于如“quotesdf=quotesdf.drop(['date'],axis=1)”这样的语句中axis的参数只能是0或者1。0代表对DataFrame中某一列进行操作,1代表对DataFrame中某一行进行操作。

选项:

A、正确

B、错误

答案:【错误】26.单选题:在利用NumPy中的ndarray数组解决各类科学计算问题时有一个重要广播思想,但是要特别注意数组在运算过程的维数变化以保证可以进行后续的广播,为此函数/方法中常有keepdims这个参数,可将此参数设置为True以保持数组的二维特性(结果中被减少那个轴的维度为1)。

选项:

A、正确

B、错误

答案:【正确】27.单选题:Python字典的内置函数中没有append()操作,可以用update()来更新字典内容。

选项:

A、正确

B、错误

答案:【正确】28.单选题:通过Requests库中的get函数可以爬取某个网页,如果要解析其内容常常使用BeautifulSoup库和re模块。

选项:

A、正确

B、错误

答案:【正确】29.单选题:执行range(N1,N2)可生成N2-N1+1个整数。

选项:

A、正确

B、错误

答案:【错误】30.单选题:在Python的函数参数定义中,可以有一些位置参数和一些关键字参数,其中关键字参数让调用者通过使用参数名区分参数,允许改变参数列表中的参数顺序。

选项:

A、正确

B、错误

答案:【正确】31.单选题:在循环控制语句中,有break,continue和pass等控制流关键词。

选项:

A、正确

B、错误

答案:【正确】32.单选题:count-1是Python的合法标识符。

选项:

A、正确

B、错误

答案:【错误】33.单选题:Python中无需定义变量类型,根据“值”确定类型,并以“引用”的方式实现赋值操作。

选项:

A、正确

B、错误

答案:【正确】34.单选题:数据规范化常用来解决量纲不同和数值范围差异大的问题。

选项:

A、正确

B、错误

答案:【正确】35.单选题:Python中的for语句可以在任意序列上进行迭代访问,例如列表、字符串和元组。

选项:

A、正确

B、错误

答案:【正确】36.单选题:Python中如果某个文件的打开模式是“r+”,则将文件指针移动到文件开头,调用f.write('hahaha')则可将字符串“hahaha”插入到文件的开头。

选项:

A、正确

B、错误

答案:【错误】37.单选题:对于与循环语句匹配的else语句,如果循环代码从break处终止跳出循环,则执行该循环的else中的语句。

选项:

A、正确

B、错误

答案:【错误】38.单选题:若要在列表l后插入元素x,可以使用l.append(x),也可以使用l[len(l):]=[x]。

选项:

A、正确

B、错误

答案:【正确】39.已知列表fruits中顺序保存了某商店每日出售的水果品名,例如fruits=['apple','banana','cherry','banana','peach','pear','peach','cherry'],定义函数count计算每一种水果的出售次数,存入字典result中并将结果返回,针对本题数据,result的结果为:{'pear':1,'banana':2,'cherry':2,'peach':2,'apple':1}。这个问题还可以利用另外的函数来解决,请在横线中填上相应的函数名。d={}foriteminfruits:d[item]=d.___________(item,0)+1

答案:【get/setdefault】40.已知列表fruits中顺序保存了某商店每日出售的水果品名,例如fruits=['apple','banana','cherry','banana','peach','pear','peach','cherry'],定义函数count计算每一种水果的出售次数,存入字典result中并将结果返回,针对本题数据,result的结果为:{'pear':1,'banana':2,'cherry':2,'peach':2,'apple':1}。我们可以用一般程序设计的方法去解决这个问题,例如:d={}fruits_set=set(fruits)foriteminfruits_set:d[item]=0foriinrange(len(fruits)):ifitem==fruits[i]:d[item]+=1但是我们更希望大家用Python中特有的方法去解决问题,例如此问题可以改成:foriteminfruits:B[item]=0foriteminfruits:B[item]+=1也可以利用Python中丰富的函数去解决这个问题,请在空白处填写相应的函数。d={}foriteminfruits:d[item]=fruits._________(item)

答案:【count】41.在当前目录存在存在文本文件test.txt,内容是:Lifeisshort,youneedPython.Simpleisbetterthancomplex.执行如下语句,结果字符串是b'_________________'。fp=open('test.txt','rb+',0)fp.readline()fp.seek(10,1)print(fp.readline())fp.close()

答案:【betterthancomplex.】42.【ask函数第2题】请填写【ask函数第1题】中第二条横线处的答案。

答案:【hint/"yesorno"/'yesorno'/'''yesorno'''】43.【情感分析第4题】上一题(【情感分析第3题】)第二和第三条横线上(所填内容一样)需要填写的函数/方法名是___________________(只填一遍即可)。

答案:【split】44.【情感分析第3题】了解了语料的基本情况后可以开始考虑处理流程,基本思路是通过对评论句的处理获得相应的对某个特征褒义/贬义的判断(假设我们只考虑简单的褒义和贬义,不需要情感强度),再把判断结果与已有的情感标注对比从而确定算法的正确率。因此需要先把语料中已进行标注情感标注评论句中的情感值和评论句

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论