在线网课学堂《深度学习基础》单元考核测试答案_第1页
在线网课学堂《深度学习基础》单元考核测试答案_第2页
在线网课学堂《深度学习基础》单元考核测试答案_第3页
在线网课学堂《深度学习基础》单元考核测试答案_第4页
在线网课学堂《深度学习基础》单元考核测试答案_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

训练集(trainingset)和测试集Truepositives(TP):被正确地划分为正例的个数,即实际为正例且被分类器划分Falsenegatives(FN):被错分类准确率Accuracy=(TP+TN)调和平均。如果二者(即准确率和召回率)同等A.(纵轴)敏感性高=漏诊率低,而(横轴)特AUC值提供了分类器的一个整体数值。通常BOW,即词袋模型。即为了计算文档之间的相似度,假设可以忽略文档内的单词顺序和语为了在python程序中进行英文自然语言的处理,如词语切分(Tokenization)词干提取其Uni-gram为“I”,“like”,“to”,“eat”,“apple”其Bi-gram为“Ilike”,“like其Tri-gram为“Iliketo”,“like关于特征降维方法有线性判别分析(LDA)和主成分分析法(PCA错误的是x=np.random.random(5)y=np.random.random(5)sim=np.dot(x,y)/(np.linalg.norm(x)*np.linalg.nox=np.random.random(5)y=np.random.random(5)数据集进行特征降维,以便于数据的二维平面可视化。则其中空格处应该填充的1234狭义线性模型通常是指自变量与因变量之间呈按比例、成直线的关系。一阶导数不为广义线性是线性模型的扩展,主要通过联结函数,使预测值落在响应变量的变梯度下降是利用一阶的梯度信息找到代价函数局部最优解的一通常会先初始化一组参数值,然后在这个值之上,用梯度下降法去求出下一组的值。由于是梯度下降的,所以损失函数的值在下降。当迭代到一定程度,此时的参数取值即为Sigmoid函数有个很漂亮的“S”形,特点是一开始变该方法从一个初始的猜测值以求得函数的局部最优值。该方法需要迭scikit-learn只能用onscikit-learn只能用one-vs.-t信息熵由Shannon提出,信息熵的概念可以用信息熵是通信领域的概念,和机器学习以及深度学习无关相对熵又称为KL散度(Kullback-Lei相对熵又称为信息散度(informationdiverg相对熵又称为信息增益(informationg关于感知机(perceptron下列说法错误的是感知机是二分类的线性分类模型,属于有监感知机是二分类的线性分类模型,属于无监q=np.array([0.6,0.2程序最后两行的的目的是计算相对熵,其是交叉熵与信息熵的q=np.array([0.6,0.2result=0.5*np.sum(p*np.log(p/M))+0.5*npq=np.array([0.6,0.2loss=-np.sum(label*np.log(so对于给定的下面的一段python程一对多的序列输出。如输入一张图片,生成输问题。并被AlexGraves进行了改良LSTM在隐藏层上增加了一个长期状态c(cellstate),用于保存则双向网络假设当前步的输出只与前面的序列有关,而与后面的序列双向网络假设当前步的输出与前面的序列无关,而与后面的序列双向网络假设当前步的输出既与前面的序列有关,也与后面的序列在卷积神经网络的某个降采样层(pooling层)中,经过降采样处理,得到了16个关于采用卷积神经网络进行图像分类和文本分类的比卷积神经网络只能用于图像分类,不能用于文本分类,没有相关文使用卷积神经网络进行句子分类,一般将句子中每个词表示为固定长度的向量,这样句子就可以表示为矩阵,从而使得在结构上与图像类似,并在后续进行卷积图像处理应用中,卷积核处理的局部区域为图像的一小块区域,而在从开始的层到后面的层,经过变换得到的特征图的尺寸逐渐变大从开始的层到后面的层,经过变换得到的特征图的尺寸逐渐变小从开始的层到后面的层,经过变换得到的特征图的尺寸大小不变从开始的层到后面的层,经过变换得到的特征图的尺寸开始变小,后来变大在卷积神经网络中,卷积的下一步通常是进行池化处理(pool如果参数较多,则容易导致过拟合。而减少参数有助于参数共享的优势是通过一个任务上学习到的参数可以直接应用到另外一个任参数越多,才能避免过拟合,减少参数容易导致隐藏层有50个神经元,每个神经元与输入图像是全数(包括偏置参数)?101010深度学习中的词向量表示模型存在的一个突出问题就是“词汇传统方法中词向量表示模型存在一个突出问题就是“Word2vec需要利用到较大规模的每个词通常初始化表示为一个d维的向不同长度和句法类型的句子其组合词向量的1.根据样本预测值和真实值之间的误差,计算损失函数2.迭代更新,直到模型整体误差小于阈值或者达到预定的迭代次数5.反向传播,按照梯度下降的方向改变神经元相应的权重值Tanh如果使用自动编码器提取特征,并与有监督学习模型使用,则在其训练过程中不需要解码器使用自动编码器提取特征,并与有监督学习模型使用。因为监督学习通常的标注数据较少模型训练完毕后,可以从这种先验分布中采样得到潜在变量,并通过解码器得到新的样本VAE在自动编码机基础上加入了随机因子,这样就可以从该模型中采

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论