机器学习应用开发入门指南_第1页
机器学习应用开发入门指南_第2页
机器学习应用开发入门指南_第3页
机器学习应用开发入门指南_第4页
机器学习应用开发入门指南_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

机器学习应用开发入门指南第一章机器学习基础理论1.1机器学习的基本概念1.2机器学习的发展历程1.3机器学习的主要算法分类1.4机器学习的应用领域1.5机器学习的挑战与趋势第二章Python编程与数据预处理2.1Python编程基础2.2NumPy与Pandas库使用2.3数据清洗与数据转换2.4数据可视化技术2.5特征工程方法第三章机器学习库与框架3.1Scikit-learn库3.2TensorFlow框架3.3PyTorch框架3.4Keras库3.5其他常用库介绍第四章学习算法4.1线性回归4.2逻辑回归4.3支持向量机4.4决策树与随机森林4.5集成学习与boosting第五章非学习算法5.1聚类算法5.2关联规则挖掘5.3降维技术5.4异常检测5.5图神经网络第六章深入学习基础6.1神经网络与激活函数6.2卷积神经网络6.3循环神经网络6.4生成对抗网络6.5深入学习的应用场景第七章模型评估与优化7.1模型评估指标7.2超参数调整7.3交叉验证7.4集成学习与模型融合7.5模型压缩与加速第八章实战案例与项目经验8.1案例一:手写数字识别8.2案例二:图像分类8.3案例三:自然语言处理8.4案例四:推荐系统8.5案例五:金融风控第一章机器学习基础理论1.1机器学习的基本概念机器学习是人工智能的一个重要分支,其核心目标是通过算法让计算机系统从数据中学习,从而获得知识或技能,无需显式编程。在机器学习中,计算机通过处理大量数据,自动发觉数据中的模式,并利用这些模式对未知数据进行预测或分类。1.2机器学习的发展历程机器学习的发展历程可追溯到20世纪50年代。早期,机器学习主要关注符号主义方法,如逻辑回归、决策树等。20世纪80年代,基于统计的方法开始兴起,如支持向量机、神经网络等。21世纪初,计算能力的提升和大数据的涌现,深入学习等算法得到了广泛应用。1.3机器学习的主要算法分类(1)学习:输入为特征和标签,输出为预测结果。例如线性回归、逻辑回归、支持向量机等。(2)无学习:输入为特征,输出为数据结构和模式。例如聚类、降维、关联规则等。(3)半学习:输入为部分标记数据和大量未标记数据,输出为预测结果。(4)强化学习:通过与环境交互,学习最优策略以实现目标。1.4机器学习的应用领域机器学习在众多领域取得了显著成果,如:自然语言处理:语音识别、机器翻译、文本分类等。计算机视觉:图像识别、目标检测、人脸识别等。推荐系统:电影推荐、商品推荐等。金融领域:信用评估、风险控制、量化交易等。医疗领域:疾病诊断、药物发觉、健康管理等。1.5机器学习的挑战与趋势尽管机器学习取得了显著进步,但仍面临以下挑战:数据质量:高质量的数据是机器学习成功的关键。可解释性:提高模型的可解释性,以便更好地理解其决策过程。泛化能力:提高模型在未知数据上的泛化能力。安全性:防止模型被恶意攻击。未来趋势包括:跨学科研究:结合生物学、心理学、经济学等领域的知识。模型压缩:降低模型复杂度,提高模型效率。自动化机器学习:简化机器学习流程,降低对专家依赖。可解释人工智能:提高模型的可解释性,增强用户信任。第二章Python编程与数据预处理2.1Python编程基础Python是一种广泛应用于机器学习领域的编程语言,其简洁、易读和高效的特点使其成为入门者学习机器学习应用开发的首选工具。Python编程基础包括以下几个核心要素:数据类型:包括数字(整数、浮点数、复数)、字符串、列表、元组、字典等。控制结构:循环(for、while)、条件判断(if、elif、else)。函数定义与调用:函数是组织代码、提高可重用性的有效手段。模块导入:通过import语句引入内置或第三方模块。2.2NumPy与Pandas库使用NumPy和Pandas是Python中两个常用的库,在机器学习应用开发中扮演着的角色。NumPy:一个强大的数学库,主要用于处理数值计算,支持大型多维数组与布局运算。核心概念:数组、布局运算、随机数生成。公式:A其中,(A)为两个向量(a)和(b)的点积,(n)为向量长度。Pandas:一个用于数据结构和数据分析的库,提供了高效的数据结构和方法。核心概念:DataFrame(二维数据结构)、Series(一维数据结构)、数据操作。应用场景:数据处理、清洗、转换、分析。2.3数据清洗与数据转换数据清洗是数据预处理的关键步骤,目的是去除无用信息、修正错误、填补缺失值等。一些常见的数据清洗和转换方法:去除重复值:通过DataFrame.drop_duplicates()方法实现。填补缺失值:使用DataFrame.fillna()方法,根据需求选择填充策略,如均值、中位数、最频繁值等。类型转换:通过DataFrame.astype()方法将数据转换为所需的类型。数据规范化:将数据缩放到某个范围,如使用MinMaxScaler或StandardScaler。2.4数据可视化技术数据可视化是理解数据、发觉数据背后规律的有效手段。一些常用的数据可视化方法:条形图:用于展示不同类别之间的比较。折线图:用于展示数据随时间的变化趋势。散点图:用于展示两个变量之间的关系。热力图:用于展示数据的热度分布。2.5特征工程方法特征工程是机器学习应用开发中的重要环节,它旨在提取出对模型有用的特征。一些常用的特征工程方法:特征选择:选择对模型预测能力有帮助的特征。过滤法:根据特征的重要性、相关性等进行筛选。包装法:使用机器学习模型对特征进行筛选。特征提取:通过降维、特征组合等方法提取新的特征。主成分分析(PCA):用于降维,将高维数据映射到低维空间。LDA(线性判别分析):用于提取区分不同类别的特征。第三章机器学习库与框架3.1Scikit-learn库Scikit-learn是一个开源的Python机器学习库,旨在提供简单易用的接口来构建机器学习模型。它提供了多种机器学习算法的实现,包括分类、回归、聚类和降维等。主要特点:算法多样性:Scikit-learn提供了多种常用的机器学习算法,可满足不同场景下的需求。简单易用:Scikit-learn的API设计简洁,易于学习和使用。文档完善:Scikit-learn的官方文档详尽,提供了丰富的示例和教程。常用方法:fit(X,y):用于训练模型。predict(X):用于对新数据进行预测。score(X,y):用于评估模型的功能。3.2TensorFlow框架TensorFlow是一个开源的机器学习由Google开发。它提供了丰富的工具和库,可用于构建和训练复杂的机器学习模型。主要特点:支持多种算法:TensorFlow支持多种机器学习算法,包括深入学习、强化学习等。灵活的可扩展性:TensorFlow支持分布式计算,可扩展到大规模的数据集和模型。易于使用:TensorFlow提供了丰富的API和文档,易于学习和使用。核心组件:Tensor:TensorFlow的基本数据结构,用于表示多维数组。Graph:TensorFlow中的计算图,用于描述计算任务。Operation:在计算图中执行的具体操作。3.3PyTorch框架PyTorch是一个开源的机器学习库,由Facebook开发。它提供了动态计算图,使得模型构建和调试更加方便。主要特点:动态计算图:PyTorch使用动态计算图,可更方便地进行模型构建和调试。易于使用:PyTorch的API设计简洁,易于学习和使用。支持GPU加速:PyTorch支持GPU加速,可加快模型训练速度。核心组件:Tensors:PyTorch的基本数据结构,类似于TensorFlow中的Tensor。Autograd:PyTorch的自动微分系统,可自动计算梯度。NN模块:PyTorch提供的神经网络模块,包括层、激活函数等。3.4Keras库Keras是一个开源的神经网络库,可在TensorFlow、Theano和CNTK等后端上运行。它提供了丰富的API和工具,可方便地构建和训练神经网络。主要特点:模块化设计:Keras采用模块化设计,可方便地组合不同的层和组件。易于使用:Keras的API设计简洁,易于学习和使用。丰富的预训练模型:Keras提供了丰富的预训练模型,可用于迁移学习。核心组件:Layer:Keras的基本层,包括全连接层、卷积层、循环层等。Model:Keras中的模型,用于组合不同的层和组件。Optimizer:Keras中的优化器,用于调整模型参数。3.5其他常用库介绍除了上述提到的库,还有其他一些常用的机器学习库,例如:Pandas:用于数据处理和分析。NumPy:用于数值计算。Matplotlib:用于数据可视化。Scrapy:用于网络爬虫。第四章学习算法4.1线性回归线性回归是一种广泛使用的学习算法,用于预测连续数值变量。其基本思想是通过建立因变量与自变量之间的线性关系来预测目标值。在机器学习应用中,线性回归算法用于以下场景:房价预测:根据房屋的面积、位置、年代等特征预测房价。股票价格预测:根据历史股价、交易量、市场指数等特征预测未来股价。线性回归模型可表示为:y其中,(y)是因变量,(x_1,x_2,…,x_n)是自变量,(_0,_1,…,_n)是回归系数,()是误差项。4.2逻辑回归逻辑回归是一种广泛应用于二分类问题的学习算法。其基本思想是通过建立因变量与自变量之间的非线性关系来预测目标值。在机器学习应用中,逻辑回归算法用于以下场景:垃圾邮件检测:根据邮件内容特征预测邮件是否为垃圾邮件。客户流失预测:根据客户行为特征预测客户是否可能流失。逻辑回归模型可表示为:P其中,(P(y=1))是因变量为1的概率,(e)是自然对数的底数,(_0,_1,…,_n)是回归系数。4.3支持向量机支持向量机(SVM)是一种基于间隔最大化的学习算法,用于解决二分类和回归问题。在机器学习应用中,SVM算法用于以下场景:人脸识别:根据人脸图像特征进行人脸识别。文本分类:根据文本特征进行文本分类。SVM算法的基本思想是找到一个最优的超平面,使得正负样本分别位于超平面的两侧,并且尽可能地将它们分开。SVM模型可表示为:w其中,(w)是权重向量,(x)是特征向量,(b)是偏置项。4.4决策树与随机森林决策树是一种基于树结构的学习算法,用于解决分类和回归问题。在机器学习应用中,决策树算法用于以下场景:疾病诊断:根据症状和体征特征进行疾病诊断。客户细分:根据客户特征进行客户细分。决策树由一系列的决策节点和叶节点组成,每个决策节点代表一个特征,每个叶节点代表一个类别。随机森林是一种集成学习方法,通过构建多个决策树并对预测结果进行投票来提高预测精度。4.5集成学习与boosting集成学习是一种将多个模型组合起来以获得更好的预测功能的方法。在机器学习应用中,集成学习算法用于以下场景:图像识别:通过结合多个图像识别模型的预测结果来提高识别精度。语音识别:通过结合多个语音识别模型的预测结果来提高识别精度。Boosting是一种集成学习方法,通过迭代地训练多个弱学习器,并将它们组合成一个强学习器。Boosting算法的基本思想是:训练一个弱学习器,然后根据弱学习器的预测误差来调整训练数据,并训练下一个弱学习器,以此类推。Boosting算法可表示为:f其中,(f(x))是最终的预测函数,(h_i(x))是第(i)个弱学习器的预测函数,(_i)是第(i)个弱学习器的权重。第五章非学习算法5.1聚类算法聚类算法是数据挖掘领域中一种常用的非学习方法,它通过将相似的数据点分到同一个簇中,实现数据自动分组。聚类算法在许多领域有着广泛的应用,如市场细分、图像分割、社交网络分析等。聚类算法的类型基于划分的聚类算法:这类算法通过迭代过程将数据划分为若干个簇,例如k-means算法。基于层次的聚类算法:这类算法将数据点通过合并相似的数据点形成层次结构,如层次聚类。基于密度的聚类算法:这类算法根据数据点的密度分布来划分簇,例如DBSCAN算法。基于模型的方法:这类算法通过学习数据点之间的分布模型来实现聚类,如高斯混合模型。k-means算法k-means算法是最常用的聚类算法之一,其基本思想是将数据点划分为k个簇,使得每个簇的均值与所有数据点之间的距离最小。公式:Minimize其中,(C_i)是第(i)个簇,(_i)是(C_i)的均值。聚类算法的应用场景市场细分:将客户根据购买习惯、收入水平等因素划分为不同的市场细分。图像分割:将图像中的不同区域进行划分,以便后续处理和分析。社交网络分析:将社交网络中的用户根据兴趣爱好、社交关系等因素进行分组。5.2关联规则挖掘关联规则挖掘是一种用于发觉数据中潜在关系的方法。它通过分析大量数据,找出频繁出现的项集,进而发觉数据之间的关联关系。关联规则挖掘的基本步骤(1)频繁项集生成:找出数据集中所有频繁出现的项集。(2)关联规则生成:根据频繁项集生成关联规则。(3)关联规则评估:对生成的关联规则进行评估,筛选出高质量的规则。Apriori算法Apriori算法是一种常用的关联规则挖掘算法,其基本思想是从单个项集开始,逐步扩展到更长的项集,直到满足最小支持度阈值。公式:Support其中,(X)是项集,((X))是(X)出现在交易中的次数。关联规则挖掘的应用场景推荐系统:根据用户的历史行为,推荐相关的商品或服务。购物篮分析:分析顾客的购买行为,挖掘潜在的销售机会。市场分析:分析市场趋势,预测市场变化。5.3降维技术降维技术是一种用于减少数据集维度的方法。通过降低数据的维度,可减少计算量和存储空间,提高模型的可解释性。主成分分析(PCA)主成分分析(PCA)是一种常用的降维方法,其基本思想是找到数据集中具有最大方差的向量,并将其作为新的特征。公式:Z其中,(Z)是新的特征,(X)是原始数据,(P)是特征向量。降维技术的应用场景图像处理:对图像进行降维,提高处理速度。机器学习:降低模型的复杂度,提高模型的可解释性。生物信息学:分析基因组数据,发觉潜在的生物学规律。5.4异常检测异常检测是一种用于检测数据集中异常值的方法。通过识别异常值,可发觉潜在的问题或异常情况。异常检测的方法基于统计的方法:通过计算数据点的统计特征,判断其是否为异常值。基于距离的方法:通过计算数据点之间的距离,判断其是否为异常值。基于模型的方法:通过训练一个分类器,将异常值与正常值区分开来。IsolationForest算法IsolationForest算法是一种常用的异常检测算法,其基本思想是通过随机选择一个特征和一个分割点,将数据点隔离,从而找到异常值。公式:Isolation其中,(x_i)是特征向量,(x_j)是分割点。异常检测的应用场景金融欺诈检测:检测可疑的交易行为,防止金融欺诈。网络安全:检测恶意攻击行为,提高网络安全水平。医疗诊断:识别异常的病例,帮助医生做出更准确的诊断。5.5图神经网络图神经网络(GraphNeuralNetworks,GNN)是一种用于处理图数据的深入学习模型。它通过学习图结构中的信息传递模式,实现节点或边的预测。图神经网络的基本原理图表示:将图数据转换为节点和边的表示。图卷积操作:通过图卷积操作学习节点和边之间的关系。图神经网络层:通过多层图神经网络层提取图结构中的特征。图神经网络的模型GCN(图卷积网络):通过卷积操作学习图结构中的特征。GAT(图注意力网络):通过注意力机制学习图结构中的特征。图神经网络的应用场景社交网络分析:分析用户之间的社交关系,发觉潜在的社会群体。推荐系统:根据用户之间的相似性推荐相关商品或服务。生物信息学:分析生物分子之间的相互作用,发觉潜在的生物学规律。第六章深入学习基础6.1神经网络与激活函数深入学习作为机器学习的一个重要分支,其核心是神经网络。神经网络由大量相互连接的神经元组成,每个神经元负责处理输入数据,并通过激活函数产生输出。激活函数是神经网络中不可或缺的部分,它决定了神经元的激活状态,从而影响整个网络的输出。在神经网络中,常见的激活函数包括:Sigmoid函数:将输入值压缩到0和1之间,适用于二分类问题。f其中,(x)为输入值。ReLU函数:非线性激活函数,对于负值输出0,对于正值输出输入值本身,具有计算效率高、参数较少等优点。fTanh函数:将输入值压缩到-1和1之间,适用于多分类问题。f6.2卷积神经网络卷积神经网络(ConvolutionalNeuralNetwork,CNN)是深入学习在图像识别、图像分类等领域的重要应用。CNN通过卷积层、池化层和全连接层等结构,实现对图像数据的特征提取和分类。卷积层:通过卷积核提取图像特征,如边缘、纹理等。池化层:降低特征图的空间分辨率,减少计算量,提高模型的鲁棒性。全连接层:将卷积层和池化层提取的特征进行组合,输出最终的分类结果。6.3循环神经网络循环神经网络(RecurrentNeuralNetwork,RNN)适用于处理序列数据,如时间序列、文本等。RNN通过循环连接,使得神经网络能够处理任意长度的序列。RNN的基本结构包括:输入层:接收序列数据。隐藏层:包含循环连接,用于处理序列数据。输出层:输出序列的预测结果。6.4生成对抗网络生成对抗网络(GenerativeAdversarialNetwork,GAN)由生成器和判别器组成,生成器负责生成数据,判别器负责判断数据是否真实。GAN在图像生成、数据增强等领域具有广泛应用。生成器:生成与真实数据分布相似的样本。判别器:判断生成数据是否真实。6.5深入学习的应用场景深入学习在各个领域都有广泛应用,以下列举一些典型应用场景:图像识别:如人脸识别、物体检测等。自然语言处理:如机器翻译、情感分析等。语音识别:如语音转文字、语音合成等。推荐系统:如电影推荐、商品推荐等。深入学习作为人工智能领域的重要技术,具有广泛的应用前景。技术的不断发展,深入学习将在更多领域发挥重要作用。第七章模型评估与优化7.1模型评估指标模型评估是机器学习应用开发中的关键步骤,它帮助我们理解模型在给定数据集上的功能。常用的评估指标包括:准确率(Accuracy):准确率衡量的是模型预测正确的样本占总样本的比例。其公式为:Accuracy-精确率(Precision):精确率衡量的是在所有被模型预测为正例的样本中,真正例的比例。其公式为:Precision-召回率(Recall):召回率衡量的是在所有真实正例中,被模型正确预测的比例。其公式为:Recall-F1分数(F1Score):F1分数是精确率和召回率的调和平均,适用于平衡精确率和召回率的场景。其公式为:F1Score7.2超参数调整超参数是模型参数的一部分,它们在训练前需要手动设置。超参数调整是优化模型功能的关键步骤。一些常用的超参数调整方法:网格搜索(GridSearch):通过遍历预定义的超参数组合来寻找最佳参数组合。随机搜索(RandomSearch):在预定义的超参数范围内随机选择参数组合,寻找最佳参数组合。贝叶斯优化(BayesianOptimization):使用贝叶斯方法寻找最佳超参数组合。7.3交叉验证交叉验证是一种评估模型功能的方法,它通过将数据集分成训练集和验证集来避免过拟合。一些常用的交叉验证方法:k折交叉验证(k-FoldCross-Validation):将数据集分成k个等大小的子集,每个子集轮流作为验证集,其余作为训练集。留一法(Leave-One-OutCross-Validation):当数据集较小或每个样本都重要时,使用留一法进行交叉验证。7.4集成学习与模型融合集成学习是将多个模型结合起来提高功能的方法。一些常用的集成学习方法:Bagging(随机森林):通过多次从原始数据集中抽取有放回的子集来训练多个模型,然后将它们的预测结果进行投票。Boosting(提升树):通过迭代地训练模型,每次都试图纠正前一个模型的错误,以提高整体功能。Stacking(堆叠):将多个模型的输出作为新特征,再训练一个模型对这些新特征进行预测。7.5模型压缩与加速模型压缩与加速是提高模型功能和降低资源消耗的关键步骤。一些常用的模型压缩与加速方法:量化(Quantization):将模型参数从浮点数转换为低精度整数,以减少模型大小和加速推理。剪枝(Pruning):移除模型中的冗余神经元,以减少模型大小和加速推理。知识蒸馏(KnowledgeDistillation):将大模型的知识迁移到小模型,以提高小模型的功能。第八章实战案例与项目经验8.1案例一:手写数字识别手写数字识别是机器学习领域的一个经典问题,使用卷积神经网络(CNN)来解决。一个简单的案例介绍。手写数字识别系统手写数字识别系统包括以下几个步骤:(1)数据预处理:对输入的手写数字图像进行预处理,如灰度化、二值化、滤波等。(2)特征提取:提取图像的特征,如边缘检测、纹理分析等。(3)分类器训练:使用CNN等深入学习模型对特征进行分类。(4)预测与评估:对新图像进行预测,并评估模型的准确率。案例实现一个简单的手写数字识别系统的实现示例:导入必要的库importtensorflowastffromtensorflow.kerasimportdatasets,layers,models加载数据集(train_images,train_labels),(test_images,test_labels)=datasets.mnist.load_data()数据预处理train_images=train_images.reshape((60000,28,28,1)).astype(‘float32’)/255test_images=test_images.reshape((10000,28,28,1)).astype(‘float32’)/255构建模型model=models.Sequential()model.add(layers.Conv2D(32,(3,3),activation=‘relu’,input_shape=(28,28,1)))model.add(layers.MaxPooling2D((2,2)))model.add(layers.Conv2D(64,(3,3),activation=‘relu’))model.add(layers.MaxPooling2D((2,2)))model.add(layers.Conv2D(64,(3,3),activation=‘relu’))添加全连接层model.add(layers.Flatten())model.add(layers.Dense(64,activation=‘relu’))model.add(layers.Dense(10))编译模型modelpile(optimizer=‘adam’,loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),metrics=[‘accuracy’])训练模型model.fit(train_images,train_labels,epochs=5,batch_size=64)评估模型test_loss,test_acc=model.evaluate(test_images,test_labels,verbose=2)print(‘accuracy:’,test_acc)8.2案例二:图像分类图像分类是计算机视觉领域的一个重要应用,通过训练深入学习模型对图像进行分类。一个简单的案例介绍。图像分类系统图像分类系统包括以下几个步骤:(1)数据预处理:对输入的图像进行预处理,如缩放、裁剪、归一化等。(2)特征提取:提取图像的特征,如颜色、纹理、形状等。(3)分类器训练:使用深入学习模型对特征进行分类。(4)预测与评估:对新图像进行预测,并评估模型的准确率。案例实现一个简单的图像分类系统的实现示例:导入必要的库importtensorflowastffromtensorflow.keras.applicationsimportMobileNetV2fromtensorflow.keras.applications.mobilenet_v2importpreprocess_input,de_predictionsfromtensorflow.keras.preprocessingimportimage加载预训练模型model=MobileNetV2(weights=‘imagenet’)加载图像img=image.load_img(‘path/to/image.jpg’,target_size=(224,224))img_data=preprocess_input(np.array([img]))预测图像类别predictions=model.predict(img_data)print(‘Predicted:’,de_predictions(predictions,top=3)[0])8.3案例三:自然语言处理自然语言处理(NLP)是机器学习领域的一个重要分支,主要研究如何让计算机理解和处理人类语言。一个简单的案例介绍。自然语言处理系统自然语言处理系统包括以下几个步骤:(1)文本预处理:对输入的文本进行预处理,如分词、去除停用词、词性标注等。(2)特征提取:提取文本的特征,如词袋模型、TF-IDF等。(3)模型训练:使用深入学习模型对特征进行分类或回归。(4)预测与评估:对新文本进行预测,并评估模型的准确率。案例实现一个简单的自然语言处理系统的实现示例:导入必要的库importtensorflowastffromtensorflow.keras.preprocessing.textimportTokenizerfromtensorflow.keras.preprocessing.sequenceimportpad_sequencesfromtensorflow.keras.modelsimportSequentialfromtensorflow.keras.layersimportEmbedding,LSTM,Dense加载文本数据texts=[‘Thisisasampletext.’,‘Anothersampletexthere.’]创建分词器tokenizer=Tokenizer(num_words=1000)tokenizer.fit_on_texts(texts)将文本转换为序列sequences=tokenizer.texts_to_sequences(texts)填充序列padded_sequences=pad_sequences(sequences,maxlen=100)构建模型model=Sequential()model.add(Embedding(1000,32,input_length=100))model.add(LSTM(64))model.add(Dense(1,activation=‘sigmoid’))编译模型modelpile(optimizer=‘adam’,loss=‘binary_crossentropy’,metrics=[‘accuracy’])训练模型model.fit(padded_sequences,np.array([1,0]),epochs=10)预测文本new_text=‘Thisisanewtext.’new_sequence=tokenizer.texts_to_sequences([new_text])new_padded_sequence=pad_sequen

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论