CPDA考试真题与答案3_第1页
CPDA考试真题与答案3_第2页
CPDA考试真题与答案3_第3页
CPDA考试真题与答案3_第4页
CPDA考试真题与答案3_第5页
免费预览已结束,剩余27页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、判断题1. 样本容量是指从总体中抽取的个体。正确答案: 2. 品质数据既可以用整数值表示,也可以用连续值表示。正确答案: 3. 需求弹性大的产品价格与销售收入反向变化。正确答案: 4. 一般而言,定量预测方法在满足下列三个条件时才能使用: 一是能够知道待测变量的过去值,二是信息可以量化,三是过去的变动形式将持续到未来是一个合理的假设。正确答案: 5. 在对不同项目进行风险衡量时, 可以用标准差作为标准, 标准差越大,方案风险水平越高。6. 在一定时期和一定产销量范围内, 固定成本与产品的产销量多少没有关系, 只有可变成本 才与产品产销量的增减变化发生关系。正确答案: 7. 如果两个变量不独立,

2、那这两者的相关系数必然不等于0。正确答案: 8. 数据库类型是按照数据存取的方法来划分的。正确答案: 9.SQL 语言中,条件年龄 BETWEEN 15 AND 35 ,表示年龄在 15 至 35 之间,且包括 15 岁但不包括 35 岁。正确答案: 10. 资本成本就是资金的时间价值。正确答案: 11. 一组数据排序后处于 25%和 75%位置上的值称为四分位数。正确答案: 12. 企业购并处于竞争地位的同类型企业形成企业集团称为集团多角化。正确答案: 13. 内部收益率考虑了资金时间价值,受折现率高低的影响。正确答案: 14. 边际收入是指每增加 1 单位销量所带来的总收入的增加额度。正确

3、答案: 15. 分类预测时,准确率和召回率存在矛盾关系,不能同时增大,所以要考虑他们的综合影响,即 F1-Score 。单选题正确答案: 1. 当所有观测值都落在回归直线上,则这两个变量之间的相关系数为(A、1B、-1C、+1 或-1D、0 正确答案: C2. 表示职称为副教授、性别为男的表达式为()A、职称 = 副教授 OR 性别= 男B、职称 = 副教授 AND 性别= 男C、BETWEEN 副教授 AND 男D、IN ( 副教授 ,男)最正确答案: B3. 对于下列实验数据: 1 , 108 , 11 , 8 , 5 , 6 , 8 , 8 , 7 , 11,描述其集中趋势用(为适宜,其

4、值是( )。A 、平均数, 14.4B、中位数, 8.5C、众数, 8D、以上都可以正确答案: C4. ( )是进行项目投资效益评价的最终依据。A、现金流量B、盈亏平衡点C、净现金流量D、现金流入量正确答案: C,那么得到的这组新数据的5. 有一组数据其均值是 20 ,对其中的每一个数据都加上 10 均值是( )。A、20B、10C、15D、30正确答案: D6. 分类变量使用以下哪个统计量进行缺失值填补较合适A、均值B、最大值C、众数D、中位数以下何者不是正确答案: C7. 假设 BCE为一频繁项目集 (Frequent Itemset) ,则根据 Apriori Principle子频繁项

5、目?A、BCB、CEC、CD、CD正确答案: D8. 请问以下何者属于时间序列的问题?A、信用卡发卡银行侦测潜在的卡奴B、基金经理人针对个股做出未来价格预测C、电信公司将人户区分为数个群体D、以上均不是正确答案: BProcess)9. 数据正规化 (Data Normalization) 是在知识发掘处理 (Knowledge Discovery 中的哪一个阶段进行?A、数据清洗B、数据选择C、数据编码D 、数据扩充正确答案: C10. 已知事件 A 的概率 P(A)0.6,U 为必然事件,则 P(A+U) 1,P( )_A、0.4B、0.6C、0D、1正确答案: B11. 当时间序列数据点

6、的一阶差分近似为一常数,可配合以下哪种预测模型()A、直线B、二次抛物线C、三次抛物线D、指数曲线正确答案: A12. 变量的量纲比如以厘米或者米为单位对下面哪种方法会有影响()A 、方差分析B、回归分析C、聚类分析D 、主成分分析正确答案: C13. 若数据量较大 ,下面哪种方式比较适合()A、系统聚类B、快速聚类( k-means )C、A 和 B 都可以D 、A 和 B 都不可以正确答案: B14. 在建立线性回归 (Linear Regression) 之前我们可以利用何种方法挑选重要属性,以降低 模型的复杂度?A、皮尔森相关系数B、卡方检定C、T-检定D 、 Z-Score正确答案:

7、 A15. ROC 曲线凸向哪个角,代表模型越理想?A、左上角B、右上角C、左下角D、右下角正确答案: A16. 决策树中的 Information Gain 的计算是用来?A、剪枝B、使树成长C、处理缺失值和异常值D、砍树正确答案: B17. 当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数 据相分离?A、分类B、聚类C、关联分析D、隐马尔可夫链正确答案: B18. 开始将个样品各自作为一类,将规定样品之间的距离和类与类之间的距离,然后将距离最近的两类合并成一个新类, 计算新类与其他类的距离, 重复进行两个最近类的合并, 每 次减少一类,直至所有的样品合并为一类,

8、此种聚类方法是( )A 、 meansB、SOM 聚类C、系统聚类D 、有序聚类正确答案: C19. 关于回归分析,下列说法中错误的是()A、作回归分析的变量之间要有实际意义,不能把毫无关联的两种现象随意进行回归分析,要结合专业知识对 两事物之间是否存在因果关系作出合理解释和结论。y 和自变量 x 都是符合总体正B、在进行线性回归分析进行的数据准备的时候,要求因变量态的随机变量。C、回归直线不要随意外延D、所有非线性回归都可以转化为线性回归正确答案: D20. 下列说明错误的是( )A 、性别 =“男” =职 业 =“司机”,是布尔型关联规则B、性别 =“女” = avg (收入=)2300

9、,是一个数值型关联规则C、肝炎 = ALT (丙氨酸转氨酶)升高,是一个单层关联规则D 、性别 =“女” =职 业 =“秘书”,是多维关联规则正确答案: C21. 在 ID3 算法中信息增益是指()A、信息的溢出程度B、信息的增加效益C、熵增加的程度最大D、熵减少的程度最大正确答案: D22. 如下哪个不是最近邻分类器的特点( )A、它使用具体的训练实例进行预测,不必维护源自数据的模型B、分类一个测试样例开销很大C、最近邻分类器基于全局信息进行预测D、可以生产任意形状的决策边界正确答案: C23. 关于混合模型聚类算法的优缺点,下面说法正确的是( )A、当簇只包含少量数据点,或者数据点近似协线

10、性时,混合模型也能很好地处理。B、混合模型比 K 均值或模糊 C 均值更一般,因为它可以使用各种类型的分布。C、混合模型很难发现不同大小和椭球形状的簇。D、混合模型在有噪声和离群点时不会存在问题。 正确答案: B24. 关于 K 均值和 DBSCAN 的比较,以下说法不正确的是(B、K 均值使用簇的基于原型的概念,而DBSCAN 使用基于密度的概念。C、K 均值很难处理非球形的簇和不同大小的簇,DBSCAN 可以处理不同大小和不同形状的簇。D 、K 均值可以发现不是明显分离的簇,即便簇有重叠也可以发现,但是DBSCAN 会合并有重叠的簇。正确答案: A25. 检测一元正态分布中的离群点,属于异

11、常检测中的基于()的离群点检测A、统计方法B、邻近度C、密度D、聚类技术正确答案: A26. 倒传递神经网络( BP神经网络)的训练顺序为何? ( A:调整权重 ; B:计算误差值 ; C:利用随机的权重产生输出的结果 )A、BCAB、CABC、BACD、CBA正确答案: D27. 假设检验中,拒绝域的边界称为()A、临界值B、临界点C、置信水平D、边际值正确答案: A28. 在有关数据仓库测试,下列说法不正确的是()A 、在完成数据仓库的实施过程中, 需要对数据仓库进行各种测试 .测试工作中要包括单元测 试和系统测试B、当数据仓库的每个单独组件完成后,就需要对他们进行单元测试C、系统的集成测

12、试需要对数据仓库的所有组件进行大量的功能测试和回归测试D、在测试之前没必要制定详细的测试计划正确答案: D29. 某项目预计运行 5 年后的净现值为 4500 万元,如折现率为 16 ,其终值应为()万元 (说明:结果保留两位小数)A、8045.86B、6996.21C、9451.54D 、7000.02正确答案: C30. 迈克尔波特的“五力模型”中,五种竞争力量中不包括 ( )A 、新进入者B、供应商议价能力C、其他利益相关者力量D 、行业中现有竞争者正确答案: C多选题1. 敏感性分析的计算指标有()A、盈亏平衡点B、敏感度系数C、临界点D、净现值正确答案: BCD2. 在 Excel

13、中,要选定 A 到 E 列单元格,操作正确的是( )A 、用鼠标左键单击列号 A ,然后向右拖动鼠标至列号 E,再释放鼠标左键B、左键单击列号 A ,再按下 shift 键不放并用鼠标左键单击列号 E,最后释放 shift 键C、单击列号 A, 然后先按下 Ctrl 键不放,再用鼠标单击 B, C,D,E 列号,最后释放Ctrl 键D、按 shift 键不放,用鼠标左键单击 A,B,C,D,E 的每个列号3. 季节变动主要是由( )引起的。正确答案: ABCA、自然灾害B、政治事件C、制度、法律、习俗D、自然界的季节变化正确答案: CD)后的社会平均利润率。4. 货币时间价值用相对值来表示时,

14、在数量上应当理解为扣除A、时间因素B、通货膨胀因素C、纯粹利率D 、风险因素正确答案: BD)表明该风险因素的风险程度。5. 概率分析中,应计算出(A、变异系数B、期望值C、方差D、标准差正确答案: ABCD6. 定基发展速度与环比发展速度的关系有()。A、各环比发展速度之和等于相应的定基发展速度B、各环比发展速度之积等于相应的定基发展速度C、两个环比发展速度之商等于相应的定基发展速度D、两个定基发展速度之商等于相应的环比发展速度正确答案: BD7. 促销预算的方法主要有( )。A、量入为出法B、竞争对等法C、销售比例法D、目标任务法正确答案: ABCD8. 行业分析数据采集方法有()。A、一

15、手资料B、实地考察法C、专家访谈法D、收集媒体信息正确答案: ABCD9. 决策树法分析问题的主要步骤包括( )。A、结构化问题B、设计可能结果发生的概率C、设计结果的得益D 、分析问题正确答案: ABCD10. 能消除时间序列中的不规则变动和季节变动的方法是()A 、移动平均法B、指数平滑法C、时间序列乘法模型D 、季节指数正确答案: AD11. 确定一个投资方案可行的必要条件是 ( )。A、净现值大于零B、现值指数大于 1C、投资回收期小于 1 年D 、内部报酬率较高正确答案: AB12. 随机对比实验的调查方法的优点是 ( )A、能够测算实验误差B、可以提高实验结果的可靠性C、可以节省分

16、析过程和时间D、费用开支小正确答案: AB13. 下列说法中不正确的是( )A、任何两个变量都具有相关关系B、人的知识与其年龄具有相关关系C、散点图中的各点是分散的没有规律D、根据散点图求得的回归直线方程都是有意义的正确答案: ACD14. 相关分析的任务有( )A、判定现象之间有无关系B、判定现象之间关系的方向C、判定相关关系的紧密程度D、说明现象之间联系的具体形式正确答案: ABCD15. 在比较不同预测方法的精确度时,通常采用()等误差指标来衡量预测误差的大小。A、绝对误差B、相对误差C、平均误差D 、随机误差正确答案: ABC16. 如果自变量有连续型变量,则适用的分类预测方法有()A、逻辑回归B、神经网络C、SVM 算法D 、C4.5 算法正确答案: ABC17. KANO 模型定义的顾客需求层次有( )A、兴奋型需求B、喜爱型需求C、基本型需求D、期望型需求正确答案: ACD18. 下面有关 HAVING 子句的说法中正确的是 ( )A、HAVING 子句必须与 GROUP BY 子句同时使用,不能单独使用B、使用 HAVING 子句的同时不能使用 WHERE 子句C、使用 HAVING 子句的同时可以使用 WHERE 子句D 、使用 HAV

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论