你就是我心中最美的太阳 发表于 2024-10-28 20:52:02

《机器学习》在线作业


1、垃圾邮件过滤器是典型的机器学习应用吗?( )
A、正确
B、错误
答案:A

2、机器学习应用可以自适应数据的变化?( )A、正确B、错误答案:A
3、根据是否在人类的监督下训练,可将机器学习系统分为( )。A、监督式学习B、无监督式学习C、半监督式学习D、批量学习答案:ABCD
4、垃圾邮件过滤器是基于实例的学习。A、正确B、错误答案:A
5、机器学习的挑战之一是训练数据不具有代表性( )A、正确B、错误答案:A
6、生活满意度模型是基于模型的学习。A、正确B、错误答案:A
7、加州房价预测模型是一个典型的回归任务。( )A、正确B、错误答案:A
8、一般情况下,数据是存储于关系型数据库(或其它常见数据库)中的多个表、文档、文件。( )A、正确B、错误答案:A
9、数据可视化是数据探索的方法之一。( )A、正确B、错误答案:A
10、重复实现数据转化的方法是建立可复用的转换函数(库)。( )A、正确B、错误答案:A
11、使用 Scikit-Learn 的交叉验证是评估模型的方法之一。A、正确B、错误答案:A
12、网格搜索是一种微调模型的方法。A、正确B、错误答案:A
13、评估系统的表现需要对预测值采样并进行评估。这通常需要人来分析。A、正确B、错误答案:A
14、配置开发环境需要安装python,并安装jupyter notebook等组件( )A、正确B、错误答案:A
15、对数据集调用hist()方法,能画出每个数值属性的柱状图。( )A、正确B、错误答案:A
16、房价预测模型中的数据是放在一个xls文件中。( )A、正确B、错误答案:B
17、散点图可以用于对地理数据(经纬度)可视化。( )A、正确B、错误答案:A
18、散点矩阵可以用探索属性之间的关联程度。( )A、正确B、错误答案:A
19、缺失值处理是数据清洗的内容之一。A、正确B、错误答案:A
20、可以使用自定义转换器为数据集添加新的属性( )A、正确B、错误答案:A
21、在数据清洗后,就可以在测试集上训练和评估数据了。( )A、正确B、错误答案:B
22、交叉验证时需要使用训练集的部分数据来做训练,用一部分来做模型验证。A、正确B、错误答案:A
23、随机搜索是微调模型的方法之一。A、正确B、错误答案:A
24、MNIST 数据集有 70000 张规格较小的手写数字图片。( )A、正确B、错误答案:A
25、评估一个分类器,通常比评估一个回归器更加简单。( )A、正确B、错误答案:B
26、二分类器只能区分两个类。( )A、正确B、错误答案:A
27、可以使用混淆矩阵进行误差分析。( )A、正确B、错误答案:A
28、输出多个二值标签的分类系统被叫做多标签分类系统。A、正确B、错误答案:A
29、MNIST 有 70000 张图片,每张图片有28个特征。A、正确B、错误答案:B
30、实现随机梯度下降分类器 SGD使用 Scikit-Learn 的SGDClassifier类。A、正确B、错误答案:A
31、在Scikit-Learn中,使用OneVsRestClassifier类实现OvO分类策略。( )A、正确B、错误答案:B
32、可以调用confusion_matrix()函数计算混淆矩阵。( )A、正确B、错误答案:B
33、KNeighborsClassifier支持多标签分类。( )A、正确B、错误答案:A
34、直接使用封闭方程进行求根运算,可以得到线性回归模型在当前训练集上的最优参数。( )A、正确B、错误答案:A
35、梯度下降的整体思路是通过的迭代来逐渐调整参数使得损失函数达到最小值。( )A、正确B、错误答案:A
36、可以使用线性模型来拟合非线性数据。( )A、正确B、错误答案:A
37、画出模型在训练集上的表现,同时画出以训练集规模为自变量的训练集函数。( )A、正确B、错误答案:A
38、降低模型的过拟合的方法是正则化这个模型。A、正确B、错误答案:A
39、Logistic 回归(也称为 Logit 回归)通常用于估计一个实例属于某个特定类别的概率。A、正确B、错误答案:A
40、可以通过矩阵的运算(标准方程)求解线性回归模型。A、正确B、错误答案:A
41、梯度下降算法包括批量梯度下降、随机梯度下降和小批量梯度下降三种( )A、正确B、错误答案:A
42、在多项式回归时,可以使用 Scikit-Learning 的PolynomialFeatures类进行训练数据集的转换,让训练集中每个特征的平方(2 次多项式)作为新特征。( )A、正确B、错误答案:A
43、学习曲线是模型在训练集和验证集上关于训练集大小的性能函数。( )A、正确B、错误答案:A
44、鸢尾花数据集包含 150 朵三种不同的鸢尾花的萼片和花瓣的长度和宽度。( )A、正确B、错误答案:A
45、支持向量机可用于大规模的数据分类问题。( )A、正确B、错误答案:B
46、支持向量机是一种监督式学习算法。( )A、正确B、错误答案:A
47、硬间隔是将数据完全分类准确,不存在分类错误的间隔。( )A、正确B、错误答案:A
48、惩罚参数C值越大,分类间隔也越大。( )A、正确B、错误答案:B
49、支持向量机的向量从低维到高纬映射过程中,会增加计算的复杂度。( )A、正确B、错误答案:A
50、支持向量机算法在引入核函数时要考虑到算法的复杂度。( )A、正确B、错误答案:A
51、支持向量机只能进行线性或非线性的分类问题分析。( )A、正确B、错误答案:B
52、支持向量机的核函数的选择要根据数据集特征数和样本数来确定。( )A、正确B、错误答案:A
53、决策树算法只适用于分类判别分析问题。( )A、正确B、错误答案:B
54、应用决策树算法时不需要过多的数据标准化处理。( )A、正确B、错误答案:B
55、决策树算法中,信息熵可作为其树节点划分的一个依据。( )A、正确B、错误答案:B
56、决策树算法中,节点划分时要进行必要的剪枝操作,防止过拟合现象。( )A、正确B、错误答案:A
57、决策树算法是一种贪心策略算法。( )A、正确B、错误答案:A
58、CART算法是用悲观剪枝策略进行剪枝处理。( )A、正确B、错误答案:B
59、集成学习中流行的几种集成方法,包括( )。A、baggingB、boostingC、stackingD、SVM答案:ABC
60、当预测器尽可能互相独立时,集成方法的效果最优。( )A、正确B、错误答案:A
61、关于自助法,以下说法错误的是( )。A、给每个预测器的训练子集引入了更高的多样性B、预测器之间的关联度更低C、集成的方差增高。D、bagging比pasting的偏差略高答案:C
62、随机森林在书的生长上引入了更多的随机性,体现在( )。A、分裂节点时搜索最好的特征B、决策树的多样性降低C、在一个随机生成的特征子集里搜索最好的特征。D、以上都正确答案:C
63、若AdaBoost集成过度拟合训练集,可以采用的方法有( )。A、减少估算器数量B、增加估算器数量C、降低基础估算器的正则化程度D、提高基础估算器的正则化程度答案:AD
64、梯度提升与AdaBoost的不同之处在于( )。A、新的预测器针对前一个预测器的残差进行拟合B、逐步在集成中添加预测器C、每个预测器对其前序做出改正D、以上都是答案:A
65、在堆叠法中,训练混合器常用的方法是使用留存集。( )A、正确B、错误答案:A
66、使用堆叠法只能训练出一种混合器。( )A、正确B、错误答案:B
67、在一个 1,000,000 维的超立方体中随机抽取两点,其平均距离为( )。A、0.52B、0.66C、408.25D、无法计算答案:C
68、关于数据降维的主要方法,以下说法正确的是( )。A、主要有投影和流形学习两种方法B、投影是将高维空间的训练实例投影到低维子空间内vB.C、流行假设认为大多数现实世界的高纬度数据集存在一个低维度的流行来重新表示¥CD、流行假设总是成立答案:ABC
69、主成分的方向( )。A、不稳定的B、稳定C、在任何情况下都不会旋转、互换D、它们定义的平面会改变答案:A
70、实现主成分分析的问题在于需要整个训练集都进入内存,才能运行SVD算法。( )A、正确B、错误答案:A
71、关于核主成分分析,以下说法正确的是( )。A、使用了核技巧B、使复杂的非线性投影降维成为可能C、擅长在投影后保留实例的集群D、有时能展开近似于一个扭曲流行的数据集答案:ABCD
72、核主成分分析方法没有明显的性能指标来帮助选择最佳的核函数核超参数。( )A、正确B、错误答案:A
73、局部线性嵌入( )。A、依赖于投影B、是一种流形学习技术C、不擅长展开弯曲的流行D、以上都不对答案:B
74、以下属于降维技术的有( )。A、 MDSB、lsomapC、t-SNED、LDA答案:ABCD
页: [1]
查看完整版本: 《机器学习》在线作业