@changedi
2019-03-21T14:10:47.000000Z
字数 4542
阅读 3100
机器学习
1.梯度下降算法的正确步骤是什么?
下列哪一项在神经网络中引入了非线性?
https://zhuanlan.zhihu.com/p/39185031
CNN的卷积核是单层的还是多层的?
什么是卷积?
https://zhuanlan.zhihu.com/p/39367605
https://zhuanlan.zhihu.com/p/39450005
什麽样的资料集不适合用深度学习?
https://zhuanlan.zhihu.com/p/39533743
广义线性模型是怎被应用在深度学习中?
深度学习常用方法。
https://zhuanlan.zhihu.com/p/39619083
神经网络中激活函数的真正意义?一个激活函数需要具有哪些必要的属性?还有哪些属性是好的属性但不必要的?
梯度爆炸会引发什么问题?
简单说下sigmoid激活函数
GRU是什么?GRU对LSTM做了哪些改动?
https://zhuanlan.zhihu.com/p/39965633
请简述应当从哪些方向上思考和解决深度学习中出现的的over fitting问题?
不平衡数据是否会摧毁神经网络?
https://zhuanlan.zhihu.com/p/40051944
你如何判断一个神经网络是记忆还是泛化?
初始化如何影响训练?
请简单解释下目标检测中的这个IOU评价函数(intersection-over-union)
https://zhuanlan.zhihu.com/p/40217488
什么是边框回归Bounding-Box regression,以及为什么要做、怎么做
CNN的特点以及优势
https://zhuanlan.zhihu.com/p/40396143
深度学习中有什么加快收敛/降低训练难度的方法?
神经网络中会用到批量梯度下降(BGD)吗?为什么用随机梯度下降(SGD)?
https://zhuanlan.zhihu.com/p/40476884
在选择神经网络的深度时,下面哪些参数需要考虑?
当在卷积神经网络中加入池化层(pooling layer)时,变换的不变性会被保留,是吗?
https://zhuanlan.zhihu.com/p/41070455
输入图片大小为200×200,依次经过一层卷积(kernel size 5×5,padding 1,stride 2),pooling(kernel size 3×3,padding 0,stride 1),又一层卷积(kernel size 3×3,padding 1,stride 1)之后,输出特征图大小为
在一个神经网络中,知道每一个神经元的权重和偏差是最重要的一步。如果知道了神经元准确的权重和偏差,便可以近似任何函数,但怎么获知每个神经的权重和偏移呢?
https://zhuanlan.zhihu.com/p/41155891
如果我们用了一个过大的学习速率会发生什么?
下列哪个神经网络结构会发生权重共享?
https://zhuanlan.zhihu.com/p/41242084
下列哪个函数不可以做激活函数?
假设你需要调整超参数来最小化代价函数(cost function),会使用下列哪项技术?
https://zhuanlan.zhihu.com/p/41416712
在感知机中(Perceptron)的任务顺序是什么?
在训练神经网络时,损失函数(loss)在最初的几个epochs时没有下降,可能的原因是?
https://zhuanlan.zhihu.com/p/41504057
深度学习与机器学习算法之间的区别在于,后者过程中无需进行特征提取工作,也就是说,我们建议在进行深度学习过程之前要首先完成特征提取的工作。这种说法是:
提升卷积核(convolutional kernel)的大小会显著提升卷积神经网络的性能,这种说法是
https://zhuanlan.zhihu.com/p/41586262
线性分类器与非线性分类器的区别以及优劣
简单说说贝叶斯定理
https://zhuanlan.zhihu.com/p/30926070
说下红黑树的五个性质
简单说下sigmoid激活函数
https://zhuanlan.zhihu.com/p/31097559
说说梯度下降法
说说共轭梯度法
Python是如何进行内存管理的?
https://zhuanlan.zhihu.com/p/31258681
说说常见的损失函数
简单介绍下logistics回归
https://zhuanlan.zhihu.com/p/31305871
在分类问题中,我们经常会遇到正负样本数据量不等的情况,比如正样本为10w条数据,负样本只有1w条数据,以下最合适的处理方法是( )
https://zhuanlan.zhihu.com/p/31337162
Nave Bayes是一种特殊的Bayes分类器,特征变量是X,类别标签是C,它的一个假定是
https://zhuanlan.zhihu.com/p/31366886
RNN是怎么从单层网络一步一步构造的的?
https://zhuanlan.zhihu.com/p/31537794
标准化与归一化的区别?
https://zhuanlan.zhihu.com/p/31607791
随机森林如何处理缺失值
如何进行特征选择?
https://zhuanlan.zhihu.com/p/31682499
数据预处理
如何理解LSTM网络?
https://zhuanlan.zhihu.com/p/32157649
Bagging与Boosting的区别
https://zhuanlan.zhihu.com/p/32226365
L1与L2范数
特征比数据量还大时,选择什么样的分类器?
https://zhuanlan.zhihu.com/p/32362052
数据清理中,处理缺失值的方法是?
https://zhuanlan.zhihu.com/p/32396385
带核的SVM为什么能分类非线性问题?
什么是共线性, 跟过拟合有什么关联?
机器学习中,有哪些特征选择的工程方法?
https://zhuanlan.zhihu.com/p/32656102
bootstrap数据是什么意思?
https://zhuanlan.zhihu.com/p/32738678
我们想在大数据集上训练决策树, 为了使用较少时间, 我们可以
https://zhuanlan.zhihu.com/p/32808814
对于维度极低的特征,选择线性还是非线性分类器?
https://zhuanlan.zhihu.com/p/33016414
SVM、LR、决策树的对比
常用的聚类划分方式有哪些?列举代表算法。
https://zhuanlan.zhihu.com/p/33057428
特征向量的归一化方法有哪些?
https://zhuanlan.zhihu.com/p/33177339
优化算法及其优缺点?
下面哪个/些超参数的增加可能会造成随机森林数据过拟合?
https://zhuanlan.zhihu.com/p/33206641
ID3、C4.5、CART、随机森林、bagging、boosting、Adaboost、GBDT、xgboost算法总结
https://zhuanlan.zhihu.com/p/34534004