面试问题

Tencent

  1. 熟悉哪个排序算法,说一下快排

    忘记说分治递归思想了

  2. ssd和yolo区别,为什么检测小目标效果不好

  3. 为什么会梯度爆炸–batch_size,learing_rate,nn的bp缺点

    one-stage,无proposal,后几层的feature-map提取,感受野较大

  4. faster-rcnn相比fast-rcnn作出的改进

    只回答了rpn,其他忘记

  5. x光项目为什么不用ssd或yolo

  6. 说一下k-means算法,欧式距离和街区距离的异同

阿里巴巴-主机安全团队:

  1. 你了解的安全

    攻击和防御,防御模块了解操作系统流程,二进制安全,逆向工程,检测反编译文件,虚拟机去编写测试脚本,脚本虚拟机

  2. 文件中查找符合规则的字符,为什么要有正则表达式

    二分对有序,正则,长字符串查匹配的子串,KMP

    有关正则

    DFA和NFA。主要是注意到正则表达式竟然是基于一种纯数学的理论稍加修改而成的数据结构。D就是确定,N就是不确定,确定和非确定有穷状态自动机最后将产生相同的结果,但路径不同。(这跟P与NP也能扯上关系啊,NP>=P,那是不是就是说NFA还是比较强大的【其实一直不明白为什么NP>=P】。但明明是DFA先出现,而基于DFA的正则引擎却后出现。)
    NFA引擎较先出现,匹配效率对表达式的质量依赖很强(所以书中说NFA是基于表达式的,拿着正则式对文本,对上了记录,/perl|perlman/来匹配文本 ‘perlman book’,匹配到第一个perl看到m不继续匹配,吐出m,向上汇报匹配到第一个正则式即可,因为相当于在状态空间做了一次DFS,找到匹配之前可能已经经过了很多回溯。

    而DFA与表达式的质量无关,所有等价的表达式的效率都一样,它是由文本驱动的,当看到 /perl/ 之后,DFA不会停,会尝试再吃一口。这时候,第一个子正则式已经山穷水尽了,没得吃了,于是就甩掉它,去吃第二个子正则式的/m/。

    由此可知,要让NFA正确工作,应该使用 /perlman|perl/ 模式。

    通过以上例子,可以理解为什么NFA是最左子式匹配,而DFA是最长左子式匹配。

    但学习正则表达式的乐趣其实是NFA,它有更大的改进空间,而且支持反向引用(还有一个特性也是DFA不支持的现在一时想不起)。很难想像没有反向引用regex还有什么意思。

Bytedance

  1. 有序数组删除一个离x值最近的元素
  2. 卷积操作求矩阵最大卷积值

雷火

  1. sigmoid和relu的导数;优势;
  2. drop如何防止过拟合,如何处理反向传播的梯度
  3. max 间隔距离 s.t. Yi(wTXi+b)>= 1的对偶形式
  4. mountain数组
  5. 字典排序数组

商汤华为

  1. 智能指针了解吗,share_ptr和unique_ptr
  2. 旋转矩阵算法,说用两个for做 他问有没有优化的方法
  3. cpp的多态,手写实现一下—–手写不太顺畅
  4. 让你做一个windows或linux系统,除了内核要封装几个层
  5. 行人检测项目你觉得比较难的是哪一块(说了数据处理转化,说自己python写的又是一通问)
  6. 特征金字塔讲一下

云从

  1. 算法:判断是否是回文字符串+最长回文字符串+一个字符串到另一个字符串的最少修改次数
  2. 动态规划和贪心的区别,又给了一道题写一下dp的递推式,
  3. 项目:yolov3整个流程,和ssd的区别,重点说一下他们anchor的区别,v3对大目标和小目标分别是怎么做的,为什么小目标精确度提高很多,ssd怎么应对小目标的。。。车道线检测都是用传统的图像处理吗?

    v3_loss += xy_loss + wh_loss(regressionLoss) + confidence_loss(iouLoss) + class_loss

  4. ML:手推SVM,BP和softmax的公式,听说前面一个问到一半有点崩溃面试官不好意思再问了。。。还好我心态好
  5. 你这个x光图片的项目如果数据集不够你会怎么做,讲一下CTC

先研院

  1. 讲一下贝叶斯,这都是朴素贝叶斯
  2. 讲行人检测和slam,可以理解为只跑了个demo吗

  3. 项目自己对接的数据集

  4. opencv补色变换可以讲一讲
  5. 傅立叶与反变换
  6. 为什么要进行空域处理
  7. 采样定理,如果不满足前后周期干扰,表现形式就是图像的混淆
  8. 不用DFT我们用FFT–O(nlogN)
  9. 频域滤波的过程第一步第二部第三部
  10. 频率滤波器,高通滤波器,带通带组,同态滤波,理想又振铃效应,福特沃斯,高斯三种

xml_to_csv:
用os模块listdir函数读取某路径下所有文件名到list
if(.endwith)筛选以xml结尾的
用xml.etree打开xml在其中找到字符串信息
存入pandas定义的df里即可