作业帮
作为秋招的首个面试,时间在晚上7点到9点半,面试过程中听到边上大佬在介绍工作时间,大小周制,早10点到晚9点,标准的互联网工作制吧,整体感觉还行,一次面了两面,感觉已经凉凉了,下面是面经:
一面
上来直接拿一张纸直接开始写代码:一道题分三问:(1)声明数据结构,存储节点 (2)给定前序遍历序列,;例如:adcv*dsf,”\代表空”,恢复二叉树 (3)得到后续遍历序列 题目不难,但是第二问脑袋抽筋了,想了很久才写出来。。。 接下来是一道决策求期望的问题,给一枚色子投到几就能够获得几枚金币,第一次投掷后可以选择是否重新投掷,问如何进行决策才能获得最大期望以及最大期望值。
二面
问项目,感觉对项目并不是很感兴趣甚至有点嫌弃…,不说了直接上问题。主要写了四道题吧,第一个机器人寻路问题,在一个m*n的网格中,有多少条路线可以走到终点,好像是剑指offer上的题目吧,递归很简单。 第三个问题是一个概率问题,就是5枚硬币,一枚正面为字背面为人,两枚正反都为人,两枚正反都为字,随机投一枚硬币发现朝上的是字,问另一面也是字的概率,一个典型的贝叶斯估计问题。第四个合并两个二叉搜索树,思路就是先中序遍历两个序列存在数组中,然后合并两个排序数组,在重建二叉搜索树,但是!这里中序遍历的非递归我居然没写出来!!!。
百度 大搜
一面
面试官说的两句话还是挺让人印象深刻的,做模型关键点不在模型算法上,更关键的应该是数据标注和特征提取,之前一直觉得机器学习才是这样,深度学习更主要的模型结构的设计,基本上没有怎么注意特征提取、数据标注,尤其是数据标注,面试官说在真正的大数据场景下是没法使用规则、人工标注的,更多的还是需要采用一定的高级自动化方式。
编程题:1.求非递减数组各个元素平方后组成的非递减数组
2.
两个场景题目:
1.两个文件中存储两个表,表1中存储id,name,locate,表2中存储id,phone,如何合并两个表(内存不支持两个表完全读入)? 他最后的提示是map-reduce思想
2.一个衡量两个query query1和query2语义是否相同的项目,如何进行数据标注,模型结构设计?
数据标注可以结合行为数据进行标注,这种准确度很高,不太需要再去人工调整
直接凉凉…
百度 安全
超长时间面试,从中午11点直接三面面到了下午4点,晕… 希望能有个好结果吧
一面
一上来直接拿了一张纸,上面有3到编程题,3选2,题目都很简单,一道获取数组整数下界,另一道不记得了,然后是算法型题目,记得的1.什么是生成模型、判别模型,两者的应用场景 2.有监督学习黑白样本不均衡对建模有什么影响?怎么去解决? 3.解释什么是概率什么是似然,二者分别在什么情况下进行应用? 4.xgbt是如何进行剪枝的? 5.模型的评价指标都有什么?计算公式 6.三种集成学习都是什么?具体介绍一下是如何进行集成的 然后问了一些模型方面的问题 word2vec原理,有哪两种?优化方式有哪两种?这里问到了具体的word2vec是怎么进行训练的,不是很清楚具体细节,答的不太好 还有就是BN在训练和预测时有什么不同 LR和决策树分别用于什么情况?决策树更适用连续数据还是离散数据?这里我答的是离散,面试官提示说说连续,其实还不是很懂 Kmeans、高斯混合模型 其他就是项目相关的问题的了,大体上就是这些,整体感觉确实很偏向算法基础
二面
这一面主要是问项目的一些细节,包括LSTM、Bert等一些细节问题然后让写了一道算法题,一个矩阵,从左上角走到右下叫最小的路径。
三面
前后来了两个面试官,一个是大数据方向的,和我聊了聊我说对大数据没有太深的了解就换了面试官,这次的面试官看样子像个领导,主要就是聊项目、应用等,最后介绍了下他们这边的情况还有这个岗位的情况
9月底才有消息,等的我真是怕了
阿里云安全
一面
下午突然接到的电话面大约30min,面试官人很好,首先就介绍了他们这边的工作,然后才让我做的自我介绍,自我介绍在,项目聊了很久,然后就是模型、web安全、协议、Linux四个方面基础知识的一些问题,模型方面问决策树是如何决定节点怎么进行分裂的?SVM的核函数是做什么的? web安全方面:什么是csrf?如何进行防御? 什么是xss都有哪几类?DOM型和其他两种类型有什么不同? 协议方面:是否了解traceroute,整个路径跟踪过程是如何实现的?
全部都面完以后才知道这个面试官就是我以后的leader,人真的很好,感觉很幸运。
二面
最后知道面试官是一个另一个组的老大,花名很独特:东厂
三面
HR面
HR面是提前约的视频面,面试过程半小时左右,主要是聊了聊了一些规划以及对安全的看法什么的,其中有几个让我印象比较深刻的问题:1.实习的时候我看到你还投了阿里这边的非安全岗位,当时是怎么考虑的呢? 后来HR告诉我在这里可能看出我至少在当时职业规划还不是很明确,还好我回答的还算不错,巧妙化解了这个问题 2.平时都通过什么进行学习,在安全领域有什么比较崇拜的人?正好我一直关注的大佬都在阿里云,HR也很兴奋,跟我说正好你说的都在这里,开心~ 有什么 3.还有就是问offer情况,问那些这些公司的对比
总裁面
HR面完一个月在正式出结果之前,忽然通知要加一个总裁面,提前去视频会议室看了一下,居然真的是阿里云安全总裁肖力,心里慌得一批,还好最好肖老板因为云栖大会临时换了人,还是一个安全团队的老大:木瓜。面试过程整体比较难,具体细节记得不是很清楚了,除了项目以外,有一些大方向上的问题,比如安全趋势了解、区块链的了解的等等,其次还有一些传统安全相关的了解,问挖洞实践、安全竞赛实践等。
惊险通过,开心得不得了!(面试持续两个月,8.1开始面试,9.28才收到意向书,然而我还是阿里云安全最早的意向书)
美团安全部
一面
面的自我感觉还可以,但是直接凉了,挺迷茫的
腾讯安全部
一面
然后是数据库相关的问题,首先是问有两张表如何进行进行合并 还有就是一个topk问题,我回答了堆排,利用大根堆的方式,但是他问能不能用小根堆,我也答了一种取负值然后进小根堆的方式,他说这个和大根堆有什么区别吗? 让我看能不能快排类似的思想 另外一道题目是map reduce的比较简单,分布在多台主机上的多个文件,如何根据找出topk个数据
总体来说面试难度不难,但是面试体验很差,面试官态度一直就不是很好,而且每道题必须要我想出和他一样的想法,那个topK大根堆、小根堆、快排效率上有什么区别吗,非要按照他的那个快排,感觉对腾讯的好感-1
二面
其他的问题回答的都还比较顺利,只有一个问题没有回答的很好,一道安全场景题:怎么去识别非正常登陆,例如撞库行为,这个问题后来发现阿里云的安全团队也有做过类似的事情,看来是一个比较关键的问题
三面
和面试官聊的还不错,但是因为在深圳所以拒绝了
京东金融推荐算法
一面
在一个酒店里的面试,形式和360类似,但是每天只面一场,面试的部门倾向于金融推荐类,面试官人很好,问的问题最后都会耐心解答最优方法,整体面试感觉真的很nice! 下面是面到的一些问题:对于特别大的离散特征如id特征怎么进行使用?直接one-hot就有向量维度过高的问题 1.使用PCA、LDA进行降维,这种由于向量过于稀疏,不太能使用 2.embedding 是一个高维稀疏向量降维的最佳方法 面试官追问,你说的这个embedding是随机初始化吧?能不能进行考虑一下怎么进行一下预训练? 其实可以通过对利用各个id的前后的点击情况做类似Word2vec的预训练 另一个比较核心的问题是模型正负样本比例不均衡的时候用什么指标?在进行过采样后什么时候可以直接利用模型结果?什么时候需要重新进行换算? 正负样本不均匀的时候最好使用的指标当然是AUC,也可以采用精确率、召回率综合考量 对于排序等只关注先后顺序的任务,可以直接使用预测结果,而对一些带阈值的分类问题,就需要对概率进行重新转化一下
二面
整个面试挺奇怪的,面试官问的问题基本上全部都会打出来了,但是还是被挂掉了,不知道是什么操作
360安全研究院
一共面了3面,具体面了什么都忘了,只记得面的很好,但是过了一个月了,还是没有消息,不知道是不是凉了。。。
互联网秋招就这样结束了,剩下这段时间就是专心做毕设和尝试在找找国企。