1.运维团队多少人,在其中负责什么东西
2.容器化有没有参与过私有化的部署
3.为什么用EFK而不用ELK,两者的区别是什么
4.对于CICD熟悉吗,简单说下你们公司CICD的流程
5.你们k8s是自建还是用云的,你觉得用云跟自建的区别是什么
6.你觉得prometheus跟zabbix有什么区别,你会怎么选择
7.Mysql做了哪些监控项
8.你个人觉得哪个项目做得不错,可以介绍一下
9.K8s里master有哪些核心组件,分别是做什么用的?

kube-aipserver处理api请求 资源操作入口

etcd 存储k8s集群状态数据和配置信息(k8s的数据库)

kube-scheduler 负责监视新创建的pod,并基于算法分配到一个节点运行

controller Manager 管理各个控制器,对k8s资源进行管理

Node的组件

kubelet 负责与master通信,并管理机器上的容器

kube-proxy 负责集群service的网络代理,pod和外部的通信

10.有一个pod,这个服务是在运行的,现在我重新打包了这个服务,打包了一个镜像,需要更新这个pod,这个时候它的一个整体流程是怎样的
11.你认为你个人优点是什么,近期有在学什么内容吗,学哪些方面
12.服务器准备安装K8S需要设置哪些参数优化

关闭swap分区提高效率,开启流量转发使iptables看到桥接流量,内核模块开启ipvs等

13.公司的大概规模是多少,你们部门的架构是如何,如有多个运维,你们如何分工(项目/模块)?
14.旧的公司的具体业务是做什么的?
15.在过去的公司主要用的哪些技术?
16.说一下你们之前版本迭代有什么制度或者流程
17.Windows服务器有没有使用了解过
18.MySQL主从复制的原理

主服务器上面的修改会保存在Bin-log日志里面。从服务器上面启动一个I/O线程, 连接到主服务器上面请求读取Bin-log日志,然后写到本地的Realy-log里面。同时开启一个SQL线程,读取Realy-log(中继日志),把更新的内容在本机的数据库上面执行一遍。随后将执行完的relay-log删除

19.Oracle有接触过吗。
20.如果我们有一个新的项目需要部署高可用,请你说一下大致方案
21.如果要配置网站的https协议,可以在什么地方进行配置呢
22.讲一下zabbix的原理吧,除了zabbix还用过什么监控软件吗
23.常见的linux系统优化有哪些
24.了解等保吗,简单描述一下等保要做什么
25.谈一下你对运维工作的理解
26.未来的职业规划大概是什么走向
27.Redis切片集群跟Redis普通的主从哨兵架构有什么区别
28.以前公司mysql的备份流程和方案,全备多大,增备多大
29.Redis的工作原理
30.以前公司服务器架构
31.zabbix监控了什么
32.写过什么shell脚本
33.ansible做过什么,用过什么模块,cmd模块有什么符号不能用
34.elk或efk怎么部署的
35.docker常用命令
36.k8s的优势是什么
37.日常的工作内容
38.Tomcat,nginx等web服务器用来干嘛
39.haproxy和lvs的区别
40.MySQL集群是怎么样的,Redis用来做了什么
41.k8s的架构,由哪些组件组成,kube—proxy网络有哪两种
42.数据库、中间件等软件升级方式
43.OSI七层模型
44.常用加固系统安全方法或方式
45.系统常用基础命令
46.同一个网段内两台服务器,当B服务器80端口正常开放且正常时,A服务器无法访问的原因有那些或解决办法。
47.如果服务器远程登录不了如何排查
48.如何挂载一个新磁盘
49.挂载上了系统,但是系统无法启动,可能是什么问题
50.忘记mysql密码如何修改
51.你们公司负责的业务一般多久迭代一次
52.k8s的服务暴露主要有几种
53.你的五险一金的比例是多少
54.redis从2g飙升到7g的话从业务上面你会如何排查
55.mysql双主需要注意什么
56.efk如何收集k8s日志
57.平时用什么工具去巡检的,巡检哪些指标
58.云服务器和物理服务器有什么不同和优劣
59.oracle和mysql的区别
60.$?、$0、$#、$@、$*、$$的意思
61.dockerfile是干什么的
62.写一下elk的数据流框架
63.nginx调优、日常故障处理思路
64.现在一个APP的软件,如果APP延迟过高 你觉得会有哪些可能性?
65.有十台云服务器,如果是你来做服务器端运维,你会怎么对他们进行管理
66.app切换时某个界面白屏了,可能有哪些问题
67.kafka和rabbitmq的区别
68.怎么应对高并发场景
69.了解哪些虚拟化的软件
70.对网络安全的理解
71.常用命令,查询内存,查看磁盘大小,查看Nginx日志具体命令,如何用awk筛选打印出访问ip
72.上家公司的人员有多少
73.开发查看日志的方式
74.了解KVM虚拟技术吗
75.了解iptables吗?介绍一下
76.如果文件系统损坏了,而硬盘是好的你会如何恢复
77.如果客户说他们服务器无法上网了你会如何进行处理
78.如果服务器卡顿了你是如何处理的
79.redis有做过运维吗?有没有遇到过什么问题具体说一下,怎么解决的?
80.如果现在有一个服务器磁盘满了,说一下你写脚本的思路?
81.你zabbix是实时采集的还是能看历史的?如果看历史的需要做哪些工作?
82.主从同步出现问题的话从哪里去查哪里入手?比如同步从库出问题?如何查看同步是否有延迟?
83.nginx流量大 想从配置文件上做优化怎么做?
84.为什么同时用rabbitmq和redis,做缓存的话一个就够了
85.除了公司领导给的任务有没有做过什么其他的对公司架构优化之类的工作
86.你们mysql主库挂了怎么办
87.tomcat负载100%你怎么处理
88.怎么保证用户的会话一致性
89.nginx怎么确定配置文件语法对不对,如何热加载
90.你们的nginx负载策略是什么,nginx怎么确定配置文件语法对不对,如何热加载
91.对mysql的主从有做监控吗,如果挂了怎么办
92.收集日志用了什么工具
93.你们的自动化上线怎么实现的
94.你们版本升级的时候需不需要停机
95.灰度发布的时候怎么进行流量控制的
96.版本升级时app也要版本更新你们是怎么对接的
97.版本更新的时候数据库需不需要变更,你们是怎么实现的
98.redis集群出现异常节点怎么处理,有没有监控命中率
99.有没有日志的链路跟踪(没有),那你们逐步排查的话日志量很大,你们的用户量多少
100.如果访问返回错误码,你要怎么排查
101.了解网络方面的知识吗,子网掩码知道吗,有没有做过安全方面的漏洞修复或检查
102.以前的公司有没有工单管理系统,简单介绍一下
103.oa系统提交流程时在某个节点无法流转、如何排查
104.假如对oa系统监控你能做到多细
105.有没有做过应用系统的备份
106.docker的工作原理
107.容器运维这方面还有什么其他相对高级一点的开源或者是能力你需要掌握的、容器化有没有参与过私有化的部署
108.K8S集群是使用搭建好的还是自己手动部署的
109.搭建K8S集群时有没有遇到过什么问题比较深刻
110.你们K8S的服务暴露方式是什么
111.你们ELK日志收集系统的日志量是多少
112.如何清理ES的历史日志的?用ES内部定时清理还是其它方式
113.你们生产环境一共有几台服务器,如何划分的?
114.日活量数据大概是多少
115.生产服务器是云还是本地,有用云服务器吗
116.之前服务器的监控方式是怎么样的
117.Jenkins里面有几个project?
118.你们K8S集群是你一个人搭建的吗,这个发布流程(CICD)也是你搭的吗
119.搭建K8S集群有什么印象深刻的问题吗或者是开发那边有什么需求吗,解决了吗
120.你花了多久将这个CICD发布流程迁移到K8S的
121.制作镜像容器的DOCKERFILE是你写的吗
122.看你这边有写一个日志收集平台的工作,假设你接收一个项目,需要设计日志收集系统,项目应用会很多,日志量也非常大,你会如何设计?
123.你们的监控系统主要有监控哪些信息呢
124.你这边写过很多的shell脚本是吗,能介绍一些你觉得写了比较有用的脚本吗?
125.Prometheus接触过吗?了解过它和Zabbix的区别吗
126.公有云这块有了解过吗?阿里云,华为云,亚马逊云这些
127.我们这边机器数量比较庞大,假设让你管理,你会如何去管理呢,可能会涉及到项目、环境的区别
128.如果你们的系统访问起来特别慢,说一下你的排查思路?
129.你这边提到的安全那块,你们是如何管理的?
130.假设你们有个紧急版本需要发布或者debug,发布的流程是怎么样的?
131.你如何理解灰度发布
132.如何保证你们业务系统的一个可用性?
133.你刚刚讲的是应用层面的,有没有接触过网络架构或者服务器架构这一块来做的?
134.那有接触过网络协议之类的吗,讲一下ISO7层协议是哪7层?
135.有哪些常用的网络工具,能介绍一下吗
136.有接触过K8S做计算的场景吗?
137.接触过其它大数据相关的应用吗
138.有进过机房或者数据中心吗
139.有进过公有云的管理台吗
140.了解阿里云的K8S用的什么组件吗
141.你们测试环境的机器是虚拟机还是物理机?用什么搭建的?你是有这个管理权限吗
142.接触过虚拟机集群的管理吗?比如Vcenter
143.了解过KVM吗?工作中用过吗?
144.你们的巡检方式是怎么样的,脚本是你自己编写的吗?
145.简单描述一下你说的这个漏洞修复工作
146.你们之前的日志收集系统的整个架构用了多少台机器?整个流程是怎样的呢?是你自己搭建吗?有对日志做什么处理吗(展示、切割等)
147.之前主要用过什么监控软件?zabbix由什么构成的?
148.有做过什么中间件的监控吗?比如数据库、MQ、Redis的监控,如何实现的?
149.有实际搭建过Prometheus的监控告警项吗
150.后续的职业规划是怎么样的?你认为自身的优点是什么?
151.K8S自我评价一下掌握的程度有多少
152.能深度说一下kubelet的功能吗,它是如何保证一个容器的运行和存活的?
153.如果一个Node节点的kubelet挂了,会有什么影响?
154.一个pod处于pending状态有哪几种可能?
1.集群资源不足 2.调度失败 3.内部运行错误多次重试失败 4.拉取失败 5.持久卷分配失败
155.我现在启用一个pod,它是如何去调用这些k8s组件的?
156.pod的网络资源和磁盘资源是由什么容器去管控的的?
157.你所接触的最大的k8s集群有多大?如何分配角色的?
158.你的K8S的技术是从哪里学习的?
159.K8S控制器有哪些类型?区别是啥
160.如果原本一个pod是两个副本,我想要扩容成三个副本,如何操作?
161.K8S的service有几种类型啊
162.无头service的应用场景是什么?
163.如果有一个容器要访问集群外部的数据库访问不同,你会考虑在哪些地方出问题,越多越好?
164.如果出现这种问题你会用什么网络工具去排查?
165.tcpdump有用过吗?用来做什么的
166.像apiserver的端口和etcd的端口记得吗
默认apiserver在6443、etcd在2379
167.不同命名空间下的容器想要互相通信,能怎么实现
168.calico和flannel的区别是什么?
169.K8S和Docker的区别?说一下你的观点(使用场景等等)
170.K8S的持久化存储有哪几种?
171.Secret和Configmap使用过吗?知道用来干嘛吗
172.shell脚本能力如何?python能力如何?元组和列表的区别是什么?
173.python的优点是什么?它是解释性的语言吗?
174.Linux系统常用的命令都OK吗?
175.Redis有实际使用经验吗?MySQL的基础操作都会吗?
176.HDFS有没有使用过
177.你们数据库的备份方式和策略是怎么样的?没有备份的话如果出现误操作如何恢复?
178.如何在同一机器上使用不同的python环境?
179.你们这个可视化资源监控平台的用处是什么?
180.有了解过怎么把软件画的图从Linux上通过Xshell的转发方式可视化吗
181.calico的隧道模式有几种?有什么区别

vxlan、ipip、bgp

182.如何去判断calico是否正常工作?

检查calico组件状态:看calico的各个pod是否正常工作

测试pod连通性:在一个pod测试能否联通另一个pod(最好在不同主机上)

查看节点状态:查看各node是否ready

183.两台机器上的pod之间是如何通信的?除了Kube-proxy
184.kube-proxy最终是由什么去实现的?
iptables和ipvs
185.ipvs和ipatbles有什么差异?
ipvs是专为负载设计的内核功能,性能强
iptables则是防火墙工具,实现流量的拦截、转发,规模大时可能存在性能瓶颈
186.etcd如何去监控它的性能

可以接入Prometheus

187.单主的etcd是如何被启用的?如何去定义编排

在init.yaml中定义

188.deployment和statefulset有什么区别?

无状态服务一般启动不需要初始数据和启动顺序、有状态服务则相反

189.这二者生成的pod的名字上、更新策略上有什么区别?

deployment一般是控制器+随机名字

statefulset则有确定顺序

190.ES有做什么架构上的设计吗

master节点只存储集群元数据、不存储实际数据、处理故障转移、切片分配等

data节点存储实际索引数据、处理读写操作

191.ES坏了一台其它两台还能工作是基于什么工作原理?

分片式存储、自动故障转移、一致性哈希

192.如果需要实现ES坏了两个节点还能正常工作要怎么配置

集群规模大的情况下、为每个切片设置两个副本

193.Redis怎么做集群呢,主节点坏了如何切换呢?
194.这些中间件是跑在机器上的还是k8s集群中的?
195.K8S使用中有遇到过什么问题是你觉得是K8S的bug或者设计问题?
196.K8S的service解析是什么去做的?

CoreDNS

197.iptables的四表五链了解过吗?

四表:Filter:默认表,用于控制数据包的访问(允许或拒绝)。它包含 INPUT、FORWARD 和 OUTPUT 三条链。

NAT(Network Address Translation):用于网络地址转换,如源地址转换(SNAT)和目的地址转换(DNAT)。它包含 PREROUTING、POSTROUTING 和 OUTPUT 三条链。

Mangle:用于修改数据包的内容,如调整 TTL 值、设置 QoS 等。它包含 PREROUTING、INPUT、FORWARD、OUTPUT 和 POSTROUTING 五条链。

Raw:用于配置数据包的早期处理,可以绕过某些内核优化。它只包含 INPUT、OUTPUT 和 FORWARD 三条链。

五链(Chains):

INPUT:处理进入本机的数据包。

OUTPUT:处理从本机发出的数据包。

FORWARD:处理经过本机但目的地不是本机的数据包。

PREROUTING:在路由决策之前处理到达的数据包,通常用于 DNAT。

POSTROUTING:在路由决策之后处理即将离开本机的数据包,通常用于 SNAT。

198.Filter有哪几个链?forward链是什么流量?
199.raid阵列有哪几种?有什么区别?
200.GPU、网卡一般接在服务器的什么接口?
201.你们ES的集群架构、ES有什么组件、高可用是怎么部署的
202.ES的Master是怎么选举出来的?
203.kafka集群包含什么组件、集群架构是怎么样的
204.K8S的etcd集群架构是怎么样的?它的一个原理是什么
205.有没有了解一些分布式的算法协议,如raft、Paxos
206.假设需要监控的应用处于假死状态应该怎样监控到呢?
207.虚拟化技术的底层实现了解过吗(软件层面)
208.如果K8S应用出现内存溢出情况如何处理
209.你们K8S的持久化卷是用什么做的?
210.python的垃圾回收机制(GC)了解过吗
211.pod的重启策略有哪几种

Always、OnFailure、Never;默认值为Always

总是重启、应用非正常退出(非0返回码)重启、从不重启

212.深浅拷贝有什么区别?

浅拷贝相当于两个变量指向同一个内存,深拷贝是开辟一个新的内存去存储

213.ESXI和KVM有什么区别呢?

ESXi:直接运行在物理硬件上

KVM:是Linux内核的一部分,需要在Linux系统上运行

214.虚拟机漂移了解过吗?你们是直接重启关机吗?
215.docker容器的进程可以怎么查看

ps aux

docker ps

216.打包镜像一般用什么命令

docker save xxx -o xxx.tar

217.ETCD主要是用来做什么的?使用于什么场景
    1.配置共享、服务发现 2.键值存储:如k8s元数据 3.分布式存储
218.kubectl和kubelet有什么区别?用户可以使用kubelet吗?

Kubectl是一款用于管理和操作k8s的一个标准 CLI它通过与apiserve交互来实现对集群内资源的增删改查。

Kubelet是一个代理组件,运行在每个节点上。定期从kube-apiserver组件接收新的或修改的Pod规范,并确保Pod及其容器在期望规范下运行。同时该组件作为工作节点的监控组件,向kube-apiserver汇报主机的运行状况。

kubelet不应该被开放给用户,他是在每个节点上用来保障当前节点的操作满足集群整体要求的组件。

219.环境部署的时候有使用过ansible批量部署吗
220.你们K8S集群维护遇到过什么问题,如何解决的?
221.Jenkins自动触发除了webhook还能怎么做?

使用Jenkins的远程API,可以远程触发构建。

222.你们一次CICD的时间大概多久?你有考虑过如何去缩短吗
223.DockerFILE中的ARG是什么意思,有什么作用?ENTRYPOINT和CMD有什么区别?

ARG是变量,可以在build时从命令行传入参数作为变量

Entrypoint用于指定容器启动时要运行的应用程序,CMD 是为 ENTRYPOINT 提供默认选项。

CMD会被run时指定的命令覆盖

ENTRYPOINT优先级高于 CMD,并且无论是否提供 docker run 后的命令,都会执行此命令,并将 docker run 后的参数追加到 ENTRYPOINT 后。

224.K8S的pod日志怎么收集有了解过吗(如何从stdout中拿到)
225.K8S的网络有去划分吗
226.Kubectl如何存储一个token凭证?
227.git merge 和 git rebase有什么区别

merge会保留提交历史、rebase不会

228.MySQL如何确定从库已经同步上主库了

SHOW SLAVE STATUS会返回Seconds_Behind_Master值,这个值表示从库在复制主库的更改时落后了多少秒。如果这个值是0,表示从库已经完全同步了主库的数据。

SQL查询表记录数是否相等、如果有时间戳字段可以对比最新的时间戳是否相等

229.如果做监控的话如何去获取这个监控项
230.如果数据库出现执行SQL慢、如何排查这个瓶颈在哪
231.不进入数据库如何查看它现在有多少连接数
232.一个TCP链接可能有多少状态?

LISTEN:服务器端套接字,等待连接。

ESTABLISHED:连接已建立,数据可以传输。

SYN-SENT:连接尚未建立,发送连接请求。

SYN-RECEIVED:连接尚未建立,收到连接请求。

FIN-WAIT-1:等待远程TCP的连接终止报文确认。

FIN-WAIT-2:从远程TCP接收到连接终止请求,等待本地应用程序关闭连接。

CLOSE-WAIT:远程TCP已关闭连接,等待本地TCP关闭连接。

CLOSING:同时发送和接收连接终止请求。

LAST-ACK:等待原来发出的连接终止请求的确认。

TIME-WAIT:等待足够的时间以确保远程TCP接收到连接终止的确认。

CLOSED:连接没有被使用,处于关闭状态。

UNKNOWN:状态未知或无法确定。

233.Linux的监听端口范围是多少?都可以使用吗?

1-65535

知名端口(Well-known ports):范围从1到1023,这些端口通常被分配给常见的服务和应用程序。例如,HTTP服务通常监听端口80,而HTTPS服务监听端口443。

注册端口(Registered ports):范围从1024到49151,这些端口可以由用户或应用程序用于特定的服务,但最好是注册使用以避免冲突。

动态或私有端口(Dynamic or Private ports):范围从49152到65535,这些端口通常不分配给特定服务,而是由各种客户端应用程序在需要时临时使用。

234.用K8S启用一个nginx的pod需要做什么动作,会调用哪些组件?
235.ingress和Nodeport暴露的区别
236.service有几种类型?有什么分别
237.deployment的pod我想指定在某个节点运行该怎么做?如果不想要其它pod在上面运行要怎么做?
238.在k8s里如何部署Prometheus?如何存储数据?
239.Prometheus的查询语句有写过吗
240.出现磁盘告警你会如何排查
241.如果流量突然增高你会如何去定位应用,实时流量监控的命令用过吗
242.如何查看某个应用或端口建立的网络连接数量?如果出现大量TIMEWAIT你会如何排查
243.MySQL有设置什么监控指标吗?遇到过什么瓶颈吗,如何解决的
244.连表查询会吗
245.滚动更新会使service的ip改变吗?
246.Nginx的pod的解析缓存时间参数你是怎么修改的?除了这个解决方式还有其他思路吗?
247.外部访问Tomcat的流程是什么?
248.有没有使用过xxjob
249.如果系统经常CPU负载很高或者数据库负载很高,你会做什么处理?
250.接触过什么系统优化的参数?
251.有出现过服务器宕机的状况吗?如何处理的?有考虑做多活吗
252.你认为云服务器运维和本地机房服务器运维的区别在哪里
253.使用过阿里云的插件吗(数据看板之类的)
254.你平时会如何去提升运维能力呢
255.数据库有试过遇到瓶颈吗?(例如数据库很大,如何优化效率)
256.你对运维开发或者DevOps有什么看法?
257.你对K8S是如何理解的?K8S的pod和docker容器的区别在哪
258.(各类中间件)集群相关的资源,你认为是推荐奇数个还是偶数个呢,为什么?
259.你之前如何对pod资源实现监控?包括资源、存活等等
260.K8S的自动扩缩容是如何实现的?有实际运用过缩容吗
261.了解灰度发布和蓝绿发布要如何实现吗?
262.你认为Ubuntu和centos以及kylin系统的区别点在哪些地方?指令有什么不同
263.有针对不同系统写过安装脚本吗?例如一键安装nginx、mysql等等
264.有写过巡检工具吗,之前写过的shell脚本主要是做什么用处的?
265.有安装过docker吗,不同系统怎么安装
266.内网环境你会如何安装软件?
267.处理过安全漏洞相关问题吗