主营业务
【51CTO开发者社群辩论赛】“智慧运维”趋势下 运维工程师会被AI替代吗?

发表时间:2024-08-03 13:47:06 来源:主营业务

  【51CTO开发者社群辩论赛】“智慧运维”趋势下, 运维工程师会被AI替代吗?

  “智慧运维”渐成趋势,运维工程师会被人工智能替代吗?51CTO组织开发者社群中的千位IT精英们,围绕这一辩题开展了激烈的辩论,小编选取了一些很具有代表性的观点,希望能够给读者带来更多关于人工智能和运维的启发,碰撞出更多思想的火花。

  【创稿件】运维无小事,尤其是对于基础设施中充当重要角色的数据中心而言,运维工作更是丝毫不能懈怠。近十多年来,数据中心已进入到囊括各种新技术和应用的新时代。随之而来的是运维管理面临更大的挑战,特别是面对不断扩充和升级的数据中心,基础设施安全、稳定的运行显得日益重要。

  数据中心的运维工作主要包括配置管理和监控,运维人员每天都要进行大量的模块维护操作,这个过程大部分程序是由人力手工操作完成的。一方面人的精力有限,不可能及时发现所有的故障,另一方面,这一过程中人为失误的可能性不可避免。将人工智能应用于数据中心的管理和控制,通过机器学习模型进行精细化管理,可以实现智能化运维的目标。

  “智慧运维”渐成趋势,运维工程师会被人工智能替代吗?51CTO组织开发者社群中的千位IT精英们,围绕这一辩题开展了激烈的辩论,小编选取了一些非常有代表性的观点,希望可以给读者带来更多关于AI和运维的启发,碰撞出更多思想的火花。

  作为正方辩友,@数据分析_菜花不是花呀_北京 表示,运维工作人员负荷比较大,工作模式不被员工认可。在没有自动化运维和平台之前,整个运维团队只有八个人,如果每个人一天处理六到十个故障,基本上没有时间去研究别的东西了。传统运维压力很大,疲于奔命和救火,必须要寻求改变,走向自动化、平台化、智能化。而这方面恰巧是机器擅长的,处理相似的问题,对机器来说,一个和100个是一样的。

  @运维/java-陈兴-北京 也表达了类似的观点,在如今自动化趋势的浪潮下,人肉运维的生存环境已经岌岌可危,正确看待岗位职责,正确的转变自己的技术目光是很有需要的,运维应该顺势而行,把更多的精力着眼于自动化工具的开发及优化上,逐渐让机器代替人力,把更多的人力及精力解放出来。因为运维懂运维,在自动化工具的开发上运维有很大的优势。运维不应该守着老路,运维是在逐渐变化的,从最开始手敲命令,到后面的脚本执行,到后边的自动化工具,运维在逐渐变化。

  @云计算-广州-嘿嘿 认为,智能运维必然会取代人类运维工程师的工作,只不过是时间问题而已。他从三个方面进行了论述:规范性上,信息化发展到一定程度,一定是向标准化的方向发展的。以前没想过语音识别能够对语音分析的准确度这么高,但是现在智能客服的语音识别度已经达到了80%以上。可控性上,智能运维取代人类并不代表上面不会再有人类进行管控,智能运维只不过是取代的最下层的基层员工的工作,而个性化、管理性的工作是需要人类进行管控的。数据化上,长时间大容量数据的运算、训练等等,肯定能够帮助并取代人类。

  @开发-福州-圆周率 给出了具体的方法:平常要做好日志、操作记录、设备运行数据的收集工作,把不同数据源的数据采集过来,制定一些KPI指标分析,通过对数据处理进行管理、预警、告警处理。展示层将分析的结果展示出来,快速定位问题节点并有相应的解决方案。

  其次,事件和时序的关联性可以为事件诊断提供有价值的分析基础和线索。通过某个时间段出现的故障会产生一些相关性的事件,对它们进行筛选能够详细捕捉到故障细节,丰富运维的整体解决数据基础。

  智能运维基于大量的数据进行训练,故障出现的形态是五花八门的,对故障的历史数据进行场景分类和标注,不断用模式识别和数据来训练机器识别和分析,让机器自动准确判断,有效预警、预报、预防故障出现,降低运维的成本还是很有帮助的。

  对于运维专业度方面的担忧,@数据-unicorn-北京 认为,AI会逐步实现专业化。机器的计算能力存储能力远大于人类,机器将从事更加专业的事情,通过数据分析,优化规范性、可控性、主动性等。AI将降低对人员专业度要求,逐步实现专业化。规范也有可能是AI自己定义,目前路径规划例子才是入门级。

  展望未来,@Java-黑子-北京 表示,未来一定是会越来越智能的。通过人工智能,全维数据,包括自主学习分析,人可以想到和分析的地方,人工智能一定是能够以更加高效的,以及更加准确的方式去处理和运维的。当然前期规则和处理方式会有人员的参与,但在达到一定成熟度之后,智慧运维是能够代替人去管理和处理这些问题的。

  总而言之,通过正方辩友的阐述,我们可以得出,利用人工智能技术,收集技术人员的工作内容以及方法并进行分析,识别模型,并根据相应模型做出判断,自动下发动作指令,完成自动化运维,整个过程不需要人来参与。使用人工智能技术参与数据中心运维,处理效率高,减少出错的概率,降低运行维护成本。

  针对正方的观点,@JAVA&PM-王周知-上海 提出了不同的意见。他认为,智能运维真正要做的是构建完善合理的运维体系,而不是去否定运维人员,不是去取代人。智能运维具体要做些什么:全面的性能管理;统一的资源管理;及时的故障告警管理;集中统一展现管理。智能运维要解决的,也正是传统运维的痛点。所以,正方持有点,没有关注到智能运维的本质,是一种本末倒置的观点。在智能运维趋势下,运维人员的技能将发生转移,而不是消失;限于各种原因,智能运维并不能全方位,无死角的取代传统运维,即传统运维人员依然存在。

  @PHP-小星星-广州 认为,真正的“智能运维”,可以定义为无需人工参与的、可自动监控、自我容错、自我恢复的运维。就人工参与这一点来说,当前还无哪个公司能够做到这一点,相信在可预见的未来也无特例。其次自动监控、自我容错、自我恢复这几点,当今科技巨头离这个水准已经很近或者说已经达到,这个毋庸置疑,但终究,这样的运维系统最终离不开人工参与,最简单的,是系统它就需要人工进行开发。所以,在运维这个层面,不存在的真正意义上的人工智能代替人这样的操作,并不会发生。

  @北京-鲲 也表示,每一次产业升级后,人都没有被替代,在人工智能时代也一样。当然,所有运维工程师都要面临更高的技术门槛,但是因此可以产生更高的价值。也许运维领域会催生更新的技术,更高效的工程方法,例如促使AI实现更多繁重的运维工作(类似于巡检,上下架等)。而运维工程师可能要更关注与此类新技术或方法的研发。因此运维工程师会被升级,不会被取代。

  @Php-七彩极-隆昌 谈到,AI运维肯定是时代的趋势,它可以代替部分人工操作,实现线小时监管,也能够避免一些人为的疏忽错误。但人类的思维是无穷的,AI再聪明,目前也打不到超越人类智慧的程度,对于复杂的网络环境以及可能发生的社会工程学类的攻击等,AI显然是无能为力的。并且,AI只能从软件层面上进行自动化管理,硬件还是必须要有人来管。AI只能对已有的经验加以判断和分析,对于突发的未知事件,处理能力肯定是不及人类灵活变通的。所以,AI可以代替部分人工,但不可能完全代替。80/20规律也比较适用于这个发展趋势。

  @网安-Kevin-北京 指出,从总体上来说,规范性、可控性、主动性抑或是数据化这些东西,都是由资深的运维人员制定出来的,然后交付或者变成AI可以理解的方式进行设计和训练,而这样的一个过程必然是人工干预的推进的,同时也要求相关的制定者要有足够的专业技能储备才能够全面评估和把控这个方案。其次,当前的线上系统或者环境并不是一成不变的,无论是以前的开发交付上线,还是现在的敏捷开发、持续集成以及自动部署等等,研发创造出的系统,依然需要维护人员去为整个维护方案背书,添加或删除相应的维护方法和监测指标,这些东西不是一个AI或者口号性质的智慧运维能够做到了。

  @SUN-JAVA开发 表示,运维的目的是确保对业务需求和运行环境变化的,及时有效地支持,所以直接取决于应用系统对变化响应的能力、效率和可管理性。运维人员需要处理各种业务场景,提供开发及测试人员等各种硬件和软件支持。智慧运维是通过使用不同的技术,例如大数据,云计算,对系统的数据进行各种处理,例如日志进行分析和数据可视化等等操作,最终的目的还是服务于系统,供运维人员决策和定位问题,提供开发人员进行系统优化,解决系统问题。智慧运维的正常运行,还需要运维人员进行监控和不断的优化配置等。

  我们通过反方辩友的陈述可以得出,技术可能永远也无法替代领域专家,无法解决专业领域的问题,如网络知识、应用原理、业务需求、系统结构等等,但是可以为领域专家提供更好的工具。因此,实现智能运维的终极目标是:人工智能将成为运维人员高效可靠的助手,从而可以将运维人员从繁杂的工作中释放出来做更有价值的工作。

  51CTO认为,无论运维工程师是否会被AI所替代,“智慧运维”已经成为行业不可阻挡的大势所趋,企业的数据中心需要实现更加智能化、自动化。因此,在当前数字化变革时代,随着IT角色的转变,需要把基础运维转化为企业竞争力。云计算、大数据、人工智能等新技术对计算、存储、网络等硬件设备以及软件都提出了更高的要求。

  企业要想保持快速增长的势头,必须重新调整IT架构或者构建更加智慧化的数据中心,以确保每个系统上运行更多不同类型的工作负载,为企业充分利用新技术,推动业务创新和持续高速发展,奠定扎实的基础。在推动新技术的落地应用上,英特尔提供了强大的软硬件产品,以帮助企业改造、升级IT架构,从而满足业务高速增长下的IT架构对新技术的需求。

  英特尔目前的数据中心产品组合比以往更为广泛。英特尔新至强可扩展处理器是近十年来数据中心领域最大的平台级提升,其针对不同场景中的应用工作负载进行了优化改进。在性能方面大幅提升,是上一代产品的1.65倍,可以运行4.28倍的虚拟机,降低65%的TCO,云方案的安全可靠性提升了2.42倍。其采用了全新的内核微架构、核内互联和内存控制器,专门针对计算、网络、存储和虚似化等应用进行优化,为下一代云基础设施提供了硬件基础,包括数据分析、人工智能、自动驾驶、高性能计算和网络转型在内的各类应用都将可以从至强可扩展当中受益。

  为了更好地满足企业多样化的工作负载,英特尔除了现有的至强可扩展处理器,还推出了英特尔Nervana和英特尔Movidius技术以及英特尔FPGAs在内的广泛的企业级产品,来满足人工智能工作负载的独特要求。在人工智能方面,英特尔提供了一个从低功耗到数据中心的全方位覆盖的端到端的方案。同时,英特尔也在框架、库、平台等软件方面做了丰富的布局,从而帮助企业应对人工智能时代的挑战。

  总之,英特尔为数据中心和工作负载优化提供了重要的机会,通过最大限度地提高支持和管理业务所需的技术平台的效率来降低成本,从而提升数据中心效能。