刘向阳:数字化底座建设

风水师任强 957 0

专题:2024 中国 AIGC 创新发展论坛

刘向阳:数字化底座建设 - 第 1 张图片 - 小城生活

  2024 年服贸会专题论坛之一——“2024 中国 AIGC 创新发展论坛 ”于 9 月 13 日 -14 日在北京举行。美的集团首席信息安全官兼软件工程院院长 、欧洲科学院院士刘向阳出席并演讲 。

  以下为演讲实录:

  刘向阳:大家好 ,非常感谢有这个机会跟大家做一个交流 ,我的题目是数字化底座建设 。

  题目里面有两个关键词:一个是 AI,美的集团全面拥抱 AI 大模型始于去年年初。去年使用 AI 的模式还是外挂式的,今年已经转变为内嵌式的。美的数字化底座也融入很多 AI 的能力 。第二个是全球化 ,全球化带来出海,出海带来的问题就是“多云 ”,在国内用的是公有云 、私有云 ,在海外可能用海外的公有云,这就会导致数字化底座的不统一,给上层应用带来非常大的改造量。怎么解决这个问题呢?在美的 ,我们建设了一整套云中立的数字化底座,也就是说不管你是在公有云上还是私有云上,对于应用来说整个数字化底座是一模一样的 ,是全球一张网。这样的话,上面的应用不需要任何改造就可以部署在任何一朵云上 。

  今天简要先介绍几个系统,分别是大数据平台、数据库平台和研发效能平台。

  首先讲一下大数据开发平台。大数据开发跟普通应用开发不一样 ,普通开发相对简单 ,大数据开发平台涉及到数据的处理,各种表的处理,过程非常复杂 。因此需要有一整套的大数据开发环境和大数据的开发平台 ,这里包括数据质量的检测,比如高管早上 7 点起来,你 7 点之前必须把这些报表准备好 ,如何确保这些数据在那个时候能出来?之一是任务要跑完,第二跑出来的数据是准确的,这经常需要手工去检查。美的数据部门必须深夜起来看这个运行是否正常 ,这需要很大人力投入,但我们已经把这个检查过程全部自动化了。

  大数据开发平台包括数据集成、数据开发 、任务运维、数据地图、数据血缘等等这些能力,还内嵌了很多 AI 的能力分析 。这个是多租户管理 ,即使是在一家企业,多租户能力也是非常重要的,否则如果一个人写一个大的数据清洗任务 ,如果任务特别耗资源 ,就会导致其他任务跑不出来,这个必须具备多租户的隔离能力,保证任何一个人写一个非常非常耗资源的任务不会把别人打挂 ,只能把自己打挂。同时我们提供了非常丰富的异构数据源之间的数据集成,因为要从各种异构数据库提取数据。数据开发能力包括离线作业的开发 、实时作业的开发,还包括各种表的管理等等 。

  大数据降本也是企业面临的一个难题 ,因为大数据非常消耗资源 。我们在这方面做了很多工作,比如一般情况大数据有两个集群:一个是生产集群,一个是开发集群。当你在开发集群上引用生产环境的数据时 ,要把很多生产数据拷贝到生成集群,这个非常消耗资源,也非常耗时。这就带来了两个问题:之一你得有两个集群;第二经过数据拷贝后 ,这两个集群的大小可能都差不多 。我们是怎么解决这个难题的?我们把这二者合二为一了,而且数据我们只保留一份逻辑数据。在数据开发的过程中,当对某些表做写操作时 ,开发人员的感受是对任何有权限表都可以写操作 ,但实际上这个操作不会影响我们的生产数据。

  数据的血缘分析非常重要 。现在美的一张复杂的表可能由上千张表最终生成的,这些复杂的表,几十万张表、上百万张表 ,他们的关系非常复杂,靠手工捋清楚是极其耗时的事情,我们实现了全自动数据血缘关系分析 ,并且以图形方式展示出来。

  我们还提供数据权限的管控,不同表采用不同权限控制,针对敏感数据 ,平台会自动识别并自动脱敏。

  大数据开发平台还内嵌 AI 能力,比如:在大数据平台内你可以直接用自然语言来问,告诉我每个城市的销售额 ,并且按照倒叙排列,平台就会直接返回正确结果 。你也可以点开查看对应 SQL 语句,你要想做修改也是可以做修改 ,也可以一键绘图 ,就能帮你生成相应的图表。

  当然还提供数据洞察、全球部署等等,这些能力是全面对标信通院标准的全部能力。

  下面介绍一下大数据引擎平台 。这个引擎平台是兼容开源大数据体系的,因为业界有很多大数据开源的组件 ,比如 Yarn 、Spark、Flink 等等,这些开源组件,很多公司是拿来直接用的 ,直接用就会产生一个问题,所有这些开源组件都不是企业级的软件,真正用起来时都会有各种各样问题 ,那我们怎么解决这个问题的?我们是把开源不具备的能力补齐,包括集群管理、组件管理 、资源管理、动态扩缩容、高可用 、高可靠等等。形象的比喻是:开源引擎就像肉身一样,我们做的是外壳 ,把这些平台管控和内核优化能力补齐。

  当然这些也是对标信通院的标准 。

  下面介绍一下数据库管理平台 。公司大部分情况下肯定要用到数据库和 DBA,DBA 大部分情况下是直联数据库,然后对数据库进行各种操作 ,没有权限管控 ,即时有管控也只能在库和表的 level 上进行管控,要么没有权限访问,要么有权限访问 ,HR 数据库 DBA 可以看到所有人工资,这个肯定是不合适的。还有看了哪些数据 、对哪些数据进行修改也没有操作审计,而且看到数据的时候 ,数据也没有脱敏,包括各种数据的传输。

  还有一点是 SQL 诊断,能不能自动诊断出 SQL 问题 ,能不能自动给出修改意见 。

  这个是我们建设一整套数据库管理平台,我们所有的 DBA 不再直联数据库,我们所有 DBA 都是登录我这个平台 ,通过这个平台去连数据库,DBA 不能直联数据库,所有操作是通过这个平台来操作 ,这里有各种权限管控以及各种操作审计 ,包括查询能力、数据变更、安全管控 、数据同步、数据归档、数据订阅 、数据校验、数据库诊断以及运维管理,这里讲一下内嵌的 AI 能力,比如能够把自然语言生成 SQL 语句 ,也能够根据 SQL 语句能告诉你这个 SQL 语句是什么意思,能够完成不同数据库之间 SQL 语句转化,给我 MySQL ,给你生成 Oracle SQL,还有 MySQL 的诊断,这块我们首先有 MySQL 监控 ,监控检测出来之后,大模型会自动给你修改意见,还有 SQL 执行异常的话也会帮你分析原因。这个我们也是对标了信通院的全部标准 ,美的有 5000 多个数据库,全部由平台管理,所有人不能直联数据库 ,只能通过平台对数据库进行操作 ,这样对 DBA 的人数是一个数量级的减少,提效非常明显。

  下面介绍一下数据库引擎,企业里用开源数据库很常见 ,比如 MySQL 等等数据库,这些更大的一个问题是:不具备高可用、高可靠的能力,想把这些补齐非常困难 。我们建设了一整套的管理平台 ,这些开源数据库我们对内核做了优化,那些没有的能力我们也进行了补齐,不是简单地把数据库改改 ,而是跟开源大数据平台一样,把缺乏的专业能力补齐。包括资源调度 、弹性的扩缩容、高可靠、高可用 、安全巡检等能力。当然我们也做了很多优化,优化后 ,数据库性能可以提升 3 倍,并发能力可以提升 4 倍 。这里面很多高可用能力、高可靠能力,即使有人把这个数据库删了 ,跑路也没有关系 ,我们有防护的能力,弹性的扩缩容等能力。

  下面介绍一下我们的研发效能平台,这是一站式的研发效能平台 ,包括几大平台:之一是项目管理,这是基于敏捷的研发模式。第二是研发平台,包括构建发布 。还有自动化测试平台 ,就是质量平台,包括各种流量回放、精准测试等等能力。这三个平台数据都会实时传递给度量平台,这里面对个人 、对团队等等从多个维度对效能进行度量。还有一个是 WorkSpace ,这个是我们一整套基于 AI 的研发平台,从需求分析一直到代码自动生成上线,整个流程是全部基于大模型的 。这是我们的项目管理平台 ,这里面也是内嵌很多的 AI 大模型能力,帮你做需求分析等等的能力 。这是流水线,包括很多安全能力 ,包括很多 SCA 分析 、DST、静态扫描等等能力。这是代码扫描和流水线 ,研发平台也包括 AI 大模型能力,能够代码自动补全,也能够给代码生成注释等等。测试平台里面有很多能力 ,包括流量回放,省去写测试用例的时间 。精准测试,一个企业里的项目很大 ,测试成千上万个,改一行代码经常要把所有测试用例库跑一遍,基本上是几个小时的时间。我们看程序员好像看似在刷手机 ,但没办法,得等测试跑完。通过精准测试,你改了 10 行代码 ,只需要跑和这 10 行代码关联的测试用例,其他用例不需要跑,这样就从几个小时等待时间降到几秒钟时间 ,大大提高了测试人员的测试效率 。我们也包含接口测试、混沌测试等功能。测试平台也内嵌 AI 大模型的能力 ,比如:性能测试自动生成性能报告 、测试失败帮你智能分析原因等等。度量平台包括各种维度的度量,因为有上千个指标,那上千的指标到底根据哪一个来衡量团队和个人的效能?其实哪一个都是不合适的 ,单个指标不能够多维度衡量团队或个人的效能,可以通过平台内置的效能模型来实现多维度,多指标的效能度量 ,当然这个模型是支持用户自定义的 。度量平台也包括了 AI 大模型能力,对于团队和个人,平台 AI 都能够自动生成效能报告 ,会帮你自动做分析,找到哪里存在效能瓶颈,哪里存在不足 ,这些都是 AI 自动生成的。

  下面介绍一下 WorkSpace,我们打造了一整套的基于大模型的全流程研发效能平台,包括产品经理 Agent、开发工程师 Agent、测试 Agent。我们来看一下怎么用这个平台?首先 ,你想做一个事情就把需求描述写在这里 ,如果你是开发一个新的程序,你把需求描述写在这里,99% 的情况是改现有的代码 ,有些部分做修改,这种情况下就可以把关联代码仓库放进来,把需求描述给出来 ,现有代码修改也是没问题的 。然后平台会根据你的需求描述,大模型会帮你自动生成需求分析,需求分析还可以做修改 ,然后再进一步地帮你生成设计方案,当然每一步可以做修改,然后自动拆解任务 ,自动生成测试单元等,最后可以一件提交部署。这是一整套的基于 AI 大模型的能力。这个在业界我们是之一个做的 。

  美的产品还包括很多电控软件,所以我们支持电控软件或者支持服务端 ,这也是满足信通院全部的认证标准 。美的的内部平台 ,就有七千多个程序员在用。

  由于时间关系,我就介绍到这里,谢谢大家。

  新浪声明:所有会议实录均为现场速记整理 ,未经演讲者审阅,新浪网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述 。

文章内容免责声明

加微信免费领取数字能量手机号旺运电子书

公众号

专家微信

1 、本网站名称:吉运乾坤风水网 2、本站永久网址:https://www.mmssq.com 3、本网站的文章部分内容可能来源于网络 ,仅供大家学习与参考,如有侵权,请联系站长进行删除处理。 4 、本站一切资源不代表本站立场 ,并不代表本站赞同其观点和对其真实性负责。 5、本站一律禁止以任何方式发布或转载任何违法的相关信息,访客发现请向站长举报 6、本站资源大多存储在云盘,如发现链接失效 ,请联系我们我们会第一时间更新 。

发布评论 0条评论)

还木有评论哦,快来抢沙发吧~