1 引言
对于边缘计算,ETSI给出的定义是“边缘计算是在靠近物或数据源头的网络边缘侧,融合网络、计算、 存储、应用核心能力的分布式开放平台,就近提供边缘智能服务,满足行业数字化在敏捷联接、实时业务、数据优化、应用智能、安全与隐私保护等方面的关键需求。”从这个定义中可以看出边缘计算有几个要素:一是在系统中的位置,靠近数据源头的网络边缘侧;二是能力,要具备网络、计算、存储和应用能力;三是服务类型,是一种智能服务,具备智能分析处理的功能;最后,是其服务的业务类型,如果某种业务在处理时延、传输带宽、智能化、安全隐私等方面有要求,就可以采用边缘计算技术。概况地说,边缘计算就是在网络的边缘执行计算能力的一种技术。
边缘计算的逐渐兴起有几个方面的原因:从技术层面来看,边缘计算作为一种智能计算技术,可以说它的基础是云计算。随着业务的发展,云计算的使用出现了很多瓶颈,比如传输路径长,导致数据处理时延过长;边缘侧的数据量增多,导致传输带宽的压力大大增加;数据中心的能耗也因为日益增加的数据处理要求而越来越高;另外,数据经由从端侧到云侧的处理存储,会经过很多节点,数据的安全性和隐私也无法得到保障。在这种情况下,业界提出了边缘计算的观点,让一部分数据在边侧直接处理或者预处理后再上传至中心云,能够很好地解决以上云计算的弊端。其次,从业务发展来看,随着智能物联的发展,边缘节点的数量以及需要处理的边缘数据量都快速增加,而且AI的发展使得其不仅应用于大型平台侧产品,也能越来越多地应用于终端或边缘侧的产品,这些都使得边缘计算技术的产品化、商用化成为可能。最后,从基础网络的发展来看,5G的全面商用也是推动边缘计算发展的一个重要因素。5G三大业务场景的落地使用,所需要的低时延、大带宽和高可靠等特性都离不开边缘计算,早在5G设计之初,就将边缘计算定为它的关键技术之一,以满足业务真正实施的需要。
2 5G与边缘计算的关系
5G与边缘计算间是相互促进、彼此成就的关系。
2.1 5G的商用化进程推动了边缘计算的快速落地
5G不是边缘计算未来唯一的承载网络,因为实际上边缘计算可以部署在任何移动网络或固定网络上,但是国家政策的扶持,加速了5G商用化进程;而5G本身具备的能力,比如用户面控制面分离、切片技术、网络虚拟化等,也使得边缘计算在移动网络中的部署成为可能;另外,基于MEC的边缘计算技术,产业界的参与度高,关于应用场景、架构、部署方式、解决方案等都有深入的研究,也已经有不少商用的产品。因此,可以说在国内5G才是真正推动边缘计算应用落地的网络接入技术。
2.2 边缘计算的应用促进了5G网络更快、更好地发展
众所周知,真正能体现5G能力和特点的应用可以说是uRLLC和eMBB业务。uRLLC业务,如无人驾驶,要求网络必须提供高可靠和低时延,才能保证无人驾驶安全使用。如果没有边缘计算,所有的操控消息都要传到云端平台,再返回来的话,时延无法得到保障,汽车不能及时处理情况,可靠性也无从谈起。而eMBB业务,如AR/VR、视频监控等,会传输大量的视频图像,对带宽的消耗很大。这些业务的数据如果都传到网络侧,有几个弊端:一是占用大量的带宽资源,而实际上这其中的大部分都不需要传到网络侧处理,只要在本地处理就可以了;二是数据如果传到云端,还会存在数据安全性的问题,像工业园区的数据,一般都不希望出园区;三是AR/VR业务的数据如果传到云端处理,时延过长,会出现眩晕感。所以,eMBB业务需要借助边缘计算解决带宽资源消耗、数据安全性和处理时延等问题。
3 MEC设备
在5G之前,应用平台都采用云计算模式进行集中设置。在终端和APP数量不多的情况下,这种集中处理的模式没有问题,但随着5G商用逐渐展开,单一的云计算模式无法保证业务所需的低时延和高带宽要求。因此,ETSI在2014年提出了MEC的概念。MEC最初是Mobile Edge Computing,只面向移动网接入,随后改为Multi-Access Edge Computing,接入方式既包括公网移动接入,也包括Wi-Fi和固定接入等多种接入方式。3GPP根据ETSI的定义和需求,针对移动网如何支持MEC技术,进行了详细的定义和补充。
在移动网架构中,实现边缘计算最关键的一点就是用户面和控制面的彻底分离。在5G以前,核心网的用户面和控制面交织在一起很难分开,很多网元既有用户面又有控制面。在5G网络中,由于采用了基于服务的架构技术,实现了控制面和用户面的彻底分离。控制面有多个网元,但用户面的网元只有一个,就是用户面功能(User Plane Function,UPF)。UPF在网络中的位置非常灵活,既可以与核心网的控制面网元一起,部署在地市级的核心机房,也可以下沉到靠近用户侧的无线接入网中。
如果没有MEC,用户面的数据会由基站到核心网的用户面,再到应用平台,然后再原路返回。通常核心网的用户面网元和应用平台都部署在至少地市级,所以这中间的延时会很长。但如果在网络的边缘侧部署了MEC服务器,用户数据直接由基站到MEC服务器平台,而且一般应用平台也会与MEC服务器合设,这样传输路径大大缩短,时延也就很小了。另外,由于用户面数据不到核心网,因此骨干网也节省了传输资源,并且用户数据没有到公网,还保证了数据的隐私和安全性。
由此可以看出,引入MEC边缘计算设备给网络带来的最主要的收益是降低业务处理时延、节省带宽资源和保证数据的安全性。图1描述的是部署了MEC后,网络中控制面信令和用户面数据的传输路径。虚线是控制面(C面)数据,在终端、基站和核心的C面之间,以及C面和用户面(U面)之间传递;实线是用户面数据,大部分数据会经过基站直接到MEC平台,在本地处理,像工业互联网的大部分数据,还有监控视频里没有价值的数据;另一部分数据经过MEC处理了之后,还会到公共的服务平台,比如视频监控中有变化、有价值的那些数据。
图1 5G网络中的MEC设备
MEC设备在网络中处于边缘的位置,可以看作是一种边缘云设备,因此首先要具备边缘侧的资源计算能力,同时要具备虚机或容器特性,以支持高吞吐量、低延时等性能,并能满足工业场景下多种应用并存的需求。此外,MEC设备还是一个CT设备,需要在提供边缘服务的同时,结合无线网络的能力、不同业务的特征能力,兼顾不同的接入方式,为用户提供统一的服务。
从目前业界的探讨来看,在实际部署时,MEC平台可以集成UPF、无线侧的集中单元和移动的边缘应用,比如VR视频渲染、视频APP等,在靠近无线侧的位置就近给用户提供前端服务。MEC的应用平台一般都是通过N6接口部署在UPF之后,与5G核心网控制面的NEF网元有直接的接口,可以基于获取的用户位置和系统能力等信息实现对用户体验进行优化。
关于MEC服务器部署的具体位置,业界并没有统一的方案,这也是部署MEC的一个难点所在。在实际中,这取决于多种因素,如业务的具体指标要求,包括时延、带宽及隐私性要求等;还有就是业务部署的性价比方面的考量,需要兼顾每个行业用户的需求来决定。
通常针对智能工厂、智慧港口和智慧园区等,会在园区就近部署边缘技术以支撑关键应用,为其提供超低时延、实时处理分析、安全可靠网络等一体的最优运行环境。如果需要覆盖更广范围的应用场景,包括智慧城市、自动驾驶、云/边缘沉浸式游戏以及通过移动终端接入和使用的其他服务,那么以区或市为颗粒度来部署边缘基础设施将更加经济有效。
4 MEC应用场景
根据业务的诉求不同,MEC的应用场景可以分为两大类。一类是面向2B的业务,比如精密制造、工业控制、园内的视频监控和管理等,其典型的业务需求是数据不能出场、高可靠的工业组网、超高的上行带宽、超低时延、超强算力和专网管理等。另一类是面向2B2C的业务,主要以OTT应用服务商业务为主,如车联网、AR/VR/云游戏等,这类业务的需求是广覆盖、有QoS保障的连接、边云密切协同和超高的移动性等。下面分析几种典型的5G业务中MEC设备的功能需求及其可能的部署位置。
4.1 智慧工厂
该场景下MEC设备要解决的问题是:接入的设备多,而且大部分设备的数据是视频数据,数据量非常大,比如安防机器人、做质量检测的机器视觉、人脸识别闸机、AR/VR眼镜等;数据处理要求时延低,特别是机床操控;数据有隐私需求,需本地处理,不能出园区;有固定不动的设备,也有高速移动的设备。
针对以上场景,一般会考虑构建一个5G专网,支持大带宽、低时延特性,以满足大规模AGV组网调度的需求。除了支持5G连接,保证移动性设备的接入外,还要支持光纤接入和Wi-Fi接入。MEC平台上需要集成AGV视觉导航系统、工业数据采集、AR远程专家指导、机器视觉质量检测等多种应用,实时地对接入的海量数据进行智能分析,以实现低时延的自动化控制。在智慧工厂场景中,MEC平台通常会就近与专网中的5G基站合设。
4.2 云游戏、AR/VR
云游戏、AR/VR业务的共同点就是都需要极大的传输带宽,用于交互很多视频的内容,时延越低,用户的体验会越好;不同点在于时延要求有所不同,业务发生的场所不同,客户群也有所不同。对这3种业务而言,如果能够采用边缘计算技术,把计算和渲染的能力迁移到边缘云的位置,相比云计算来说,一方面能够大大降低时延,提升用户体验;另一方面能大大减低对终端的性能要求,终端的重量、成本下降,能够向轻便型转变,这样客户的接受程度也会提升,促进产业发展。
对于云游戏,如果是在公有云的服务器上运行,服务器渲染完成后的游戏画面通过网络再传送给用户的话,玩家会直接感受到从指令输入到画面更新,延迟较高,游戏体验差。如果将云游戏从公有云迁移到靠近玩家的边缘云,在本地进行渲染,缩短传输距离,时延能够降到20 ms以内,显著提升用户体验,同时还能节省边缘云到5G核心网的回传带宽。
云游戏属于2C业务,而且对时延的要求不是太高,因此MEC服务器可以部署在地市核心机房,这样在兼顾到更多客户的情况下,既提升业务性能又能够降低运维成本。对于AR,在现有的解决方案中,用户需先下载安装巨大的APP来进行AR的体验,手机的内存、电量和存储容量也限制了AR的发展。MEC平台能够通过网络数据来确定用户的位置,然后利用就近的、本地的AR服务器,提供实时的AR内容匹配计算和推送,以实现本地实景和AR内容频道实时聚合,这样就能带给客户全新的独特用户体验。
对于VR业务,以赛事直播为例,如果在场馆内部署MEC平台,在本地缓存全景摄像头所拍摄的视频,供球迷通过VR设备来快速回看,就能体验到在VIP位置的观看效果。通过在本地部署的MEC,大大地降低时延以避免眩晕感,并减少对回传资源的消耗。AR/VR通常都是2B2C业务,区域性比较强,而且对时延要求很高。因此,一般建议在业务区域内部署MEC平台,就近进行业务分流和处理。
4.3 自动驾驶
自动驾驶首先对网络的带宽有着苛刻的要求,如果把车辆遇到的所有信息都传输到云端处理,至少需要超过100 Mbit/s才能满足要求;其次,车辆在高速行驶中,对于时延的要求也极高,必须保持在1 ms ~ 10 ms之间。要实现自动驾驶,有几个问题必须依靠边缘计算平台才能解决。
(1)单车、路侧单元与应用平台等之间交互时延过大,无法及时获取、处理以及决策信息,无法满足自动驾驶对网络实时性的需求。
(2)单车以及周边交通单元感知能力不足,无法对于超过视距范围事件准确感知和信息同步,无法全局掌握区域交通信息,运行范围及车路协同一体化受限。
(3)汽车故障管理也是制约自动驾驶从实验室走向商用的重要因素之一,需要进行及时人工干预,预防事故发生,保障自动驾驶安全性等。
MEC平台分布式特征则能够很好地解决海量数据处理、海量终端连接以及高速移动切换等问题。MEC平台还能及时接受路侧单元上报的路侧信息,并推送至邻近的车辆,实现本地分流和无缝切换,保障更好地支持视线盲区的预警业务。另外,车载部分计算分析系统上移至MEC边缘云,能够有效降低智能车辆改造成本,提速无人驾驶商业化步伐,并预留开放接口,为所有车联网终端提供远程故障管理服务。
由于自动驾驶的复杂性,对带宽、时延、移动性的要求都特别地高,所以针对自动驾驶来部署边缘计算设备时也会相对复杂,考虑的因素比其他业务更多一些。首先,MEC平台应尽量靠近终端接入侧,一般会在路侧部署边缘计算节点,获取车辆周边的全面路况交通信息,并进行数据统一处理,对于有安全隐患的车辆发出警示信号,辅助车辆安全驾驶;其次,要实施更全面的车辆控制和故障管理等功能,平台的功能和性能要求也会很高,路侧部署的边缘节点通常不能满足要求,此时需要在基站侧再部署计算能力高的MEC服务器。由于涉及到高速移动,车载终端必须采用5G接入方式才能满足业务连续性的要求。3GPP针对这种场景也进行了专门的规定,在切换发生时,通过双连接的方式以保证高速移动情况下业务的连续性。
4.4 安防行业
由于国家一批大型项目的推动,安防是AI最早落地的领域。安防的AI化过程中,已经经历了从云计算到云边协同的阶段,甚至已经在向边网融合的方向发展。现在很多的摄像头,包括家用的摄像头,都已经有人脸识别、语音识别和行为识别功能,这就是一种典型的边缘节点;而视频监控一体机、人脸识别盒子、NVR存储设备等,计算能力就更强一些,可以属于边缘云计算;云计算中心的应用平台的功能和性能更强大,通常都是具有超大运算能力的GPU服务器。
安防和MEC的结合应用,其实更多是由于移动化的巡检设备的出现而需要考虑的,像巡检无人机等。如果要实时传输监控数据,这些设备所需的回传带宽要求也是非常高的。但在监控过程中,大部分画面其实是静止不动的,没有必要上传所有的数据,这时就可以通过就近部署MEC平台,对采集到的视频内容进行预分析处理,只上传有变化、有价值的画面,大部分价值不高的监控数据就存在本地的存储服务器中,这样就能够大大地节省传输资源。
4.5 实际应用案例
在应用的最后,以一个实时无人机检测的项目为例,说明未来边缘计算产业链将会是多方合作的发展模式。该项目由微软Azure提供边缘云服务,AT&T提供5G网络连接服务,软件公司Vorpal提供的是与无人机相关的检测定位应用程序,该程序是运行在Azure的云服务器上,无人机提供的信息可以供执法机构或者机场使用。通过这个案例,可以看到边缘计算应用中的几个关键点。
(1)必须要有边缘计算才能降低业务的时延,提升用户体验。
(2)仅有云服务提供商,无法提供广阔的网络覆盖,业务无法开展。
(3)电信运营商要想超越管道角色也很难,需要努力挖掘产业链上的机会。
5 边缘计算的其他关键技术
由于边缘计算融合了IT、CT和OT 3个领域的技术,MEC技术可以说是CT领域的技术代表,更多地解决的是网络连接方面的问题,但除此之外,边缘计算还会涉及IT和OT领域的技术,MEC技术也要和这些技术配合,才能让运营商网络中的边缘计算应用真正落地。下面将介绍其他的边缘计算所涉及的关键技术。图2通过分层的方式,描述了边缘计算会涉及到的一 些技术。由于边缘计算本身也还在发展完善,后续还会有新的技术补充进来。
图2 边缘计算中的关键技术
网络层技术是为了构建一个确定性的网络,以提供高可靠、低时延、高安全隔离的网络,比如说移动公网、TSN、SDN、OPC UA和Wi-Fi等技术,都是在满足这方面的要求。由于边缘计算是云计算的延伸,所以很多用于云计算的技术也可以适用于边缘计算,比如容器、微服务等,只是使用规模上会朝着轻量化方向发展。将云原生技术通过统一的标准迁移到边缘侧,能够促进边云协同,为边缘侧提供与云上一致的功能和体验,并且能够快速地实现应用分发,解决海量边缘设备统一交付、运维和管控等问题。边缘计算也有不同于云计算的特点,就是边缘智能,通过边缘侧的专用芯片、硬件、操作系统以及边缘智能技术,充分利用边缘侧资源异构、实时响应等特点,满足各类应用场景敏捷联接、实时可靠、数据优化、应用智能等方面的需求。
5.1 TSN&OPC UA
传统以太网中,当两个工作站发生冲突时,必须延迟一定时间后重发报文,一旦发生拥堵,会出现有的报文可能长时间发不出去,因而造成通信时间的不确定性。但实际上,在工业环境里,对时延的要求是很高的,必须要保证数据传输的实时性和确定性。TSN(时间敏感网络)就是以IEEE 802.1标准框架为基础,针对如何保证网络通信中数据传输及获取的可靠性和确定性的问题做了增强。
TSN提供的是通信协议模型中的数据链路层的标准,如果要真正实现网络间的互操作,还需要有一套通用的数据解析机制,这就是OPC UA。OPC UA其实可以理解为一种高层的描述语言,通过面向对象的技术,将物理设备、传感器、电机描述成一个个对象,形成数字化、结构化的模型,让不同的软件可以像调用对象那样来控制设备。
TSN做的是OSI参考模型中1~4层的事情,要解决的是数据获得的问题;而OPC UA做的是5~7层的事情,要解决的是语义解析的问题。两者配合,才能实现工业环境中边缘侧设备与网络间的互联互通,为边缘计算提供更好的网络支撑。此外,3GPP在R16以后,针对工业场景的IoT,也增加了网络对TSN的支持,能够实现端到端的TSN。
5.2 容器技术
容器技术和虚拟机一样,都是计算平台中应用程序运行的模式,也就是说如果有多个应用程序在一台主机上,这些程序是如何运行的。应用程序的运行模式是从物理服务器向虚机和容器逐步发展的。物理服务器因为独享计算资源,会造成极大的资源浪费,而且硬件和软件的紧密绑定也会造成应用的难以迁移和扩展。相比物理服务器,后两种技术都能节省资源,提高工作效率。虚机是将一台计算机虚拟为多台逻辑计算机,每个逻辑计算机可运行不同的操作系统,并且每个应用程序都可以在相互独立的空间内运行而互不影响,从而显著提高计算机的工作效率,安全性和可迁移性都很好。但虚机仍然存在资源占用率高的情况,这从图3的对比就可以看出来。在虚机的架构中,除了Host操作系统外,每个应用都有一个独立的操作系统,而容器的3个应用是在同一个Host操作系统上运行的。因此,容器消耗的资源更少,从运行效果上来说,更加轻量化、安全,可移植性更强,非常适合边缘计算的场景。
图3 虚机和容器协议栈对比
由于边缘计算开发工具和编程语言的多样性,因此要求边缘计算平台必须具备安全的隔离手段保证程序的正常运行。而通过容器技术来实现资源的隔离,一方面能够减小对CPU、内存和存储的额外开销,另一方面也能快速地进行容器的生命周期管理,可以以毫秒级的速度进行容器的开关。事实上,容器技术已经成为边缘计算平台的标准技术,各大云计算厂商都选择容器技术构建边缘计算平台的底层技术栈。
5.3 微服务架构
微服务架构是边缘计算时代应用层的技术,应用层在开发的时候,把以前的应用拆分成更小一点的模块,独立进行开发。这些小模块的模式,可以根据实际的应用场景进行组合,因此更加灵活。微服务架构很符合边缘计算海量连接,应用场景复杂、分布式部署的需求,能够提升资源利用率,推动功能解耦与复用,加速应用的开发与创新。
5.4 边侧智能+云边协同
AI发展初期,由于边缘/终端设备的算力普遍有限AI,模型训练与推断大多在云端服务器上完成。随着芯片的发展,已经有很多可以在边缘推理的芯片,应用在商用产品上。像我们熟悉的AI摄像头、智能音箱等,都是把云端训练完的推理模型直接迁移到边缘终端上加以应用的。除此之外,边端和云端还可以协同,实现模型的不断优化。边端采集到的数据,经过预处理以后,上传到云端,供云端训练用。云端训练好的模型再反馈给边侧,以供边侧进一步优化推理。像华为软件定义的摄像头,就具备不断优化模型的功能。微软、谷歌和亚马逊也都有很多适用于工业场景的边缘智能技术,可以将云端的模型推送到边侧设备上运行。在AI能力中,目前应用比较多的是计算机视觉、语音技术、自然语言处理和知识图谱,而在边缘计算应用最多的是可以说是计算机视觉技术,像智慧园区、智慧工厂、智慧家庭、AR/VR、车联网、智慧安防、智慧医疗等,都需要依赖计算机视觉技术进行环境的检测、产品的检测或者图片处理。
6 结束语
随着5G商用化进程的加快,5G助力万物互联的特性将会得到全方位地开发应用,产业链各方都在积极寻求5G和垂直行业结合的解决方案,MEC是其中不可或缺的重要一环。MEC设备虽然是移动网络上的一个节点设备,与移动网络深度融合,但它并不是一个单纯的移动网设备,而是一个具备智能计算的IT服务器,同时还需要与OT领域的设备进行交互,AI、5G、SDN、NFV、TSN等新技术都能在MEC中得到应用。因此,如何兼顾IT和OT行业的特性,设计和部署MEC设备,让边缘计算在业务实现中发挥作用,达到降低业务处理时延、节省带宽资源和保护数据隐私的目的,加速千行百业的数字化转型步伐,是业界一直在不断探索的问题。