Publishing Service

Polishing & Checking

Journal of Zhejiang University SCIENCE C

ISSN 1869-1951(Print), 1869-196x(Online), Monthly

<<<                         CONTENTS                         >>>

Special Feature on Coordination of Networking and Computing: Architecture, Theory, and Practice (Editor-in-Chief: Xiaoyun WANG; Executive Lead Editors: Yong CUI, Tao SUN)

Editorial: Coordination of networking and computing: toward new information infrastructure and new services mode

Xiaoyun WANG, Tao SUN, Yong CUI, Rajkumar BUYYA, Deke GUO, Qun HUANG, Hassnaa MOUSTAFA, Chen TIAN, Shangguang WANG

DOI: 10.1631/FITEE.2430000 Downloaded: 204 Clicked: 184 Cited: 0 Commented: 0(p.629-632) <Full Text>

Chinese summary   <3>  

王晓云1,孙滔2,崔勇3,Rajkumar BUYYA4,郭得科5
黄群6,Hassnaa MOUSTAFA7,田臣8,王尚广9
1中国移动通信集团有限公司,中国北京市,100032
2中国移动通信有限公司研究院,中国北京市,100053
3清华大学计算机科学与技术系,中国北京市,100084
4墨尔本大学计算与信息系统学院CLOUDS实验室,澳大利亚维多利亚州墨尔本市,3010
5国防科技大学信息系统工程国家重点实验室,中国长沙市,410073
6北京大学计算机学院,中国北京市,100871
7英特尔公司,美国加利福尼亚州圣克拉拉市,95054
8南京大学计算机软件新技术国家重点实验室,中国南京市,210023
9北京邮电大学网络与交换技术国家重点实验室,中国北京市,100876
计算,作为信息处理的基石,在数字服务时代起着至关重要的作用。"网络"和"计算"分别用于信息传输和处理,传统上属于不同的利益主体,并独立演进。近期,网络和计算协同、融合的演进趋势得到工业界和学术界广泛关注。相应地,"算力网"和"算力网络"等概念被陆续提出,电信标准化组织国际电信联盟(ITU-T)也已启动算网协同(coordination of networking and computing,CNC)的标准化工作,尤其关注架构和框架设计。网络与计算协同将带来几个直接好处:
能够在广域内有效调度资源,实现节能。中国在2022年启动的"东数西算"国家工程就是例证,该工程旨在引导产业界在有着丰富能源的中国西部地区进行数据处理和存储,高效利用能源,特别是可再生能源。
促进算力成为一种公共基础设施服务。这是人工智能先驱约翰·麦卡锡(John McCarthy)在20世纪60年代提出的愿景。其目的是使算力像家用水电一样容易获得,以弥合算力资源可获取性的差距。孙凝晖院士及其团队将上述能力命名为"computility",亦即基于网络提供泛在的信息处理能力。
显著提升用户体验。例如,沉浸式通信是以大流量、低延迟、频繁交互和高计算复杂性为特征的通信模式,其服务质量的评估需同时考虑数据的传输和处理。连接和计算的协同可以实现优化的平衡,例如选择合适的计算节点和网络传输路径。
本专题包括6篇文章--1篇前瞻观点、1篇综述和4篇研究论文。该专题可以看作对长久以来的经典问题--将系统设计为一个网络连接的超级计算机--的一次再探讨。通过对终端、边缘云和中心云进行计算资源的协同管理,实现端到端服务的优化至关重要。其核心理念是"以计算换传输",通过增强的算力减少数据处理时延,从而降低网络传输过程中对超低延迟传输的苛刻要求。通过系统性协同和集成,让网络和计算能力产生协同放大作用。为达到上述优势,需解决3个方面的重要问题:
对网络与算力的需求及资源进行标识,识别应用所需的算力和网络传输能力。了解如何识别和建模这些需求至关重要,特别对于异构和分布式计算资源。挑战在于确保有效分配原始数据或处理逻辑,以使用可用的计算资源。
及时与联合的感知算力和网络资源,收集与网络或算力相关的负载信息。由于采用不同监控方法,算力指标通常获取自算力基础设施组件,如云服务、虚拟机或容器。相比之下,网络连接指标通常依赖于端到端数据路径传输的测量。
计算和网络资源的协同调度需要系统性优化。促进终端设备、边缘计算和云服务之间的协作,涉及到为网络建立一个统一的"大脑",使得该网络化的"分布式计算系统"中的资源提供者可协作地应对多维资源调度的挑战。
除以上核心方面外,这些系统的实现还涉及任务,比如应用任务分解。此外,评估网络和计算资源能否在信息处理全生命周期--包括生成、传输、处理和消费--中协作至关重要。在数字化转型背景下,网络与计算协同预示着一个有着广泛前景的崭新研究领域,还有许多挑战有待发现和解决。
系统的架构设计是实现这些新功能的关键。王晓云等提出算力感知网络(CAN)概念,这是一个新的框架,集成了促进广域计算和网络协同的感知平面。这个框架确定了3项关键技术:算力路由(CATS)、弹性广播和广域高吞吐传输。尽管将算力引入路由策略还需进一步调研,国际互联网工程任务组(IETF)已启动关于算力路由的讨论,以探索潜在场景和架构设计。弹性广播是为广域网络中"一对多"通信定制设计的,这对于跨数据中心的人工智能模型训练和推理至关重要。尽管高吞吐传输并非新概念,但长距离造成的物理延迟、数据丢包和服务器限制,为其在广域网中的应用带来不小挑战。
由于高功率计算对环境和成本的影响,能源使用效率至关重要。近年来业界关注的联邦学习就需要采用节能的方法,特别是在边缘计算环境中。颜康等对边缘联邦学习中的节能策略作了全面调研,包括系统和能源消耗模型。探讨了3类策略,包括基于学习的策略、资源分配策略和用户选择策略,并指出几种潜在的节能联邦学习研究方向。
有效提供计算服务或解决复杂问题,需要采用协作的方法进行任务分解。这包括在用户设备、边缘网络和云数据中心之间的任务卸载,促进在云、边缘、终端设备等基础设施之间的协作。白小军等将不同任务分为延迟敏感类和延迟容忍类,利用连续时间马尔可夫链对系统建模。通过对边缘网络缓冲区访问阈值的优化,实现了在平均延迟和阻塞率之间的平衡。
当有多个计算和网络资源服务提供者时,选择适当的提供者对于完成任务至关重要。付月霞等利用基于beta分布函数的信誉模型来评估资源提供者的信誉,并引入基于性能的信誉更新模型。该方法被建模为一个受约束的多目标优化问题,通过改进的快速精英非主导的排序遗传算法确定可行解。大量仿真实验证实了模型在提高用户满意度和资源使用率方面的有效性和效力。
网络和计算协同的本质在于对计算资源与网络资源分配的联合考虑。韩雪莹等提出一种将深度强化学习与图神经网络相结合的智能资源分配方法。该方法通过优化跨网络拓扑中的网络和计算资源,在结构性变化情况下也能克服算力网络中路由的挑战。
在各种场景和领域中,算力与网络之间的协同作用至关重要。蔡逸卓等致力于提高6G网络中联邦学习场景的通信效率,调研了传统和对等(peer-to-peer)联邦学习架构。文章证明基于实时资源状态优化的算力调度可以显著提高性能。
本专题得到学术和产业界大力支持,涵盖了网络与计算协同的多个方面,如互联网协议(IP)、蜂窝网络等。需要指出的是,相关研究仍处于起步阶段,许多问题和技术值得进一步深入研究。
最后,衷心感谢所有作者、评审人及期刊编辑的支持和贡献。

Perspective: Computing-aware network (CAN): a systematic design of computing and network convergence

Xiaoyun WANG, Xiaodong DUAN, Kehan YAO, Tao SUN, Peng LIU, Hongwei YANG, Zhiqiang LI

DOI: 10.1631/FITEE.2400098 Downloaded: 249 Clicked: 299 Cited: 0 Commented: 0(p.633-644) <Full Text><PPT> 61

Chinese summary   <3>  

王晓云1,段晓东2,姚柯翰2,孙滔2,刘鹏2,杨红伟2,李志强2
1中国移动通信集团有限公司,中国北京市,100032
2中国移动通信有限公司研究院,中国北京市,100053
摘要:网络资源的覆盖范围日益广泛,算力资源也逐渐成为能够提供泛在计算服务的基础设施。然而,在广域网络,底层网络和计算资源缺乏密切的研究或协同设计,仍然存在计算服务调度缓慢、数据分发不灵活、数据传输效率低等问题。本文提出算力感知网络(CAN)的系统架构设计,其核心贡献在于引入感知平面来收集、管理并综合计算和网络的信息。这样,感知平面、控制平面和数据平面组成一个闭环控制系统,增强了整个系统的感知能力、决策能力和数据转发功能。为了使能CAN系统,本文提出三项关键技术:算力路由、弹性广播和广域高吞吐传输。本文以人工智能(AI)模型训练、推理和离线参数传输为例,展示CAN的适用性,并指出未来的一些研究方向。

关键词组:网络架构;算力感知网络;算网一体

Review Article: A survey of energy-efficient strategies for federated learning in mobile edge computing

Kang YAN, Nina SHU, Tao WU, Chunsheng LIU, Panlong YANG

DOI: 10.1631/FITEE.2300181 Downloaded: 550 Clicked: 540 Cited: 0 Commented: 0(p.645-663) <Full Text><PPT> 76

Chinese summary   <3>  

颜康1,束妮娜1,吴韬1,2,刘春生1,杨盘隆3
1国防科技大学电子对抗学院,中国合肥市,230009
2香港理工大学电子计算学系,中国香港特别行政区,999077
3中国科学技术大学计算机科学与技术学院,中国合肥市,230026
摘要:随着第五代网络技术和物联网的蓬勃发展,终端用户设备数量和各种各样的应用程序正在激增,从而在网络边缘产生大量数据。为了高效处理这些数据,创新性的移动边缘计算框架已经出现,以实现靠近用户流量的低延迟和高效的计算能力。近年来,由于其保护隐私的优势,联邦学习在边缘计算中展示出经验性的成功。因此,它成为各种机器学习任务中分析和处理分布式数据有前景的解决方案,这些任务是移动边缘计算中的主要工作负载。遗憾的是,终端用户设备通常由容量有限的电池供电,在执行高能耗的联邦学习任务时会面临挑战。为应对这些挑战,已有许多节能策略被提出。考虑到目前缺乏全面总结和分类这些策略的调查,我们对移动边缘计算中联邦学习的节能策略的最新进展作了全面调查。具体而言,首先介绍了联邦学习中的系统模型和能耗模型,涉及计算和通信。然后,分析了提高能效方面的挑战,并从3个角度总结了节能策略:基于学习的策略、资源分配策略和客户端选择策略。对这些策略作了详细分析,比较了它们的优势和劣势。此外,通过展示实验结果,直观展现了这些策略对联邦学习性能的影响。最后,讨论了节能联邦学习若干潜在研究方向。

关键词组:移动边缘计算;联邦学习;能量高效

A cloud-edge-device collaborative offloading scheme with heterogeneous tasks and its performance evaluation

Xiaojun BAI, Yang ZHANG, Haixing WU, Yuting WANG, Shunfu JIN

DOI: 10.1631/FITEE.2300128 Downloaded: 484 Clicked: 572 Cited: 0 Commented: 0(p.664-684) <Full Text><PPT> 54

Chinese summary   <3>  

作者:邵烨程1,2,金永斌1,2,黄志龙4,王宏涛1,2,3,杨卫1,2
机构:1浙江大学,交叉力学中心,中国杭州,310027;2浙江大学,杭州国际科创中心,中国杭州,311200;3浙江大学,流体动力与机电系统国家重点实验室,中国杭州,310058;4浙江大学,应用力学研究所,中国杭州,310027
目的:控制四足机器人实现连续、可控的多种运动。
创新点:1.将动作生成与基于动作模仿的强化学习方法结合,使用同一个控制器,跟踪不同运动学轨迹,在实物机器人上实现步态切换、高抬腿和跳跃等不同动作。2.提出参考轨迹可预测性的概念,强化学习控制器具备挖掘参考轨迹内在关联性的能力,揭示动作模仿中控制器输入的参考轨迹长度对控制器性能的影响机理。
方法:1.通过动作捕获、草绘与轨迹优化等方法,建立运动轨迹数据库。2.通过基于动作模仿的强化方法,在仿真环境中训练控制器模仿数据库中的动作。3.基于控制器设计动作状态机,根据用户指令实时生成可控的运动轨迹,作为控制器的输入,实现对实物机器人的控制。4.提出参考轨迹可预测性的概念,分析参考轨迹长度对控制器性能的影响。
结论:1.本文所提出的控制方法可以在实物机器人上实现对多种技能的控制。2.参考轨迹长度对控制器性能的影响是通过可预测性实现的;对于可预测性低的运动,可以通过补充参考轨迹长度提高控制器性能。

关键词组:四足机器人;强化学习;动作生成;控制

Reputation-based joint optimization of user satisfaction and resource utilization in a computing force network

Yuexia FU, Jing WANG, Lu LU, Qinqin TANG, Sheng ZHANG

DOI: 10.1631/FITEE.2300156 Downloaded: 488 Clicked: 614 Cited: 0 Commented: 0(p.685-700) <Full Text><PPT> 50

Chinese summary   <2>  

付月霞1,王晶1,陆璐1,唐琴琴2,张晟3
1中国移动通信有限公司研究院,中国北京市,100053
2紫金山实验室,中国南京市,211111
3中国移动通信集团有限公司,中国北京市,100033
摘要:随着算力和网络融合的发展,在算力网络(CFN)中统筹考虑多个提供商的算力资源和网络资源逐渐成为一种新趋势。然而,由于每个算网资源提供商(CNRP)只考虑自身利益,与其他CNRP存在竞争关系,因此引入多个CNRP会造成缺乏信任和难以统一调度的问题。此外,多个并发用户的需求各不相同,因此迫切需要研究如何在多对多的基础上优化匹配用户和CNRP,从而提高用户满意度,保证和提高有限资源的利用率。首先采用基于贝塔分布函数的声誉模型衡量CNRP可信度,并提出基于性能的声誉更新模型。其次,将问题形式化为一个约束多目标优化问题,并使用改进的快速精英非支配排序遗传算法(NSGA-II)找到可行解。本文进行大量仿真实验评估所提算法。仿真结果表明,所提模型、问题表述、和NSGA-II是有效的,NSGA-II可以找到CFN的帕累托集,提高用户满意度和资源利用率。此外,帕累托集所提供的一组解决方案根据实际情况为用户和CNRP的多对多匹配问题提供更多选择。

关键词组:算力网络;资源调度;基于性能的声誉;用户满意度

Combining graph neural network with deep reinforcement learning for resource allocation in computing force networks

Xueying HAN, Mingxi XIE, Ke YU, Xiaohong HUANG, Zongpeng DU, Huijuan YAO

DOI: 10.1631/FITEE.2300009 Downloaded: 913 Clicked: 1104 Cited: 0 Commented: 0(p.701-712) <Full Text><PPT> 47

Chinese summary   <2>  

韩雪莹1,谢明熹2,禹可2,黄小红1,杜宗鹏3,姚惠娟3
1北京邮电大学计算机学院(国家示范性软件学院),中国北京市,100876
2北京邮电大学人工智能学院,中国北京市,100876
3中国移动研究院基础网络技术研究所,中国北京市,100032
摘要:由于具有特定计算需求及超低延迟传输需求的实时应用呈现爆炸性增长,算力网络成为热门研究课题。当前算力网络的主要挑战是如何权衡网络资源与计算资源,作出联合最优决策。尽管近年来深度强化学习在网络优化方面取得一定进步,但这些方法仍然受到拓扑结构变化的影响,特别是对未在训练中出现的网络拓扑作出决策。本文提出一个基于图神经网络的深度强化学习框架,使得智能体在进行网络与计算资源联合优化的同时,兼具拓扑泛化性,更加适应网络拓扑的动态变化。借助图神经网络的泛化优势,该方法可在变动的网络拓扑中运行,且相比基于传统深度强化学习的方法具有更强的优化决策能力。

关键词组:算力网络;路由优化;深度学习;图神经网络;资源分配

Communication efficiency optimization of federated learning for computing and network convergence of 6G networks

Yizhuo CAI, Bo LEI, Qianying ZHAO, Jing PENG, Min WEI, Yushun ZHANG, Xing ZHANG

DOI: 10.1631/FITEE.2300122 Downloaded: 517 Clicked: 732 Cited: 0 Commented: 0(p.713-727) <Full Text><PPT> 59

Chinese summary   <1>  

蔡逸卓1,雷波2,赵倩颖2,彭竞3,卫敏2,张禹舜1,张兴1
1北京邮电大学无线信号处理与网络实验室,中国北京市,100876
2中国电信股份有限公司研究院,中国北京市,102209
3中国电信股份有限公司北京分公司,中国北京市,100011
摘要:联邦学习以参与设备之间协作训练全局模型的形式,有效地解决了数据隐私等问题。然而,在复杂的网络环境中,网络拓扑和设备算力等因素极其影响联邦学习的训练和通信过程。作为一种算力可测、可感知、可分配、可调度和可管理的新型网络架构和范式,6G中的算力网络恰好能有效支持联邦学习训练并提高其通信效率。根据业务需求、资源负载、网络条件和设备算力等信息,算力网络可以决策联邦学习的训练进而实现通信效率提高。为了提高复杂网络环境下联邦学习的通信效率,本文研究了其在6G算力网络中的通信效率优化方法,针对不同的网络条件和参与设备的算力作出训练过程的决策。仿真实验基于联邦学习中存在的两种架构,依据算力信息调度设备参与训练,并在传输模型参数的过程中实现通信效率的优化。仿真结果表明,本文提出的方法能够很好地应对复杂的网络情况,有效平衡参与设备的本地训练延迟差异,提高在传输模型参数时的通信效率,并提高网络中的资源利用率。

关键词组:算力网络协同;通信效率;联邦学习;两种架构

Regular Papers

Federated learning on non-IID and long-tailed data via dual-decoupling

Zhaohui WANG, Hongjiao LI, Jinguo LI, Renhao HU, Baojin WANG

DOI: 10.1631/FITEE.2300284 Downloaded: 579 Clicked: 596 Cited: 0 Commented: 0(p.728-741) <Full Text><PPT> 69

Chinese summary   <1>  

王朝晖,李红娇,李晋国,胡仁豪,王宝金
上海电力大学计算机科学与技术学院,中国上海市,201306
摘要:联邦学习(FL)作为一种最前沿的分布式机器学习训练范式,旨在通过协作训练客户端模型生成全局模型,且不泄露本地私有数据。然而客户端数据同时呈现出非独立同分布(non-IID)和长尾分布时会严重影响全局模型准确率,从而对联邦学习造成根本性挑战。针对非独立同分布和长尾数据,提出一种通过模型和逻辑校准的双解耦联邦学习(FedDDC)框架。该模型具有3个特点。首先,解耦全局模型为特征提取器和分类器,从而微调受异构数据影响的组件。针对有偏特征提取器,提出客户端置信度重加权算法辅助校准,该算法为每个客户端分配最优权重。针对有偏分类器,采用分类器再平衡方法进行微调。其次,校准并集成经过客户端重加权和分类器重平衡的逻辑,从而得到无偏逻辑。最后,首次在非独立同分布和长尾分布下的联邦学习中使用解耦知识蒸馏,通过提取无偏模型知识提高全局模型准确率。大量实验表明,在非独立同分布和长尾数据上FedDDC优于最先进的联邦学习算法。

关键词组:联邦学习;非独立同分布;长尾数据;解耦学习;知识蒸馏

Target parameter estimation for OTFS-integrated radar and communications based on sparse reconstruction preprocessing

Zhenkai ZHANG, Xiaoke SHANG, Yue XIAO

DOI: 10.1631/FITEE.2300462 Downloaded: 344 Clicked: 429 Cited: 0 Commented: 0(p.742-754) <Full Text><PPT> 59

Chinese summary   <4>  

张贞凯,商晓可,肖悦
江苏科技大学海洋学院,中国镇江市,212003
摘要:正交时频空间(orthogonal time-frequency space, OTFS)是近年来针对高多普勒无线场景提出的一种新的调制技术。针对OTFS雷达通信一体化系统的参数估计问题,本文提出一种基于稀疏重构预处理的参数估计方法,以降低传统加权子空间拟合(weighted subspace fitting,WSF)算法的计算量。首先,构建了OTFS一体化回波信号模型。然后,对回波信号进行时域变换,将目标角度与距离分离,利用稀疏重建算法对检测目标的距离和角度进行粗估计。最后,利用WSF算法以粗估计为中心对搜索进行细化,得到准确的估计。仿真实验证明了所提参数估计算法的有效性和优越性。

关键词组:雷达通信一体化系统;正交时频空;目标参数估计;稀疏重构;加权子空间拟合

Correspondence: SEVAR: a stereo event camera dataset for virtual and augmented reality

Yuda DONG, Zetao CHEN, Xin HE, Lijun LI, Zichao SHU, Yinong CAO, Junchi FENG, Shijie LIU, Chunlai LI, Jianyu WANG

DOI: 10.1631/FITEE.2400011 Downloaded: 293 Clicked: 345 Cited: 0 Commented: 0(p.755-762) <Full Text><PPT> 83

Chinese summary   <2>  

董宇达1,3,陈泽涛4,何欣?1,2,李立俊4,舒子超4,曹易农1,3
冯俊驰1,3,刘世界1,李春来1,2,王建宇1,2
1中国科学院大学杭州高等研究院,中国杭州市,310024
2中国科学院上海技术物理研究所,中国上海市,200083
3中国科学院大学,中国北京市,100049
4甬江实验室,中国宁波市,130021
摘要:近年来,事件相机以其低延迟、高动态范围和高时间分辨率等特点受到越来越多关注。这些特点使它特别适合应用于虚拟和增强现实(VR/AR)领域。为了促进事件相机在VR/AR应用中的三维感知和定位算法的发展,我们引入用于虚拟和增强现实场景的双目事件相机数据集(SEVAR)。该数据集以头戴式设备为主体,覆盖几种常见的室内场景序列,包括面向事件相机的快速运动和高动态范围的挑战性情景。我们发布了第一组VR/AR场景的感知和定位数据集,该数据集由双目事件体相机、30 Hz双目标准相机和1000 Hz惯性测量单元采集。相机的放置方式、视场和分辨率与商用头戴设备(如Meta Quest Pro)相似。所有传感器在硬件上进行时间同步。为更好地开展定位精度和轨迹的评估,提供了由动作捕捉系统捕捉的位姿真值。数据集见https://github.com/sevar-dataset/sevar。

关键词组:同步定位与地图构建(SLAM)数据集;事件相机;虚拟和增强现实(VR/AR)

Journal of Zhejiang University-SCIENCE, 38 Zheda Road, Hangzhou 310027, China
Tel: +86-571-87952276; Fax: +86-571-87952331; E-mail: jzus@zju.edu.cn
Copyright © 2000~ Journal of Zhejiang University-SCIENCE