JZUS - Journal of Zhejiang University SCIENCE

Journal of Zhejiang University SCIENCE C

ISSN 1869-1951(Print), 1869-196x(Online), Monthly

2025 Vol.26 No.10 P.1767-2064

<<< CONTENTS >>>

Special Feature on Theories and Applications of Financial Large Models (Editors-in-Chief: Qiang YANG, Xiu LI; Executive Lead Editors: Shuoling LIU, Xiaojun ZENG; Guest Editors: Bo AN, Liyuan CHEN, Jian GUO, Jianzong WANG, Miao ZHENG)

Editorial: Theories and applications of financial large models

Shuoling LIU, Xiaojun ZENG, Xiu LI, Qiang YANG

DOI: 10.1631/FITEE.2520000 Downloaded: 355 Clicked: 447 Cited: 0 Commented: 0(p.1767-1770) <Full Text>

Position Article: Large investment model

Jian GUO, Heung-Yeung SHUM

DOI: 10.1631/FITEE.2500268 Downloaded: 1715 Clicked: 872 Cited: 0 Commented: 0(p.1771-1792) <Full Text><PPT> 345

Chinese summary <5>

郭健，沈向洋
粤港澳大湾区数字经济研究院（IDEA），中国深圳市，518045
摘要：传统量化投资研究正面临边际效益递减与人力时间成本攀升的双重压力。为突破此困境，我们提出投资大模型（LIM）—一种旨在实现规模化性能与效率提升的新型量化投资研究范式。该模型通过端到端学习与构建底座模型的方法构建量化投资基础模型，使其能够从跨市场、跨资产类别、跨频率的多维度金融数据中自主学习综合信号模式。这些"全局规律"可迁移至下游策略建模阶段，针对具体任务实现性能优化。本文详述了LIM的系统架构设计，探讨了该范式下的关键技术挑战，并指出未来研究方向。

关键词组：通用人工智能；端到端；投资大模型；量化投资；基础模型；多模态大语言模型

Review Article: Knowledge distillation for financial large language models: a systematic review of strategies, applications, and evaluation

Jiaqi SHI, Xulong ZHANG, Xiaoyang QU, Junfei XIE, Jianzong WANG

DOI: 10.1631/FITEE.2500282 Downloaded: 600 Clicked: 1544 Cited: 0 Commented: 0(p.1793-1808) <Full Text><PPT> 264

Chinese summary <5>

石家琪^1,2，张旭龙¹，瞿晓阳¹，谢骏飞^1,2，王健宗¹
¹平安科技（深圳）有限公司，中国深圳市，518046
²中国科学技术大学先进技术研究院，中国合肥市，230027
摘要：金融大语言模型为金融应用提供了巨大潜力。然而，过高的部署成本和巨大的推理延迟构成了主要障碍。作为一种重要压缩方法，知识蒸馏为这些难题提供了有效解决方案。本文对知识蒸馏如何与金融大语言模型相互作用进行了全面调查，涵盖了策略、应用和评估3个核心方面。在策略层面，引入一个结构化分类法，以比较分析现有蒸馏路径。在应用层面，提出一个逻辑的上游–中游–下游框架，系统地解释蒸馏模型在金融领域的实际价值。在评估层面，为解决金融领域缺乏标准的问题，构建了一个综合评估框架，从金融准确性、推理保真度和稳健性等多个维度进行评估。总而言之，本文旨在为这一跨学科领域提供清晰的路线图，以加速蒸馏型金融大模型发展。

关键词组：金融大语言模型；知识蒸馏；模型压缩；量化交易

Review Article: A survey on large language model-based alpha mining

Junjie ZHANG, Shuoling LIU, Tongzhe ZHANG, Yuchen SHI

DOI: 10.1631/FITEE.2500386 Downloaded: 1205 Clicked: 857 Cited: 0 Commented: 0(p.1809-1821) <Full Text><PPT> 263

Chinese summary <5> 基于大语言模型的阿尔法挖掘研究综述

张俊杰¹，刘硕凌²，张桐喆²，施雨晨^2,3
¹南洋理工大学计算机与数据科学学院，新加坡，639798
²易方达资产管理有限公司，中国广州市，510000
³新加坡国立大学工业系统工程与管理系，新加坡，119077
摘要：阿尔法挖掘指系统性地发现能够预测未来截面收益的数据驱动信号，是量化研究的核心任务。近年来，大语言模型（LLM）的进展催生基于LLM的阿尔法挖掘框架，这类框架在人工指导与算法自动挖掘方法之间提供了理想的中间路径，兼具效率与语义深度。本文从智能体视角出发，对新兴的基于LLM的阿尔法挖掘系统进行结构化综述，并分析LLM在挖掘者、评估者及交互助手中的功能性角色定位。尽管初期取得进展，关键挑战依然存在，包括简化的绩效评估、有限的数值理解能力、缺乏多样性与原创性、薄弱的探索动力学、时间数据泄露以及黑箱风险与合规性挑战。据此，我们勾勒出未来的发展方向，包括提升推理一致性、拓展至新型数据模态、重新审视评估方案，以及将LLM整合到更通用的量化系统中。我们的分析表明，LLM作为可扩展的接口，既能放大领域专业知识又能增强算法严谨性，即它通过将定性假设转化为可验证因素来强化领域专业知识，同时通过支持快速回测和语义推理来提升算法严谨性。由此形成的互补范式中，直觉、自动化与基于语言的推理相互融合，共同重塑量化研究的未来。

关键词组：阿尔法挖掘；量化投资；大语言模型（LLM）；LLM智能体；金融科技

FinSphere: a real-time stock analysis agent with instruction-tuned large language models and domain-specific tool integration

Shijie HAN, Jingshu ZHANG, Yiqing SHEN, Kaiyuan YAN, Hongguang LI

DOI: 10.1631/FITEE.2500414 Downloaded: 627 Clicked: 864 Cited: 0 Commented: 0(p.1822-1831) <Full Text><PPT> 305

Chinese summary <4> FinSphere：一款搭载指令微调大语言模型及集成领域专用工具的实时股票分析代理

韩世杰^1,3，张景舒^2,3，沈逸卿^3,4，闫开元³，李宏广³
¹哥伦比亚大学工业工程与运筹学系，美国纽约市，10027
²上海财经大学信息管理与工程学院，中国上海市，200433
³九方智投控股有限公司，中国上海市，201702
⁴约翰斯·霍普金斯大学计算机科学系，美国巴尔的摩市，21218
摘要：当前金融大语言模型（FinLLM）存在两大局限：缺乏股票分析质量的标准化评估指标，以及分析深度不足。我们通过两项创新突破这些局限。首先推出AnalyScore，一套评估股票分析质量的系统化框架；其次构建一个由专家精心筛选的数据集Stocksis，旨在提升大语言模型（LLM）的金融分析能力。基于Stocksis数据集，结合创新集成框架与量化工具，我们开发出FinSphere智能体，可生成专业级股票分析报告。AnalyScore评估表明，FinSphere在分析质量和实际应用能力方面显著优于通用LLM、领域专用金融LLM及现有智能体系统，即便后者配备实时数据访问和少样本指导功能亦然。研究结果凸显了FinSphere在分析质量与现实应用中的显著优势。

关键词组：大语言模型（LLM）；指令微调金融大模型；实时股票分析；评估框架与数据集

Can large language models effectively process and execute financial trading instructions?

Yu KANG, Xin YANG, Ge WANG, Yuda WANG, Zhanyu WANG, Mingwen LIU

DOI: 10.1631/FITEE.2500285 Downloaded: 685 Clicked: 750 Cited: 0 Commented: 0(p.1832-1846) <Full Text>

Chinese summary <4>

康裕¹，杨欣²，王戈³，王誉达⁴，王占宇⁵，刘铭文⁶
¹西交利物浦大学数学物理学院，中国苏州市，215123
²中山大学数学学院，中国珠海市，519082
³香港科技大学工学院，中国香港特别行政区，999077
⁴香港大学计算与数据科学学院，中国香港特别行政区，999077
⁵悉尼大学电气与计算机工程学院，澳大利亚悉尼，2006
⁶似然实验室，中国广州市，510300
摘要：大语言模型（LLM）的发展为金融行业创造了变革性机遇，尤其在金融交易领域。然而，如何将LLM与交易系统集成成为一项挑战。为解决这一问题，本文提出一种智能交易订单识别流程，能够在交易执行过程中将交易订单转换为标准格式。该系统提升人工交易员与交易平台的交互能力，同时解决交易执行中的信息获取偏差问题。此外，构建一个包含500条数据的交易订单数据集，用于模拟真实交易场景。通过在该数据集上对5个最先进的LLM进行实验，设计多项评价指标，以全面评估数据集的可靠性及大模型在金融领域的生成能力。实验结果表明，大多数模型能以较高准确率（约80%–99%）生成语法正确的JavaScript对象表示法（JSON），并在几乎所有（约90%–100%）不完整案例中主动提出澄清性问题。但模型的端到端准确率仍处于较低水平（约6%–14%），信息缺失问题显著（约12%–66%）。此外，模型存在过度问询倾向—约70%–80%后续问询并无必要，这不仅增加交互成本，还带来潜在的信息泄露风险。研究还证实将该流程与真实交易系统集成的可行性，为基于LLM的交易自动化解决方案的实际部署奠定基础。

关键词组：大语言模型；金融指令；评估；数据集构建

MENTOR: a multi-agent framework for event and narrative trend prediction with optimized reasoning

Liyuan CHEN, Gaoguo JIA, Dongsheng GU, Jiangpeng YAN, Yuhang JIANG, Xiu LI, Xiaojun ZENG

DOI: 10.1631/FITEE.2500608 Downloaded: 745 Clicked: 524 Cited: 0 Commented: 0(p.1847-1861) <Full Text><PPT> 234

Chinese summary <5>

陈丽园^1,2，贾杲果²，顾东升²，严江鹏²，蒋昱航²，李秀¹，曾晓军³
¹清华大学深圳国际研究生院，中国深圳市，518055
²易方达基金管理有限公司，中国广州市，510620
³曼彻斯特大学计算机科学系，英国曼彻斯特市，M139PL
摘要：叙事经济学认为，金融市场很大程度上受不断演化的叙事影响，这为预测新兴事件及其对经济的影响提供了新的可能。然而，现有基于大语言模型的方法在任务分解的系统性和与金融场景的契合度方面仍存在不足。本文提出MENTOR框架，这是一种面向事件和叙事趋势预测的多智能体系统，结合了教师-学生式的迭代推理机制，并通过一系列渐进式子任务实现预测功能：识别和排序正在形成的热点事件、从当前叙事中预测未来事件以及预测受这些事件影响的行业指数表现。基于我们自建的中文关键意见领袖（KOL）数据集和英文财经新闻数据集的实验结果表明，MENTOR在事件预测和行业排序任务上均优于近期的基线模型，包括增强型未来事件预测（StkFEP）和"总结–解释–预测"（SEP）框架。此外，投资组合层面的回测结果显示，改进的事件和行业预测可带来实际的投资绩效提升。研究结果表明，将结构化推理与多智能体反馈相结合，能够显著提升事件预测的可靠性，并加强叙事动态与金融市场结果之间的联系。

关键词组：叙事经济学；多智能体；事件检测；事件预测

Correspondence: When DeepSeek-R1 meets financial applications: benchmarking, opportunities, and limitations

Shuoling LIU, Liyuan CHEN, Jiangpeng YAN, Yuhang JIANG, Xiaoyu WANG, Xiu LI, Qiang YANG

DOI: 10.1631/FITEE.2500227 Downloaded: 2598 Clicked: 1092 Cited: 0 Commented: 0(p.1862-1870) <Full Text><PPT> 298

Chinese summary <4>

刘硕凌^1,2，陈丽园²，严江鹏^2,4，蒋昱航²，王笑予²，李秀⁴，杨强^1,3
¹香港科技大学，中国香港特别行政区，999077
²易方达基金管理有限公司，中国广州市，510000
³微众银行，中国深圳市，518054
⁴清华大学深圳国际研究生院，中国深圳市，518055
摘要：在金融服务领域，推理型大语言模型--尤其新兴开源模型DeepSeek-R1--的潜在价值仍处于初步探索阶段。尽管通用大语言模型已在金融新闻分析、客户交互等场景实现较多应用，但DeepSeek-R1凭借集成强化学习的多阶段训练机制，突破性地解锁了高级推理能力，不仅能精准应对复杂金融问答任务，还针对资源受限环境推出轻量级蒸馏学生模型，显著提升部署灵活性。本文以跨学科视角切入金融人工智能领域，首先系统剖析DeepSeek-R1的技术架构与核心原理，随后基于两个公开金融问答数据集，对DeepSeek-R1及其蒸馏模型开展初步但全面的性能基准测试。在此基础上，深入探讨该模型为金融服务带来的创新机遇，客观分析其现存局限性，并前瞻性地提出3个未来研究方向。本文旨在为推理型大语言模型在金融人工智能领域的合理应用与深度发展提供理论依据与实践指引，推动金融科技迈向更高层次。

关键词组：大语言模型；模型推理；人工智能；金融科技

Comment: Three trustworthiness challenges in large language model-based financial systems: real-world examples and mitigation strategies

Shurui XU, Feng LUO, Shuyan LI, Mengzhen FAN, Zhongtian SUN

DOI: 10.1631/FITEE.2500421 Downloaded: 689 Clicked: 593 Cited: 0 Commented: 0(p.1871-1878) <Full Text><PPT> 260

Chinese summary <4>

徐殊睿¹，罗凤²，李舒燕¹，范梦真³，孙中天⁴
¹贝尔法斯特女王大学电子、电气工程与计算机科学学院，英国贝尔法斯特，BT9 5BN
²莱斯大学计算机科学系，美国得克萨斯州休斯敦市，77005
³北京大学汇丰商学院牛津校区，英国英格兰，OX1 5HR
⁴肯特大学计算机学院，英国肯特郡坎特伯雷，CT2 7NZ
摘要：大语言模型（LLM）在金融应用中的集成展现出显著潜力，可提升决策流程、实现操作自动化并提供个性化服务。然而，金融系统的高风险特性要求极高的可信度，而当前LLM往往难以满足这一要求。本研究识别并探讨了基于LLM的金融系统中的3大可信度挑战：（1）逃逸式提示—利用模型对齐漏洞生成有害或违规响应；（2）幻觉现象—模型产出事实错误的输出误导金融决策；（3）偏见与公平性问题—LLM内嵌的人口统计或制度偏见可能导致个体或区域遭受不公平对待。为具体呈现这些风险，我们设计了3项金融相关测试，并对涵盖专有与开源家族的主流LLM进行评估。在所有模型中，每项测试至少出现一次风险行为。基于这些发现，系统性地总结了现有风险缓解策略。我们认为，解决这些问题不仅对确保金融领域人工智能的负责任使用至关重要，更是实现其安全可扩展部署的关键所在。

关键词组：可信赖的人工智能；大语言模型；金融；金融科技

Regular Papers

An adaptive outlier correction quantization method for vision Transformers

Zheyang LI, Chaoxiang LAN, Kai ZHANG, Wenming TAN, Ye REN, Jun XIAO

DOI: 10.1631/FITEE.2400994 Downloaded: 576 Clicked: 920 Cited: 0 Commented: 0(p.1879-1895) <Full Text><PPT> 274

Chinese summary <4>

李哲暘^1,2，蓝朝祥²，张凯²，谭文明²，任烨²，肖俊¹
¹浙江大学计算机科学与技术学院，中国杭州市，310027
²杭州海康威视数字技术股份有限公司，中国杭州市，310051
摘要：Transformer模型虽已在多个领域展现出显著成效，但其巨大的计算和内存需求对其应用构成限制，尤其在资源受限的边缘设备上部署时面临挑战。量化作为一种有效的模型压缩方法，能显著降低Transformer在边缘设备上的运行时间。值得注意的是，与卷积神经网络（CNN）相比，Transformer的激活值表现出更为显著的离群值，导致不同通道和令牌间的特征分布不均。为应对此问题，提出一种自适应离群值校正量化（AOCQ）方法，该方法能显著降低这些离群值的不利影响。AOCQ在3个层级上调整通道和令牌间的显著差异：算子级；框架级；损失级。引入一种新颖的算子，它能等效平衡不同通道间的激活值，并在框架层面增设一个额外的阶段，以优化激活值的量化步骤。此外，在损失层面，将各令牌和各通道间的不均衡激活值转移到模型权重的优化过程中。理论分析表明，该方法能有效降低量化误差。所提方法的有效性已在在多种基准模型和任务上得到验证。经过8位训练后量化的DeiT-B模型在仅损失0.28个百分点精度的情况下，精度达到81.57%，同时实现4倍的推理加速。此外，在包括图像分类和目标检测在内的多项任务中，Swin Transformer和DeiT的权重可被训练后量化到4位，精度损失仅为2%，同时所需内存仅为原来的1/8。

关键词组：Transformer；模型压缩和加速；训练后量化；离群值

Prototypical clustered federated learning for heart rate prediction

Yongjie YIN, Hui RUAN, Yang CHEN, Jiong CHEN, Ziyue LI, Xiang SU, Yipeng ZHOU, Qingyuan GONG

DOI: 10.1631/FITEE.2500062 Downloaded: 1413 Clicked: 1065 Cited: 0 Commented: 0(p.1896-1912) <Full Text><PPT> 142

Chinese summary <4>

殷勇杰¹，阮辉¹，陈阳¹，陈炯²，黎子玥³，苏翔⁴，周义朋⁵，宫庆媛⁶
¹复旦大学计算机科学技术学院，中国上海市，200438
²蔚来汽车，中国上海市，201805
³科隆大学信息系统系，德国科隆，50969
⁴赫尔辛基大学农业科学系，芬兰赫尔辛基，00014
⁵麦考瑞大学计算学院，澳大利亚悉尼，2109
⁶复旦大学智能复杂体系基础理论与关键技术实验室，中国上海市，200433
摘要：预测未来心率不仅有助于检测心律异常，也能为下游健康监测服务提供及时支持。现有心率预测方法在隐私保护和数据异构性方面面临挑战。为应对这些挑战，本文提出一种新颖的心率预测框架--PCFedH，该框架利用个性化联邦学习和原型对比学习，来实现稳定聚类效果与更精准的预测。PCFedH包含两个核心模块：一个基于原型对比学习的联邦聚类模块，通过刻画数据异构性并增强心率表征以获取更有效聚类；一个两阶段软聚类联邦学习模块，依托稳定聚类结果实现各本地模型的个性化性能提升。在两个真实数据集上的实验结果表明，本方法优于现有最先进技术，在两个数据集上均方误差平均降低3.1%。此外，进行了全面实验，以实证验证所提方法各关键组件的有效性。其中个性化组件被证实为整个设计中最关键部分，表明其对整体性能具有重大影响。

关键词组：联邦学习；心率预测；原型对比学习

Multiplication extended Kalman filter-aided non-blind star image restoration algorithm based on the heterogeneous blur kernel

Yang LIU, Huajian DENG, Hao WANG, Zhonghe JIN

DOI: 10.1631/FITEE.2500193 Downloaded: 527 Clicked: 801 Cited: 0 Commented: 0(p.1913-1925) <Full Text>

Chinese summary <4>

刘洋^1,2,3，邓华健¹，王昊^1,2,3，金仲和^1,2,3
¹浙江大学微小卫星研究中心，中国杭州市，310027
²浣江实验室，中国诸暨市，311899
³浙江省微纳卫星研究重点实验室，中国杭州市，310027
摘要：在动态条件下，星斑在成像平面上的模糊效应会降低质心提取精度，从而影响姿态估算。为提升星敏感器的动态性能，提出一种基于异质模糊核的乘性扩展卡尔曼滤波（MEKF）辅助非盲星图像复原算法。该算法包含3个步骤：首先，采用MEKF估计姿态和陀螺漂移，以消除星敏感器测量误差和陀螺漂移。其次，利用MEKF预测的姿态作为初始条件，加速后续算法运行。最后，提出一种陀螺辅助异质模糊核估计算法，用于恢复非均匀与非线性运动模糊的星图。与现有动态星像去模糊算法主要关注图像内容不同，本方法着眼于运动模糊的成因，融合MEKF和异质模糊核技术。这显著增强了对噪声的鲁棒性并提高了复原精度。仿真结果表明，该方法显著优于现有技术，将质心提取精度提升高达59.64%，并将各轴指向精度提高78.94%以上。

关键词组：异质模糊核估计；动态环境；局部图像复原；乘性扩展卡尔曼滤波；陀螺漂移

Large language model-enhanced probabilistic modeling for effective static analysis alarms

Xinlong PAN, Jianhua LI, Zhihong ZHOU, Gaolei LI, Xiuzhen CHEN, Jin MA, Jun WU, Quanhai ZHANG

DOI: 10.1631/FITEE.2500038 Downloaded: 1148 Clicked: 1131 Cited: 0 Commented: 0(p.1926-1941) <Full Text><PPT> 140

Chinese summary <4>

潘鑫龙^1,2，李建华^1,2，周志洪^1,2，李高磊^1,2，陈秀真^1,2，马进^1,2，伍军^1,2，张全海^1,2
¹上海交通大学计算机学院网络安全技术研究院，中国上海市，200240
²上海市信息安全综合管理技术研究重点实验室，中国上海市，200240
摘要：静态分析在警报处理方面面临诸多挑战，其中概率模型与警报优先级排序是缓解用户手动检查负担的关键方法。这些模型通常依赖用户反馈对警报进行排序，从而提升处理效率。然而，现有方法常受限于效率低下及泛化能力不足等问题。尽管基于学习的方法已展现一定潜力，但其通常伴随着高昂的训练代价，并受预定义模型结构的制约。此外，大语言模型（LLM）在静态分析中的集成尚未充分发挥其潜力，导致漏洞识别准确率偏低。为应对上述问题，本文提出一种新型框架—BinLLM，该框架利用LLM的泛化能力，通过规则学习提升警报概率模型的性能。我们的方法将LLM生成的抽象规则引入概率模型，结合静态分析中的警报路径与关键语句，从而增强模型推理能力，有效提高真实漏洞的识别率，并缓解泛化错误问题。在一组C程序的实验评估中，BinLLM在警报验证所需检查数量上，较两个先进基线方法Bingo和BayeSmith分别减少40.1%与9.4%，充分体现了LLM与静态分析的结合在提升警报管理方面的应用潜力。

关键词组：静态分析；贝叶斯推理；大语言模型；警报排序

An improved sliding mode control based on fuzzy logic for quadrotor unmanned aerial vehicles under unmatched uncertainty

Qingmei CAO, Ruiwen XIANG, Yonghong TAN, Weiqing SUN, Jiawei CHI, Xiaodong ZHOU, Lei YAO

DOI: 10.1631/FITEE.2500058 Downloaded: 502 Clicked: 953 Cited: 0 Commented: 0(p.1942-1953) <Full Text>

Chinese summary <5>

曹庆梅¹，项瑞雯¹，谭永红²，孙伟卿¹，池佳威¹，周晓东^3,4，姚磊¹
¹上海理工大学机械工程学院，中国上海市，200093
²上海师范大学机电工程学院，中国上海市，200234
³中国人民公安大学信息与网络安全学院，中国北京市，100038
⁴上海公安学院信息化与网络安全系，中国上海市，200137
摘要：本文提出一种新型模糊滑模控制（FSMC）策略，旨在增强欠驱动四旋翼无人机（UAV）在存在外部干扰和模型不确定性条件下位置控制的鲁棒性与稳定性。为实现系统在复杂动态环境中的自适应能力与鲁棒性，基于传统滑模控制（SMC）设计智能二维模糊控制器，实时调整SMC参数以适应系统可变结构参数。首先基于误差滤波变量设计，采用传统SMC抑制跟踪误差。随后基于滤波变量及其变化率，开发融合模糊逻辑模块（FLM）与SMC的自学习模块（FLM+SMC）来调节上述SMC的两个参数。继而将FLM输出信号反馈至SMC模块，最终构建基于FSMC的UAV闭环调谐系统。此外，通过李亚普诺夫理论对FSMC的稳定性进行了严格验证。最终综合仿真表明，所设计的FSMC不仅能实现精确的轨迹精度，还具备鲁棒性和抗干扰能力；与SMC及自适应径向基函数神经网络控制（RBFNNC）的对比仿真验证了该结果。

关键词组：滑模控制；模糊逻辑理论；欠驱动系统；无人机；自学习策略

Swarm intelligent computing of electric eel foraging heuristics for fractional Hammerstein autoregressive exogenous noise model identification

Faisal ALTAF, Ching-Lung CHANG, Naveed Ishtiaq CHAUDHARY, Taimoor Ali KHAN, Zeshan Aslam KHAN, Chi-Min SHU, Muhammad Asif Zahoor RAJA

DOI: 10.1631/FITEE.2400730 Downloaded: 2409 Clicked: 1555 Cited: 0 Commented: 0(p.1954-1968) <Full Text>

Jiu fusion artificial intelligence (JFA): a two-stage reinforcement learning model with hierarchical neural networks and human knowledge for Tibetan Jiu chess

Xiali LI, Xiaoyu FAN, Junzhi YU, Zhicheng DONG, Xianmu CAIRANG, Ping LAN

DOI: 10.1631/FITEE.2500287 Downloaded: 458 Clicked: 681 Cited: 0 Commented: 0(p.1969-1983) <Full Text>

Chinese summary <3>

李霞丽^1,2，樊霄宇^1,2，喻俊志^3,4，董志诚⁵，才让先木⁵，兰萍⁵
¹中央民族大学民族语言智能分析与安全治理教育部重点实验室，中国北京市，100081
²中央民族大学信息工程学院，中国北京市，100081
³北京大学湍流与复杂系统国家重点实验室，中国北京市，100871
⁴北京大学通用人工智能国家重点实验室，中国北京市，100871
⁵西藏大学信息科学技术学院，中国拉萨市，850000
摘要：藏族久棋作为国家级非物质文化遗产，是一种复杂的棋类游戏，包含布局和战斗两个阶段。在硬件资源受限下，提升藏族久棋深度强化学习（DRL）模型的棋力水平成为难题。为解决该问题，本文提出一种基于层级神经网络和知识引导的两阶段模型—JFA。其包含两个子模型：用于布局阶段的策略布局模型（SLM）和用于对战阶段的分层对战模型（HBM）。两个子模型采用相似的网络结构，利用并行蒙特卡洛树搜索（MCTS）方法，独立进行自对弈训练。HBM由分层神经网络构成，上层网络用以选择移动和跳吃动作，下层网络用以选择成方吃子动作。基于人类知识设计辅助智能体，配合SLM和HBM模拟整个对局过程，根据成方情况或者实际胜负为棋局提供奖励信号。此外，在HBM模型中，提出两种基于人类知识的剪枝方法，分别对并行MTCS进行剪枝，以及对下层网络中的吃子动作进行捕获。与使用AlphaZero方法布局模型对弈的实验中，SLM胜率为74%，其决策时间大约缩短至AlphaZero模型所需时间的1/147。SLM在2024年中国全国计算机游戏大赛中摘得桂冠。HBM模型在与其他藏族久棋模型的对弈中取得70%胜率。当SLM与HBM在JFA框架下协同运作时，胜率提升至81%，达到人类业余四段棋手水平。这些成果表明JFA框架能有效提升藏族久棋人工智能的竞技表现。

关键词组：博弈；强化学习；藏族久棋；独立两阶段模型；自对弈；分层神经网络；并行蒙特卡洛树搜索

MltAuxTSPP: a unified benchmark for deep learning-based traffic state prediction with multi-source auxiliary data

Yusong ZHOU, Xiaoyu JIANG, Shu SUN, Xinmin ZHANG, Yuanqiu MO, Zhihuan SONG

DOI: 10.1631/FITEE.2500169 Downloaded: 785 Clicked: 1280 Cited: 0 Commented: 0(p.1984-1999) <Full Text><PPT> 255

Chinese summary <4>

周渝松^1,2，江肖禹^1,2，孙姝^1,2，张新民^1,2，莫远秋³，宋执环^1,2
¹浙江大学控制科学与工程学院，中国杭州市，310027
²浙江大学工业控制技术全国重点实验室，中国杭州市，310027
³东南大学数学学院，中国南京市，211189
摘要：深度学习使交通预测模型能够融合多种辅助数据源（如天气和时间信息），从而提升预测精度。现有方法往往存在通用性与可扩展性受限的问题，且该领域缺乏统一的基准测试框架来实现公平的模型比较。这种缺失阻碍了性能评估的一致性，延缓了稳健且适应性强的模型开发进程，导致量化不同辅助数据源的增量效益变得困难。为解决这些问题，我们提出MltAuxTSPP—一个融合多源辅助数据的交通预测深度学习统一基准框架。该框架具备标准化数据容器与融合嵌入模块，可实现异构数据的统一处理并提升可扩展性。其生成的统一隐含表示能被各类下游模型无缝采用，确保在相同条件下进行公平可复现的比较。基于真实数据集的广泛实验表明，MltAuxTSPP能有效利用气象与时间特征提升长期预测性能，为推进交通状态预测研究提供实用且可复现的基础框架。

关键词组：交通预测；基准平台；深度学习；多源辅助数据

Frequency of arrival-based state estimation and trajectory optimization for the navigation of autonomous marine vehicles

Sitian WANG, Huarong ZHENG, Jianlong LI, Wen XU

DOI: 10.1631/FITEE.2500235 Downloaded: 386 Clicked: 1198 Cited: 0 Commented: 0(p.2000-2015) <Full Text><PPT> 160

Chinese summary <4>

王思甜¹，郑华荣²，李建龙¹，徐文^2,3
¹浙江大学信息与电子工程学院，中国杭州市，310027
²浙江大学海洋学院，中国舟山市，316021
³中国科学院深海科学与工程研究所，中国三亚市，572000
摘要：本文利用全球定位系统（GPS）与海洋水面载具的机动性，研究了无人水面航行器（USV）与自主水下航行器（AUV）间的导航问题，提出一种基于USV轨迹优化的移动AUV状态估计方法。通过分析多普勒效应对单一水面USV接收的声学信号到达频率（FOA）的影响，可同步估计AUV的位置与速度，提供了一种不需要时间同步的鲁棒解决方案。此外，通过动态调整USV轨迹来构建最优的USV-AUV测量几何构型，从而提高AUV的可观测性并提升状态估计性能。该方法的创新点是一个基于Cramér-Rao下界（CRLB）进行可观测性分析与几何约束的定制化成本函数。该函数整合了：（1）CRLB—用于优化系统可观测性，从而提高估计精度；（2）距离项—确保USV与AUV保持适当距离；（3）转向率项—用于调整USV航向以增强跟踪能力。采用粒子群优化算法对该成本函数进行最小化求解，通过多组件平衡实现稳健的AUV跟踪框架。我们通过全面仿真验证了USV轨迹复杂度、AUV下潜深度、测量频率、数据丢包率及噪声水平等不同因素对导航性能的潜在影响。仿真结果表明，所提方法在AUV状态估计与跟踪方面具有显著有效性。

关键词组：到达频率；滚动视界估计；轨迹优化；无人水面航行器；自主水下航行器；导航

Distributed kernel mean embedding Gaussian belief propagation for underwater multi-sensor multi-target passive tracking

Dengpeng YANG, Yunfei GUO, Yanbo XUE, Anke XUE, Yun CHEN

DOI: 10.1631/FITEE.2500204 Downloaded: 615 Clicked: 1221 Cited: 0 Commented: 0(p.2016-2029) <Full Text>

Chinese summary <4>

杨登朋，郭云飞，薛研博，薛安克，陈云
杭州电子科技大学自动化学院，中国杭州市，310018
摘要：为解决杂波环境下水下多传感器多目标被动跟踪问题，本文提出一种分布式核均值嵌入高斯置信传播（DKME-GaBP）算法。首先，建立并因式分解联合后验概率密度函数（PDF），通过对应因子图进行表示。随后，在该因子图上运行GaBP算法，以降低数据关联的计算复杂度。GaBP的因子图包含内环与外环：内环负责局部航迹估计与数据关联，外环融合多传感器信息。在内环中，设计基于高斯核的核均值嵌入（KME）方法，将局部估计中的强非线性问题转化为高维再生核希尔伯特空间（RKHS）中的线性问题。在外环中，提出一种基于KME的多传感器分布式融合方法，通过考虑RKHS中不同PDF之间的距离来提高融合精度。仿真结果验证了DKME-GaBP算法的有效性与鲁棒性。

关键词组：核均值嵌入；置信传播；多传感器多目标跟踪；水下被动跟踪

Port and radiation pattern decoupled metasurface-loaded patch antenna using deep-learning-assisted optimization for MIMO applications

Gu LIU, Jiajiang SHEN, Lei MA, Wei QIN, Wenwen YANG, Lei GUO, Jianxin CHEN

DOI: 10.1631/FITEE.2500119 Downloaded: 713 Clicked: 983 Cited: 0 Commented: 0(p.2030-2040) <Full Text><PPT> 163

Chinese summary <5>

刘谷¹，沈嘉蒋¹，马磊¹，秦伟¹，杨汶汶¹，郭磊²，陈建新¹
¹南通大学信息科学技术学院，中国南通市，226019
²大连理工大学信息与通信工程学院，中国大连市，116024
摘要：提出一种由深度学习优化方法辅助的元表面加载1×2贴片阵列天线，以同时实现端口和辐射方向图解耦，从而增强多输入多输出（MIMO）系统中元件之间的隔离。深度学习辅助优化方法使用人工神经网络（ANN）和粒子群优化（PSO）算法来寻求天线的最佳结构，以实现具有无失真辐射方向图的端口解耦。ANN被训练来描述几何参数与天线响应之间的非线性关系。在成本函数和迭代次数的指导下，使用PSO算法，根据成本函数并结合训练好的ANN对天线结构进行优化。最后，通过约束成本函数，得到一个1×2贴片阵列天线，其上有一个由螺柱固定的元表面，同时实现了端口和辐射方向图的解耦。为验证该原理和设计方法，设计、制造并测量了一个尺寸为0.88λ₀×0.47λ₀×0.21λ₀（λ₀是中心频率处自由空间中的波长）的天线原型。测量的分数带宽为8%（4.8-5.2 GHz）。二元贴片天线的隔离度从7.6 dB增加到24.3 dB，在0.35λ₀处的包络相关系数（ECC）<0.0005。此外，每个元素的H平面辐射方向图是一致的，并在宽边方向上对称。这些特性使得所提出的天线适用于近间距的MIMO天线系统。

关键词组：人工神经网络；粒子群优化算法；互耦；辐射方向图恢复；超表面

Effective fault detection in M3D ICs: a cluster-based BIST for enhanced inter-layer via fault coverage

Hadi JAHANIRAD, Ahmad MENBARI, Hemin RAHIMI, Daniel ZIENER

DOI: 10.1631/FITEE.2401094 Downloaded: 411 Clicked: 716 Cited: 0 Commented: 0(p.2041-2063) <Full Text>

Chinese summary <4>

Hadi JAHANIRAD¹, Ahmad MENBARI²,Hemin RAHIMI¹, Daniel ZIENER²
¹库尔德斯坦大学电子与通信工程系，伊朗萨南达季市，90210
²伊尔默瑙工业大学计算机体系结构与嵌入式系统系，德国伊尔默瑙市，98693
摘要：单片三维集成电路（M3D IC）作为克服传统二维器件缩放限制的一种创新解决方案，能够提升性能、降低功耗、增强功能。作为M3D IC中的重要组件，层间通孔（ILV）可实现层间垂直连接，但其易在制造及运行过程中出现故障，如阻塞（SAF）、短路、开路等，进而影响系统可靠性。上述问题亟需采用先进的内建自测（BIST）方法，实现高效故障检测与定位，同时降低测试开销。本文提出一种新型BIST结构，能够高效检测ILV故障，尤其针对非规则分布的ILV，并基于步进模式方法实现簇内近似故障定位。在所提出的BIST框架中，根据故障发生的概率将ILV分成若干簇，以实现对所有SAF和桥接故障（BF）以及大部分多重故障的高效检测。该策略使设计者能够对故障覆盖率、定位精度、测试时间进行微调，以满足特定设计要求。新的BIST方法解决了现有方案的一个关键缺陷，即通过引入多簇ILV结构，显著减少了测试配置数量与总体测试时间。该方法还提高了区域和硬件利用率，尤其适用于大规模电路基准测试。例如，在LU32PEENG基准测试中，将ILV划分为64个簇后，功耗、面积、硬件开销分别降低0.82%、1.03%和1.14%。

关键词组：单片三维集成电路（M3D IC）；层间通孔（ILV）；内建自测（BIST）；故障检测与定位

Erratum: Erratum to: Efficient learning of robust multigait quadruped locomotion for minimizing the cost of transport

Zhicheng WANG, Xin ZHAO, Meng Yee (Michael) CHUAH, Zhibin LI, Jun WU, Qiuguo ZHU

DOI: 10.1631/FITEE.24e1070 Downloaded: 201 Clicked: 303 Cited: 0 Commented: 0(p.2064-2064) <Full Text>

Journal of Zhejiang University-SCIENCE, 38 Zheda Road, Hangzhou 310027, China
Tel: +86-571-87952276; Fax: +86-571-87952331; E-mail: jzus@zju.edu.cn
Copyright © 2000~ Journal of Zhejiang University-SCIENCE

CONTENTS

INSTR. FOR AUTHOR

FOR REVIEWER

ABOUT JZUS

Publishing Service

Advertisements

CONTENTS

INSTR. FOR AUTHOR

FOR REVIEWER

ABOUT JZUS

Publishing Service

Advertisements

Chinese summary <5>

Chinese summary <5>

Chinese summary <5> 基于大语言模型的阿尔法挖掘研究综述

Chinese summary <4> FinSphere：一款搭载指令微调大语言模型及集成领域专用工具的实时股票分析代理

Chinese summary <4>

Chinese summary <5>

Chinese summary <4>

Chinese summary <4>

Chinese summary <4>

Chinese summary <4>

Chinese summary <4>

Chinese summary <4>

Chinese summary <5>

Chinese summary <3>

Chinese summary <4>

Chinese summary <4>

Chinese summary <4>

Chinese summary <5>

Chinese summary <4>