项目编号:【168695】
我们现有一份采用HDF5存储的一维可变长序列数据,每个事件(event)均携带多条击(hit),其数量不一,每条击包含\text{time}与\text{ID}两个特征;对应的目标输出是该事件的空间坐标(x,y,z),即需要进行回归。为此,我们已经开发了一个简易的Encoder-OnlyTransformer示例,演示如何在不定长序列基础上完成回归任务。现希望你在不改变数据输入与输出格式的前提下,基于PyTorch编写一个更复杂、更高效的单脚本训练流程,可以使用Transformer、Mamba、GTN、PointNET等任意结构或训练策略,只要能充分利用这些可变长时序击信息,在同样的输入(\text{time},\text{ID})与输出((x,y,z)回归)条件下取得更好的预测效果即可。请尽量在脚本中包含完整的网络定义、数据处理(特别是对可变长序列的处理)以及训练循环,以便我们能直接运行并对比新的模型与原有示例在回归精度和整体性能上的差异。