人工智能-远程-1个月
¥1-6K/月
技能要求: Torch
经验要求: 5-10年经验
程序员客栈
2025-04-10 11:54
工作描述:
项目编号:【37718】
本项目从数据分析的角度出发,应用先进深度学习方法(Transformer、Mamba、GNN等)处理粒子探测器事件数据,以实现高精度的位置回归。具体分析流程及工程师要求如下:

一、数据特点与分析目标
探测器数据包含大量光子信息,每个事件的光子(hits)记录了到达时间、对应光电倍增管(PMT)的位置坐标、电荷等特征。这些光子分为两类:

切伦科夫光子:具有较高的定位价值,通常最早到达且受散射较少。

闪烁光子:出现时间较晚、各向同性且易受散射干扰。

数据分析目标为自动筛选高价值光子(如切伦科夫光子),显著提升事件顶点位置的预测精度。

二、分析方法与模型(两阶段端到端可微分)
阶段一:自动光子筛选
输入数据:完整事件所有hits数据(时间、PMT坐标、电荷信息)。

特征嵌入(Embedding):MLP、Fourier映射或类似方法进行高维特征映射。

重要性评分网络:Transformer、Mamba或GNN计算光子的贡献分值。

自动Top-K选择:使用Gumbel-TopK等技术从大量hits中自适应选取K个高质量光子。

阶段二:精确位置回归
输入数据:阶段一精选的K个高质量光子。

高级分析模型:Transformer、LSTM、Mamba或MLP进一步提取精细时序与空间特征。

输出预测:事件顶点坐标(x,y,z)。

三、数据预处理与清理
PMT位置导入:通过外部PMT坐标文件构建映射表。

事件与光子筛选:应用物理标准过滤事件(光子数量、能量范围、时间窗口)。

四、完整脚本与实现要求
工程师要求:

以PyTorch写出能实现数据处理、特征工程、模型搭建与端到端训练及预测脚本;

提供完整脚本,包括数据加载、预处理、模型定义(Phase-1与Phase-2)、训练过程与结果评估;

可参考现有脚本进行开发优化;

代码结构清晰,注释明确,易于维护。

分析结果输出:

损失函数曲线、验证与测试的分辨率图表;

测试集预测坐标输出文件(test_set_DL.root)。

五、讨论与探索高级训练方法
鼓励讨论强化学习或其他先进训练技术(如自监督学习、自适应采样策略等)的潜在应用;

探索使用强化学习优化光子筛选策略,以进一步提升整体分析性能;

欢迎提出新模型与新分析方法的想法与建议。
公司信息

立即沟通