CERN的触发系统 -  LHC如何与持续的数据泛滥的数据©Getty Images

核心触发系统–LHC如何应对泛滥的数据

我们与Ben Wynne博士谈论CERN的大型特罗龙撞机如何处理4000万次碰撞中的数据。

另一天,另一种高能质子束碰撞。自从2008年CERN的大型特罗龙撞机(LHC)开始运营以来,难以捉摸的粒子的发现经常制造了头条新闻,并且公告范围 希格斯博世 对于Pentaquark来说已经给了我们在那里完成的研究的迷人形象。但对于在LHC工作的科学家来说,在接近光速接近速度的亚原子粒子的射线是日常现实的一部分,并且令人眼花缭乱的新的异国颗粒的发现不容易。

广告

事实上,尽管LHC是历史上最复杂和最令人印象深刻的壮举之一,但它有一个简单但其科学家可以分析多少数据来分析:CERN的计算机存储。每次碰撞都有可能告诉我们更多关于我们的宇宙的宇宙,而是为了防止CERN变得不堪重负,绝大多数数据需要被抛弃。这是否意味着LHC的科学家可能会错过新发现?

瑞士梅素镇的百米门,核心粒子物理实验室的家庭,位于LHC最大的粒子探测器:地图集实验。由于质子的梁在地图集地区彼此冲突,因此探测器的作业拾取碰撞的碎片,这是以较小的高能量颗粒和结构的形式,它们互相粉碎所产生的较小,高能量粒子和结构。

“爱丁堡大学的研究员Ben Wynne博士表示,将探测器描述为一个大规模的向内的数码相机是一种急剧的过度简化的,这是一个由地图集地收集的数据。但是,普通摄像机创建由各个闪光的像素组成的图像,或者击中其检测器的不同像素化部分,相机博士描述是完全不同的。

“Atlas检测器的最内层称为像素检测器,由像素化硅制成;除了我们寻找比您可以用来撰写普通照片的光子更高的能量粒子。“因此,由碰撞产生的每个高能粒子形成独特照片的一小部分。阿特拉斯能够以质子束碰撞的后果连续,3D图像发生,然后将其存储在Cern的计算机系统中,以进行物理学家分析。

Wynne Dr在处理这些图像中的角色至关重要。由于LHC的探测器拾取了各个质子 - 质子碰撞所产生的粒子,因此压倒性的数据淹没到Cern的计算机中。这意味着需要一个系统来录制最重要的碰撞数据,并丢失其余部分。 “阿特拉斯每秒检测4000万次冲突,但我们只能每秒纪录1,000。 Wynne博士解释说,单个事件需要大约1.3兆字节的存储,因此我们无法存储所有原始数据“。因此,录音率低(即将在40,000次碰撞中即将左右),因此他的工作和数百名其他科学家们开发了Atlas极其挑剔的数据记录系统所需的软件。

“我们在探测器本身中的下一个洞穴中有一个大型计算机系统,这将读出探测器,并且基于特定事件是否有趣,非常迅速做出决策。我们称之为触发系统。“幸运的是,触发系统对触发系统决定发生了很多数据时不是太难。

“从机器中出来的大多数数据都不是很有趣,我们不需要录制它。这要做,因为质子碰撞不是特别是中环,所以没有大量的能量实际上被转移,否则这只是一个非常常见的过程,所以它没有什么会让我们感到惊讶“。所以尽管有机会告诉我们一些新的机会,但它非常不可能。考虑到这一点,触发系统的数据验收率为1以上40,000英寸并不像它首次似乎一样低得多。但这足以告诉科学家在他们想要知道的所有东西吗?

 “经过
“Alt =”“”按“类=”“”“”“”“Alt =”“by”classes =“”“”“”“credits =”false“]
,通过Wikimedia Commons
在LHC粒子加速器环上的与地图集相反,在法国狭窄下面的九千米,呈CMS实验。 CMS具有与Atlas类似的设置,并且探测器的主要目的之一是交叉检查彼此的结果,以验证任何感兴趣的结果。但有时,不同的研究需要CMS,留下两个探测器寻找不同类型的碰撞数据。

Wynne博士在当时的两项实验之间的目标差异导致一些科学家们的差异召回了一个例子。 “CMS正在制作结果,这些结果是在LHC内一般的一般无趣的碰撞。但他们去寻找可能出现在其中的特定结构,他们将他们的触发系统设置为专门寻找此问题,这产生了一个非常有趣的结果。“

这意味着随着CMS分析他们的发现,他们不幸的是,他们无法通过地图集地交叉检查结果。 “在Atlas,我们的触发系统以完全不同的方式设置,我们没有在CMS所需的能谱的下端中的数据。所以我们不仅没有这个结果,还没有看到CMS的结果,我们仍然无法返回并分析我们的数据来尝试并确认它。“

部分问题的是,随着LHC的研究人员逐渐更有趣的发现,它们通常需要编程LHC的探测器来寻找越来越高的能量粒子。这最终假设已经制作了低能量发现 - 但这并不总是如此。在这种情况下,CMS已经回去分析了地图集的较低能量粒子,即阿特拉斯决定不太注意,这意味着他们无法匹配CMS的结果。

因此,LHC研究人员有时需要在改变两个探测器的目标时进行计算的风险。在决定将LHC探测器设置为哪些能量范围时,有时需要进行这些权衡,这并不总是偿还。 “可能存在罕见的过程,我们刚刚在较低的能量实验中没有看到,因为他们没有生产足够的数据,”Wynne说。 “CMS必须在此分析上从触发系统中花费一个可怕的输出带宽,因此您可以争辩是对他们有价值的。”

一定的触发器

但是探测器导致不同地方引起的问题不是Cern的有限数据存储引起的唯一问题。计算机空间的限制意味着不同的科学家群体需要常常互相争论,谁获得了收集他们对研究所需的数据的资源。 “我们确实有会议,人们将以很长的长度争论,称这种特殊的物理信号是我有兴趣的,需要这个数字”,Wynne博士说。

“我们有限的产出总量,有些人将不得不丢失别人分析被视为更重要的地方”,他补充道。对于失去这些辩论的科学家来说,研究可以变得更加困难。 “如果您有更少的数据,您有时可以对相当有限的数据进行一些非常聪明的分析,但它更难完成它。”

全球LHC计算网格服务器,在瑞士日内瓦的Cern LHC实验的一部分©Harold Cunningham / Getty Images
全球LHC计算网格服务器,在瑞士日内瓦的Cern LHC实验的一部分©Harold Cunningham / Getty Images

最终,LHC产生的数据类型主要由每个LHC检测器的触发系统被编程为检测到的人的决定。已经,这个过程牺牲了对许多科学家有用的数据,在被认为最有可能是重要的数据。但即使在科学家的实验中,也赢得了这些辩论并与他们的研究有所了解,它并不完全确定是否将由触发系统拾取所有重要事件。

“你必须决定有趣的事情,什么不是,肯定有很多讨论,不仅仅是你如何如何证明一件事。但在哲学层面,您依靠您对实验和物理学的现有知识,并在那里建立了很多假设。“ LHC的科学家就像在未知领域的探险家一样,他们需要依靠自己的专业知识和直觉,因为它们标志着触发系统决定记录的事件的标准。没有保证物理学中最聪明的思想甚至可以困入正确的地方。

该现象科学家希望分析只能根据当前的科学理论确定,如果在探测器中发生完全新的科学的东西,则触发系统可以决定完全忽略它。 “我们必须做出一个选择我们将系统寻找的内容进行选择,如果我们被惊喜 - 那里有意外的东西,那么我们可能会错过它”,Wynne博士补充道。

但是,LHC的触发系统对意外事件并不完全盲目。 “我们确实有努力考虑这一点的方法。如果触发系统无法做出决定,所以无论出于何种原因,它都不理解该事件,然后可以在这种情况下保存,以防有一些特别有趣或奇怪的事情。“这一聪明的编程降低了科学家们发现新发现的风险。

“Wynne博士补充道”也有其他方法“。 “LHCB,CERN的其他实验之一,尝试并尽可能多地在触发系统本身中进行实际数据分析,因此随着数据的读出,大量分析只是实时完成。所以他们不必在他们负担不起时存放原始事件,但他们仍然可以从中获得相当多的物理学。“

保证,Wynne博士和所有LHC的触发系统软件工程师都准备好几乎每种可能性,因为潜在的发现来自意外的地方。但仍然,触发系统的令人难以置信的细致选择过程意味着意外事件没有完整的保证被记录而不是科学家实际寻找的更令人预测的事件。

尽管团队使用的所有方法都在大型强子撞机中工作,但它可以收集多少数据的基本限制,并且在它周围没有任何方式。 “您保存的数据越多,您在存储和网络带宽上就越多。因此,对数据集的规模有一些相当主要的限制 - 计算时间成本费用。我们目前的最大值是我们的最大值“,Wynne博士的结论。

这一约束已经为LHC创造了一个关于我们很少听到的研究的环境:一个设置在新发现上错过的风险。这就是为什么CERN只接受世界上最聪明的思想,并要求他们彼此不断辩论,以决定谁获得足够的资源来开展研究。这意味着LHC必须只使用现代工程和技术的巅峰,以确保最低可能数量的新发现穿过裂缝。但它最终是由缺失发现的风险不可避免的粒子物理学的混乱,不可预测的性质,并且只能减轻物理法允许的程度来缓解。


广告

关注科学专注  推特 Facebook , Instagram.   抹布