CMS đã thử nghiệm một phương pháp mới “thăm dò dữ liệu” • Igor Ivanov • Tin tức khoa học về “Yếu tố” • Phương pháp xử lý dữ liệu, Công cụ dò tìm CMS, Công nghệ tăng tốc và phát hiện

CMS đã cố gắng thông minh dữ liệu mới

Các ràng buộc hàng đầu trên hằng số liên kết của một boson nặng giả định Z 'Bphân rã thành hadron. Đường màu đen – Kết quả CMS thu được bằng phương pháp "thông minh dữ liệu". Đường cong màu sắc khác nhau – Kết quả của các thí nghiệm khác nhau với một tập hợp thống kê thống kê. Hình ảnh từ bài viết đang thảo luận

Tỷ lệ va chạm proton tại Large Hadron Collider cao tới mức các thiết bị dò tìm theo nghĩa đen cân bằng với điểm không chết trong luồng dữ liệu. Va chạm của các chùm proton xảy ra hàng chục triệu lần mỗi giây. Mỗi người trong số họ dẫn đến hàng chục vụ va chạm proton-proton cá nhân, và kết quả là, với sự ra đời của hàng trăm hạt. Mỗi sự kiện như vậy để lại một phản ứng trong máy dò, trong đó, sau khi số hóa, "nặng" thứ tự của một megabyte. Rõ ràng là việc truyền và ghi tất cả luồng dữ liệu này – và đó sẽ là nhiều terabyte mỗi giây – đơn giản là không có nơi nào để đi.

Trên thực tế, tất cả dữ liệu này không được ghi lại. Phần lớn các va chạm là vật lý hadron “nhàm chán”, đã được nghiên cứu rất xa và rộng rãi, hoặc tại các máy gia tốc trước đây hoặc tại LHC trong các buổi làm việc đầu tiên.Mối quan tâm chính được thể hiện bởi các sự kiện tương đối hiếm hoi của sự ra đời của các hạt nặng hoặc các quá trình cứng nhắc với momenta ngang lớn. Quy mô của sự hiếm có của các quy trình có sẵn để nghiên cứu tại LHC được mô tả trong bài viết phổ biến Rarities of the Microworld.

Trong các thiết bị dò tìm hiện đại, có các thiết bị đặc biệt, các bộ kích hoạt quản lý để phân tích tối thiểu từng va chạm trên bay và nói nếu nó có ý nghĩa để ghi lại nó để phân tích sâu hơn hay không (xem phần Một trăm nghìn của hàng triệu trong bài báo Giải phẫu của một tin tức). Hệ thống kích hoạt thường là đa cấp. Ví dụ, trong bộ dò CMS có bộ kích hoạt L1 chính, – thiết bị điện tử nhanh, được xây dựng theo một kiến ​​trúc đặc biệt, chỉ có thời gian để loại bỏ hầu hết dữ liệu chính từ máy đo lượng tử và thiết bị dò muon và biết liệu có bất kỳ phát hành năng lượng đáng kể hay không. Nếu L1 thấy điều gì đó, nó sẽ bỏ qua sự kiện này.

Sau đó, một kích hoạt HLT cấp cao, là một trang trại của 13.000 CPU, được lấy cho nó. Ở đây, các nhà vật lý đã đưa ra một số yêu cầu cho việc lựa chọn các sự kiện, ví dụ, ngưỡng giải phóng năng lượng tối thiểu.Nếu một sự kiện không đáp ứng tiêu chuẩn này, nó sẽ bị ném; nếu nó thỏa mãn, sự kiện được số hóa hoàn toàn từ tất cả các thành phần của máy dò và ghi lại trên sóng mang. Dòng chảy của các sự kiện trong CMS, thông qua lựa chọn hai giai đoạn khó khăn này, là 400 sự kiện mỗi giây; Đây là số liệu thống kê mà các nhà vật lý sẽ làm việc sau này trong chế độ ngoại tuyến.

Trong chương trình làm việc này, bạn có thể nhận thấy một số "chất thải" của quyền lực. Khi kích hoạt HLT phân tích dữ liệu, nó thực hiện số hóa tối thiểu, đặc biệt, nó phục hồi năng lượng của máy bay phản lực hadron, nhưng sau đó thông tin này bị loại bỏ. Do đó, vào năm 2012, CMS Collaboration đã quyết định giới thiệu một phương pháp ghi dữ liệu song song mới, được gọi là trinh sát dữ liệu ("thông minh dữ liệu").

Chúng tôi đang nói về việc bảo tồn thông tin về các sự kiện không đạt được tiêu chí lựa chọn HLT, nhưng trong đó cũng có một hoạt động hadron đáng chú ý. Dòng chảy của các sự kiện như vậy đạt đến hàng ngàn mỗi giây, và nó sẽ không có lợi nhuận để ghi lại tất cả chúng hoàn toàn. Tuy nhiên, có thể ghi lại không phải toàn bộ phản ứng của máy dò, nhưng chỉ một phần nhỏ thông tin mà trên thực tế, được sử dụng trong quá trình hoạt động của HLT. Sau đó, khối lượng của mỗi sự kiện sẽ được đơn đặt hàng của độ lớn nhỏ hơn, và dữ liệu này có thể được lưu mà không có vấn đề.

Ý nghĩa của thủ tục này là ngay cả thông tin không đầy đủ sẽ cho phép các nhà vật lý quy mô nhỏ "tìm kiếm" khu vực năng lượng trung bình, rất khó để xem xét dựa trên số liệu thống kê thông thường. Thường không có gì mong đợi rằng sẽ không thể nhìn thấy ở năng lượng cao. Nhưng nếu một bất thường được phát hiện đột nhiên, nói, một sự cộng hưởng mới trong một kênh hadron thuần túy với khối lượng vài trăm GeV, thì các nhà vật lý trong tương lai sẽ có thể cấu hình lại các kích hoạt và giải quyết sự bất thường này chặt chẽ hơn.

Gần đây, CMS Collaboration đã cho thấy ví dụ đầu tiên về kết quả thu được bằng cách sử dụng loại thông tin dữ liệu này (arXiv: 1604.08907). Cô đã phân tích số liệu thống kê được thu thập song song này để tìm kiếm các cộng hưởng giả thiết có thể chia thành hai vòi phản ứng hadron (xem hình). Vùng khối bất biến được bao phủ bởi các số liệu thống kê này bắt đầu từ 400 GeV, xấp xỉ gấp đôi so với phân tích số liệu thống kê thông thường.

Không tìm thấy cộng hưởng mới. Nhưng điều chính ở đây là những hạn chế được thiết lập về tính chất của các cộng hưởng này hóa ra là đáng chú ý hơn so với việc lựa chọn dữ liệu truyền thống. Điều này chứng minh rằng kỹ thuật này hoạt động tốt, và do đó nó sẽ được áp dụng trong tương lai.Một câu chuyện phổ biến về tác phẩm mới cũng có thể được tìm thấy trong blog của Tommaso Dorigo, một thành viên của cộng tác CMS.


Like this post? Please share to your friends:
Trả lời

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: