trgrİd altinda İlk 7 tev datalarinin analİzİ
DESCRIPTION
TRGRİD ALTINDA İLK 7 TeV DATALARININ ANALİZİ. Mehmet Vergili , Emrah Akkoyun Cukurova Universitesi , Ulakbim. Gidişhat. Giriş Data Seçme Analiz Araçlarının seçilmesi Gürültü ve Diger Gerçek olmayan olayların Temizlenmesi 1- Kırıntıların Temizlenmesi - PowerPoint PPT PresentationTRANSCRIPT
TRGRİD ALTINDAİLK 7 TeV DATALARININ
ANALİZİ
1
Mehmet Vergili , Emrah Akkoyun
Cukurova Universitesi , Ulakbim
04.09.2010
Gidişhat
• Giriş
• Data Seçme
• Analiz Araçlarının seçilmesi
• Gürültü ve Diger Gerçek olmayan olayların Temizlenmesi1- Kırıntıların Temizlenmesi
2- Tetikler ile Minumumbias, BeamHalo, PhysicsDeclared in seçilmesi
3- ECAL Spike ın temizlenmesi
4- HF PMT çarpmalarının temizlenmesi
5- RBX ve HPD gürültülerinin temizlenmesi
• CMS Analizleri için TRGrid altyapısı
• Analiz
204.09.2010
Giriş
304.09.2010
• 7 Tev datalar alınmaya başlandı– Şu anda bu dataların analizi için kullanılan en kararlı versiyon
CMSSW_3_5_6_patch1 dir
• Bu datalar henuz bir çok gürültü ve gerçek olmayan olay içermektedir. Bunları elemek için prosedurler ve paketler uzmanlar tarafından hazırlanmaktadır. Prosedurler DPGAnalysis , Calorimetre paketleri RecoLocalCalo bölümünden altından takip edilebilir.
– http://cmssw.cvs.cern.ch/cgi-bin/cmssw.cgi/CMSSW/
• Gerçek olmayan olaylar elenince dataların simulasyonlar ile şu ana kadar gözlenen oldukça uyumlu olduğudur.
• Yaptığımız bütün analiz işlemleri TRGrid altında yapılmış ve test edilmiştir bunun için hazırladığımız tutorial takip edilerek sonuçlar gözlenebilir
– http://lufer.ulakbim.gov.tr/~mvergili/html/crabtr.htm
Data Seçme
404.09.2010
• Analizlerimizde kullanacağımız MonteCarlo yada Gercek dataların dataset isimleri burdan takip edilebilir
– https://twiki.cern.ch/twiki/bin/viewauth/CMS/Collisions2010Analysis
• Gerçer datalar da hangi run ların iyi olduğunu seçmek için HCAL grubunun hazırladığı twiki sayfası
– https://twiki.cern.ch/twiki/bin/viewauth/CMS/HcalDataValidationRunList2010
• Bu datasetlerin kullanımı run seçimi crab.cfg içinde tanımlandığı şekilde TRGridde sorunsuz çalışmaktadır.
Analiz Araçlarının Seçilmesi
504.09.2010
• TRGrid altında en verimli ve hızlı analiz yapmak için onerilen yontem
• Bu çalışmada PAT (Physics Analysis Toolkit) kullanılmıştır. Gerekli araçlar aşağıdaki linkten elde edilebilir.
– https://twiki.cern.ch/twiki/bin/view/CMS/WorkBookPATExampleData
• PAT nesnelerini kulanarak oncelikle bir ntuple oluşturup daha sonra oluşturulan ntuple’ı analiz edecek bir kod hazırlanmıştır.
– Burada analiz kodumuz için tavsiye edilen analiz kodumuzu ED analiz ile hazırladığımız kodun içine gommek ve CMSSW nun bütün kütüphanelerinden faydalanmaktır.
• Sonuçlarımızı gozlemlemek için TRGrid lufer altına bir web servis eklenmiştir. Sonuçlarımızı buraya gif formatında atıp web uzerinden oldukça hızlı erişebiliriz.
Gürültü ve Gerçek olmayan olayların temizlenmesi
604.09.2010
1- Kırıntıların Temizlenmesi (Scrapping Event Veto)
2- Tetikler ile Minumumbias, BeamHalo, PhysicsDeclared in seçilmesi
3- ECAL Spike ın temizlenmesi
4- HF PMT çarpmalarının temizlenmesi
5- RBX ve HPD gürültülerinin temizlenmesi
Gürültü ve Gerçek olmayan olayların temizlenmesi
704.09.2010
1- Kırıntıların Temizlenmesi (Scrapping Event Veto)
Piixel dedektorunde olusan sahte izlerden kaynaklanan olaylarin elenmesi icin
kullanilan bir eleme yontemidir. Asagida configurasyon dosyasina bunu elemek
icin eklenen prosedurler verilmistir.
process.scrapingVeto = cms.EDFilter("FilterOutScraping",applyfilter = cms.untracked.bool(True),debugOn = cms.untracked.bool(False),numtrack = cms.untracked.uint32(10),thresh = cms.untracked.double(0.2))
process.primaryVertexFilter = cms.EDFilter("GoodVertexFilter",vertexCollection = cms.InputTag('offlinePrimaryVertices'),minimumNDOF = cms.uint32(4) ,maxAbsZ = cms.double(15),maxd0 = cms.double(2)
Gürültü ve Gerçek olmayan olayların temizlenmesi
804.09.2010
1- Kırıntıların Temizlenmesi (Scrapping Event Veto)
Gürültü ve Gerçek olmayan olayların temizlenmesi
904.09.2010
2- Tetikler ile Minumumbias, BeamHalo, PhysicsDeclared in seçilmesi
process.load('L1TriggerConfig.L1GtConfigProducers.L1GtTriggerMaskTechTrigConfig_cff')
process.load('HLTrigger/HLTfilters/hltLevel1GTSeed_cfi')
process.hltLevel1GTSeed.L1TechTriggerSeeding = cms.bool(True)
process.hltLevel1GTSeed.L1SeedsLogicalExpression = cms.string('0 AND (40 OR 41) AND
NOT (36 OR 37 OR 38 OR 39)')
Burada tetik 0 fizik olaylarini (beam in olup olmadigi zaman olcumlerinin dogrulugunu) 40
veya 41 Minumumbias olaylarini 36,37,38 veya 39 beamhalo olaylarini işaret etmektedir.
Sartlardan da anlasilacagi gibi 0 ve 40 veya 41 tetiklenmesini bekledigimiz tetikler
36,37,38 veya 39 tetiklenmesini istemedigimiz tetiklerdir.
Gürültü ve Gerçek olmayan olayların temizlenmesi
1004.09.2010
2- Tetikler ile Minumumbias, BeamHalo, PhysicsDeclared in seçilmesi
Bütün şekillerde ölçü birimi cm dir
BSC sol 1 BSC sol 2
BSC sağ 1 BSC sağ 2
BSC : Beam Scilator Counter
BSC nin Z eksenindeki yerleri
Bu sayıcılar kullanılarak geliştirilenAlgoritmalar ile BeamHalo Minumumbiasolayları seçilmektedir.
Gürültü ve Gerçek olmayan olayların temizlenmesi
1104.09.2010
2- ECAL Spike ın temizlenmesi
Fiziksel bir olaydan kaynaklanmayan foton yada elektron gibi davranan cok yuksek enerjili
kanallar. Bu kanalları elemek icin iki degisik yontem vardir.
a) Dik enerjisi 5 GeV den buyuk olan en yüksek enerjili Rechit'i bulup (s1) bunu etrafindaki 8 kanalla toplayip (s9) daha sonra bunlarin oranlarina bakip karar vermek. s9/s1
s9 = s1 + 1 + 2 + 3 + 4 + 5 + 6 + 7 + 8
1 2 3
8 s1 4
7 6 5
Gürültü ve Gerçek olmayan olayların temizlenmesi
1204.09.2010
2- ECAL Spike ın temizlenmesi
Fiziksel bir olaydan kaynaklanmayan foton yada elektron gibi davranan cok yuksek enerjili
kanallar. Bu kanalları elemek icin iki degisik yontem vardir.
b) Yine dik enerjisi 5 GeV den buyuk olan en yüksek enerjili Rechit'i bulup (s1) daha sonra yan komsularini toplayip (s4) bunun oranina bakmaktir. s4/s1 genellikle bu yontem tercih edilmektedir.
s4 = 1 + 2 + 3 + 4
Bu yöntem sadece ECAL Barel de uygulanmaktadır . Bunun sonucunda barelin sınır
bölgesine gelen s1 in sağ yada sol yan komşusu olmayacaktır bu yüzden ieta=85 de s4/s1
hesaplanamamaktadır.
1
4 s1 2
3
Gürültü ve Gerçek olmayan olayların temizlenmesi
1304.09.2010
2- ECAL Spike ın temizlenmesi
1
4 s1 2
3
MC
R:132440Şekilde montecarlo ve gerçek data için S4/s1 oranına bakılmıştır.
1-s4/s1 = 0.95 noktasına konacak bir eşik ecal spike ları eleyecektir
Montecarlo herhangi bir ecal spike içermiyor
spike
Gürültü ve Gerçek olmayan olayların temizlenmesi
1404.09.2010
2- ECAL Spike ın temizlenmesi
1
s1 2
3
1
4 s1
3
Dedektörün ieta iphi kesitine baktığımızda burada 1 olay ECAL Spike elemeyi geçmiştir çünkü sınır bölgesindedir
Gürültü ve Gerçek olmayan olayların temizlenmesi
1504.09.2010
4- HF PMT çarpmalarının temizlenmesi
HF govdesinden PMT ye iletilmeyen direk olarak PMT ye gelen parcaciklardan
kaynaklanan yuksek enerjili anormal olaylardır. Bu olayların elenmesi icin yine 2 degisik
yontem vardır. Burada sadece biri uzerinde durulacaktir.
Dik Enerjisi 5 GeV den buyuk olan rechitler icin
R = ( E(uzun) - E (kısa) ) / ( E(uzun) + E (kısa) )
oranına bakarak eleme yapilabilir -0.8 < R < 0.99 arasinda kalan olaylar
normal olaylardir.
Gürültü ve Gerçek olmayan olayların temizlenmesi
1604.09.2010
4- HF PMT çarpmalarının temizlenmesi
Burada R nin 0.99 dan büyük Olması çarpmaların uzun fiberden
R nin -0.8 den küçük olması Çarpmaların kısa fiberden geldiğiniGösteriyor
Ki buda eğer normal HF gödesineBir çarpma varsa beklenmedikbirşey
Gürültü ve Gerçek olmayan olayların temizlenmesi
1704.09.2010
4- HF PMT çarpmalarının temizlenmesi
Montecarlo Run:132440
Burada HF PMT Hitlerinin GEANT4 de simülasyonu yapılmıştır
Gürültü ve Gerçek olmayan olayların temizlenmesi
1804.09.2010
4- RBX ve HPD gürültülerinin temizlenmesi
Bu elemeler için alınan datalar içinde Hcal noise içinde RBX yığını bulunmaktadır.
Bu yığını kullanarak gürültüye karar verilebilir.
Yığın içinde bulunan totalZeroAfterPeak , 2Ts , 10Ts , numberOfRechit gibi
Parametreler kullanılarak gürültü tespiti yapılmaktadır.
Burada totalZeroAfterPeak: ADC okunan verilerde en yüksek değerli yada ondan
sonraki en yüksek değerli kanaldan sonra 0 gelmesi .
En yüksek değerli ikinci kanaldan sonra 0 gelmiştir gürültü olması yüksek ihtimal
Detaylı bilgi için http://home.fnal.gov/~lvergili/ANALYSIS/PrintInfo.txt
CMS Analizleri için TRGrid Altyapısı
1904.09.2010
Yapılan bütün analizler TRGrid altında yapılmış ve test edilmiştir. İlerleyen
bölümlerde izlediğimiz adımlar tek tek gösterilecektir.
TRGrid alt yapısı altında CMS icin verilen destek
- 10 TB data alanı metu sitesi altında
- web servis destegi http://lufer.ulakbim.gov.tr/~mvergili/html/crabtr.htm
- Bütün kullanıcıların kendi hesapları altında kullanabilecekleri 10 GB alan
- CMSSW nun butun kararlı surumleri
- CRAB
Analiz
2004.09.2010
Analizimiz PAT ile yapılacaktır bu yuzden oncelikle PAT nesnelerini ureten
paketleri alıp daha sonra Analiz kodumuzu oluşturacağız
source /opt/exp_soft/cms/SITECONF/local/JobConfig/cmsset_default.sh
mkdir work
cd work
cmsrel CMSSW_3_5_6_patch1
cd CMSSW_3_5_6_patch1/src
cmsenv
addpkg PhysicsTools/PatAlgos V07-11-31
addpkg PhysicsTools/PatExamples V00-02-18
addpkg PhysicsTools/SelectorUtils V00-00-11
cvs co -d Analyzer/NtupleProducer UserCode/vergili/src/NtupleProducer
Scramv1 b –j4
Analiz
2104.09.2010
Scramv1 b –j4
Analiz
2204.09.2010
cd Analyzer/NtupleProducer/test
cmsRun patLayer1_fromRECO_7TeV_firstdata_cfg.py
Analiz
2304.09.2010
cd Analyzer/NtupleProducer/test
source /opt/exp_soft/cms/CRAB/CRAB_2_7_1_pre12/crab.sh
crab –create
CRAB e iş göndermek
2404.09.2010
crab -submitcrab -submit
CRAB e iş göndermek
2504.09.2010
crab -statuscrab -status
100 iş başarılı bitirişmiş
CRAB
2604.09.2010
return_data = 0
copy_data = 1 storage_element = T2_TR_METU
storage_path = /srm/managerv2?SFN=/XXXXXuser_remote_dir = XXXX
publish_data = 1 publish_data_name = xxxxxxxxxxxxxx
dbs_url_for_publication = https://cmsdbsprod.cern.ch:8443/cms_dbs_ph_analysis_01_writer/servlet/DBSServlet
se_white_list = T2_TR_METU
se_black_list = T2_TR_METU
LFN and PFN kontrol
http://cmsweb.cern.ch/phedex/datasvc/xml/prod/lfn2pfn?node=T2_TR_METU&protocol=srmv2&lfn=/store/xxx.root
CRAB
2704.09.2010
<?xml version="1.0" encoding="ISO-8859-1" ?> - <phedex request_timestamp="1270769725.85522" instance="prod" request_url="http://cmsweb.cern.ch:7001/phedex/datasvc/xml/prod/lfn2pfn" request_version="1.5.2" request_call="lfn2pfn" call_time="0.01675" request_date="2010-04-08 23:35:25 UTC"> <mapping protocol="srmv2" custodial="n" destination="" space_token="" node="T2_TR_METU" lfn="/store/xxx.root" pfn="srm://eymir.grid.metu.edu.tr:8446/srm/managerv2?SFN=/dpm/grid.metu.edu.tr/home/cms/store/xxx.root" /> </phedex>
LFN and PFN kontrol
Analiz Kodunun çalıştırılması
2804.09.2010
Bin klasörü içinde oluşturduğumuz Analiz kodunu Buildfile ile scram a tanıtalım
<use name=CondFormats/JetMETObjects><use name=rootcintex><use name=root><use name=boost>
<use name=DataFormats/PatCandidates><use name=DataFormats/FWLite><use name=FWCore/Framework><use name=FWCore/FWLite><use name=CommonTools/Utils><use name=PhysicsTools/Utilities><use name=PhysicsTools/PatUtils><use name=PhysicsTools/PatExamples><use name=PhysicsTools/FWLite><use name=PhysicsTools/SelectorUtils>
<bin name=Analysis file=Analysis.cc> </bin>
Analiz kodumuz artık scram b ile derlenecektir. Ve bulunduğunuz alanda Analysis ismi ile çağırıp çalıştırılacaktır
Analiz Programını Çalıştırmak
2904.09.2010
Analysis test/ntuple.rootAnalysis test/ntuple.root
Sonuc result.root
Sonuçlar
3004.09.2010
Sonuç ve Tartışma
3104.09.2010
TRGrid altında CMS için kullanılan yazılımlar Şu ana kadar eksiksiz çalıştırıldı.
Ilk alınan 7 Tev Run 132440 oldukça hızlı bir Şekilde TRGrid altında analiz edildi ve sonuçları Karşılaştırıldı.
Sonuçların paylaşımı için lufer altına bir web servis açıldı
TRGrid kullanıcılarına lxplus ın verdiği kotadan çok daha fazlasını sağlamaktadır. Bu kullanıcıların isteklerine göre arttırılabilir.