Користувальницькькі налаштування

Налаштування сайту


slurm

Розбіжності

Тут показані розбіжності між вибраною ревізією та поточною версією сторінки.

Посилання на цей список змін

Both sides previous revision Попередня ревізія
Наступна ревізія
Попередня ревізія
slurm [2015/04/29 00:32]
wombat [Настройка]
slurm [2015/06/19 12:42] (поточний)
wombat MUNGE
Рядок 2: Рядок 2:
  
 ===== Установка ===== ===== Установка =====
 +
 +==== MUNGE ====
 +
 +Скопировать файл /​etc/​munge/​munge.key на все компьютеры кластера. Доступ к этому файлу должен быть ограничен,​ т.к. он содержит секретный ключ, по которому даётся доступ к вычислительным мощностям компьютеров.
 +
 +  user@Computer03:​~$ ls -l /​etc/​munge/​munge.key ​
 +  -r-------- 1 munge munge 1024 кві 29 14:48 /​etc/​munge/​munge.key
  
 ==== Gentoo ==== ==== Gentoo ====
Рядок 14: Рядок 21:
  
  
 +==== Debian ====
  
 +  apt-get install slurm-wlm
 ===== Настройка ===== ===== Настройка =====
  
-file:///​usr/​share/​doc/​slurm-2.6.3/​html/​configurator.html+''​/​usr/​share/​doc/​slurm-2.6.3/​html/​configurator.html''​
  
  
Рядок 25: Рядок 34:
 https://​computing.llnl.gov/​linux/​slurm/​quickstart.html https://​computing.llnl.gov/​linux/​slurm/​quickstart.html
  
 +<file conf '/​etc/​slurm/​slurm.conf'>​ 
 +# slurm.conf file generated by configurator.html. 
 +# Put this file on all nodes of your cluster. 
 +# See the slurm.conf man page for more information. 
 +
 +ControlMachine=k517 
 +#​ControlAddr= 
 +#​BackupController= 
 +#​BackupAddr= 
 +
 +AuthType=auth/​munge 
 +CacheGroups=0 
 +#​CheckpointType=checkpoint/​none 
 +CryptoType=crypto/​munge 
 +#​DisableRootJobs=NO 
 +#​EnforcePartLimits=NO 
 +#Epilog= 
 +#​EpilogSlurmctld= 
 +#​FirstJobId=1 
 +#​MaxJobId=999999 
 +#​GresTypes= 
 +#​GroupUpdateForce=0 
 +#​GroupUpdateTime=600 
 +#​JobCheckpointDir=/​var/​slurm/​checkpoint 
 +#​JobCredentialPrivateKey= 
 +#​JobCredentialPublicCertificate= 
 +#​JobFileAppend=0 
 +#​JobRequeue=1 
 +#​JobSubmitPlugins=1 
 +#​KillOnBadExit=0 
 +#​Licenses=foo*4,​bar 
 +#​MailProg=/​bin/​mail 
 +#​MaxJobCount=5000 
 +#​MaxStepCount=40000 
 +#​MaxTasksPerNode=128 
 +MpiDefault=none 
 +#​MpiParams=ports=#​-#​ 
 +#​PluginDir= 
 +#​PlugStackConfig= 
 +#​PrivateData=jobs 
 +ProctrackType=proctrack/​cgroup 
 +#Prolog= 
 +#​PrologSlurmctld= 
 +#​PropagatePrioProcess=0 
 +#​PropagateResourceLimits= 
 +#​PropagateResourceLimitsExcept= 
 +ReturnToService=1 
 +#​SallocDefaultCommand= 
 +SlurmctldPidFile=/​var/​run/​slurm/​slurmctld.pid 
 +SlurmctldPort=6817 
 +SlurmdPidFile=/​var/​run/​slurm/​slurmd.pid 
 +SlurmdPort=6818 
 +SlurmdSpoolDir=/​var/​spool/​slurmd 
 +SlurmUser=slurm 
 +#​SlurmdUser=root 
 +#​SrunEpilog= 
 +#​SrunProlog= 
 +StateSaveLocation=/​tmp/​slurm 
 +SwitchType=switch/​none 
 +#​TaskEpilog= 
 +TaskPlugin=task/​cgroup 
 +#​TaskPluginParam= 
 +#​TaskProlog= 
 +#​TopologyPlugin=topology/​tree 
 +#​TmpFs=/​tmp 
 +#​TrackWCKey=no 
 +#​TreeWidth= 
 +#​UnkillableStepProgram= 
 +#UsePAM=0 
 +
 +
 +# TIMERS 
 +#​BatchStartTimeout=10 
 +#​CompleteWait=0 
 +#​EpilogMsgTime=2000 
 +#​GetEnvTimeout=2 
 +#​HealthCheckInterval=0 
 +#​HealthCheckProgram= 
 +InactiveLimit=0 
 +KillWait=30 
 +#​MessageTimeout=10 
 +#​ResvOverRun=0 
 +MinJobAge=300 
 +#​OverTimeLimit=0 
 +SlurmctldTimeout=120 
 +SlurmdTimeout=300 
 +#​UnkillableStepTimeout=60 
 +#​VSizeFactor=0 
 +Waittime=0 
 +
 +
 +# SCHEDULING 
 +#​DefMemPerCPU=0 
 +FastSchedule=0 
 +#​MaxMemPerCPU=0 
 +#​SchedulerRootFilter=1 
 +#​SchedulerTimeSlice=30 
 +SchedulerType=sched/​backfill 
 +SchedulerPort=7321 
 +SelectType=select/​linear 
 +#​SelectTypeParameters= 
 +
 +
 +# JOB PRIORITY 
 +#​PriorityType=priority/​basic 
 +#​PriorityDecayHalfLife= 
 +#​PriorityCalcPeriod= 
 +#​PriorityFavorSmall= 
 +#​PriorityMaxAge= 
 +#​PriorityUsageResetPeriod= 
 +#​PriorityWeightAge= 
 +#​PriorityWeightFairshare= 
 +#​PriorityWeightJobSize= 
 +#​PriorityWeightPartition= 
 +#​PriorityWeightQOS= 
 +
 +
 +# LOGGING AND ACCOUNTING 
 +#​AccountingStorageEnforce=0 
 +#​AccountingStorageHost= 
 +AccountingStorageLoc=/​var/​log/​slurm 
 +#​AccountingStoragePass= 
 +#​AccountingStoragePort= 
 +AccountingStorageType=accounting_storage/​filetxt 
 +#​AccountingStorageUser= 
 +AccountingStoreJobComment=YES 
 +ClusterName=cluster 
 +#​DebugFlags= 
 +#​JobCompHost= 
 +#​JobCompLoc= 
 +#​JobCompPass= 
 +#​JobCompPort= 
 +JobCompType=jobcomp/​none 
 +#​JobCompUser= 
 +JobAcctGatherFrequency=30 
 +JobAcctGatherType=jobacct_gather/​linux 
 +SlurmctldDebug=3 
 +#​SlurmctldLogFile= 
 +SlurmdDebug=3 
 +#​SlurmdLogFile= 
 +#​SlurmSchedLogFile= 
 +#​SlurmSchedLogLevel= 
 +
 +
 +# POWER SAVE SUPPORT FOR IDLE NODES (optional) 
 +#​SuspendProgram= 
 +#​ResumeProgram= 
 +#​SuspendTimeout= 
 +#​ResumeTimeout= 
 +#​ResumeRate= 
 +#​SuspendExcNodes= 
 +#​SuspendExcParts= 
 +#​SuspendRate= 
 +#​SuspendTime= 
 +
 +
 +# COMPUTE NODES 
 +NodeName=k517 CPUs=1 Sockets=1 CoresPerSocket=2 ThreadsPerCore=2 State=UNKNOWN 
 +PartitionName=debug Nodes=k517 Default=YES MaxTime=INFINITE State=UP 
 +</​file>​
  
slurm.1430256759.txt.bz2 · В останнє змінено: 2015/04/29 00:32 by wombat