This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision | ||
wiki:infraestructura_computo [2019/08/07 14:29] admin [Storage] |
wiki:infraestructura_computo [2021/03/17 12:30] (current) admin [Cómputo] |
||
---|---|---|---|
Line 135: | Line 135: | ||
- | <!-------------------------------------------------- MIRTA2 ·----------------------------------------> | + | <!-------------------------------------------------- servidore ·----------------------------------------> |
<div class="tab"> | <div class="tab"> | ||
Line 142: | Line 142: | ||
<button class="tablinks" onclick="abrirMenuPrincipal(event, 'sersic')"><b>Sersic</b></button> | <button class="tablinks" onclick="abrirMenuPrincipal(event, 'sersic')"><b>Sersic</b></button> | ||
<button class="tablinks" onclick="abrirMenuPrincipal(event, 'Clemente')"><b>Clemente</b></button> | <button class="tablinks" onclick="abrirMenuPrincipal(event, 'Clemente')"><b>Clemente</b></button> | ||
+ | <button class="tablinks" onclick="abrirMenuPrincipal(event, 'Alumnos')"><b>Alumnos</b></button> | ||
<button class="tablinks" onclick="abrirMenuPrincipal(event, 'Mendieta')"><b>Mendieta</b></button> | <button class="tablinks" onclick="abrirMenuPrincipal(event, 'Mendieta')"><b>Mendieta</b></button> | ||
<button class="tablinks" onclick="abrirMenuPrincipal(event, 'Mulatona')"><b>Mulatona</b></button> | <button class="tablinks" onclick="abrirMenuPrincipal(event, 'Mulatona')"><b>Mulatona</b></button> | ||
Line 169: | Line 170: | ||
<b>Memoria:</b> 256 GB DDR4<br /> | <b>Memoria:</b> 256 GB DDR4<br /> | ||
<b>Acceso:</b> ssh username@mirta3<br /> | <b>Acceso:</b> ssh username@mirta3<br /> | ||
- | <b>Almacenamiento:</b> 3,5 TB<br /> | + | <b>Almacenamiento:</b> 22T TB<br /> |
<b>Aceleradora:</b> NO<br /> | <b>Aceleradora:</b> NO<br /> | ||
<b>Particiones SLURM:</b> NO<br /> | <b>Particiones SLURM:</b> NO<br /> | ||
Line 176: | Line 177: | ||
          |           | ||
</p> | </p> | ||
- | |||
- | <button class="botonPanel" >Particiones SLURM</button> | ||
- | <div class="panel"> | ||
- | <p><b>batch</b>, partición por defecto, tiempo máximo de 3 días en un total de 32 núcleos.<br /> | ||
- | <b>long</b>, tiempo máximo de 6 días en un total de 32 núcleos. | ||
- | </p> | ||
- | </div> | ||
- | |||
- | <button class="botonPanel" >Scripts SLURM</button> | ||
- | <div class="panel"> | ||
- | <button class="botonPanel" >GPU</button> | ||
- | <div class="panel"> | ||
- | <br> | ||
- | <ul class="ul1"> | ||
- | <li class="li1">Tarea: ejecutar programas utilizando gpu </li> | ||
- | <li class="li1">Ejecución: sbatch submit_gpu_job.sh </li> | ||
- | <li class="li1">Partición: gpu </li> | ||
- | <li class="li1">Tiempo máximo: 7 días </li> | ||
- | |||
- | </ul> | ||
- | <br> | ||
- | </HTML> | ||
- | <file c submit_gpu_job.sh[enable_line_numbers="true",highlight_lines_extra="7,10,11,28,32"]> | ||
- | #!/bin/bash | ||
- | |||
- | ### Las líneas #SBATCH configuran los recursos de la tarea | ||
- | ### (aunque parezcan estar comentadas) | ||
- | |||
- | ### Nombre de la tarea | ||
- | #SBATCH --job-name=gpu_job | ||
- | |||
- | ### Cola de trabajos a la cual enviar. | ||
- | #SBATCH --partition=gpu | ||
- | #SBATCH --gres=gpu:1 | ||
- | |||
- | ### Procesos a largar. | ||
- | ### Por defecto, se usa un solo proceso para tareas GPU. | ||
- | #SBATCH --ntasks-per-node=1 | ||
- | |||
- | ### Tiempo de ejecucion. Formato dias-horas:minutos. | ||
- | #SBATCH --time 7-0:00 | ||
- | |||
- | ### Script que se ejecuta al arrancar el trabajo | ||
- | |||
- | ### Cargar el entorno del usuario incluyendo la funcionalidad de modules | ||
- | ### No tocar | ||
- | . /etc/profile | ||
- | |||
- | ### Cargar los módulos para la tarea | ||
- | # FALTA: Agregar los módulos necesarios | ||
- | module load cuda/6.5 | ||
- | |||
- | ### Largar el programa | ||
- | # FALTA: Cambiar el nombre del programa | ||
- | srun NOMBRE_DEL_PROGRAMA | ||
- | |||
- | |||
- | </file> | ||
- | <HTML> | ||
- | </div> | ||
- | | ||
- | <button class="botonPanel" >MPI</button> | ||
- | <div class="panel"> | ||
- | <br> | ||
- | <ul class="ul1"> | ||
- | <li class="li1">Tarea: ejecutar programas utilizando mpi </li> | ||
- | <li class="li1">Ejecución: sbatch submit_mpi_job.sh </li> | ||
- | <li class="li1">Partición: batch </li> | ||
- | <li class="li1">Tiempo máximo: 2 días </li> | ||
- | </ul> | ||
- | <br> | ||
- | </HTML> | ||
- | <file c submit_mpi_job.sh[enable_line_numbers="true",highlight_lines_extra="7,10,13,26,32"]> | ||
- | #!/bin/bash | ||
- | |||
- | ### Las líneas #SBATCH configuran los recursos de la tarea | ||
- | ### (aunque parezcan estar comentadas) | ||
- | |||
- | ### Nombre de la tarea | ||
- | #SBATCH --job-name=mpi_job | ||
- | |||
- | ### Tiempo de ejecucion. Formato dias-horas:minutos. | ||
- | #SBATCH --time 2-0:00 | ||
- | |||
- | ### Numero de procesos a ser lanzados. | ||
- | #SBATCH --ntasks=2 | ||
- | |||
- | ### Nombre de partcion | ||
- | #SBATCH --partition=batch | ||
- | |||
- | ### Script que se ejecuta al arrancar el trabajo | ||
- | |||
- | ### Cargar el entorno del usuario incluyendo la funcionalidad de modules | ||
- | ### No tocar | ||
- | . /etc/profile | ||
- | |||
- | ### Cargar los módulos para la tarea | ||
- | # FALTA: Agregar los módulos necesarios | ||
- | module load etc... | ||
- | |||
- | ### Largar el programa con los cores detectados | ||
- | ### La cantidad de nodos y cores se detecta automáticamente | ||
- | # FALTA: Cambiar el nombre del programa | ||
- | srun NOMBRE_DEL_PROGRAMA | ||
- | </file> | ||
- | <HTML> | ||
- | </div> | ||
- | | ||
- | <button class="botonPanel" >OPENMP</button> | ||
- | <div class="panel"> | ||
- | <br> | ||
- | <ul class="ul1"> | ||
- | <li class="li1">Tarea: ejecutar programas utilizando openmp </li> | ||
- | <li class="li1">Ejecución: sbatch submit_openmp_job.sh </li> | ||
- | <li class="li1">Partición: batch </li> | ||
- | <li class="li1">Tiempo máximo: 2 días </li> | ||
- | </ul> | ||
- | <br> | ||
- | </HTML> | ||
- | <file c submit_openmp_job.sh[enable_line_numbers="true",highlight_lines_extra="7,18,21,30,31,35,39"]> | ||
- | #!/bin/bash | ||
- | |||
- | ### Las líneas #SBATCH configuran los recursos de la tarea | ||
- | ### (aunque parezcan estar comentadas) | ||
- | |||
- | ### Nombre de la tarea | ||
- | #SBATCH --job-name=openmp_job | ||
- | |||
- | ### Cola de trabajos a la cual enviar. | ||
- | #SBATCH --partition=batch | ||
- | |||
- | ### Procesos a largar. | ||
- | ### Es OpenMP, o sea que un proceso en un nodo y muchos hilos. | ||
- | #SBATCH --ntasks=1 | ||
- | |||
- | ### Hilos por proceso | ||
- | ### Poner el mismo valor acá que en OMP_NUM_THREADS/MKL_NUM_THREADS | ||
- | #SBATCH --cpus-per-task=16 | ||
- | |||
- | ### Tiempo de ejecucion. Formato dias-horas:minutos. | ||
- | #SBATCH --time 2-0:00 | ||
- | |||
- | ### Script que se ejecuta al arrancar el trabajo | ||
- | |||
- | ### Cargar el entorno del usuario incluyendo la funcionalidad de modules | ||
- | ### No tocar | ||
- | . /etc/profile | ||
- | |||
- | ### Configurar OpenMP/MKL/etc con la cantidad de cores detectada. | ||
- | export OMP_NUM_THREADS=16 | ||
- | export MKL_NUM_THREADS=16 | ||
- | |||
- | ### Cargar los módulos para la tarea | ||
- | # FALTA: Agregar los módulos necesarios | ||
- | module load etc... | ||
- | |||
- | ### Largar el programa | ||
- | # FALTA: Cambiar el nombre del programa | ||
- | srun NOMBRE_DEL_PROGRAMA | ||
- | </file> | ||
- | <HTML> | ||
- | </div> | ||
- | | ||
- | | ||
- | | ||
- | </div> | ||
- | |||
- | | ||
- | | ||
- | | ||
- | | ||
</div> | </div> | ||
Line 374: | Line 204: | ||
<h3></h3> | <h3></h3> | ||
<p> | <p> | ||
- | <b>Procesador:</b> 168 + 32 cores <br/> | + | <b>Procesador:</b> Intel Xeon E5-2660v4 x 14 - 168 núcleos físicos - 336 núcleos virtuales <br/> |
- | <b>Memoria:</b> 384 + 64 GB <br /> | + | <b>Memoria:</b> 640 + 64 GB <br /> |
<b>Acceso:</b> ssh username@clemente<br /> | <b>Acceso:</b> ssh username@clemente<br /> | ||
<b>Almacenamiento:</b> 1 TB /home<br /> | <b>Almacenamiento:</b> 1 TB /home<br /> | ||
Line 382: | Line 212: | ||
    </b> 17 TB /mnt/clemente<br /> |     </b> 17 TB /mnt/clemente<br /> | ||
<b>Aceleradora:</b> 1 Tesla 2070<br /> | <b>Aceleradora:</b> 1 Tesla 2070<br /> | ||
- | <b>Particiones SLURM:</b> debug (2 minutos - 200 núcleos)<br /> | + | <b>Particiones SLURM:</b> debug (2 minutos - 336 núcleos virtuales - Clemente01-06)<br /> |
<b>             | <b>             | ||
             |              | ||
- |          </b> batch (3 días - 168 núcleos)<br /> | + |          </b> batch (3 días - 280 núcleos virtuales - Clemente01-05)<br /> |
<b>             | <b>             | ||
             |              | ||
- |          </b> small (1 hora - 30 núcleos)<br /> | + |          </b> small (6 horas - 56 núcleos virtuales - Clemente06)<br /> |
<b>             | <b>             | ||
             |              | ||
- |          </b> gpu (3 días - 32 núcleos)<br /> | + |          </b> gpu (3 días - 50 núcleos virtuales - Clemente06)<br /> |
<b>Conectividad:</b> Infiniband DDR / Ethernet 1Gbps<br /> | <b>Conectividad:</b> Infiniband DDR / Ethernet 1Gbps<br /> | ||
Line 401: | Line 231: | ||
| | ||
<p><br /><b> Cabecera:</b> <br/> | <p><br /><b> Cabecera:</b> <br/> | ||
+ | |||
+ | |||
+ | <p><br /><b>Sistema operativo:</b> <br/> | ||
             |              | ||
- |        <i>Procesador:</i> 6 Cores Intel Xeon E5-2603v4 <br/> | + |                 |
+ | Operating System: CentOS Linux 7 (Core)<br/> | ||
             |              | ||
- |        <i>Memoria:</i> 32 GB DDR4 <br /> | + |                 |
+ | Kernel: Linux 3.10.0-514.el7.x86_64<br /> | ||
             |              | ||
- |        <i>Acceso:</i> ssh username@clemente <br /> | + |                 |
+ | Architecture: x86-64<br /> | ||
+ | </p> | ||
+ | <p><br /><b> clemente[01-05]:</b> <br/> | ||
             |              | ||
- |        <i>Almacenamiento:</i> 1TB /home <br /> | + |                 |
- |                   | + | <i>Procesador:</i> 28 Cores [56 w/HT] Intel Xeon E5-2660v4 <br/> |
- |                   | + | |
- |             17 TB /mnt/clemente <br /> | + | |
             |              | ||
- |        <i>Aceleradora:</i> NO<br /> | + |                 |
+ | <i>Socket(s):</i> 2     <i>Core(s) per socket: </i> 14      | ||
+ | <i>Thread(s) per core: </i> 2     <br/> | ||
             |              | ||
- |        <i>Particiones SLURM:</i> debug (2 minutos - 200 núcleos)<br /> | + |                 |
- |                   | + | <i>L1d cache: </i> 32K   <i>L1i cache: </i> 32K    |
- |                   | + | <i>L2 cache: </i> 256K   <i>L3 cache: </i> 35840K <br /> |
- |                   | + | |
- | batch (3 días - 168 núcleos)<br /> | + | |
- |                   | + | |
- |                   | + | |
- |                   | + | |
- | small (1 hora - 30 núcleos)<br /> | + | |
- |                   | + | |
- |                   | + | |
- |                   | + | |
- | gpu (3 días - 32 núcleos - 1 GPU)<br /> | + | |
- | </p> | + | |
- | <p><br /><b> clemente[01-03]:</b> <br/> | + | |
             |              | ||
                |                 | ||
- | <i>Procesador:</i> 28 Cores [56 w/HT] Intel Xeon E5-2660v4 <br/> | + | <i>Cpu MHz:</i> 1200 <br /> |
             |              | ||
                |                 | ||
Line 448: | Line 274: | ||
                |                 | ||
<i>Particiones SLURM:</i> debug - batch<br /> | <i>Particiones SLURM:</i> debug - batch<br /> | ||
- | </p> | + | </p> |
- | <p><br /><b> clemente04:</b> <br/> | + | |
+ | <p><br /><b> clemente06:</b> <br/> | ||
             |              | ||
- |         <i>Procesador:</i> 16 Cores [32 w/HT] Intel Xeon E5-2620v4 <br/> | + |         <i>Procesador:</i> 28 Cores [56 w/HT] Intel Xeon E5-2680v4 <br/> |
             |              | ||
+ | |||
+ |         <i>Socket(s):</i> 2      | ||
+ | <i>Core(s) per socket: </i> 14      <i>Thread(s) per core: </i> 2    <br/> | ||
+ |              | ||
+ |         <i>L1 cache</i> 896 KB    | ||
+ | <i>L2 cache: </i> 3584 KB    <i>L3 cache: </i> 35840 KB   <br /> | ||
+ |              | ||
+ |         <i>Cpu MHz:</i> 1200 <br /> | ||
+ |              | ||
+ | |||
        <i>Memoria:</i> 64 GB DDR4 <br /> |         <i>Memoria:</i> 64 GB DDR4 <br /> | ||
             |              | ||
Line 461: | Line 298: | ||
        <i>Aceleradora:</i> Tesla 2070<br /> |         <i>Aceleradora:</i> Tesla 2070<br /> | ||
             |              | ||
- |         <i>Particiones SLURM:</i> debug - gpu - small<br /> | + |         <i>Particiones SLURM:</i> batch - debug - gpu - small<br /> |
- | + | | |
</p> | </p> | ||
<p><br /> <i>(*) A los nodos solo se puede acceder cuando hay un trabajo del usuario en ejecución</i> <br /></p> | <p><br /> <i>(*) A los nodos solo se puede acceder cuando hay un trabajo del usuario en ejecución</i> <br /></p> | ||
</div> | </div> | ||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
| | ||
Line 501: | Line 331: | ||
### Cola de trabajos a la cual enviar. | ### Cola de trabajos a la cual enviar. | ||
#SBATCH --partition=gpu | #SBATCH --partition=gpu | ||
- | #SBATCH --gres=gpu:1 | ||
### Procesos a largar. | ### Procesos a largar. | ||
Line 518: | Line 347: | ||
### Cargar los módulos para la tarea | ### Cargar los módulos para la tarea | ||
# FALTA: Agregar los módulos necesarios | # FALTA: Agregar los módulos necesarios | ||
- | module load gpu cuda/9.1.85 | + | module load cuda |
### Largar el programa | ### Largar el programa | ||
Line 551: | Line 380: | ||
### Numero de procesos a ser lanzados. | ### Numero de procesos a ser lanzados. | ||
- | #SBATCH --ntasks=2 | + | |
+ | #SBATCH --ntasks=112 | ||
+ | #SBATCH --nodes=2 | ||
### Nombre de partcion | ### Nombre de partcion | ||
Line 635: | Line 466: | ||
| | ||
| | ||
- | | ||
- | | ||
- | | ||
- | | ||
- | | ||
- | | ||
- | | ||
- | | ||
| | ||
<button class="botonPanel">Información Particular</button> | <button class="botonPanel">Información Particular</button> | ||
Line 663: | Line 486: | ||
<button class="botonPanel" >MPI</button> | <button class="botonPanel" >MPI</button> | ||
<div class="panel"> | <div class="panel"> | ||
- | <p>Clemente posee una partición para trabajos en MPI llamada bach. Tiene un tiempo máximo de 5 días y un total de 168 núcleos con disponibilidad de conexión infiniband | + | <p>Clemente posee una partición para trabajos en MPI llamada bach. Tiene un tiempo máximo de 5 días y un total de 224 núcleos con disponibilidad de conexión infiniband |
</p> | </p> | ||
Line 670: | Line 493: | ||
</div> | </div> | ||
+ | |||
+ | |||
+ | |||
+ | <!--------------------------------------------------Alumnos -----------------------------·----------------------> | ||
+ | |||
+ | <div id="Alumnos" class="tabcontent"> | ||
+ | <h3></h3> | ||
+ | <p> | ||
+ | <b>Procesador:</b>AMD EPYC 7282 16-Core Processor <br/> | ||
+ | <b>Cores:</b> 32 virtuales SMT<br /> | ||
+ | <b>Memoria:</b> 32 GB DDR4<br /> | ||
+ | <b>Acceso:</b> ssh username@alumnos.oac.uncor.edu<br /> | ||
+ | <b>Almacenamiento:</b><br /> | ||
+ | <b>Aceleradora:</b> NO<br /> | ||
+ | <b>Particiones SLURM:</b> NO<br /> | ||
+ | <b>             | ||
+ |              | ||
+ |           | ||
+ | </p> | ||
+ | |||
+ | |||
+ | |||
+ | </div> | ||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
<!--------------------------------------------------MENDIETA-----------------------------·----------------------> | <!--------------------------------------------------MENDIETA-----------------------------·----------------------> | ||
Line 1382: | Line 1236: | ||
       <i>Almacenamiento:</i> <br /> |        <i>Almacenamiento:</i> <br /> | ||
             |              | ||
- |        <i>Aceleradora:</i> br /> | + |        <i>Aceleradora:</i> <br /> |
             |              | ||
       <i>Particiones SLURM:</i> <br /> |        <i>Particiones SLURM:</i> <br /> |