Ayuda
Ir al contenido

Dialnet


Resumen de Fpga-based special-purpose computers: application to spin glass simulations

José Miguel Gil Narvión

  • 1.-INTRODUCCIÓN EL TRABAJO DE INVESTIGACIÓN REALIZADO EN EL TRANSCURSO DE ESTA TESIS DOCTORAL SE CENTRA EN EL DESARROLLO DE IMPLEMENTACIONES DE DISEÑOS DIGITALES EN COMPUTADORES DE PROPÓSITO ESPECÍFICO PARA SIMULACIONES DE SPIN GLASS Y EN EL DISEÑO DE NUEVAS ARQUITECTURAS Y MÁQUINAS PARA LA SIMULACIÓN DE ESTE TIPO DE MODELOS.

    2.-DESARROLLO TEÓRICO LA TESIS TIENE DOS PARTES PRINCIPALES. POR UN LADO, SE HA CENTRADO EN EL DESARROLLO DE SISTEMAS QUE INCREMENTEN TODAVÍA MÁS EL RENDIMIENTO OBTENIDO POR EL SUPERCOMPUTADOR JANUS, UBICADO EN EL INSTITUTO DE BIOCOMPUTACIÓN Y FÍSICA DE SISTEMAS COMPLEJOS (BIFI) DE LA UNIVERSIDAD DE ZARAGOZA. SE HAN ESTUDIADO DIFERENTES DESARROLLOS DE HARDWARE QUE PERMITEN INCREMENTAR TANTO LA CANTIDAD DE APLICACIONES COMO EL RENDIMIENTO DE LA MÁQUINA A NIVEL DE POTENCIA DE CÁLCULO Y DE CONSUMO ELÉCTRICO.

    RESPECTO A LA IMPLEMENTACIÓN DE NUEVOS ALGORITMOS, EN PRIMER LUGAR SE HAN ANALIZADO LOS PRINCIPALES CUELLOS DE BOTELLA EN EL USO DE UN ALGORITMO DE SIMULACIÓN LLAMADO PARALLEL TEMPERING. UNA VEZ IDENTIFICADOS LOS PRINCIPALES PROBLEMAS QUE HACÍAN INEFICIENTE AL SUPERCOMPUTADOR PARA ESTA TAREA, SE HA IMPLEMENTADO UN MICROPROCESADOR EMPOTRADO EN LA LÓGICA REPROGRAMABLE DE LOS COMPONENTES DE COMUNICACIÓN PARA ACELERAR LAS SIMULACIONES, OBTENIENDO UN SATISFACTORIO AUMENTO DE LAS PRESTACIONES DEL ORDENADOR.

    ADEMÁS, SE HA IMPLEMENTADO UN NUEVO ESQUEMA DE PARALELIZACIÓN A NIVEL DE DATOS, EN EL QUE UN SISTEMA GRANDE DE SPIN GLASS SE HA DIVIDIDO EN DIVERSAS SECCIONES QUE SE HAN EJECUTADO EN PARALELO EN LA PLACA DE JANUS. HACIENDO USO DE LA RED DE COMUNICACIÓN DE LA PLACA, CADA NODO DE COMPUTACIÓN MANDA LOS RESULTADOS INTERMEDIOS NECESARIOS AL RESTO DE NODOS, PERMITIENDO DE ESTA MANERA LA SIMULACIÓN DE SISTEMAS MUCHO MÁS GRANDES QUE LOS INICIALMENTE SIMULADOS EN JANUS, ALARGANDO DE ESTA MANERA EL RANGO DE APLICACIONES DE JANUS Y SU VIDA ÚTIL.

    LA SEGUNDA PARTE DE LA TESIS DISCUTE EL DESARROLLO DE UN NUEVO SUPERCOMPUTADOR DE PROPÓSITO ESPECÍFICO, QUE PERMITE ALCANZAR RENDIMIENTOS TODAVÍA MAYORES Y QUE AMPLÍA EL RANGO DE ALGORITMOS CIENTÍFICOS QUE SE PODRÍAN SIMULAR EN EL NUEVO COMPUTADOR, INCLUYENDO POR EJEMPLO ALGORITMOS CON ALTA NECESIDAD DE MEMORIA, O REQUERIMIENTOS DE BAJA LATENCIA EN LAS COMUNICACIONES.

    EN LA TESIS SE DETALLA ESTE DISEÑO Y DESARROLLO, QUE HA REQUERIDO DE TAREAS COMO EL DISEÑO DE LA ARQUITECTURA HARDWARE DE LA MÁQUINA O EL DESARROLLO DE LOS SISTEMAS RECONFIGURABLES DE LA NUEVA MÁQUINA, QUE SERÍA UTILIZADA DESPUÉS PARA SU USO DURANTE LA ETAPA DE EXPLOTACIÓN CIENTÍFICA.

    ADEMÁS, SE HA DESARROLLADO UNA NUEVA IMPLEMENTACIÓN DE UN MODELO DE SPIN GLASS PARA LA NUEVA MÁQUINA. DURANTE LA ETAPA DE DISEÑO, SE HAN EXPLORADO DIFERENTES ALTERNATIVAS DE CONFIGURACIÓN DE LA SEGMENTACIÓN DE CÁLCULO Y DEL USO DE DIVERSAS ESTRATEGIAS DE IMPLEMENTACIÓN. SE HA MEDIDO EL RENDIMIENTO ALCANZADO Y EL CONSUMO DE POTENCIA DE LA MÁQUINA, COMPARÁNDOLO CON EL DE ORDENADORES ACTUALES.

    3.-CONCLUSIONES 3.1 - IMPLEMENTACIONES EN JANUS EN EL SUPERCOMPATUDOR JANUS, LA IMPLEMENTACIÓN DE ALGORITMOS PARALELOS QUE REQUIEREN PROCESOS DE COMUNICACIÓN ENTRE ELLOS SUFRE DE UN GRAN CUELLO DE BOTELLA CUANDO LOS MENSAJES SE DIRIGEN AL HOST: EL PROTOCOLO GIGABIT ETHERENET TIENE UNA LATENCIA DEMASIADO GRANDE, AÑADIENDO UN TIEMPO DE RETRASO A LAS COMUNICACIONES QUE HACE INEFICIENTE A CASI CUALQUIER POSIBLE PARALELIZACIÓN ENTRE NODOS DE ESTE TIPO. EN EL CASO DE LAS SIMULACIONES DE SPIN GLASS, EL PARALLEL TEMPERING ES UN ALGORITMO DE SIMULACIÓN QUE SUFRE DE ESTA SITUACIÓN, EN LA QUE CUALQUIER POSIBLE PARALELIZACIÓN ENTRE NODOS ES MAS LENTA QUE UNA IMPLEMENTACION SECUENCIAL EN UNA SOLA FPGA.

    PARA SOLUCIONAR ESTE PROBLEMA, EL DESARROLLO DE UN SISTEMA EMPOTRADO DENTRO DE LA FPGA DE COMUNICACIÓN USANDO EL SOFT CORE MICROBLAZE DE XILINX PERMITE EVITAR LA COMUNICACIÓN GIGABIT ETHERNET Y USAR ÚNICAMENTE LOS BUSES DE COMUNICACIÓN PARALELA DE BAJA LATENCIA. LA SIMPLICIDAD DEL ALGORITMO ES UNA VENTAJA, PUESTO QUE EL PROCESADOR SOLO TIENE QUE REALIZAR UNAS POCAS OPERACIONES ARITMÉTICAS. ADEMÁS, EL DESARROLLO EN VHDL DE LOS PERIFÉRICOS DEL PROCESADOR PARA CADA TAREA COMPUTACIONALMENTE INTENSIVA HACE AL DISEÑO COMPETITIVO AUNQUE LA VELOCIDAD DE RELOJ DEL PROCESADOR ES RELATIVAMENTE BAJA.

    EL RENDIMIENTO OBTENIDO CON ESTE NUEVO DISEÑO EMPOTRADO SUPONE UNA SATISFACTORIA MEJORA EN LA VELOCIDAD MAYOR QUE 5, PERMITIENDO EFICIENCIAS PARALELAS MAYORES DEL 80% PARA ALGUNAS SIMULACIONES TÍPICAS DE SPIN GLASS. EL MICROBLAZE EMPOTRADO SE PUSO FINALMENTE EN PRODUCCIÓN EN JANUS, Y SE UTILIZÓ SATISFACTORIAMENTE EN ALGUNAS SIMULACIONES PROBLEMÁTICAS DE SPIN GLASS, DONDE EL RENDIMIENTO EXTRA ACELERÓ LA OBTENCIÓN DE RESULTADOS.

    OTRO ALGORITMO DE PARALELIZACIÓN DIFERENTE ES UNA PARTICIÓN DIRECTA DEL VOLUMEN DE UN SPIN GLASS, TRANSMITIENDO LAS SUPERFICIES DE LA FRONTERA A LOS NODOS VECINOS. LA ARQUITECTURA DE LA PLACA JANUS, 16 FPGA CONFIGURANDO UN MALLADO DE 4 X 4 CON CONEXIONES A LOS PRIMEROS VECINOS Y CONDICIONES DE CONTORNO PERIÓDICAS, ES LA CARACTERÍSTICA CLAVE QUE PERMITE EL DESARROLLO DE UN SISTEMA DIGITAL QUE USA ESTE ESQUEMA DE PARALELIZACIÓN DE DATOS EN PRODUCCIÓN CIENTÍFICA.

    SIN EMBARGO, EL ANCHO DE BANDA MÁXIMO PUEDE SER LA FUENTE DE CUELLOS DE BOTELLA PROBLEMÁTICOS, QUE PUEDEN AFECTAR SENSIBLEMENTE EL RENDIMIENTO DEL ALGORITMO. LA EFICIENCIA PARALELA VA DESDE EL MÁXIMO TEÓRICO DE $0.98\%$ AL EFECTIVO $80\%$, DADO EL CUELLO DE BOTELLA EN EL ANCHO DE BANDA DE LA COMUNICACIÓN ENTRE SP.

    EL ASPECTO MAS IMPORTANTE DE ESTA IMPLEMENTACIÓN ES CÓMO INCREMENTA EL RANGO DE APLICACIONES DEL COMPUTADOR JANUS. ESTE ALGORITMO DE PARALELIZACIÓN DE DATOS PERMITE CORRER SIMULACIONES DE REDES DE TAMAÑOS INALCANZABLES EN LOS PRIMEROS AÑOS DE EXPLOTACIÓN DEL COMPUTADOR JANUS. LA IMPLEMENTACIÓN DE ESTE ALGORITMO HACE A JANUS UNA MÁQUINA MÁS VERSÁTIL, ALARGANDO LA VIDA ÚTIL DEL COMPUTADOR.

    3.2 - DESARROLLO DE JANUS II EL PRINCIPAL OBJETIVO AL COMIENZO DEL PROYECTO JANUS II FUE EL DISEÑO DE UN NUEVO COMPUTADOR, USANDO LA ÚLTIMA GENERACIÓN DE FPGA, PARA INCREMENTAR EL RENDIMIENTO DE CADA NODO DE PROCESAMIENTO. ASÍ MISMO, LAS IDEAS INICIALES DEL COMPUTADOR JANUS FUERON MEJORADAS DE VARIAS MANERAS.

    POR EJEMPLO, EL INCREMENTO DE LA MEMORIA DISPONIBLE EN EL SISTEMA PERMITE EXPANDIR EL NÚMERO DE APLICACIONES PARA LAS QUE JANUS II PUEDE SER POTENCIALMENTE UN COMPUTADOR EFICIENTE. DESDE EL PUNTO DE VISTA DE LAS MISMAS SIMULACIONES DE VIDRIOS DE SPIN QUE FUERON USADAS PREVIAMENTE EN EL PRIMER JANUS, AHORA SE BENEFICIAN FUERTEMENTE DEL INCREMENTO DE LA MEMORIA BRAM INTERNA DISPONIBLE. ASÍ, MIENTRAS QUE LA RED MÁS GRANDE QUE PODÍA SIMULARSE EN UN NODO DEL PRIMER JANUS TENÍA UN TAMAÑO DE L=100, ESTE NÚMERO HA SIDO EXTENDIDO HASTA L=195.

    EL INCREMENTO EN EL TAMAÑO DE LA RED BENEFICIA IMPORTANTEMENTE A LAS SIMULACIONES DE SPIN GLASS FUERA DEL EQUILIBRIO. PARA CUALQUIER RED DE SPIN GLASS DE TAMAÑO $L$ EXISTE UN TIEMPO MÁXIMO DE SIMULACIÓN ANTES DE QUE LA CALIDAD DE LA SIMULACIÓN SE DEGRADE Y EMPIECE A SUFRIR EFECTOS DE TAMAÑO FINITO. EN LAS REDES MAS GRANDES SIMULADAS EN JANUS DE TAMAÑO L=80, ESTE TIEMPO PARA ALGUNAS TEMPERATURAS DE SIMULACIÓN SE SOBREPASARON AMPLIAMENTE.

    LAS REDES MAS GRANDES QUE JANUS II PUEDE SIMULAR EXTIENDEN ESTE TIEMPO MÁXIMO DE SEGURIDAD VARIOS ÓRDENES DE MAGNITUD, AUMENTANDO FUERTEMENTE LA CALIDAD DE LAS SIMULACIONES.

    ADEMÁS, LA PRESENCIA DE LA MEMORIA RAM EXTERNA EN CADA FPGA ES TAMBIÉN UNA IMPORTANTE MEJORA. LA EXPERIENCIA DEL PRIMER ORDENADOR JANUS AL IMPLEMENTAR OTRAS APLICACIONES NO RELACIONADAS CON SPIN GLASS FUE QUE EL PRINCIPAL CUELLO DE BOTELLA ERA LA PEQUEÑA CANTIDAD DE MEMORIA DISPONIBLE. CON LA NUEVA MEMORIA DDR3, CRECE EL CAMPO DE APLICACIONES QUE PUEDEN SER EFICIENTEMENTE IMPLEMENTADAS. POR EJEMPLO, APLICACIONES EN AREAS COMO CRIPTOGRAFÍA U OPTIMIZACIÓN DE GRAFOS SON BUENAS CANDIDATAS PARA IMPLEMENTARSE EN JANUS II.

    LA INTERCONEXIÓN DE COMUNICACIONES ENTRE NODOS DE PROCESAMIENTO SE HA MEJORADO, Y ES TAMBIÉN UNA CARACTERÍSTICA CLAVE DE LA NUEVA MÁQUINA. LA PRESENCIA DE ESTA RED DE COMUNICACIÓN ENTRE NODOS DE COMPUTACIÓN EN EL PRIMER JANUS SE HA DEMOSTRADO COMO UN COMPLETO ÉXITO. SIN EMBARGO, EL ANCHO DE BANDA LIMITADO EN JANUS CAUSÓ UNA CAÍDA EN LA EFICIENCIA PARALELA. JANUS II INCLUYE ENLACES DE COMUNICACIÓN DE ALTO ANCHO DE BANDA ENTRE NODOS QUE SON MÁS DE UN ORDEN DE MAGNITUD MÁS GRANDES QUE LOS PRESENTES EN JANUS. ESTO PERMITE LA SIMULACIÓN DE UN SISTEMA DE TAMAÑO $L \SIMEQ 500$ EN UNA PLACA. ADEMÁS, JANUS II PERMITE CONFIGURAR UNA RED TOROIDAL TRIDIMENSIONAL QUE PERMITE SIMULACIONES DE SISTEMAS PARALELIZADOS EN DIFERENTES PLACAS DE UN TAMAÑO DE HASTA L=700.

    OTRA DIFERENCIA EN JANUS II ES EL RENDIMIENTO MEJORADO EN LAS COMUNICACIONES ENTRE LOS NODOS DE PROCESAMIENTO Y EL HOST. LAS CONEXIONES DE BAJA LATENCIA Y ALTO ANCHO DE BANDA PRESENTES EN JANUS II, BASADAS EN LOS PROTOCOLOS PCI EXPRESS Y AURORA DE XILINX, PUEDEN PERMITIR UN MODO DE OPERACIÓN MIXTO DEL SISTEMA, DONDE EL CONTROL COMPLEJO DEL ALGORITMO PODRÍA SER EJECUTADO AHORA EN EL HOST, PERMITIENDO ADEMÁS UN ACOPLAMIENTO FLEXIBLE ENTRE LOS COMPONENTES DE HARDWARE.

    EL RENDIMIENTO DE LOS PRIMEROS MODELOS DE SPIN GLASS IMPLEMENTADOS EN JANUS II FUE MEDIDO EN 3.125 PICOSEGUNDOS POR SPIN UPDATE, SIMULANDO UNA RED DE L=160 CON 1600 ACTUALIZACIONES SIMULTANEAS CORRIENDO A 200 MHZ EN UNA FPGA VIRTEX 7. EL RENDIMIENTO DE JANUS COMPARADO CON ORDENADORES GENERALES ES TODAVÍA BUENO. LA IMPLEMENTACIÓN DE JANUS II ES MÁS DE 16 VECES MÁS RÁPIDA QUE UN XEON-PHI, Y 20 VECES MEJOR QUE UNA PLACA CON DOS PROCESADORES SANDY BRIDGE. ADEMÁS, LA EFICIENCIA EN CONSUMO DE ENERGÍA ES DOS ÓRDENES DE MAGNITUD MEJOR. ESTO MUESTRA OTRA GRAN VENTAJA DE LOS ORDENADORES DE PROPÓSITO ESPECÍFICO BASADOS EN FPGA: SU CONSUMO ELÉCTRICO ES MUCHO MÁS BAJO. LA GRAN EFICIENCIA ENERGÉTICA SIGNIFICA COSTES OPERATIVOS MÁS BAJOS Y UNA MENOR EMISIÓN DE CO2.

    4.-BIBLIOGRAFÍA CONSULTADA [1] J. MAKINO “GRAPE PROJECT: SPECIAL-PURPOSE COMPUTERS FOR MANY-BODY SIMULATIONS”, COMPUTER PHYSICS COMMUNICATIONS, 1 (2001): 45-54.

    [2] J.MAKINO AND M. TAIJI, “SCIENTIFIC SIMULATIONS WITH SPECIAL-PURPOSE COMPUTERS”, WILEYVCH, APRIL 1998.

    [3] F. BELLETTI ET AL. “COMPUTING FOR LQCD: APENEXT”, COMPUTING IN SCIENCE & ENGINEERING, 8.1 (2006): 18-29.

    [4] J. MAKINO ET AL. “GRAPE-6: MASSIVELY-PARALLEL SPECIAL-PURPOSE COMPUTER FOR ASTROPHYSICAL PARTICLE SIMULATIONS”, PUBLICATIONS OF THE ASTRONOMICAL SOCIETY OF JAPAN, 55.6 (2003): 1163-1187.

    [5] T. NARUMI, ET AL. “A 55 TFLOPS SIMULATION OF AMYLOID-FORMING PEPTIDES FROM YEAST PRION SUP35 WITH THE SPECIAL-PURPOSE COMPUTER SYSTEM MDGRAPE-3”, PROCEEDINGS OF THE 2006 ACM/IEEE CONFERENCE ON SUPERCOMPUTING, ACM, 2006.

    [6] M. TAIJI ET AL. “PROTEIN EXPLORER: A PETAFLOPS SPECIAL-PURPOSE COMPUTER SYSTEM FOR MOLECULAR DYNAMICS SIMULATIONS” SUPERCOMPUTING, 2003 ACM/IEEE CONFERENCE IEEE, 2003.

    [7] I. OHMURA ET AL. “MDGRAPE-4: A SPECIAL-PURPOSE COMPUTER SYSTEM FOR MOLECULAR DYNAMICS SIMULATIONS”, PHILOSOPHICAL TRANSACTIONS OF THE ROYAL SOCIETY OF LONDON A: MATHEMATICAL, PHYSICAL AND ENGINEERING SCIENCES, 372 (2014).

    [8] D. SHAW ET AL. “ANTON, A SPECIAL-PURPOSE MACHINE FOR MOLECULAR DYNAMICS SIMULATION” COMMUNICATIONS OF THE ACM, 51.7 (2008): 91-97.

    [9] D. SHAW ET AL. “MILLISECOND-SCALE MOLECULAR DYNAMICS SIMULATIONS ON ANTON” PROCEEDINGS OF THE CONFERENCE ON HIGH PERFORMANCE COMPUTING NETWORKING, STORAGE AND ANALYSIS, IEEE, 2009.

    [10] XILINX “ISE IN-DEPTH TUTORIAL” PRODUCT USER GUIDE UG695 (2012) [11] XILINX “VIVADO DESIGN SUITE USER GUIDE: USING THE VIVADO IDE” PRODUCT USER GUIDE UG893 (2015) [12] XILINX “AURORA 8B/10B PROTOCOL SPECIFICATION” OPEN STANDARD SPECIFICATION SP002 (2014) [13] XILINX “KC705 EVALUATION BOARD FOR THE KINTEX-7 FPGA” PRODUCT USER GUIDE UG810 (2015) [14] XILINX “ML605 HARDWARE USER GUIDE” PRODUCT USER GUIDE UG534 (2012) [15] XILINX “LOGICORE IP INTEGRATED BIT ERROR RATIO TESTER (IBERT) FOR 7 SERIES GTX TRANSCEIVERS V3.0” PRODUCT GUIDE FOR VIVADO DESIGN SUITE PG132 (2013) [16] G. DE MICHELL AND R. GUPTA. “HARDWARE/SOFTWARE CO-DESIGN” PROCEEDINGS OF THE IEEE, 85.3 (1997): 349-365.

    [17] MENTOR GRAPHICS “MODELSIM USER’S MANUAL” PRODUCT USER MANUAL (2012) [18] E. MARINARI, G. PARISI AND J. J. RUIZ-LORENZO, “NUMERICAL SIMULATIONS OF SPIN GLASS SYSTEMS”, IN SPIN GLASSES AND RANDOM FIELDS, (A. P. YOUNG EDITOR) WORLD SCIENTIFIC, SINGAPORE, 1998.

    [19] F. BELLETTI ET AL., “IANUS: AN ADAPTIVE FPGA COMPUTER”, COMPUTING IN SCIENCE AND ENGINEERING 8 (2006) 41-49.

    [20] F. BELLETTI ET AL., “SIMULATING SPIN SYSTEMS ON IANUS, AND FPGA-BASED COMPUTER”, COMP. PHYS. COMM. 178, (2008) 208.

    [21] F. BELLETTI ET AL., “JANUS: AN FPGA-BASED SYSTEM FOR HIGH-PERFORMANCE SCIENTIFIC COMPUTING”, COMPUTING IN SCIENCE AND ENGINEERING 11, (2009) 48.

    [22] M.BAITY-JESI ET AL. (2013). “JANUS: AN FPGA-BASED SUPERCOMPUTER” IN HIGH-PERFORMANCE COMPUTING USING FPGAS (PP. 481-506). SPRINGER, NEW YORK.

    [23] S. F. EDWARDS AND P. W. ANDERSON, “THEORY OF SPIN GLASSES”, J. PHYS. F: MAT. PHYS. 5 (1975) 965-974.

    [24] Y. IMRY AND S. MA, “RANDOM-FIELD INSTABILITY OF THE ORDERED STATE OF CONTINUOUS SYMMETRY”, PHYS. REV. LETT. 35 (1975) 1399-1401.

    [25] D. P. BELANGER AND A. P. YOUNG, “THE RANDOM FIELD ISING MODEL”, J. OF MAGNETISM AND MAGNETIC MATERIALS 100, (1991) PP. 272-291.

    [26] A. D. OGIELSKI AND D. A. HUSE, “CRITICAL BEHAVIOR OF THE THREE-DIMENSIONAL DILUTE ISING ANTIFERROMAGNET IN A FIELD”, PHYS. REV. LETT.56 (1986) 1298-1301.

    [27] N. METROPOLIS ET AL., “EQUATION OF STATE CALCULATION BY FAST COMPUTING MACHINES”, J. CHEMICAL PHYSICS 21, (1986) 1087-1092.

    [28] K. HUKUSHIMA AND K. NEMOTO, J. PHYS. SOC. JPN. 65 (1996) 1604. M.C. TESI ET AL, J. STAT. PHYS. 82 (1996) 155.

    [29] G.PARISI AND F. RAPUANO, “EFFECTS OF THE RANDOM NUMBER GENERATOR ON COMPUTER SIMULATIONS”, PHYS. LETT. B 157, (1985) 301-302.

    [30] M. GUIDETTI, A. MAIORANO, F. MANTOVANI, S. F. SCHIFANO, AND R. TRIPICCIONE, “SPIN GLASS MONTE CARLO SIMULATIONS ON THE CELL BROADBAND ENGINE”, PROC. OF PPAM09, SEPTEMBER 13-16 2009, WROCLAW (POLAND). LNCS VOL. 6067/2010, PP. 467-476.

    [31] M. GUIDETTI, A. MAIORANO, F. MANTOVANI, M. PIVANTI, S.F. SCHIFANO, AND R. TRIPICCIONE, “MONTE CARLO SIMULATIONS OF SPIN SYSTEMS ON MULTI-CORE PROCESSORS”, PROC. OF PARA10, JUNE 6-9, 2010, REYKJAV ́IK (ICELAND). TO APPEAR ALSO ON LNCS VOL. 7133 AND 7134.

    [32] F. BELLETI ET AL, “NONEQUILIBRIUM SPIN GLASS DYNAMICS FROM PICOSECONDS TO ONE TENTH OF A SECOND”, PHYS. REV. LETT. 101, (2008) 157201.

    [33] F. BELLETI ET AL, “AN IN-DEPTH VIEW OF THE MICROSCOPIC DYNAMICS OF ISING SPIN GLASSES AT FIXED TEMPERATURE”, J. STAT. PHYS 135, (2009) 1121.

    [34] R. ALVAREZ BAÑOS ET AL, “CRITICAL BEHAVIOR OF THREE-DIMENSIONAL DISORDERED POTTS MODELS WITH MANY STATES”, J. STAT. MECH. (2010) P05002.

    [35] R. ALVAREZ BAÑOS ET AL, “NATURE OF THE SPIN-GLASS PHASE AT EXPERIMENTAL LENGTH SCALES”, J. STAT. MECH. (2010) P06026.

    [36] R. ALVAREZ BÃNOS ET AL, “STATIC VERSUS DYNAMIC HETEROGENEITIES IN THE D = 3 EDWARDS-ANDERSON-ISING SPIN GLASS”, PHYS. REV. LETT. 105 (2010) 177202.

    [37] M. BAITY-JESI ET AL. “RECONFIGURABLE COMPUTING FOR MONTE CARLO SIMULATIONS: RESULTS AND PROSPECTS OF THE JANUS PROJECT” THE EUROPEAN PHYSICAL JOURNAL SPECIAL TOPICS, 210.1 (2012): 33-51.

    [38] W. K. HASTINGS, “MONTE CARLO SAMPLING METHODS USING MARKOV CHAINS AND THEIR APPLICATIONS” BIOMETRIKA 57.1 (1970): 92-109 [39] C. P. ROBERT AND G. CASELLA (2004) “MONTE CARLO STATISTICAL METHODS” SPINGER, NEW YORK.

    [40] D. EARL AND M. DEEM, “PARALLEL TEMPERING: THEORY, APPLICATIONS, AND NEW PERSPECTIVES” PHYSICAL CHEMISTRY CHEMICAL PHYSICS, 7.23 (2005): 3910-3916.

    [41] G. AMDAHL “VALIDITY OF THE SINGLE PROCESSOR APPROACH TO ACHIEVING LARGE SCALE COMPUTING CAPABILITIES” PROCEEDINGS OF THE APRIL 18-20, 1967, SPRING JOINT COMPUTER CONFERENCE, ACM, 1967.

    [42] XILINX “MICROBLAZE PROCESSOR REFERENCE GUIDE EMBEDDED DEVELOPMENT KIT” PRODUCT USER GUIDE UG081 (2012) [43] XILINX “LOGICORE IP PROCESSOR LOCAL BUS (PLB)” PRODUCT SPECIFICATION DS531 (2010) [44] W. HILLIS AND G.L. STEELE JR. “DATA PARALLEL ALGORITHMS” COMMUN. ACM 29, N12 (1986): 1170-1183.

    [45] XILINX “VIRTEX-4 FAMILY OVERVIEW” PRODUCT SPECIFICATION DS112 (2010) [46] G. FOX ET AL. (1988) “SOLVING PROBLEMS ON CONCURRENT PROCESSORS, VOLUME 1” PRENTICE-HALL, ENGLEWOOD CLIFFS, NJ.

    [47] V. KUMAR ET AL. (1994) “INTRODUCTION TO PARALLEL COMPUTING - DESIGN AND ANALYSIS OF ALGORITHMS” THE BENJAMIN/CUMMINGS PUBLISHING COMPANY, INC., REDWOOD CITY, CA.

    [48] INTERNATIONAL ORGANIZATION FOR STANDARDIZATION (2005) “ISO/IEC TR 19759:2005, SOFTWARE ENGINEERING — GUIDE TO THE SOFTWARE ENGINEERING BODY OF KNOWLEDGE (SWEBOK)” [49] PORTWELL “PCOM-B217VG-ECC” PRODUCT DATA SHEET [50] XILINX “7 SERIES FPGAS INTEGRATED BLOCK FOR PCI EXPRESS V3.2 ” PRODUCT USER GUIDE PG054 (2015) [51] PCI-SIG “PCI EXPRESS BASE SPECIFICATION REVISION 2.1” PROTOCOL SPECIFICATION (2009) [52] A.X WIDMER AND P. A. FRANASZEK. ”A DC-BALANCED, PARTITIONED-BLOCK, 8B/10B TRANSMISSION CODE” IBM JOURNAL OF RESEARCH AND DEVELOPMENT, 27, NO. 5 (1983): 440-451.

    [53] XILINX “ETHERNET 1000BASE-X PCS/PMA OR SGMII V14.3” PRODUCT USER GUIDE PG047 (2014) [54] XILINX “TRI-MODE ETHERNET MAC V9.0” PRODUCT USER GUIDE PG051 (2015) [55] XILINX “VIVADO DESIGN SUITE: AXI REFERENCE GUIDE” PRODUCT USER GUIDE UG1037 (2015) [56] XILINX “7 SERIES FPGAS CONFIGURATION” PRODUCT USER GUIDE UG470 (2015) [57] XILINX “7 SERIES FPGAS GTX/GTH TRANSCEIVERS” PRODUCT USER GUIDE UG476 (2015) [58] XILINX “FIFO GENERATOR V13.0” PRODUCT USER GUIDE PG057 (2015) [59] XILINX “BLOCK MEMORY GENERATOR V8.3” PRODUCT USER GUIDE PG058 (2015) [60] XILINX “7 SERIES FPGAS OVERVIEW” PRODUCT SPECIFICATION DS180 (2015) [61] M. BAITY-JESI ET AL. “JANUS II: A NEW GENERATION APPLICATION-DRIVEN COMPUTER FOR SPIN-SYSTEM SIMULATIONS” COMPUTER PHYSICS COMMUNICATIONS, 185, NO. 2 (2014): 550-559.

    [62] A. SHARMA AND A.P. YOUNG “PHASE TRANSITIONS IN THE ONE-DIMENSIONAL LONG-RANGE DILUTED HEISENBERG SPIN GLASS” PHYS. REV. B 83 (2011): 214405.

    [63] V. MARTIN-MAYOR AND S. PEREZ-GAVIRO, “THREE-DIMENSIONAL HEISENBERG SPIN GLASS UNDER A WEAK RANDOM ANISOTROPY” PHYS. REV. B, 84 (2011): 024419.

    [64] T. GUNEYSU ET AL. (2013). “HIGH-PERFORMANCE CRYPTANALYSIS ON RIVYERA AND COPACOBANA COMPUTING SYSTEMS” IN HIGH-PERFORMANCE COMPUTING USING FPGAS (PP. 335-366). SPRINGER, NEW YORK.

    [65] W.N. CHELTON, M. BENAISSA. “FAST ELLIPTIC CURVE CRYPTOGRAPHY ON FPGA” IEEE TRANSACTIONS ON VERY LARGE SCALE INTEGRATION (VLSI) SYSTEMS, 16 NO. 2 (2008): 198-205.

    [66] F. MANTOVANI (2008) “JANUS: A RECONFIGURABLE SYSTEM FOR SCIENTIFIC COMPUTING” ( UNPUBLISHED DOCTORAL DISSERTATION), UNIVERSIT`A DEGLI STUDI DI FERRARA [67] M.A. KHAN ET AL. (2013) “FPGA-ACCELERATED MOLECULAR DYNAMICS” IN HIGH-PERFORMANCE COMPUTING USING FPGAS (PP. 105-135). SPRINGER NEW YORK.

    [68] Y. GU ET AL. “ACCELERATING MOLECULAR DYNAMICS SIMULATIONS WITH CONFIGURABLE CIRCUITS” IEE PROCEEDINGS-COMPUTERS AND DIGITAL TECHNIQUES, 153, NO. 3 (2006): 189-195.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus