José Miguel Muñoz Gómez, Abimael Jiménez Pérez, Gustavo Alberto Rodríguez Gómez
La biblioteca de funciones denominada Subprogramas B´asicos de Algebra ´ Lineal (BLAS-1) es considerada el est´andar de programaci´on en computaci´on cient´ıfica. En este trabajo nos enfocamos en el an´alisis de diversas t´ecnicas de optimizaci´on de c´odigo para incrementar el desempe˜no computacional de BLAS-1. En particular abordamos un enfoque combinacional para explorar las posibles formas de codificaci´on empleando la t´ecnica de unroll con diversos niveles de profundidad, programaci´on vectorial de datos con MMX y SSE para procesadores Intel. Empleando las funciones principales de BLAS-1 determinamos num´ericamente un incremento computacional, expresado en mega-flops, de hasta 52 % en comparaci´on con la biblioteca optimizada BLAS-1 de ATLAS.
The functions library, called Basic Linear Algebra Subprograms (BLAS-1), is considered the programming standard in scientific computing. In this work, we focus on the analysis of various code optimization techniques to increase the computational performance of BLAS-1. In particular, we address a combinational approach to explore possible methods of encoding using unroll technique with different levels of depth, vector data programming with MMX and SSE for Intel processors. Using the main functions of BLAS-1, it was determined numerically a computational increase, expressed in mega-flops, up to 52 % compared to the optimized BLAS-1 ATLAS library.
© 2001-2024 Fundación Dialnet · Todos los derechos reservados