<< Chapter < Page Chapter >> Page >

FORALL (I=1:100, J=1:100) A(I,J) = I + J

Ello puede expresarse en FORTRAN 90 nativo, pero es mucho más feo, contraintuitivo y propenso a errores.

Otra estructura de control proporciona la habilidad de declarar una función como "PURE." Una función PURE no tiene efectos secundarios mas que a través de sus parámetros. El programador garantiza que una función PURE puede ejecutarse simultáneamente en muchos procesadores sin efectos indeseables. Esto le permite a HPF asumir que dicha función sólo operará sobre datos locales y que no requiere de ninguna comunicación de datos durante el tiempo que dure su ejecución completa. El programador también puede declarar cuáles parámetros de la función son de entrada, cuáles de salida y cuáles de ambos.

Intrínsecos de hpf

Las compañías que venden computadoras SIMD requieren entregarlas con herramientas que permitan la ejecución de operaciones colectivas eficientes sobre todos los procesadores. Un ejemplo perfecto de esto es la operación SUM. Para SUM el valor de un arreglo a lo largo de N procesadores, el enfoque más simplista toma N pasos. Sin embargo, es posible lograrlo en log(N) pasos usando una técnica denominada suma prefija en paralelo . Al momento en que se estaba desarrollando HPF se habían identificado e implementado varias de tales operaciones. HPF dio la oportunidad de definir una sintaxis estandarizada para ellas.

Una muestra de tales operaciones incluye:

  • SUM_PREFIX Realiza varios tipos de sumas prefijas en paralelo.
  • ALL_SCATTER Distribuye un único valor a un conjunto de procesadores.
  • GRADE_DOWN Ordena en orden decreciente.
  • IANY Calcula el OR lógico de un conjunto de valores.

Aun cuando existe un gran número de tales funciones intrínsecas, la mayoría de las aplicaciones sólo usa unas pocas de tales operaciones.

Extrínsecos de hpf

Con el objeto de permitir a los vendedores de arquitecturas diversas, proporcionar sus ventajas particulares, HPF incluyó la capacidad de enlazarse con funciones "extrínsecas". Tales funciones no requieren de reescribirse en FORTRAN 90/HPF, y realizan varias capacidades sólo soportadas por los vendedores. Esta capacidad permite a los usuarios realizar tales tareas, como la creación de aplicaciones híbridas, con algo de HPF y algo de paso de mensajes.

Los programadores de cómputo de alto rendimiento siempre gustan de tener la habilidad de hacer cosas a su propio modo, con el objetivo de exprimir hasta la última gota de rendimiento.

Flujo calórico en hpf

Para transportar nuestra aplicación de flujo calórico a HPF, realmente sólo requerimos de agregar una línea de código. En el ejemplo siguiente, lo hemos cambiado a un arreglo bidimensional más grande:


INTEGER PLATESIZ,MAXTIME PARAMETER(PLATESIZ=2000,MAXTIME=200)!HPF$ DISTRIBUTE PLATE(*,BLOCK) REAL*4 PLATE(PLATESIZ,PLATESIZ)INTEGER TICK PLATE = 0.0* Sumar las fronterasPLATE(1,:) = 100.0 PLATE(PLATESIZ,:) = -40.0PLATE(:,PLATESIZ) = 35.23 PLATE(:,1) = 4.5DO TICK = 1,MAXTIMEPLATE(2:PLATESIZ-1,2:PLATESIZ-1) = ( + PLATE(1:PLATESIZ-2,2:PLATESIZ-1) ++ PLATE(3:PLATESIZ-0,2:PLATESIZ-1) + + PLATE(2:PLATESIZ-1,1:PLATESIZ-2) ++ PLATE(2:PLATESIZ-1,3:PLATESIZ-0) ) / 4.0 PRINT 1000,TICK, PLATE(2,2)1000 FORMAT('TICK = ',I5, F13.8) ENDDO* END

Notará que la directiva HPF distribuye las columnas del arreglo usando el enfoque BLOCK , manteniendo todos los elementos de una columna sobre un mismo procesador. A primera vista, pudiera parecer que ( BLOCK , BLOCK ) es la mejor distribución. Sin embargo, hay dos ventajas de una distribución ( * , BLOCK ). Primero, recorrer hacia abajo una columna es una operación de paso único, y de este modo puede usted procesar una columna completa. El aspecto más significativo de la distribución es que una distribución ( BLOCK , BLOCK ) fuerza a cada procesador a comunicarse con hasta ocho procesadores más para obtener los valores de sus vecinos. Usando la distribución (*, BLOCK ), cada procesador tendrá que intercambiar datos con cuando mucho dos procesadores en cada ciclo.

Cuando veamos PVM, veremos el mismo programa implementado al estilo de paso de mensajes SPMD. En este ejemplo, verá usted algunos de los detalles que HFP debe manejar para ejecutar apropiadamente este código. Tras revisarlo ¡probablemente usted elija implementar todas sus aplicaciones futuras de flujo calórico en HPF!

Resumen de hpf

En ciertas cosas HPF ha sido mejor que FORTRAN 90. Compañías como IBM con su SP-1 requieren de proporcionar algún lenguaje de alto nivel para el que sus usuarios no quieren escribir código de paso de mensajes. Por tal motivo, IBM ha invertido una gran cantidad de esfuerzo en implementar un HPF optimizado. Resulta interesante que mucho de su esfuerzo beneficiará directamente la habilidad de desarrollar compiladores de FORTRAN 90 más sofisticados. El extensivo análisis de flujo de datos requerido para minimizar las comunicaciones y administrar las estructuras de datos dinámicos recaerá en los compiladores de FORTRAN 90 incluso sin usar las directivas de HPF.

El tiempo dirá si ya no serán necesarias las directivas de distribución de datos de HPF, y si los compiladores serán capaces de realizar suficiente análisis sobre el código plano de FORTRAN 90 para optimizar la ubicación y movimiento de los datos.

En su forma actual, HPF es un vehículo excelente para expresar las aplicaciones altamente paralelas a nivel de datos, y basadas en retículas. Sus debilidades son las comunicaciones irregulares y el balance de cargas dinámicas. Un nuevo esfuerzo para desarrollar la siguiente versión de HPF está en camino, para manejar algunos de estos temas. Desafortunadamente, es más difícil resolver estos problemas a tiempo de ejecución a la vez que se mantiene un buen rendimiento a través de una amplia variedad de arquitecturas.

Get Jobilize Job Search Mobile App in your pocket Now!

Get it on Google Play Download on the App Store Now




Source:  OpenStax, Cómputo de alto rendimiento. OpenStax CNX. Sep 02, 2011 Download for free at http://cnx.org/content/col11356/1.2
Google Play and the Google Play logo are trademarks of Google Inc.

Notification Switch

Would you like to follow the 'Cómputo de alto rendimiento' conversation and receive update notifications?

Ask