<< Chapter < Page Chapter >> Page >

DO I=1,N DO J=1,NIF (B(J,I) .GT. 1.0) A(J,I) = A(J,I) + B(J,I) * C ENDDOENDDO

NO hay mucho que pueda hacer con este tipo de condicional. Pero dado que cada iteración es independiente, puede desenrollar el ciclo, o bien realizarlo en paralelo.

Condicionales dependientes del ciclo

Cuando el condicional se basa en un valor que cambia con cada iteración del ciclo, al compilador no le queda más opción que ejecutar el código exactamente tal y como se escribió. Por ejemplo, el siguiente ciclo tiene una sentencia selectiva con una recursividad escalar interna:


DO I=1,N IF (X .LT. A(I)) X = X + B(I)*2.ENDDO

No puede usted saber en qué forma actuará la bifurcación en la siguiente iteración hasta que no haya ejecutado la actual. Para reconocer la dependencia, trate de desenrollar ligeramente el ciclo manualmente. Si no puede comenzar la segunda prueba hasta haber finalizado la primera, tiene un condicional dependiente del ciclo . Puede que quiera revisar este tipo de bucles en busca de formas de eliminar el valor que cambia de iteración a iteración.

Reducciones

Mantenga la vista atenta en busca de ciclos en los cuales la sentencia selectiva está aplicando una función max o min a un arreglo. Se trata de una reducción , así llamada porque reduce todo un arreglo a un resultado escalar (por cierto, el ejemplo previo también fue una reducción). De nuevo, estamos un poco por delante de nosotros mismos, pero dado que estamos hablando acerca de sentencias selectivas adentro de bucles, quiero introducir un truco para reestructurar las reducciones del tipo max y min para exponer un mayor paralelismo. El siguiente ciclo busca el valor máximo, z , en el arreglo a , recorriendo todos los elementos uno a la vez:


for (i=0; i<n; i++) z = a[i]>z ? a[i] : z;

Tal como está escrito es recursivo, como el bucle de la sección previa. Requiere usted el resultado de una iteración dada antes de que pueda proceder con la siguiente. Sin embargo, y dado que estamos buscando el mayor elemento en todo el arreglo, y dado que será el mismo elemento (esencialmente) sin importar dónde lo hallemos, podemos reestructurar el ciclo para comprobar varios elementos a la vez (asumiendo que n es divisible de forma entera entre 2, y que no incluya el ciclo precondicionante):


z0 = 0.; z1 = 0.;for (i=0; i<n-1; i+=2) { z0 = z0<a[i] ? a[i]: z0; z1 = z1<a[i+1] ? a[i+1]: z1; }z = z0<z1 ? z1 : z0;

¿Observa cómo calcula el nuevo ciclo dos valores máximos en cada iteración? Estos máximos se comparan luego uno con otro, y el ganador se convierte en el nuevo valor max oficial. Es análogo a la ronda de semifinales en un torneo de ping-pong. El ciclo anterior consistía en dos jugadores compitiendo a la vez mientras que el resto se sentaba a su alrededor; en cambio, el nuevo ciclo ejecuta varios encuentros simultáneos. En general esta optimización en particular no es adecuada para codificarse a mano. En los procesadores paralelos, el compilador realiza la reducción a su propio modo. Si usted lo codificó de forma similar a este ejemplo, puede que esté limitando inadvertidamente la flexibilidad del compilador en un sistema paralelo.

Condicionales que transfieren el control

Detengámonos por un segundo. ¿Ha notado cierta similaridad en todos los bucles hasta ahora? Sólo hemos buscado un tipo de condicional, la asignación condicional , esto es, la reasignación de una variable basados en el resultado de la prueba. Por supuesto, no todo condicional termina en una asignación. Existen sentencias que transfieren el control de flujo, tales como llamados a subrutinas o sentencias goto . En el siguiente ejemplo, el programador está comprobando cuidadosamente antes de dividir entre cero:

Pero esta prueba tiene un impacto extremadamente negativo en el rendimiento, porque fuerza la ejecución de las iteraciones precisamente en el orden en que se escriben:


DO I=1,N DO J=1,NIF (B(J,I) .EQ. 0 ) THEN PRINT *,I,JSTOP ENDIFA(J,I) = A(J,I) / B(J,I)ENDDO ENDDO

Evitar este tipo de pruebas es una de las razones por las cuales los diseñadores del estándar de punto flotante del IEEE agregaron las trampas (traps) en operaciones tales como dividir entre cero. El uso de trampas permite al programador dentro de una sección de código de rendimiento crítico, lograr un rendimiento máximo sin necesidad de detectar cuándo ocurre un error.

Get Jobilize Job Search Mobile App in your pocket Now!

Get it on Google Play Download on the App Store Now




Source:  OpenStax, Cómputo de alto rendimiento. OpenStax CNX. Sep 02, 2011 Download for free at http://cnx.org/content/col11356/1.2
Google Play and the Google Play logo are trademarks of Google Inc.

Notification Switch

Would you like to follow the 'Cómputo de alto rendimiento' conversation and receive update notifications?

Ask