<< Chapter < Page Chapter >> Page >

Comenzaremos dando un paseo por el optimizador de código de un compilador, para verlo en acción. Creemos que es interesante, y si puede usted volverse empático con el compilador se convertirá en un mejor programador; verá lo que el compilador espera de usted, así como lo que puede hacer por sí mismo.

El proceso de compilación

Procesos básicos de un compilador

Esta figura es un diagrama de flujo que muestra el movimiento de líneas de código numeradas a cajas numeradas. En la parte superior hay un grupo de código, la primera línea mostrando A=B*C+5, y la segunda D=B*C. En la parte inferior de este grupo está una línea apuntado a una caja etiquetada Análisis Lexicográfico. Bajo ella está una línea apuntado a una línea de código, A=B*C+5. La A está etiquetada como Variable, el * como Operador y el 5 como Constante. Bajo esta línea de código está una flecha apuntando hacia abajo a una caja rotulada Análisis Sintáctico. Bajo esta caja está un grupo de código. La primera línea dice T1:=B*C, la segunda A:=T1+5, y la tercera D:=B*C. Apuntando hacia la parte superior derecha está una flecha que señala a una caja etiquetada Optimización.

Típicamente, el proceso de compilación se divide en un número de pasos identificables, como se muestra en la [link] . Aunque no todos los compiladores estén implementados exactamente de esta manera, ayuda a comprender las diferentes funciones que éstos deben realizar:

  1. Una fase de precompilación o preprocesamiento, donde se realiza cierta manipulación textual sencilla del código fuente. El paso de preprocesamiento puede procesar o incluir archivos, así como realizar substituciones sencillas de cadenas de texto a lo largo del código.
  2. La fase de análisis lexicográfico es la que descompone las sentencias de código fuente entrantes en tokens tales como variables, constantes, comentarios o elementos del lenguaje.
  3. La fase de análisis sintáctico es la encargada de comprobar la sintaxis de la entrada, y el copilador traduce el programa entrante a un lenguaje intermedio que está listo para su optimización.
  4. Se le realizan una o más pasadas de optimización al lenguaje intermedio.
  5. Un generador de código objeto traduce el lenguaje intermedio a código ensamblador, tomando en consideración los detalles arquitectónicos particulares del procesador en cuestión.

Conforme los compiladores se vuelven más y más sofisticados para poder dar hasta el último bit de rendimiento del procesador, algunos de estos pasos (especialmente los de optimización y generación de código) se vuelven más y más confusos. En este capítulo nos enfocaremos en el optimizador de código tradicional de un compilador, y en los capítulos subsecuentes revisaremos más de cerca cómo hacen optimizaciones más sofisticadas los compiladores modernos.

Representación en lenguaje intermedio

Como estamos más interesados en la optimización de nuestro programa, comenzaremos nuestra discusión a partir de la salida de la fase de análisis sintáctico del compilador. Dicha salida está en la forma de un lenguaje intermedio (LI), algo entre un lenguaje de alto nivel y un lenguaje ensamblador. El lenguaje intermedio expresa los mismos cálculos que en el programa original, en una forma que el compilador pueda manipular más fácilmente. Es más, ciertas instrucciones que no están presentes en el fuente, tales como expresiones de direccionamiento para referencias a arreglos, se hacen visibles junto con el resto del programa, haciéndolo también de este modo sujeto de optimización.

¿Cómo luce un lenguaje intermedio? En términos de complejidad, es similar a un código ensamblador, pero no tan simple como para que se pierdan las definiciones Por "definiciones" nos referimos a la asignación de valores, no a las declaraciones. y usos de las variables. Necesitaremos la información acerca de definición y uso para analizar el flujo de datos a través del programa. Típicamente los cálculos se expresan como u flujo de cuádruplas — sentencias con exactamente un operador, (hasta) dos operandos, y un resultado. De manera más general, el código puede representarse como n -tuplas. Depende del nivel del lenguaje intermedio. Presuponiendo que cualquier cosa en el programa fuente original pueda cambiar su representación en términos de cuádruplas, tenemos un lenguaje intermedio utilizable. Para darnos una idea de cómo trabaja, reescribiremos la sentencia siguiente como una serie de cuatro cuádruplas:

Get Jobilize Job Search Mobile App in your pocket Now!

Get it on Google Play Download on the App Store Now




Source:  OpenStax, Cómputo de alto rendimiento. OpenStax CNX. Sep 02, 2011 Download for free at http://cnx.org/content/col11356/1.2
Google Play and the Google Play logo are trademarks of Google Inc.

Notification Switch

Would you like to follow the 'Cómputo de alto rendimiento' conversation and receive update notifications?

Ask