Salvador Abreu / sim2c

Blame view

apt-vspl.tex 13.9 KB
\documentclass[a4paper]{article}

\usepackage{pslatex}
\usepackage{a4wide}
\usepackage{isolatin1}
\usepackage[portuges]{babel}
\usepackage{picins}
\usepackage{hyperref}

\def�{\~o}
\def�{\~O}

\begin{document}

% $Id: apt-vspl.tex,v 1.2 2010/03/26 07:35:57 spa Exp spa $

\def\LANG{\textsf{VSPL}}

\begin{center}
  \begin{Large}
    \textsf{Compiladores -- Ano lectivo 2009/10} \\
    \textbf{Acerca da representa��o para a APT na Linguagem \LANG} \\
  \end{Large}
  \mbox{}\\
  \hrulefill{}
  \begin{center}
    Informa��o de vers�o: \verb$Id: apt-vspl.tex,v 1.2 2010/03/26 07:35:57 spa Exp spa $
  \end{center}
\end{center}

\noindent \hrulefill{} {\Large Especifica��o} \hrulefill{}

\noindent
Na constru��o da �rvore abstracta para um programa em \LANG, �
necess�rio ter em conta a estrutura concreta da gram�tica utilizada
para construir o parser.  No entanto, e como um dos objectivos da
no��o de sintaxe \emph{abstracta} � o de ``suavizar'' a sintaxe
concreta, � poss�vel definir alguns crit�rios gerais para elabora��o
da sintaxe abstracta.  Estes ir�o incorporar alguns aspectos da
sem�ntica pretendida para a linguagem.

\noindent \mbox{} \hrulefill{} \mbox{}

\vspace{0.4cm}
\noindent
Este documento pretende apresentar crit�rios para comp�r a sintaxe
abstracta para uma linguagem de programa��o.  � aplicada ao \LANG{}
mas pode ser adaptada a outras linguagens duma forma simples.

Na sec��o~\ref{sec:principios-gerais} s�o apresentados princ�pios
orientadores para a resolu��o deste tipo de problema.  Na
sec��o~\ref{sec:literais} descreve-se abordagens � representa��o de
literais.  Na sec��o~\ref{sec:expressoes} as express�es (aritm�ticas,
nomeadamente) s�o descritas e na sec��o~\ref{sec:statements} �
abordada a problem�tica da representa��o das instru��es
(``statements'').

\section{Princ�pios Gerais}
\label{sec:principios-gerais}

Embora se trate de especificar uma estrutura capaz de exprimir um
programa, com uma sintaxe simplificada, muitos aspectos importantes
para fases posteriores do processo de compila��o ser�o omitidos ao
n�vel da APT, s�o estes nomeadamente:
\begin{itemize}
\item A informa��o de tipo associada a qualquer express�o ou nome.
\item A informa��o de �mbito (``scope'') associada aos nomes.
\end{itemize}
Estes aspectos s� dever�o ser contemplados posteriormente, na fase de
an�lise sem�ntica (an�lise de nomes e de tipos).

Por ter sido estipulado que as fases de an�lise sem�ntica e
posteriores seriam implementadas numa linguagem de Programa��o em
L�gica com Restri��es (\emph{Constraints}), torna-se importante
adequar as caracter�sticas da APT ao modelo computacional subjacente.
Assim, para beneficiar plenamente das capacidades dos mecanismos de
Unifica��o e Constraints, importa especificar cuidadosamente a
estrutura da APT por forma a criar oportunidades de factorizar a
representa��o sempre que isto se mostre ben�fico.

\section{Tipos}
\label{sec:tipos}

Quando for preciso representar um tipo, utiliza-se um termo.  Os
termos associados aos tipos do \LANG{} restrito s�o:
\begin{description}
\item[\texttt{int}] Um inteiro.
\item[\texttt{bool}] Um booleano.
\item[\texttt{array(TYPE, DIM)}] Um array (vector) do tipo
  \texttt{TYPE} com \texttt{DIM} (uma express�o inteira) elementos.
\item[\texttt{pair(TYPE1, TYPE2)}] Um par de tipos.
\item[\texttt{tuple([T1,T2,..Ts])}] Uma lista de tipos, representando
  um tuplo.
\end{description}

\section{Literais}
\label{sec:literais}

Os literais que ocorrem na linguagem \LANG{} restrita s�o:
\begin{itemize}
\item As constantes inteiras,
%\item As constantes em v�rgula flutuante,
\item As constantes booleanas,
\item Os literais de tipos compostos que incluem os tuplos, os \emph{arrays},
  % os literais de classe,
\item Os literais funcionais.
\end{itemize}
Para agrupar estas formas de literal, conv�m definir uma estrutura comum capaz
de as representar todas.  Uma poss�vel representa��o seria:
\begin{center}
  \verb+lit(TYPE, VALUE)+
\end{center}
Em que \verb+TYPE+ � um �tomo com a representa��o do tipo de literal
que est� a ser representado e \verb+VALUE+ uma sua representa��o, com
uma estrutura adequada ao tipo.  Por exemplo, poderiamos ter:
\begin{description}

\item[\texttt{lit(int, 3)}] \mbox{} \\ Para a constante inteira 3.

\item[\texttt{lit(pair(int, pair(bool, int)), V)}] \mbox{} \\
  Em que \textbf{\texttt{V = pair(lit(int, 2), pair(lit(bool, true),
      lit(int, 4)))}}, para o literal de tuplo \textbf{\texttt{(2,
      true, 4)}}, que � entendido como \textbf{\texttt{(2, (true,
      4))}}.

\item[\texttt{lit(tuple([int, bool, int]), [lit(int, 2), lit(bool,
    true), lit(int, 4)])}] %
  %\mbox{} \\
  Para o mesmo literal, mas neste caso a estrutura foi ``linearizada''
  pois fic�mos com um triplo expresso como uma lista Prolog e n�o uma
  �rvore.  Esta representa��o � alternativa � anterior e, embora possa
  ser mais trabalhosa de obter, � conveniente por ser pouco profunda.

\item[\texttt{lit(map(ARGT, VALT), VALOR)}] \mbox{} \\ Para um literal
  funcional.  Note-se que, neste caso, o tipo de literal � muito
  simplificado pois ainda n�o inclui informa��o expl�cita sobre o tipo
  concreto do literal: este est� por agora no valor associado e
  poss�velmente s� poder� ser determinado completamente ap�s a an�lise
  de nomes e de tipos.  S� quando isto tiver sido feito � que
  \texttt{ARGT} e \texttt{VALT} poder�o tomar valores.
  
  Tamb�m acerca deste exemplo concreto, n�o � dado mais detalhe sobre o valor
  associado pois este requer que tenham sido definidas as representa��es para
  express�es (sec��o~\ref{sec:expressoes}) e para as instru��es ou
  ``statements'' (sec��o~\ref{sec:expressoes}).
  
\item[\texttt{lit(array(T,NUM), VALOR)}] \mbox{} \\ Para um literal de
  array.  Tal como no caso anterior, muita da informa��o sobre o
  literal (nomeadamente a conducente � determina��o do tipo do
  literal) est� contida no argumento \texttt{VALOR} e s� depois de
  alguma an�lise (p/ex a travessia de \texttt{VALOR}) � que se podem
  concretizar \texttt{T} e \texttt{NUM}.

\end{description}
Aten��o que o tipo referido no termo \texttt{lit} come�a por ser uma
especifica��o de tipo \emph{incompleta}, no sentido dos tipos do
\LANG{}.  O papel de determinar o tipo exacto do literal (assim como
das express�es) pertence a uma fase posterior da compila��o, designada
por \emph{an�lise de tipos.}

\section{Express�es}
\label{sec:expressoes}

No tocante a express�es h� muitas formas vi�veis de as representar usando
termos Prolog.  Uma primeira escolha consiste em determinar se se agrupam
todas as express�es sob uma representa��o comum ou se se deixa que cada
express�o seja distinta das restantes, imediatamente ao n�vel superficial.
Assim, estariam em confronto as seguintes\footnote{Claro que esta enumera��o
  n�o � exaustiva, pretende apenas sugerir formas diferentes de representar
  express�es focando alguns dos aspectos pr�prios a cada uma.} representa��es,
por exemplo para a express�o \texttt{2+a}:
\begin{description}

\item[\texttt{expr(add, expr(lit(int, 2)), expr(name(a)))}] \mbox{} \\ Nesta
  representa��o, uma express�o � dada por um termo \texttt{expr/3}, em que o
  primeiro argumento indica a opera��o e os restantes os seus operandos, sendo
  estes for�osamente coagidos a serem representados como uma express�o.

\item[\texttt{add(lit(int, 2), name(a))}] \mbox{} \\ Esta abordagem simplifica
  em larga medida a anterior, n�o tornando expl�cito que se trata duma
  express�o mas transmitindo essa informa��o impl�citamente pelo contexto em
  que se insere.

\item[\texttt{binop(add, lit(int, 2), name(a))}] \mbox{} \\ Esta representa��o
  � bastante pr�xima da anterior mas foca o facto da express�o em causa ser a
  aplica��o dum operador bin�rio (da� o functor principal ser
  \texttt{binop/3}), deixando para o papel de argumento a especifica��o da
  opera��o concreta a usar.
  
\item[\fbox{\texttt{op(add, lit(int, 2), name(a))}}] \mbox{} \\ � uma
  representa��o que coincide com a anterior mas que se adequa mais �
  filosofia do Prolog no sentido em que um termo composto �
  caracterizado pelo par (functor, aridade) e n�o s� pelo functor, o
  que permite que se distingam f�cilmente por exemplo \texttt{op/3}
  para operadores bin�rios de \texttt{op/2} para operadores un�rios.

\end{description}
Qual a melhor?  Esta pergunta n�o tem resposta muito clara, pelo que a
decis�o ficar� � escolha de quem tiver de implementar procedimentos
que actuem sobre estas estruturas de dados.  Dado que procuramos ter
alguma interoperabilidade entre trabalhos de diversos grupos, temos de
assentar numa representa��o: ser� a �ltima.

Note-se que a distin��o entre \texttt{primary} e \texttt{expr}
desaparece nesta APT, pois a fun��o desta distin��o (e da introdu��o
do n�o-terminal \texttt{primary}) era exclusivamente de restringir
sintacticamente o conjunto de programas aceit�veis.

\section{Instru��es}
\label{sec:statements}

Tal como para as express�es, a multiplicidade de abordagens poss�veis � vasta.
As quest�es que se colocam s�o as mesmas, na sua ess�ncia, pelo que nos
limitamos a apresentar algumas possibilidades sem preferir nenhuma �s
restantes.  Os exemplos s�o excertos de c�digo \LANG{}, nos quais se focam os
aspectos relativos ao uso de diferentes instru��es (``statements'').


\subsection{Exemplo}
\label{sec:exemplo-statement}

Supondo que estamos a representar a instru��o em \LANG{} dada pelo segmento de
programa expresso na figura~\ref{fig:ex-apt-statement}, poderemos recorrer �s
seguintes representa��es:
\begin{center}
  \begin{figure}[htbp]
    \centering
\begin{verbatim}
                              [ a := 2;
                                * [ a < 10 -> a := a+1 ] ]
\end{verbatim}
    \caption{Exemplo de c�digo para as instru��es (``statements'')}
    \label{fig:ex-apt-statement}
  \end{figure}
\end{center}
Existem v�rias formas de representar este fragmento de programa,
aquela que optamos por usar � esta:
\begin{description}
  
\item[\texttt{[assign(name(a), lit(int, 2)), while(CLAUSES)]}] \mbox{} \\ Para
  representar a sequ�ncia de instru��es usou-se uma \emph{lista} nativa do
  Prolog.  Para as restantes instru��es usaram-se conven��es ``minimalistas''
  semelhantes � usada para os literais, como os que ocorrem neste exemplo.
  
  Por exemplo, o elemento \texttt{CLAUSES} que aparece poder� ser
  representado por:
  
\item[\texttt{CLAUSES=[clause(op(lt, name(a), lit(int, 10)), STMT)]}]
  \mbox{} \\ Note-se que \texttt{CLAUSES} � uma lista, embora neste
  caso s� com um elemento.  Tamb�m o termo \texttt{clause/2} tem como
  primeiro argumento uma express�o (a guarda) que dever� ser booleana
  e como segundo argumento uma instru��o (statement):
  
\item[\texttt{STMT=assign(name(a), op(add, name(a), lit(int, 1)))}]
  \mbox{} \\ Finalmente, o segundo subtermo de \texttt{CLAUSES} �
  descrito: tem a estrutura duma instru��o (statement.)

\end{description}


\subsection{Enumera��o de statements}
\label{sec:enum-de-stat}

Concretamente, os tipos de n� de APT para \LANG{} que iremos utilizar
ao longo da disciplina s�o estes:
\begin{description}
\item[\texttt{decl(NAME, TYPE, VALUE)}] \mbox{} \\ Em que NAME � da
  forma \texttt{name(NOME)} e NOME � um �tomo, \texttt{TYPE} � uma
  express�o de tipo (como na sec��o~\ref{sec:tipos}).
  
\item[\texttt{assign(EXPR, EXPR)}] \mbox{} \\ Uma afecta��o, em que a
  primeira express�o dever� ser um \emph{prim�rio} e a segunda n�o
  ter� restri��es.  Note-se que neste caso deixa de haver distin��o
  estrutural entre o primeiro e segundo argumentos: sabemos (pela
  an�lise sintactica) que o primeiro elemento tem um dom�nio muito
  mais restrito (o dos prim�rios), embora isso n�o se reflicta aqui.
  
\item[\texttt{funcall(EXPR, EXPR)}] \mbox{} \\ Uma chamada de fun��o,
  como express�o.  As mesmas observa��es que para a afecta��o s�o aqui
  aplic�veis.

\item[\texttt{return(EXPR)}] \mbox{} \\ Retorna um valor.
  
\item[\texttt{break}, \texttt{skip}, \texttt{retry}] \mbox{} \\
  Instru��es de modula��o de fluxo de controle local.  Do ponto de
  vista da APT s�o semelhantes.
  
\item[\texttt{cond(CLAUSES)}] \mbox{} \\ Grupo de clausulas
  condicionais (o ``if-then-else'' da linguagem).  \texttt{CLAUSES}
  ser� posteriormente detalhado.
  
\item[\texttt{while(CLAUSES)}] \mbox{} \\ Ciclo while: estes ciclos
  s�o ligeiramente mais poderosos que os tradicionais ciclos while de
  outras linguagens de programa��o, pois estes permitem ter m�ltiplas
  condi��es, entendo-se por condi��o de termina��o do ciclo a
  n�o-satisfac��o de nenhuma dessas condi��es.  A estrutura � a mesma
  do \texttt{cond}.
  
  A lista de clausulas tem a forma duma lista Prolog em que os
  elementos podem ser:
  \begin{description}
  \item[\texttt{clause(EXPR, STAT)}] Para uma clausula ``normal'', com
    uma guarda (a express�o booleana) e uma instru��o (o statement).
  \item[\texttt{clause(STAT)}] Para a clausula ``else'', em que a
    instru��o � incondicionalmente avaliada.
  \end{description}
  
\item[\texttt{[STAT | STATS]}] \mbox{} \\ Lista de statements (ou
  statement composto.)  Neste caso foi simplesmente usada o termo
  lista do Prolog, por conveni�ncia.

\end{description}

\section{Representa��o noutras linguagens}
\label{sec:rep}

Caso pretendamos representar a APT numa linguagem que n�o Prolog,
basta criar tipos de dados que contenham a informa��o descrita
anteriormente.  Caso estejamos a lidar com uma linguagem orientada a
objectos, poderemos procurar modelar a taxonomia das entidades da
linguagem como uma hierarquia de classes, com heran�a.

\end{document}

% $Log: apt-vspl.tex,v $
% Revision 1.2  2010/03/26 07:35:57  spa
% *** empty log message ***
%
% Revision 1.1  2009/03/19 00:35:30  spa
% Initial revision
%
% Revision 1.6  2006/10/19 08:26:24  spa
% vers�o 2006/07.
%
% Revision 1.5  2006/10/19 07:16:13  spa
% *** empty log message ***
%
% Revision 1.4  2005/11/03 11:01:47  spa
% *** empty log message ***
%
% Revision 1.3  2005/03/10 10:32:54  spa
% update para 2004/05
%
% Revision 1.2  2002/11/07 12:51:49  spa
% Vers�o inicial, distribuida hoje.  Faltam ainda umas coisas (statements nomeadamente)
%
% Revision 1.1  2002/10/24 08:58:33  spa
% Initial revision
%

% Local Variables:
% mode: latex
% mode: font-lock
% mode: auto-fill
% End: