Baixe o app para aproveitar ainda mais
Prévia do material em texto
INTRODUÇÃO À LINGUAGEM C Versão 2.0 Gerência de Atendimento ao Cliente CENTRO DE COMPUTAÇÃO UNICAMP INTRODUÇÃO A LINGUAGEM C GACLI - CENTRO DE COMPUTAÇÃO - UNICAMP 1 ÍNDICE 1. Introdução.......................................................................................................................................................... 3 2. Sintaxe............................................................................................................................................................... 4 2.1. Identificadores ............................................................................................................................................. 4 2.2. Tipos ........................................................................................................................................................... 5 2.2.1. Tipos Inteiros........................................................................................................................................ 5 2.2.2. Tipos Flutuantes.................................................................................................................................... 6 2.3. Operadores .................................................................................................................................................. 6 2.3.1. Operador de atribuição.......................................................................................................................... 6 2.3.2. Aritméticos ........................................................................................................................................... 7 2.3.3. Operadores de relação e lógicos............................................................................................................. 7 2.3.4. Incremento e decremento ...................................................................................................................... 8 2.3.5. Precedência........................................................................................................................................... 8 2.3.6. Operador cast........................................................................................................................................ 8 2.3.7. Operador sizeof..................................................................................................................................... 9 3. Funções Básicas da Biblioteca C......................................................................................................................... 9 3.1. Função printf() ............................................................................................................................................ 9 3.2. Função scanf() ........................................................................................................................................... 10 3.3. Função getchar()........................................................................................................................................ 11 3.4. Função putchar() ....................................................................................................................................... 11 4. Estruturas de Controle de Fluxo........................................................................................................................ 12 4.1. If ............................................................................................................................................................... 12 4.2. If-else-if..................................................................................................................................................... 13 4.3. Operador ternário ...................................................................................................................................... 13 4.4. Switch ....................................................................................................................................................... 13 4.5. Loop for..................................................................................................................................................... 14 4.6. While ........................................................................................................................................................ 15 4.7. Do while.................................................................................................................................................... 16 4.8. Break......................................................................................................................................................... 17 4.9. Continue.................................................................................................................................................... 17 5. Matrizes ........................................................................................................................................................... 17 5.1. Matriz unidimensional............................................................................................................................... 17 5.2. Matriz Multidimencional ........................................................................................................................... 18 5.3. Matrizes estáticas ...................................................................................................................................... 19 5.4. Limites das Matrizes.................................................................................................................................. 19 6. Manipulação de Strings .................................................................................................................................... 19 6.1. Função gets() ............................................................................................................................................. 20 6.2. Função puts()............................................................................................................................................. 20 6.3. Função strcpy() .......................................................................................................................................... 20 6.4. Função strcat()........................................................................................................................................... 21 6.5. Função strcmp()......................................................................................................................................... 21 7. Ponteiros .......................................................................................................................................................... 22 7.1. Declarando Ponteiros................................................................................................................................. 22 7.2. Manipulação de Ponteiros.......................................................................................................................... 22 7.3. Expressões com Ponteiros .......................................................................................................................... 23 7.4. Ponteiros para ponteiros............................................................................................................................. 24 7.5. Problemas com ponteiros ........................................................................................................................... 24 8. Ponteiros e Matrizes ......................................................................................................................................... 24 8.1. Manipulando Matrizes Através de Ponteiros .............................................................................................. 24 8.2. String de Ponteiros.................................................................................................................................... 25 8.3. Matrizes de Ponteiros ................................................................................................................................ 26 9. Funções ............................................................................................................................................................ 27 9.1. Função sem Retorno .................................................................................................................................. 27 9.2. Função com Retorno.................................................................................................................................. 27 INTRODUÇÃO A LINGUAGEM C GACLI - CENTRO DE COMPUTAÇÃO - UNICAMP 2 9.3. Parâmetros Formais ................................................................................................................................... 28 9.3.1. Chamada por Valor............................................................................................................................. 28 9.3.2. Chamada por Referência ..................................................................................................................... 28 9.4. Classe de Variáveis.................................................................................................................................... 29 9.4.1. Variáveis locais................................................................................................................................... 29 9.4.2. Variáveis Globais................................................................................................................................ 30 9.4.3. Variáveis Estáticas.............................................................................................................................. 30 9.5. Funções com Matrizes ............................................................................................................................... 30 9.5.1. Passando Parâmetros Formais ............................................................................................................. 30 9.5.2. Alterando o Valores da Matriz ............................................................................................................ 31 10. Argumentos da Linha de Comando................................................................................................................. 31 11. Estruturas....................................................................................................................................................... 32 12. Noções de Alocação Dinâmica........................................................................................................................ 33 13. Noções de Maninipulação de Arquivos ........................................................................................................... 34 14. Bibliografia .................................................................................................................................................... 35 INTRODUÇÃO A LINGUAGEM C GACLI - CENTRO DE COMPUTAÇÃO - UNICAMP 3 1. Introdução A linguagem C foi criada por Dennis Ritchie, em 1972, no centro de Pesquisas da Bell Laboratories. Sua primeira utilização importante foi a reescrita do Sistema Operacional UNIX, que até então era escrito em assembly. Em meados de 1970 o UNIX saiu do laboratório para ser liberado para as universidades. Foi o suficiente para que o sucesso da linguagem atingisse proporções tais que, por volta de 1980, já existiam várias versões de compiladores C oferecidas por várias empresas, não sendo mais restritas apenas ao ambiente UNIX, porém compatíveis com vários outros sistemas operacionais. O C é uma linguagem de propósito geral, sendo adequada à programação estruturada. No entanto é mais utilizada escrever compiladores, analisadores léxicos, bancos de dados, editores de texto, etc.. A linguagem C pertence a uma família de linguagens cujas características são: portabilidade, modularidade, compilação separada, recursos de baixo nível, geração de código eficiente, confiabilidade, regularidade, simplicidade e facilidade de uso. Visão geral de um programa C A geração do programa executável a partir do programa fonte obedece a uma seqüência de operações antes de tornar-se um executável. Depois de escrever o módulo fonte em um editor de textos, o programador aciona o compilador que no UNIX é chamado pelo comando cc. Essa ação desencadeia uma seqüência de etapas, cada qual traduzindo a codificação do usuário para uma forma de linguagem de nível inferior, que termina com o executável criado pelo lincador. Editor (módulo fonte em C) Ð Pré-processador (novo fonte expandido) Ð Compilador (arquivo objeto) Ð Lincador (executável) INTRODUÇÃO A LINGUAGEM C GACLI - CENTRO DE COMPUTAÇÃO - UNICAMP 4 2. Sintaxe A sintaxe são regras detalhadas para cada construção válida na linguagem C. Estas regras estão relacionadas com os tipos, as declarações, as funções e as expressões. Os tipos definem as propriedades dos dados manipulados em um programa. As declarações expressam as partes do programa, podendo dar significado a um identificador, alocar memória, definir conteúdo inicial, definir funções. As funções especificam as ações que um programa executa quando roda. A determinação e alteração de valores, e a chamada de funções de I/O são definidas nas expressões. As funções são as entidades operacionais básicas dos programas em C, que por sua vez são a união de uma ou mais funções executando cada qual o seu trabalho. Há funções básicas que estão definidas na biblioteca C. As funções printf() e scanf() por exemplo, permitem respectivamente escrever na tela e ler os dados a partir do teclado. O programador também pode definir novas funções em seus programas, como rotinas para cálculos, impressão, etc. Todo programa C inicia sua execução chamando a função main(), sendo obrigatória a sua declaração no programa principal. Comentários no programa são colocados entre /* e */ não sendo considerados na compilação. Cada instrução encerra com ; (ponto e vírgula) que faz parte do comando. Ex: main() /* função obrigatória */ { printf("oi"); } 2.1. Identificadores São nomes usados para se fazer referência a variáveis, funções, rótulos e vários outros objetos definidos pelo usuário. O primeiro caracter deve ser uma letra ou um sublinhado. Os 32 primeiros caracteres de um identificador são significativos. É case sensitive, ou seja, as letras maiúsculas diferem das minúsculas. int x; /*é diferente de int X;*/ INTRODUÇÃO A LINGUAGEM C GACLI - CENTRO DE COMPUTAÇÃO - UNICAMP 5 2.2. Tipos Quando você declara um identificador dá a ele um tipo. Os tipos principais podem ser colocados dentro da classe do tipo de objeto de dado. Um tipo de objeto de dados determina como valores de dados são representados, que valores pode expressar, e que tipo de operações você pode executar com estes valores. 2.2.1. Tipos Inteiros char [0,128) igual a signed char ou unsigned char signed char (-128,128) inteiro de pelo menos 8 bits unsigned char (0,256) mesmo que signed char sem negativos short (2-15,215 inteiro de pelo menos 16 bits tamanho pelo menos igual a char unsigned sort [0,216) mesmo tamanho que sort sem negativos int (2-15,215) inteiro de pelo menos 16 bits; tamanho pelo menos igual a short unsigned int [0,216) mesmo tamanho que int sem negativos long (2-31,231) inteiro com sinal de pelo menos 32 bits; tamanho pelo menos igual a int unsigned log [0,232) mesmo tamanho que long sem valores negativos tipos de objetos de dados tipos não escalares tipos de estrutura tipos de união tipos de matriz tipos de funçãotipos incompletos tipos escalares tipos ponteiros tipos aritméticos tipos ponteiros para funções tipos ponteiros para objetos de dados tipos ponteiros para tipos incompletos tipos flutuantes tipos inteiros float double long double Char signed char unsigned char short unsigned sort int unsigned int long unsigned long tipos de enumeração INTRODUÇÃO A LINGUAGEM C GACLI - CENTRO DE COMPUTAÇÃO - UNICAMP 6 Uma implementação do compilador pode mostrar um faixa maior do que a mostrada na tabela, mas não uma faixa menor. As potencias de 2 usadas significam: 215 32.768 216 65536 231 2.147.483.648 232 4.294.967.298 2.2.2. Tipos Flutuantes float [3.4-38, 3.4+38] pelo menos 6 dígitos de precisão decimal double (1.7-308,1.7+308) pelo menos 10 dígitos decimais e precisão maior que do float long double (1.7-308,1.7+308) pelo menos 10 dígitos decimais e precisão maior que do double Ex: main() { char c; unsigned char uc; int i; unsigned int ui; float f; double d; printf("char %d",sizeof(c)); printf("unsigned char %d",sizeof(uc)); printf("int %d",sizeof(i)); printf("unsigned int %d",sizeof(ui)); printf("float %d",sizeof(f)); printf("double %d",sizeof(d)); } 2.3. Operadores 2.3.1. Operador de atribuição O operador de atribuição em C é o sinal de igual "=". Ao contrário de outras linguagens, o operador de atribuição pode ser utilizado em expressões que também envolvem outros operadores. INTRODUÇÃO A LINGUAGEM C GACLI - CENTRO DE COMPUTAÇÃO - UNICAMP 7 2.3.2. Aritméticos Os operadores *, /, + e - funcionam como na maioria das linguagens, o operador % indica o resto de uma divisão inteira. i+=2; -> i=i+2; x*=y+1; -> x=x*(y+1); d-=3; -> d=d-3; Ex: main() { int x,y; x=10; y=3; printf("%d\n",x/y); printf("%d\n",x%y); } 2.3.3. Operadores de relação e lógicos Relação refere-se as relações que os valores podem ter um com o outro e lógico se refere às maneiras como essas relações podem ser conectadas. Verdadeiro é qualquer valor que não seja 0, enquanto que 0 é falso. As expressões que usam operadores de relação e lógicos retornarão 0 para falso e 1 para verdadeiro. Tanto os operadores de relação como os lógicos tem a precedência menor que os operadores aritméticos. As operações de avaliação produzem um resultado 0 ou 1. relacionais lógicos > maior que && and >= maior ou igual || ou < menor ! not <= menor ou igual == igual != não igual Ex: main() { int i,j; printf("digite dois números: "); scanf("%d%d",&i,&j); printf("%d == %d é %d\n",i,j,i==j); printf("%d != %d é %d\n",i,j,i!=j); printf("%d <= %d é %d\n",i,j,i<=j); printf("%d >= %d é %d\n",i,j,i>=j); printf("%d < %d é %d\n",i,j,i< j); printf("%d > %d é %d\n",i,j,i> j); } INTRODUÇÃO A LINGUAGEM C GACLI - CENTRO DE COMPUTAÇÃO - UNICAMP 8 Ex: main() { int x=2,y=3,produto; if ((produto=x*y)>0) printf("é maior"); } 2.3.4. Incremento e decremento O C fornece operadores diferentes para incrementar variáveis. O operador soma 1 ao seu operando, e o decremento subtrai 1. O aspecto não usual desta notação é que podem ser usado como operadores pré-fixo(++x) ou pós-fixo(x++). ++x incrementa x antes de utilizar o seu valor. x++ incrementa x depois de ser utilizado. Ex: main() { int x=0; printf("x= %d\n",x++); printf("x= %d\n",x); printf("x= %d\n",++x); printf("x= %d\n",x); } 2.3.5. Precedência O nível de precedência dos operadores é avaliado da esquerda para a direita. Os parênteses podem ser utilizados para alterar a ordem da avaliação. ++ -- mais alta * / % + - mais baixa 2.3.6. Operador cast Sintaxe: (tipo)expressão Podemos forçar uma expressão a ser de um determinado tipo usando o operador cast. Ex: main() { int i=1; printf("%d/3 é: %f",i,(float) i/3); } INTRODUÇÃO A LINGUAGEM C GACLI - CENTRO DE COMPUTAÇÃO - UNICAMP 9 2.3.7. Operador sizeof O operador sizeof retorna o tamanho em bytes da variável, ou seja, do tipo que está em seu operando. É utilizado para assegurar a portabilidade do programa. 3. Funções Básicas da Biblioteca C 3.1. Função printf() Sintaxe: printf("expressão de controle",argumentos); É uma função de I/O, que permite escrever no dispositivo padrão (tela). A expressão de controle pode conter caracteres que serão exibidos na tela e os códigos de formatação que indicam o formato em que os argumentos devem ser impressos. Cada argumento deve ser separado por vírgula. \n nova linha %c caractere simples \t tab %d decimal \b retrocesso %e notação científica \" aspas %f ponto flutuante \\ barra %o octal \f salta formulário %s cadeia de caracteres \0 nulo %u decimal sem sinal %x hexadecimal Ex: main() { printf("Este é o numero dois: %d",2); printf("%s está a %d milhões de milhas\ndo sol","Vênus",67); } Tamanho de campos na impressão: Ex: main() { printf("\n%2d",350); printf("\n%4d",350); printf("\n%6d",350) } INTRODUÇÃO A LINGUAGEM C GACLI - CENTRO DE COMPUTAÇÃO - UNICAMP 10 Para arredondamento: Ex: main() { printf("\n%4.2f",3456.78); printf("\n%3.2f",3456.78); printf("\n%3.1f",3456.78); printf("\n%10.3f",3456.78); } Para alinhamento: Ex: main(){ printf("\n%10.2f %10.2f %10.2f",8.0,15.3,584.13); printf("\n%10.2f %10.2f %10.2f",834.0,1500.55,4890.21); } Complementando com zeros à esquerda: Ex: main() { printf("\n%04d",21); printf("\n%06d",21); printf("\n%6.4d",21); printf("\n%6.0d",21); } Imprimindo caracteres: Ex: main(){ printf("%d %c %x %o\n",'A','A','A','A'); printf("%c %c %c %c\n",'A',65,0x41,0101); } A tabela ASCII possui 256 códigos de 0 a 255, se imprimirmos em formato caractere um número maior que 255, será impresso o resto da divisão do número por 256; se o número for 3393 será impresso A pois o resto de 3393 por 256 é 65. 3.2. Função scanf() Também é uma função de I/O implementada em todos compiladores C. Ela é o complemento de printf() e nos permite ler dados formatados da entrada padrão (teclado). Sua sintaxe é similar a printf(). scanf("expressão de controle", argumentos); INTRODUÇÃO A LINGUAGEM C GACLI - CENTRO DE COMPUTAÇÃO - UNICAMP 11 A lista de argumentos deve consistir nos endereços das variáveis. C oferece um operador para tipos básicos chamado operador de endereço e referenciado pelo símbolo "&" que retorna o endereço do operando. Operador de endereço &: A memória do computador é dividida em bytes, e são numerados de 0 até o limite da memória. Estas posições são chamadas de endereços. Toda variável ocupa uma certa localização na memória, e seu endereço é o primeiro byte ocupado por ela. Ex: main() { int num; printf("Digite um número: "); scanf("%d",&num); printf("\no número é %d",num); printf("\no endereço e %u",&num); } 3.3. Função getchar() É a função original de entrada de caractere dos sistemas baseados em UNIX. getchar() armazena a entrada até que ENTER seja pressionada. Ex: main() { char ch; ch=getchar(); printf("%c\n,ch); } 3.4. Função putchar() Escreve na tela o argumento de seu caractere na posição corrente. Ex: main() { char ch; printf("digite uma letra minúscula : "); ch=getchar(); putchar(toupper(ch)); putchar('\n'); } Há inumeras outras funções de manipulação de char complementares às que foram vistas, como isalpha(), isupper(), islower(), isdigit(), isespace(), toupper(), tolower(). INTRODUÇÃO A LINGUAGEM C GACLI - CENTRO DE COMPUTAÇÃO - UNICAMP 12 4. Estruturas de Controle de Fluxo Os comandos de controle de fluxo são a essência de qualquer linguagem, porque governam o fluxo da execução do programa. São poderosos e ajudam a explicar a popularidade da linguagem. Podemos dividir em três categorias. A primeira consiste em instruções condicionais if e switch. A segunda são os comandos de controle de loopo while, for e o do-while. A terceira contém instruções de desvio incondicional goto. 4.1. If sintaxe: if (condição)comando; else comando; Se a condição avaliar em verdadeiro (qualquer coisa menos 0), o computador executará o comando ou o bloco, de outro modo, se a cláusula else existir, o computador executará o comando ou o bloco que é seu objetivo. Ex: main() { int a,b; printf("digite dois números:"); scanf("%d%d",&a,&b); if (b) printf("%d\n",a/b); else printf("divisão por zero\n"); } Ex: #include <stdlib.h> #include <time.h> main(){ int num,segredo; srand(time(NULL)); segredo=rand()/100; printf("Qual e o numero: "); scanf("%d",&num); if (segredo==num) {printf("Acertou!"); printf("\nO numero e %d\n",segredo);} else if (segredo<num) printf("Errado, muito alto!\n"); else printf("Errado, muito baixo!\n");} INTRODUÇÃO A LINGUAGEM C GACLI - CENTRO DE COMPUTAÇÃO - UNICAMP 13 4.2. If-else-if Uma variável é testada sucessivamente contra uma lista de variáveis inteiras ou de caracteres. Depois de encontrar uma coincidência, o comando ou o bloco de comandos é executado. Ex #include <stdlib.h> #include <time.h> main() { int num,segredo; srand(time(NULL)); segredo=rand()/100; printf("Qual e o numero: "); scanf("%d",&num); if (segredo==num) {printf("Acertou!"); printf("\nO numero e %d\n",segredo);} else if (segredo<num) printf("Errado, muito alto!\n"); else printf("Errado, muito baixo!\n"); } 4.3. Operador ternário Sintaxe: condição?expressão1:expressão2 É uma maneira compacta de expressar if-else. Ex: main() { int x,y,max; printf("Entre com dois números: "); scanf(%d,%d,&x,&y); max=(x>y)?1:0; printf("max= %d\n",max); } 4.4. Switch sintaxe: switch(variável) { case constante1: seqüência de comandos break; INTRODUÇÃO A LINGUAGEM C GACLI - CENTRO DE COMPUTAÇÃO - UNICAMP 14 case constante2: seqüência de comandos break; default: seqüência de comandos } Uma variável é testada sucessivamente contra uma lista de variáveis inteiras ou de caracteres. Depois de encontrar uma coincidência, o comando ou o bloco de comandos é executado. Se nenhuma coincidência for encontrada o comando default será executado. O default é opcional. A seqüência de comandos é executada até que o comando break seja encontrado. Ex: main() { char x; printf("1. inclusão\n"); printf("2. alteração\n"); printf("3. exclusão\n"); printf(" Digite sua opção:"); x=getchar(); switch(x) { case '1': printf("escolheu inclusão\n"); break; case '2': printf("escolheu alteração\n"); break; case '3': printf("escolheu exclusão\n"); break; default: printf("opção inválida\n"); } } 4.5. Loop for Sintaxe: for(inicialização;condição;incremento) comando; O comando for é de alguma maneira encontrado em todas linguagens procedurais de programação. Em sua forma mais simples, a incialização é um comando de atribuição que o compilador usa para estabelecer a variável de controle do loop. A condição é uma expressão de relação que testa a variável de controle do loop contra algum valor para determinar quando o loop terminará. O incremento define a maneira como a variável de controle do loop será alterada cada vez que o computador repetir o loop. INTRODUÇÃO A LINGUAGEM C GACLI - CENTRO DE COMPUTAÇÃO - UNICAMP 15 Ex: main() { int x;for(x=1;x<100;x++)printf("%d\n",x);} Ex: main() { int x,y; for (x=0,y=0;x+y<100;++x,++y) printf("%d ",x+y); } Um uso interessante para o for é o loop infinito, como nenhuma das três definições são obrigatórias, podemos deixar a condição em aberto. Ex: main() { for(;;) printf("loop infinito\n"); } Outra forma usual do for é o for aninhado, ou seja, um for dentro de outro. Ex: main() { int linha,coluna; for(linha=1;linha<=24;linha++) { for(coluna=1;coluna<40;coluna++) printf("-"); putchar('\n'); } } 4.6. While Sintaxe: while(condição) comando; Uma maneira possível de executar um laço é utilizando o comando while. Ele permite que o código fique sendo executado numa mesma parte do programa de acordo com uma determinada condição. - o comando pode ser vazio, simples ou bloco - ele é executado desde que a condição seja verdadeira - testa a condição antes de executar o laço INTRODUÇÃO A LINGUAGEM C GACLI - CENTRO DE COMPUTAÇÃO - UNICAMP 16 Ex: main() { char ch; while(ch!='a') ch=getchar(); } 4.7. Do while Sintaxe: do { comando; } while(condição); Também executa comandos repetitivos. Ex: main() { char ch; printf("1. inclusão\n"); printf("2. alteração\n"); printf("3. exclusão\n"); printf(" Digite sua opção:"); do { ch=getchar(); switch(ch) { case '1': printf("escolheu inclusao\n"); break; case '2': printf("escolheu alteracao\n"); break; case '3': printf("escolheu exclusao\n"); break; case '4': printf("sair\n"); } } while(ch!='1' && ch!='2' && ch!='3' && ch!='4'); } INTRODUÇÃO A LINGUAGEM C GACLI - CENTRO DE COMPUTAÇÃO - UNICAMP 17 4.8. Break Quando o comando break é encontrado em qualquer lugar do corpo do for, ele causa seu término imediato. O controle do programa passará então imediatamente para o código que segue o loop. Ex: main() { char ch; for(;;) { ch=getchar(); if (ch=='a') break; } } 4.9. Continue Algumas vezes torna-se necessário "saltar" uma parte do programa, para isso utilizamos o "continue". - força a próxima iteração do loop - pula o código que estiver em seguida Ex: main() { int x; for(x=0;x<100;x++) { if(x%2)continue; printf("%d\n",x); } } 5. Matrizes A matriz é um tipo de dado usado para representar uma certa quantidade de variáveis que são referenciados pelo mesmo nome. Consiste em locações contíguas de memória. O endereço mais baixo corresponde ao primeiro elemento. 5.1. Matriz unidimensional Sintaxe: tipo nome[tamanho]; INTRODUÇÃO A LINGUAGEM C GACLI - CENTRO DE COMPUTAÇÃO - UNICAMP 18 As matrizes tem 0 como índice do primeiro elemento, portanto sendo declarada uma matriz de inteiros de 10 elementos, o índice varia de 0 a 9. Ex: main(){ int x[10]; int t; for(t=0;t<10;t++) { x[t]=t*2; printf("%d\n",x[t]; } } Ex: main() { int notas[5],i,soma; for(i=0;i<5;i++) { printf("Digite a nota do aluno %d: ",i); scanf("%d",¬as[i]); } soma=0; for(i=0;i<5;i++) soma=soma+notas[i]; printf("Media das notas: %d.",soma/5); } 5.2. Matriz Multidimencional Sintaxe: tipo nome[tamanho][tamanho] ...; Funciona como na matriz de uma dimensão (vetor), mas tem mais de um índice. Ex: main(){ int x[10][10]; int t,p=0; for(t=0;t<10;t++,p++) { x[t][p]=t*p; printf("%d\n",x[t][p]); } } INTRODUÇÃO A LINGUAGEM C GACLI - CENTRO DE COMPUTAÇÃO - UNICAMP 19 5.3. Matrizes estáticas Os vetores de dados podem ser inicializados como os dados de tipos simples, mas somente como variáveis globais. Quando for inicializar uma matriz local sua classe deve ser static. Ex: main() { int i; static int x[10]={0,1,2,3,4,5,6,7,8,9}; for(i=0;i<10;i++) printf("%d\n",x[i]); } 5.4. Limites das Matrizes A verificação de limites não é feita pela linguagem, nem mensagem de erros são enviadas, o programa tem que testar os limites das matrizes. Ex: main() { int erro[10],i; for(i=0;i<100;i++) { erro[i]=1; printf("%d\n",erro[i]; } } 6. Manipulação de Strings Em C não existe um tipo de dado string, no seu lugar é utilizado uma matriz de caracteres. Uma string é uma matriztipo char que termina com '\0'. Por essa razão uma string deve conter uma posição a mais do que o número de caracteres que sedeseja. Constantes strings são uma lista de caracteres que aparecem entre aspas, não sendo necessário colocar o '\0', que é colocado pelo compilador. Ex: main() { static re[]=“lagarto”; puts(re); puts(&re[0]); putchar('\n'); } INTRODUÇÃO A LINGUAGEM C GACLI - CENTRO DE COMPUTAÇÃO - UNICAMP 20 6.1. Função gets() Sintaxe: gets(nome_matriz); É utilizada para leitura de uma string através do dispositivo padrão, até que o ENTER seja pressionado. A função gets() não testa limites na matriz em que é chamada. Ex: main() { char str[80]; gets(str); printf("%s",str); } 6.2. Função puts() Sintaxe: puts(nome_do_vetor_de_caracteres); Escreve o seu argumento no dispositivo padrão de saída (vídeo), coloca um '\n' no final. Reconhece os códigos de barra invertida. Ex: main() { puts("mensagem"); } 6.3. Função strcpy() Sintaxe: strcpy(destino,origem); Copia o conteúdo de uma string. Ex: main(){ char str[80]; strcpy(str,"alo"); puts(str); } INTRODUÇÃO A LINGUAGEM C GACLI - CENTRO DE COMPUTAÇÃO - UNICAMP 21 6.4. Função strcat() Sintaxe: strcat(string1,string2); Concatena duas strings. Não verifica tamanho. Ex: main() { char um[20],dois[10]; strcpy(um,"bom"); strcpy(dois," dia"); strcat(um,dois); printf("%s\n",um); } 6.5. Função strcmp() Sintaxe: strcmp(s1,s2); Compara duas strings, se forem iguais devolve 0. Ex: main() { char s[80]; printf("Digite a senha:"); gets(s); if (strcmp(s,"laranja")) printf("senha inválida\n"); else printf("senha ok!\n") ; } Além das funções acima, há outras que podem ser consultadas no manual da linguagem, como strlen() e atoi(). INTRODUÇÃO A LINGUAGEM C GACLI - CENTRO DE COMPUTAÇÃO - UNICAMP 22 7. Ponteiros Sintaxe: tipo *nomevar; É uma variável que contém o endereço de outra variável. Os ponteiros são utilizados para alocação dinâmica, podendo substituir matrizes com mais eficiência. Também fornecem a maneira pelas quais funções podem modificar os argumentos chamados, como veremos no capítulo de funções. 7.1. Declarando Ponteiros Se uma variável irá conter um ponteiro, então ela deve ser declarada como tal: int x,*px; px=&x; /*a variável px aponta para x */ Se quisermos utilizar o conteúdo da variável para qual o ponteiro aponta: y=*px; O que é a mesma coisa que: y=x; 7.2. Manipulação de Ponteiros Desde que os pointers são variáveis, eles podem ser manipulados como as variáveis podem. Se py é um outro ponteiro para um inteiro então podemos fazer a declaração: py=px; Ex: main(){ int x,*px,*py; x=9; px=&x; py=px; printf("x= %d\n",x); printf("&x= %d\n",&x); printf("px= %d\n",px); printf("*px= %d\n",*px); printf("*px= %d\n",*px); } INTRODUÇÃO A LINGUAGEM C GACLI - CENTRO DE COMPUTAÇÃO - UNICAMP 23 7.3. Expressões com Ponteiros Os ponteiros podem aparecer em expressões, se px aponta para um inteiro x, então *px pode ser utilizado em qualquer lugar que x seria. O operador * tem maior precedência que as operações aritméticas, assim a expressão abaixo pega o conteúdo do endereço que px aponta e soma 1 ao seu conteúdo. y=*px+1; No próximo caso somente o ponteiro será incrementado e o conteúdo da próxima posição da memória será atribuído a y: y=*(px+1); Os incrementos e decrementos dos endereços podem ser realizados com os operadores ++ e --, que possuem procedência sobre o * e operações matemáticas e são avaliados da direita para a esquerda: *px++; /* sob uma posição na memória */ *(px--); /* mesma coisa de *px-- */ No exemplo abaixo os parênteses são necessários, pois sem eles px seria incrementado em vez do conteúdo que é apontado, porque os operadores * e ++ são avaliados da direita para esquerda. (*px)++ /* equivale a x=x+1; ou *px+=1 */ Ex: main() {nt x,*px; x=1; px=&x; printf("x= %d\n",x); printf("px= %u\n",px); printf("*px+1= %d\n",*px+1); printf("px= %u\n",px); printf("*px= %d\n",*px); printf("*px+=1= %d\n",*px+=1); printf("px= %u\n",px); printf("(*px)++= %d\n",(*px)++); printf("px= %u\n",px); printf("*(px++)= %d\n",*(px++)); printf("px= %u\n",px); printf("*px++-= %d\n",*px++); printf("px= %u\n",px);} INTRODUÇÃO A LINGUAGEM C GACLI - CENTRO DE COMPUTAÇÃO - UNICAMP 24 7.4. Ponteiros para ponteiros Um ponteiro para um ponteiro é uma forma de indicação múltipla. Num ponteiro normal, o valor do ponteiro é o valor do endereço da variável que contém o valor desejado. Nesse caso o primeiro ponteiro contém o endereço do segundo, que aponta para a variável que contém o valor desejado. float **balanço; balanço é um ponteiro para um ponteiro float. Ex: main() { int x,*p,**q; x=10; p=&x; q=&p; printf("%d",**q); } 7.5. Problemas com ponteiros O erro chamado de ponteiro perdido é um dos mais difíceis de se encontrar, pois a cada vez que a operação com o ponteiro é utilizada, poderá estar sendo lido ou gravado em posições desconhecidas da memória. Isso pode acarretar em sobreposições sobre áreas de dados ou mesmo área do programa na memória. int,*p; x=10; *p=x; Estamos atribuindo o valor 10 a uma localização desconhecida de memória. A conseqüência desta atribuição é imprevisível. 8. Ponteiros e Matrizes Em C existe um grande relacionamento entre ponteiros e matrizes, sendo que eles podem ser tratados da mesma maneira. As versões com ponteiros geralmente são mais rápidas. 8.1. Manipulando Matrizes Através de Ponteiros Considerando a declaração da matriz int a[10]; Sendo pa um ponteiro para inteiro então: pa=&a[0]; /*passa o endereço inicial do vetor a para o ponteiro pa */ INTRODUÇÃO A LINGUAGEM C GACLI - CENTRO DE COMPUTAÇÃO - UNICAMP 25 pa=a; /* é a mesma coisa de pa=&a[0]; */ x=*pa; /*(passa o conteúdo de a[0] para x */ Se pa aponta para um elemento particular de um vetor a, então por definição pa+1 aponta para o próximo elemento, e em geral pa-i aponta para i elementos antes de pa e pa+i para i elementos depois. Se pa aponta para a[0] então: *(pa+1) aponta para a[1] pa+i é o endereço de a[i] e *(pa+i) é o conteúdo. É possível fazer cópia de caracteres utilizando matrizes e ponteiros: Ex: (versão matriz) main() { int i=0; char t[10]; static char s[]="abobora"; while(t[i]=s[i])i++; printf("%s\n",t); } Ex: (versão ponteiro) main() { char *ps,*pt,t[10],s[10]; strcpy(s,"abobora"); ps=s; pt=&t[0]; while(*ps)*pt++=*ps++; printf("%s",t); } 8.2. String de Ponteiros Sendo um ponteiro para caracter char *texto;:, podemos atribuir uma constante string para texto, que não é uma cópia de caracteres, somente ponteiros são envolvidos. Neste caso a string é armazenada como parte da função em que aparecem, ou seja, como constante. Char *texto="composto"; /* funciona como static char texto[]=“composto”; */ INTRODUÇÃO A LINGUAGEM C GACLI - CENTRO DE COMPUTAÇÃO - UNICAMP 26 Ex: main() { char *al="conjunto"; char re[]=”simples”; puts(al); puts(&re[0]); /* ou puts(re); */ for(;*al;al++) putchar(*al); putchar('\n'); } 8.3. Matrizes de Ponteiros A declaração de matrizes de ponteiros é semelhante a qualquer outro tipo de matrizes: int *x[10]; Para atribuir o endereço de uma variável inteira chamada var ao terceiro elemento da matriz de ponteiros: x[2]=&var; Verificando o conteúdo de var: *x[2] As matrizes de ponteiros são tradicionalmente utilizadas para mensagens de erro, que são constantes : char *erro[]={"arquivo não encontrado\n","erro de leitura\n"}; printf("%s",erro[0]); printf("%s",erro[1]); Ex: main() { char *erro[2]; erro[0]="arquivo nao encontrado\n"; erro[1]="erro da leitura\n"; for(;*erro[0];) printf("%c",*erro[0]++); INTRODUÇÃO A LINGUAGEM C GACLI - CENTRO DE COMPUTAÇÃO - UNICAMP 279. Funções É uma unidade autônoma de código do programa é desenhada para cumprir uma tarefa particular. Geralmente os programas em C consistem em várias pequenas funções. A declaração do tipo da função é obrigatória no C do UNIX. Os parâmetros de recepção de valores devem ser separados por vírgulas. Sintaxe: tipo nome(parâmetros); { comandos} 9.1. Função sem Retorno Quando uma função não retorna um valor para a função que a chamou ela é declarada como void. Ex: void inverso(); main() { char *vet="abcde"; inverso(vet); } void inverso(s) char *s; { int t=0; for(;*s;s++,t++); s--; for(;t--;)printf("%c",*s--); putchar('\n'); } 9.2. Função com Retorno O Tipo de retorno da função deve ser declarado. Ex: int elevado(); main() { int b,e; printf("Digite a base e expoente x,y : "); scanf("%d,%d",&b,&e); printf("valor=%d\n",elevado(b,e)); } int elevado(base,expoente) int base,expoente; INTRODUÇÃO A LINGUAGEM C GACLI - CENTRO DE COMPUTAÇÃO - UNICAMP 28 { int i; if (expoente<0) return; i=1; for(;expoente;expoente--)i=base*i; return i; } 9.3. Parâmetros Formais Quando uma função utiliza argumentos, então ela deve declarar as variáveis que aceitaram os valores dos argumentos, sendo essas variáveis os parâmetros formais. Ex: int pertence(string,caracter) /* pertence(char *string,char caracter) */ char *string,caracter; { while (*string) if (*string==caracter) return 1; else string++; return 0; } 9.3.1. Chamada por Valor O valor de um argumento é copiado para o parâmetro formal da função, portanto as alterações no processamento não alteram as variáveis. Ex: int sqr(); main() { int t=10; printf("%d %d",sqr(t),t); } int sqr(x) int x; { x=x*x; return(x) } 9.3.2. Chamada por Referência Permite a alteração do valor de uma variável. Para isso é necessário a passagem do endereço do argumento para a função. INTRODUÇÃO A LINGUAGEM C GACLI - CENTRO DE COMPUTAÇÃO - UNICAMP 29 Ex: void troca(); main() { int x=10,y=20; troca(&x,&y); printf("x=%d y=%d\n",x,y); } void troca(a,b) int *a,*b; { int temp; temp=*a; *a=*b; *b=temp; } 9.4. Classe de Variáveis Uma função pode chamar outras funções, mas o código que compreende o corpo de uma função (bloco entre {}) está escondido do resto do programa, ele não pode afetar nem ser afetado por outras partes do programa, a não ser que o código use variáveis globais. Existem três classes básicas de variáveis: locais, estáticas e globais. 9.4.1. Variáveis locais As variáveis que são declaradas dentro de uma função são chamadas de locais. Na realidade toda variável declarada entre um bloco { } podem ser referenciadas apenas dentro deste bloco. Elas existem apenas durante a execução do bloco de código no qual estão declaradas. O armazenamento de variáveis locais por default é na pilha, assim sendo uma região dinâmica. Ex: void linha; main(){ int tamanho; printf("Digite o tamanho: "); scanf("%d",&tamanho); linha(tamanho); } void linha(x) int x; { int i; for(i=0;i<=x;i++)putchar(95); /* A variável i na função linha não é reconhecida pela função main.*/ } INTRODUÇÃO A LINGUAGEM C GACLI - CENTRO DE COMPUTAÇÃO - UNICAMP 30 9.4.2. Variáveis Globais São conhecidas por todo programa e podem ser usadas em qualquer parte do código. Permanecem com seu valor durante toda execução do programa. Deve ser declarada fora de qualquer função e até mesmo antes da declaração da função main. Fica numa região fixa da memória própria para esse fim. Ex: void func1(),func2(); int cont; main() { cont=100; func1(); } void func1() { int temp; temp=cont; func2(); printf("cont é = %d",cont); } void func2() { int cont; for(cont=1;cont<10;cont++) printf("."); } 9.4.3. Variáveis Estáticas Funcionam de forma parecida com as variáveis globais, conservando o valor durante a execução de diferentes funções do programa. No entanto só são reconhecidas na função onde estão declaradas. São muitos utilizadas para inicializar vetores. Ex: main() { int i; static int x[10]={0,1,2,3,4,5,6,7,8,9}; for(i=0;i<10;i++) printf("%d\n",x[i]); } 9.5. Funções com Matrizes 9.5.1. Passando Parâmetros Formais É necessário passar somente o endereço e não uma cópia da matriz. INTRODUÇÃO A LINGUAGEM C GACLI - CENTRO DE COMPUTAÇÃO - UNICAMP 31 Ex: void mostra(); main() { int t[10],i; for(i=0;i<10;i++)t[i]=i; mostra(t); } void mostra(num) int num[]; /* ou declarar int *num; */ { int i; for(i=0;i<10;i++)printf("%d",num[i]); } 9.5.2. Alterando o Valores da Matriz Ex: void maiusc(); main() { char s[80]; gets(s); maiusc(s); } void maiusc(string) char *string; { register int t; for(t=0;string[t];t++) { string[t]=toupper(string[t]); printf("%c",string[t]); } } 10. Argumentos da Linha de Comando No ambiente C existe uma maneira de passar argumentos através da linha de comandos para um programa quando ele inicia. O primeiro argumento (argc) é a quantidade de argumentos que foram passados quando o programa foi chamado; o segundo argumento (argv) é um ponteiro de vetores de caracteres que contém os argumentos, um para cada string. Por convenção argv[0] é o nome do programa que foi chamado, portanto argc é pelo menos 1. Cada argumento da linha de comando deve ser separado por um espaço ou tab. Ex: main(argc,argv) int argc; INTRODUÇÃO A LINGUAGEM C GACLI - CENTRO DE COMPUTAÇÃO - UNICAMP 32 char *argv[]; { if (argc!=2) { printf("falta digitar o nome\n"); exit(0); }printf("alo %s",argv[1]);} Ex: main(argc,argv) int argc; char *argv[]; { int disp,cont; if (argc<2) { printf("falta digitar o valor para contagem\n"); exit(0); } if (argc==3&&!strcmp(argv[2],"display")) disp=1; else disp=0; for(cont=atoi(argv[1]);cont;--cont) if(disp)printf("%d",cont); printf("%c",7);} 11. Estruturas Ao manusearmos dados muitas vezes deparamos com informações que não são fáceis de armazenar em variáveis escalares como são os tipos inteiros e pontos flutuantes, mas na verdade são conjuntos de coisas. Este tipo de dados são compostos com vários dos tipos básicos do C. As estruturas permitem uma organização dos dados dividida em campos e registros. Ex: struct lapis { int dureza; char fabricante; int numero; }; main() { int i; struct lapis p[3]; p[0].dureza=2; p[0].fabricante='F'; p[0].numero=482; p[1].dureza=0; p[1].fabricante='G'; p[1].numero=33; p[2].dureza=3; INTRODUÇÃO A LINGUAGEM C GACLI - CENTRO DE COMPUTAÇÃO - UNICAMP 33 p[2].fabricante='E'; p[2].numero=107; printf("Dureza Fabricante Numero\n"); for(i=0;i<3;i+ +) printf("%d\t%c\t\t%d\n",p[i].dureza,p[i].fabricante,p[i].numero); } Como ocorre com as variáveis, as estruturas também podem ser referenciadas por ponteiros. Assim, definindo-se por exemplo o ponteiro *p para a estrutura acima (lapis), pode-se usar a sintaxe (*p).dureza. Porém, para referenciar o ponteiro há ainda outra sintaxe, através do operador -> , como por exemplo, p->dureza. 12. Noções de Alocação Dinâmica Há duas maneiras de armazenar variáveis na memória do computador. Primeiro por variáveis globais e static locais, segundo através de alocação dinâmica, quando o C armazena a informação em uma área de memória livre, de acordo com a necessidade. No caso do C standart, a alocação dinâmica fica disponível com a inclusão de stdio.h. Ex. #include <stdio> main() { int *p, t; p=(int *) malloc(40*sizeof(int)); if (!p) printf("memoria insuficiente\n"); else { for(t=0;t<40;++t) *(p+t)=t; for(t=0;t<40;++t) printf("%d ",*(p+t)); free(p); } } Ex: #include <stdio> main() { int i,quant;float max,min,*p; printf ("quantidade de numeros:\n"); scanf("%d",&quant); if (!(p=(float*)malloc((quant+1)*sizeof(float)))) { printf("sem memoria\n"); exit(1); } printf("digite %d numeros:\n",quant); INTRODUÇÃO A LINGUAGEM C GACLI - CENTRO DE COMPUTAÇÃO - UNICAMP 34 for (i=1;i<=quant;i++) { scanf("%f",(p+i)); } max=*(p+1); for (i=2;i<=quant;i++) { if (*(p+i)>=max) max=*(p+i); } printf("maior e :%f\n",max); free(p); } 13. Noções de Maninipulação de Arquivos Para tratar de arquivos a linguagem C fornece um nível de abstração entre o programador e o dispositivo que estiver sendo usado. Esta abstração é chamada fila de bytes e o dispositivo normalmente é o arquivo. Existe um sistema bufferizado de acesso ao arquivo, onde um ponteiro de arquivo define vários aspectos do arquivo, como nome, status e posição corrente, além de ter a fila associada a ele. Ex: #include <stdio.h> main () { FILE *fp; char ch;int nu,*pn; pn=ν fp=fopen("teste.dat","w"); printf("Entre com os numeros para gravar e 0 para sair: "); scanf("%d",&nu); while(nu) { fprintf(fp,"%d ",nu); scanf("%d",&nu); } fclose(fp); fp=fopen("teste.dat","r"); while(!feof(fp)) { fscanf(fp,"%d ",&nu); printf("%d",nu); } } INTRODUÇÃO A LINGUAGEM C GACLI - CENTRO DE COMPUTAÇÃO - UNICAMP 35 14. Bibliografia • KERNIGHAN, Brian W. e RITCH, Dennis M., C: A Linguagem de Programação, Rio de Janeiro, Campus, 1986. • PLAUGER, P.J. e BRODIE J. Standart C : guia de referência básica, São Paulo, Mcgraw-Hill, 1991. 306p. • HANCOCK, Les e KRIEGER, Morris. Manual de Linguagem C, Rio de Janeiro, Campus,1985. 182p. • MIZRAHI, Viviane V. Treinamento em Linguagem C - módulo 1 e 2, São Paulo, McGraw-Hill, 1990, 241p. • SCHILDT, Herbert. Turbo C: Guia do Usuário, São Paulo, McGraw-Hill, 1988, 414p. Apresentação A disciplina de Estruturas de Dados (ED) está sendo ministrada em sua nova versão desde o segundo semestre de 1998. Trata-se da segunda disciplina de informática oferecida no curso de Engenharia da PUC-Rio. Na primeira disciplina, Introdução à Ciência da Computação (ICC), são apresentados os conceitos fundamentais de programação. ICC, em sua versão mais nova, utiliza a linguagem Scheme, de fácil aprendizado, o que permite a discussão de diversos conceitos de programação num curso introdutório. Isso acontece porque Scheme, como a linguagem LISP da qual descende, é uma linguagem funcional, baseada em conceitos familiares aos alunos, como a definição de funções e sua aplicação em expressões que devem ser avaliadas. O enfoque do curso de Estruturas de Dados é diferente. Discutem-se técnicas de programação e estruturação de dados para o desenvolvimento de programas eficientes. Adota-se a linguagem de programação C. Apesar de reconhecermos as dificuldades na aprendizagem da linguagem C, optamos por sua utilização neste curso simplesmente porque C é a linguagem básica da programação do UNIX, da Internet, do Windows, do Linux. Além de C, usam-se nestes sistemas e em aplicações desenvolvidas para eles linguagens derivadas de C, como C++ e Java. Um ponto adicional a favor da escolha de C é que o estudo de várias disciplinas posteriores a ED será facilitado se os alunos já puderem programar com desenvoltura nessa linguagem. Este curso foi idealizado e montado pelo Prof. José Lucas Rangel. Neste semestre, estamos reformulando alguns tópicos, criando outros e alterando a ordem de apresentação. Esta apostila foi reescrita tendo como base a apostila do Prof. Rangel, utilizada nos semestres anteriores. O curso está dividido em três partes. A Parte I apresenta os conceitos fundamentais da linguagem C e discute formas simples de estruturação de dados; a Parte II discute as estruturas de listas e árvores, e suas aplicações; e a Parte III discute algoritmos e estruturas de dados para ordenação e busca. A apostila apresenta todos os tópicos que serão discutidos em sala de aula, mas recomendamos fortemente que outras fontes (livros, notas de aula, etc.) sejam consultadas. Rio de Janeiro, 19 de fevereiro de 2002 Waldemar Celes Estruturas de Dados – PUC-Rio 1-1 1. Conceitos fundamentais W. Celes e J. L. Rangel 1.1. Introdução O curso de Estruturas de Dados discute diversas técnicas de programação, apresentando as estruturas de dados básicas utilizadas no desenvolvimento de software. O curso também introduz os conceitos básicos da linguagem de programação C, que é utilizada para a implementação das estruturas de dados apresentadas. A linguagem de programação C tem sido amplamente utilizada na elaboração de programas e sistemas nas diversas áreas em que a informática atua, e seu aprendizado tornou-se indispensável tanto para programadores profissionais como para programadores que atuam na área de pesquisa. O conhecimento de linguagens de programação por si só não capacita programadores – é necessário saber usá-las de maneira eficiente. O projeto de um programa engloba a fase de identificação das propriedades dos dados e características funcionais. Uma representação adequada dos dados, tendo em vista as funcionalidades que devem ser atendidas, constitui uma etapa fundamental para a obtenção de programas eficientes e confiáveis. A linguagem C, assim como as linguagens Fortran e Pascal, são ditas linguagens “convencionais”, projetadas a partir dos elementos fundamentais da arquitetura de von Neuman, que serve como base para praticamente todos os computadores em uso. Para programar em uma linguagem convencional, precisamos de alguma maneira especificar as áreas de memória em que os dados com que queremos trabalhar estão armazenados e, freqüentemente, considerar os endereços de memória em que os dados se situam, o que faz com que o processo de programação envolva detalhes adicionais, que podem ser ignorados quando se programa em uma linguagem como Scheme. Em compensação, temos um maior controle da máquina quando utilizamos uma linguagem convencional, e podemos fazer programas melhores, ou seja, menores e mais rápidos. A linguagem C provê as construções fundamentais de fluxo de controle necessárias para programas bem estruturados: agrupamentos de comandos; tomadas de decisão (if-else); laços com testes de encerramento no início (while, for) ou no fim (do-while); e seleção de um dentre um conjunto de possíveis casos (switch). C oferece ainda acesso a apontadores e a habilidade de fazer aritmética com endereços. Por outro lado, a linguagem C não provê operações para manipular diretamente objetos compostos, tais como cadeias de caracteres, nem facilidades de entrada e saída: não há comandos READ e WRITE. Todos esses mecanismos devem ser fornecidos por funções explicitamente chamadas. Embora a falta de algumas dessas facilidades possa parecer uma deficiência grave (deve-se, por exemplo, chamar uma função para comparar duas cadeias de caracteres), a manutenção da linguagem em termos modestos tem trazido benefícios reais. C é uma linguagem relativamente pequena e, no entanto, tornou-se altamente poderosa e eficiente. 1.2. Modelo de um computador Existem diversos tipos de computadores. Embora não seja nosso objetivo estudar hardware, identificamos, nesta seção, os elementos essenciais de um computador. O Estruturas de Dados – PUC-Rio 1-2 conhecimento da existência destes elementos nos ajudará a compreender como um programa de computador funciona. Figura 1.1: Elementos básicos de um computador típico. A Figura1.1 identifica os elementos básicos de um computador típico. O canal de comunicação (conhecido como BUS) representa o meio para a transferência de dados entre os diversos componentes. Na memória principal são armazenados os programas e os dados no computador. Ela tem acesso randômico, o que significa que podemos endereçar (isto é, acessar) diretamente qualquer posição da memória. Esta memória não é permanente e, para um programa, os dados são armazenados enquanto o programa está sendo executado. Em geral, após o término do programa, a área ocupada na memória fica disponível para ser usada por outras aplicações. A área de armazenamento secundário é, em geral, representada por um disco (disco rígido, disquete, etc.). Esta memória secundária tem a vantagem de ser permanente. Os dados armazenados em disco permanecem válidos após o término dos programas. Esta memória tem um custo mais baixo do que a memória principal, porém o acesso aos dados é bem mais lento. Por fim, encontram-se os dispositivos de entrada e saída. Os dispositivos de entrada (por exemplo, teclado, mouse) permitem passarmos dados para um programa, enquanto os dispositivos de saída permitem que um programa exporte seus resultados, por exemplo em forma textual ou gráfica usando monitores ou impressoras. Armazenamento de dados e programas na memória A memória do computador é dividida em unidades de armazenamento chamadas bytes. Cada byte é composto por 8 bits, que podem armazenar os valores zero ou um. Nada além de zeros e uns pode ser armazenado na memória do computador. Por esta razão, todas as informações (programas, textos, imagens, etc.) são armazenadas usando uma codificação numérica na forma binária. Na representação binária, os números são representados por uma seqüência de zeros e uns (no nosso dia a dia, usamos a representação decimal, uma vez que trabalhamos com 10 algarismos). Por exemplo, o número decimal 5 é representado por 101, pois 1*22 + 0*21 + 1*20 é igual a 5 (da mesma forma que, na base decimal, 456=4*102 + 5*101 + 6*100). Cada posição da memória (byte) tem um endereço único. Não é possível endereçar diretamente um bit. Se só podemos armazenar números na memória do computador, como fazemos para armazenar um texto (um documento ou uma mensagem)? Para ser possível armazenar uma seqüência de caracteres, que representa o texto, atribui-se a cada caractere um código Canal de comunicação (BUS) CPU Memória Armazenamento secundário Dispositivos de entrada/saída Central de processamento Estruturas de Dados – PUC-Rio 1-3 numérico (por exemplo, pode-se associar ao caractere 'A' o código 65, ao caractere 'B' o código 66, e assim por diante). Se todos os caracteres tiverem códigos associados (inclusive os caracteres de pontuação e de formatação), podemos armazenar um texto na memória do computador como uma seqüência de códigos numéricos. Um computador só pode executar programas em linguagens de máquina. Cada programa executável é uma seqüência de instruções que o processador central interpreta, executando as operações correspondentes. Esta seqüência de instruções também é representada como uma seqüência de códigos numéricos. Os programas ficam armazenados em disco e, para serem executados pelo computador, devem ser carregados (transferidos) para a memória principal. Uma vez na memória, o computador executa a seqüência de operações correspondente. 1.3. Interpretação versus Compilação Uma diferença importante entre as linguagens C e Scheme é que, via de regra, elas são implementadas de forma bastante diferente. Normalmente, Scheme é interpretada e C é compilada. Para entender a diferença entre essas duas formas de implementação, é necessário lembrar que os computadores só executam realmente programas em sua linguagem de máquina, que é específica para cada modelo (ou família de modelos) de computador. Ou seja, em qualquer computador, programas em C ou em Scheme não podem ser executados em sua forma original; apenas programas na linguagem de máquina (à qual vamos nos referir como M) podem ser efetivamente executados. No caso da interpretação de Scheme, um programa interpretador (IM), escrito em M, lê o programa PS escrito em Scheme e simula cada uma de suas instruções, modificando os dados do programa da forma apropriada. No caso da compilação da linguagem C, um programa compilador (CM), escrito em M, lê o programa PC, escrito em C, e traduz cada uma de suas instruções para M, escrevendo um programa PM cujo efeito é o desejado. Como conseqüência deste processo, PM, por ser um programa escrito em M, pode ser executado em qualquer máquina com a mesma linguagem de máquina M, mesmo que esta máquina não possua um compilador. Na prática, o programa fonte e o programa objeto são armazenados em arquivos em disco, aos quais nos referimos como arquivo fonte e arquivo objeto. As duas figuras a seguir esquematizam as duas formas básicas de implementação de linguagens de programação. Figura 1.2: Execução de programas com linguagem interpretada. PS Programa Fonte Dados de Entrada IM Interpretador Saída Execução Estruturas de Dados – PUC-Rio 1-4 Figura 1.3: Execução de programas com linguagem compilada. Devemos notar que, na Figura 1.2, o programa fonte é um dado de entrada a mais para o interpretador. No caso da compilação, Figura 1.3, identificamos duas fases: na primeira, o programa objeto é a saída do programa compilador e, na segunda, o programa objeto é executado, recebendo os dados de entrada e gerando a saída correspondente. Observamos que, embora seja comum termos linguagens funcionais implementadas por interpretação e linguagens convencionais por compilação, há exceções, não existindo nenhum impedimento conceitual para implementar qualquer linguagem por qualquer dos dois métodos, ou até por uma combinação de ambos. O termo “máquina” usado acima é intencionalmente vago. Por exemplo, computadores idênticos com sistemas operacionais diferentes devem ser considerados “máquinas”, ou “plataformas”, diferentes. Assim, um programa em C, que foi compilado em um PC com Windows, não deverá ser executado em um PC com Linux, e vice-versa. 1.4. Exemplo de código em C Para exemplificar códigos escritos em C, consideremos um programa que tem a finalidade de converter valores de temperatura dados em Celsius para Fahrenheit. Este programa define uma função principal que captura um valor de temperatura em Celsius, fornecido via teclado pelo usuário, e exibe como saída a temperatura correspondente em Fahrenheit. Para fazer a conversão, é utilizada uma função auxiliar. O código C deste programa exemplo é mostrado abaixo. /* Programa para conversão de temperatura */ #include <stdio.h> float converte (float c) { float f; f = 1.8*c + 32; return f; } PC Programa Fonte CM Compilador PM Programa Objeto Dados de Entrada PM Programa Objeto Saída Compilação Execução Estruturas de Dados – PUC-Rio 1-5 int main (void) { float t1; float t2; /* mostra mensagem para usuario */ printf("Digite a temperatura em Celsius: "); /* captura valor entrado via teclado */ scanf("%f",&t1); /* faz a conversao */ t2 = converte(t1); /* exibe resultado */ printf("A temperatura em Fahrenheit é: %f\n", t2); return 0; } Um programa em C, em geral, é constituído de diversas pequenas funções, que são independentes entre si – não podemos, por exemplo, definir uma função dentro de outra. Dois tipos de ambientes são caracterizados em um código C. O ambiente global, externo às funções, e os ambientes locais, definidos pelas diversas funções (lembrando que os ambientes locais são independentes entre si). Podem-se inserir comentáriosno código fonte, iniciados com /* e finalizados com */, conforme ilustrado acima. Devemos notar também que comandos e declarações em C são terminados pelo caractere ponto-e-vírgula (;). Um programa em C tem que, obrigatoriamente, conter a função principal (main). A execução de um programa começa pela função principal (a função main é automaticamente chamada quando o programa é carregado para a memória). As funções auxiliares são chamadas, direta ou indiretamente, a partir da função principal. Em C, como nas demais linguagens “convencionais”, devemos reservar área de memória para armazenar cada dado. Isto é feito através da declaração de variáveis, na qual informamos o tipo do dado que iremos armazenar naquela posição de memória. Assim, a declaração float t1;, do código mostrado, reserva um espaço de memória para armazenarmos um valor real (ponto flutuante – float). Este espaço de memória é referenciado através do símbolo t1. Uma característica fundamental da linguagem C diz respeito ao tempo de vida e à visibilidade das variáveis. Uma variável (local) declarada dentro de uma função "vive" enquanto esta função está sendo executada, e nenhuma outra função tem acesso direto a esta variável. Outra característica das variáveis locais é que devem sempre ser explicitamente inicializadas antes de seu uso, caso contrário conterão “lixo”, isto é, valores indefinidos. Como alternativa, é possível definir variáveis que sejam externas às funções, isto é, variáveis globais, que podem ser acessadas pelo nome por qualquer função subseqüente Estruturas de Dados – PUC-Rio 1-6 (são “visíveis” em todas as funções que se seguem à sua definição). Além do mais, devido às variáveis externas (ou globais) existirem permanentemente (pelo menos enquanto o programa estiver sendo executado), elas retêm seus valores mesmo quando as funções que as acessam deixam de existir. Embora seja possível definir variáveis globais em qualquer parte do ambiente global (entre quaisquer funções), é prática comum defini-las no início do arquivo-fonte. Como regra geral, por razões de clareza e estruturação adequada do código, devemos evitar o uso indisciplinado de variáveis globais e resolver os problemas fazendo uso de variáveis locais sempre que possível. No próximo capítulo, discutiremos variáveis com mais detalhe. 1.5. Compilação de programas em C Para desenvolvermos programas em uma linguagem como C, precisamos de, no mínimo, um editor e um compilador. Estes programas têm finalidades bem definidas: com o editor de textos, escrevemos os programas fontes, que são salvos em arquivos1; com o compilador, transformamos os programas fontes em programas objetos, em linguagem de máquina, para poderem ser executados. Os programas fontes são, em geral, armazenados em arquivos cujo nome tem a extensão “.c”. Os programas executáveis possuem extensões que variam com o sistema operacional: no Windows, têm extensão “.exe”; no Unix (Linux), em geral, não têm extensão. Para exemplificar o ciclo de desenvolvimento de um programa simples, consideremos que o código apresentado na seção anterior tenha sido salvo num arquivo com o nome prog.c. Devemos então compilar o programa para gerarmos um executável. Para ilustrar este processo, usaremos o compilador gcc. Na linha de comando do sistema operacional, fazemos: > gcc –o prog prog.c Se não houver erro de compilação no nosso código, este comando gera o executável com o nome prog (prog.exe, no Windows). Podemos então executar o programa: > prog Digite a temperatura em Celsius: 10 A temperatura em Fahrenheit vale: 50.000000 > Em itálico, representamos as mensagens do programa e, em negrito, exemplificamos um dado fornecido pelo usuário via teclado. Programas com vários arquivos fontes Os programas reais são, naturalmente, maiores. Nestes casos, subdividimos o fonte do programa em vários arquivos. Para exemplificar a criação de um programa com dois arquivos, vamos considerar que o programa para conversão de unidades de temperatura 1 Podemos utilizar qualquer editor de texto para escrever os programas fontes, exceto editores que incluem caracteres de formatação (como o Word do Windows, por exemplo). Estruturas de Dados – PUC-Rio 1-7 apresentado anteriormente seja dividido em dois fontes: o arquivo converte.c e o arquivo principal.c. Teríamos que criar dois arquivos, como ilustrado abaixo: Arquivo converte.c: /* Implementação do módulo de conversão */ float converte (float c) { float f; f = 1.8*c + 32; return f; } Arquivo principal.c: /* Programa para conversão de temperatura */ #include <stdio.h> float converte (float c); int main (void) { float t1; float t2; /* mostra mensagem para usuario */ printf("Entre com temperatura em Celsius: "); /* captura valor entrado via teclado */ scanf("%f",&t1); /* faz a conversao */ t2 = converte(t1); /* exibe resultado */ printf("A temperatura em Fahrenheit vale: %f\n", t2); return 0; } Embora o entendimento completo desta organização de código não fique claro agora, interessa-nos apenas mostrar como geramos um executável de um programa com vários arquivos fontes. Uma alternativa é compilar tudo junto e gerar o executável como anteriormente: > gcc –o prog converte.c principal.c No entanto, esta não é a melhor estratégia, pois se alterarmos a implementação de um determinado módulo não precisaríamos re-compilar os outros. Uma forma mais eficiente é compilarmos os módulos separadamente e depois ligar os diversos módulos objetos gerados para criar um executável. > gcc –c converte.c > gcc –c principal.c > gcc –o prog converte.o principal.o Estruturas de Dados – PUC-Rio 1-8 A opção –c do compilador gcc indica que não queremos criar um executável, apenas gerar o arquivo objeto (com extensão “.o” ou “.obj”). Depois, invocamos gcc para fazer a ligação dos objetos, gerando o executável. 1.6. Ciclo de desenvolvimento Programas como editores, compiladores e ligadores são às vezes chamados de “ferramentas”, usadas na “Engenharia” de Software. Exceto no caso de programas muito pequenos (como é o caso de nosso exemplo), é raro que um programa seja composto de um único arquivo fonte. Normalmente, para facilitar o projeto, os programas são divididos em vários arquivos. Como vimos, cada um desses arquivos pode ser compilado em separado, mas para sua execução é necessário reunir os códigos de todos eles, sem esquecer das bibliotecas necessárias, e esta é a função do ligador. A tarefa das bibliotecas é permitir que funções de interesse geral estejam disponíveis com facilidade. Nosso exemplo usa a biblioteca de entrada/saída padrão do C, stdio, que oferece funções que permitem a captura de dados a partir do teclado e a saída de dados para a tela. Além de bibliotecas preparadas pelo fornecedor do compilador, ou por outros fornecedores de software, podemos ter bibliotecas preparadas por um usuário qualquer, que pode “empacotar” funções com utilidades relacionadas em uma biblioteca e, dessa maneira, facilitar seu uso em outros programas. Em alguns casos, a função do ligador é executada pelo próprio compilador. Por exemplo, quando compilamos o primeiro programa prog.c, o ligador foi chamado automaticamente para reunir o código do programa aos códigos de scanf, printf e de outras funções necessárias à execução independente do programa. Verificação e Validação Outro ponto que deve ser observado é que os programas podem conter (e, em geral, contêm) erros, que precisam ser identificados e corrigidos. Quase sempre a verificação é realizada por meio de testes, executando o programa a ser testado com diferentes valoresde entrada. Identificado um ou mais erros, o código fonte é corrigido e deve ser novamente verificado. O processo de compilação, ligação e teste se repete até que os resultados dos testes sejam satisfatórios e o programa seja considerado validado. Podemos descrever o ciclo através da Figura 1.4. Figura 1.4: Ciclo de desenvolvimento. Editar Compilar Ligar Testar Estruturas de Dados – PUC-Rio 1-9 Este ciclo pode ser realizado usando programas (editor, compilador, ligador) separados ou empregando um “ambiente integrado de desenvolvimento” (integrated development environment, ou IDE). IDE é um programa que oferece janelas para a edição de programas e facilidades para abrir, fechar e salvar arquivos e para compilar, ligar e executar programas. Se um IDE estiver disponível, é possível criar e testar um programa, tudo em um mesmo ambiente, e todo o ciclo mencionado acima acontece de maneira mais confortável dentro de um mesmo ambiente, de preferência com uma interface amigável. Estruturas de Dados –PUC-Rio 2-1 2. Expressões W. Celes e J. L. Rangel Em C, uma expressão é uma combinação de variáveis, constantes e operadores que pode ser avaliada computacionalmente, resultando em um valor. O valor resultante é chamado de valor da expressão. 2.1. Variáveis Podemos dizer que uma variável representa um espaço na memória do computador para armazenar determinado tipo de dado. Na linguagem C, todas as variáveis devem ser explicitamente declaradas. Na declaração de uma variável, obrigatoriamente, devem ser especificados seu tipo e seu nome: o nome da variável serve de referência ao dado armazenado no espaço de memória da variável e o tipo da variável determina a natureza do dado que será armazenado. Tipos básicos A linguagem C oferece alguns tipos básicos. Para armazenar valores inteiros, existem três tipos básicos: char, short int, long int. Estes tipos diferem entre si pelo espaço de memória que ocupam e conseqüentemente pelo intervalo de valores que podem representar. O tipo char, por exemplo, ocupa 1 byte de memória (8 bits), podendo representar 28 (=256) valores distintos. Todos estes tipos podem ainda ser modificados para representarem apenas valores positivos, o que é feito precedendo o tipo com o modificador “sem sinal” – unsigned. A tabela abaixo compara os tipos para valores inteiros e suas representatividades. Tipo Tamanho Representatividade char 1 byte -128 a 127 unsigned char 1 byte 0 a 255 short int 2 bytes -32 768 a 32 767 unsigned short int 2 bytes 0 a 65 535 long int 4 bytes -2 147 483 648 a 2 147 483 647 unsigned long int 4 bytes 4 294 967295 Os tipos short int e long int podem ser referenciados simplesmente com short e long, respectivamente. O tipo int puro é mapeado para o tipo inteiro natural da máquina, que pode ser short ou long. A maioria das máquinas que usamos hoje funcionam com processadores de 32 bits e o tipo int é mapeado para o inteiro de 4 bytes (long).1 O tipo char é geralmente usado apenas para representar códigos de caracteres, como veremos nos capítulos subseqüentes. 1 Um contra-exemplo é o compilador TurboC, que foi desenvolvido para o sistema operacional DOS mas ainda pode ser utilizado no Windows. No TurboC, o tipo int é mapeado para 2 bytes. Estruturas de Dados –PUC-Rio 2-2 A linguagem oferece ainda dois tipos básicos para a representação de números reais (ponto flutuante): float e double. A tabela abaixo compara estes dois tipos. Tipo Tamanho Representatividade float 4 bytes ± 10-38 a 1038 double 8 bytes ± 10-308 a 10308 Declaração de variáveis Para armazenarmos um dado (valor) na memória do computador, devemos reservar o espaço correspondente ao tipo do dado a ser armazenado. A declaração de uma variável reserva um espaço na memória para armazenar um dado do tipo da variável e associa o nome da variável a este espaço de memória. int a; /* declara uma variável do tipo int */ int b; /* declara outra variável do tipo int */ float c; /* declara uma variável do tipo float */ a = 5; /* armazena o valor 5 em a */ b = 10; /* armazena o valor 10 em b */ c = 5.3; /* armazena o valor 5.3 em c */ A linguagem permite que variáveis de mesmo tipo sejam declaradas juntas. Assim, as duas primeiras declarações acima poderiam ser substituídas por: int a, b; /* declara duas variáveis do tipo int */ Uma vez declarada a variável, podemos armazenar valores nos respectivos espaços de memória. Estes valores devem ter o mesmo tipo da variável, conforme ilustrado acima. Não é possível, por exemplo, armazenar um número real numa variável do tipo int. Se fizermos: int a; a = 4.3; /* a variável armazenará o valor 4 */ será armazenada em a apenas a parte inteira do número real, isto é, 4. Alguns compiladores exibem uma advertência quando encontram este tipo de atribuição. Em C, as variáveis podem ser inicializadas na declaração. Podemos, por exemplo, escrever: int a = 5, b = 10; /* declara e inicializa as variáveis */ float c = 5.3; Valores constantes Em nossos códigos, usamos também valores constantes. Quando escrevemos a atribuição: a = b + 123; Estruturas de Dados –PUC-Rio 2-3 sendo a e b variáveis supostamente já declaradas, reserva-se um espaço para armazenar a constante 123. No caso, a constante é do tipo inteiro, então um espaço de quatro bytes (em geral) é reservado e o valor 123 é armazenado nele. A diferença básica em relação às variáveis, como os nomes dizem (variáveis e constantes), é que o valor armazenado numa área de constante não pode ser alterado. As constantes também podem ser do tipo real. Uma constante real deve ser escrita com um ponto decimal ou valor de expoente. Sem nenhum sufixo, uma constante real é do tipo double. Se quisermos uma constante real do tipo float, devemos, a rigor, acrescentar o sufixo F ou f. Alguns exemplos de constantes reais são: 12.45 constante real do tipo double 1245e-2 constante real do tipo double 12.45F constante real do tipo float Alguns compiladores exibem uma advertência quando encontram o código abaixo: float x; ... x = 12.45; pois o código, a rigor, armazena um valor double (12.45) numa variável do tipo float. Desde que a constante seja representável dentro de um float, não precisamos nos preocupar com este tipo de advertência. Variáveis com valores indefinidos Um dos erros comuns em programas de computador é o uso de variáveis cujos valores ainda estão indefinidos. Por exemplo, o trecho de código abaixo está errado, pois o valor armazenado na variável b está indefinido e tentamos usá-lo na atribuição a c. É comum dizermos que b tem “lixo”. int a, b, c; a = 2; c = a + b; /* ERRO: b tem “lixo” */ Alguns destes erros são óbvios (como o ilustrado acima) e o compilador é capaz de nos reportar uma advertência; no entanto, muitas vezes o uso de uma variável não definida fica difícil de ser identificado no código. Repetimos que é um erro comum em programas e uma razão para alguns programas funcionarem na parte da manhã e não funcionarem na parte da tarde (ou funcionarem durante o desenvolvimento e não funcionarem quando entregamos para nosso cliente!). Todos os erros em computação têm lógica. A razão de o programa poder funcionar uma vez e não funcionar outra é que, apesar de indefinido, o valor da variável existe. No nosso caso acima, pode acontecer que o valor armazenado na memória ocupada por b seja 0, fazendo com que o programa funcione. Por outro lado, pode acontecer de o valor ser –293423 e o programa não funcionar. Estruturas de Dados –PUC-Rio 2-4 2.2. Operadores A linguagem
Compartilhar