Baixe o app para aproveitar ainda mais
Prévia do material em texto
Universidade do Sul de Santa Catarina Palhoça UnisulVirtual 2011 Probabilidade e Estatística Disciplina na modalidade a distância Créditos Universidade do Sul de Santa Catarina | Campus UnisulVirtual | Educação Superior a Distância Reitor Ailton Nazareno Soares Vice-Reitor Sebastião Salésio Heerdt Chefe de Gabinete da Reitoria Willian Corrêa Máximo Pró-Reitor de Ensino e Pró-Reitor de Pesquisa, Pós-Graduação e Inovação Mauri Luiz Heerdt Pró-Reitora de Administração Acadêmica Miriam de Fátima Bora Rosa Pró-Reitor de Desenvolvimento e Inovação Institucional Valter Alves Schmitz Neto Diretora do Campus Universitário de Tubarão Milene Pacheco Kindermann Diretor do Campus Universitário da Grande Florianópolis Hércules Nunes de Araújo Secretária-Geral de Ensino Solange Antunes de Souza Diretora do Campus Universitário UnisulVirtual Jucimara Roesler Equipe UnisulVirtual Diretor Adjunto Moacir Heerdt Secretaria Executiva e Cerimonial Jackson Schuelter Wiggers (Coord.) Marcelo Fraiberg Machado Tenille Catarina Assessoria de Assuntos Internacionais Murilo Matos Mendonça Assessoria de Relação com Poder Público e Forças Armadas Adenir Siqueira Viana Walter Félix Cardoso Junior Assessoria DAD - Disciplinas a Distância Patrícia da Silva Meneghel (Coord.) Carlos Alberto Areias Cláudia Berh V. da Silva Conceição Aparecida Kindermann Luiz Fernando Meneghel Renata Souza de A. Subtil Assessoria de Inovação e Qualidade de EAD Denia Falcão de Bittencourt (Coord.) Andrea Ouriques Balbinot Carmen Maria Cipriani Pandini Assessoria de Tecnologia Osmar de Oliveira Braz Júnior (Coord.) Felipe Fernandes Felipe Jacson de Freitas Jefferson Amorin Oliveira Phelipe Luiz Winter da Silva Priscila da Silva Rodrigo Battistotti Pimpão Tamara Bruna Ferreira da Silva Coordenação Cursos Coordenadores de UNA Diva Marília Flemming Marciel Evangelista Catâneo Roberto Iunskovski Auxiliares de Coordenação Ana Denise Goularte de Souza Camile Martinelli Silveira Fabiana Lange Patricio Tânia Regina Goularte Waltemann Coordenadores Graduação Aloísio José Rodrigues Ana Luísa Mülbert Ana Paula R.Pacheco Artur Beck Neto Bernardino José da Silva Charles Odair Cesconetto da Silva Dilsa Mondardo Diva Marília Flemming Horácio Dutra Mello Itamar Pedro Bevilaqua Jairo Afonso Henkes Janaína Baeta Neves Jorge Alexandre Nogared Cardoso José Carlos da Silva Junior José Gabriel da Silva José Humberto Dias de Toledo Joseane Borges de Miranda Luiz G. Buchmann Figueiredo Marciel Evangelista Catâneo Maria Cristina Schweitzer Veit Maria da Graça Poyer Mauro Faccioni Filho Moacir Fogaça Nélio Herzmann Onei Tadeu Dutra Patrícia Fontanella Roberto Iunskovski Rose Clér Estivalete Beche Vice-Coordenadores Graduação Adriana Santos Rammê Bernardino José da Silva Catia Melissa Silveira Rodrigues Horácio Dutra Mello Jardel Mendes Vieira Joel Irineu Lohn José Carlos Noronha de Oliveira José Gabriel da Silva José Humberto Dias de Toledo Luciana Manfroi Rogério Santos da Costa Rosa Beatriz Madruga Pinheiro Sergio Sell Tatiana Lee Marques Valnei Carlos Denardin Sâmia Mônica Fortunato (Adjunta) Coordenadores Pós-Graduação Aloísio José Rodrigues Anelise Leal Vieira Cubas Bernardino José da Silva Carmen Maria Cipriani Pandini Daniela Ernani Monteiro Will Giovani de Paula Karla Leonora Dayse Nunes Letícia Cristina Bizarro Barbosa Luiz Otávio Botelho Lento Roberto Iunskovski Rodrigo Nunes Lunardelli Rogério Santos da Costa Thiago Coelho Soares Vera Rejane Niedersberg Schuhmacher Gerência Administração Acadêmica Angelita Marçal Flores (Gerente) Fernanda Farias Secretaria de Ensino a Distância Samara Josten Flores (Secretária de Ensino) Giane dos Passos (Secretária Acadêmica) Adenir Soares Júnior Alessandro Alves da Silva Andréa Luci Mandira Cristina Mara Schauffert Djeime Sammer Bortolotti Douglas Silveira Evilym Melo Livramento Fabiano Silva Michels Fabricio Botelho Espíndola Felipe Wronski Henrique Gisele Terezinha Cardoso Ferreira Indyanara Ramos Janaina Conceição Jorge Luiz Vilhar Malaquias Juliana Broering Martins Luana Borges da Silva Luana Tarsila Hellmann Luíza Koing Zumblick Maria José Rossetti Marilene de Fátima Capeleto Patricia A. Pereira de Carvalho Paulo Lisboa Cordeiro Paulo Mauricio Silveira Bubalo Rosângela Mara Siegel Simone Torres de Oliveira Vanessa Pereira Santos Metzker Vanilda Liordina Heerdt Gestão Documental Lamuniê Souza (Coord.) Clair Maria Cardoso Daniel Lucas de Medeiros Jaliza Thizon de Bona Guilherme Henrique Koerich Josiane Leal Marília Locks Fernandes Gerência Administrativa e Financeira Renato André Luz (Gerente) Ana Luise Wehrle Anderson Zandré Prudêncio Daniel Contessa Lisboa Naiara Jeremias da Rocha Rafael Bourdot Back Thais Helena Bonetti Valmir Venício Inácio Gerência de Ensino, Pesquisa e Extensão Janaína Baeta Neves (Gerente) Aracelli Araldi Elaboração de Projeto Carolina Hoeller da Silva Boing Vanderlei Brasil Francielle Arruda Rampelotte Reconhecimento de Curso Maria de Fátima Martins Extensão Maria Cristina Veit (Coord.) Pesquisa Daniela E. M. Will (Coord. PUIP, PUIC, PIBIC) Mauro Faccioni Filho (Coord. Nuvem) Pós-Graduação Anelise Leal Vieira Cubas (Coord.) Biblioteca Salete Cecília e Souza (Coord.) Paula Sanhudo da Silva Marília Ignacio de Espíndola Renan Felipe Cascaes Gestão Docente e Discente Enzo de Oliveira Moreira (Coord.) Capacitação e Assessoria ao Docente Alessandra de Oliveira (Assessoria) Adriana Silveira Alexandre Wagner da Rocha Elaine Cristiane Surian (Capacitação) Elizete De Marco Fabiana Pereira Iris de Souza Barros Juliana Cardoso Esmeraldino Maria Lina Moratelli Prado Simone Zigunovas Tutoria e Suporte Anderson da Silveira (Núcleo Comunicação) Claudia N. Nascimento (Núcleo Norte- Nordeste) Maria Eugênia F. Celeghin (Núcleo Pólos) Andreza Talles Cascais Daniela Cassol Peres Débora Cristina Silveira Ednéia Araujo Alberto (Núcleo Sudeste) Francine Cardoso da Silva Janaina Conceição (Núcleo Sul) Joice de Castro Peres Karla F. Wisniewski Desengrini Kelin Buss Liana Ferreira Luiz Antônio Pires Maria Aparecida Teixeira Mayara de Oliveira Bastos Michael Mattar Patrícia de Souza Amorim Poliana Simao Schenon Souza Preto Gerência de Desenho e Desenvolvimento de Materiais Didáticos Márcia Loch (Gerente) Desenho Educacional Cristina Klipp de Oliveira (Coord. Grad./DAD) Roseli A. Rocha Moterle (Coord. Pós/Ext.) Aline Cassol Daga Aline Pimentel Carmelita Schulze Daniela Siqueira de Menezes Delma Cristiane Morari Eliete de Oliveira Costa Eloísa Machado Seemann Flavia Lumi Matuzawa Geovania Japiassu Martins Isabel Zoldan da Veiga Rambo João Marcos de Souza Alves Leandro Romanó Bamberg Lygia Pereira Lis Airê Fogolari Luiz Henrique Milani Queriquelli Marcelo Tavares de Souza Campos Mariana Aparecida dos Santos Marina Melhado Gomes da Silva Marina Cabeda Egger Moellwald Mirian Elizabet Hahmeyer Collares Elpo Pâmella Rocha Flores da Silva Rafael da Cunha Lara Roberta de Fátima Martins Roseli Aparecida Rocha Moterle Sabrina Bleicher Verônica Ribas Cúrcio Acessibilidade Vanessa de Andrade Manoel (Coord.) Letícia Regiane Da Silva Tobal Mariella Gloria Rodrigues Vanesa Montagna Avaliação da aprendizagem Claudia Gabriela Dreher Jaqueline Cardozo Polla Nágila Cristina Hinckel Sabrina Paula Soares Scaranto Thayanny Aparecida B. da Conceição Gerência de Logística Jeferson Cassiano A. da Costa (Gerente) Logísitca de Materiais Carlos Eduardo D. da Silva (Coord.) Abraao do Nascimento Germano Bruna Maciel Fernando Sardão da Silva Fylippy Margino dos Santos Guilherme Lentz Marlon Eliseu Pereira Pablo Varela da Silveira Rubens Amorim Yslann David Melo Cordeiro Avaliações Presenciais Graciele M. Lindenmayr (Coord.)Ana Paula de Andrade Angelica Cristina Gollo Cristilaine Medeiros Daiana Cristina Bortolotti Delano Pinheiro Gomes Edson Martins Rosa Junior Fernando Steimbach Fernando Oliveira Santos Lisdeise Nunes Felipe Marcelo Ramos Marcio Ventura Osni Jose Seidler Junior Thais Bortolotti Gerência de Marketing Eliza B. Dallanhol Locks (Gerente) Relacionamento com o Mercado Alvaro José Souto Relacionamento com Polos Presenciais Alex Fabiano Wehrle (Coord.) Jeferson Pandolfo Karine Augusta Zanoni Marcia Luz de Oliveira Mayara Pereira Rosa Luciana Tomadão Borguetti Assuntos Jurídicos Bruno Lucion Roso Sheila Cristina Martins Marketing Estratégico Rafael Bavaresco Bongiolo Portal e Comunicação Catia Melissa Silveira Rodrigues Andreia Drewes Luiz Felipe Buchmann Figueiredo Rafael Pessi Gerência de Produção Arthur Emmanuel F. Silveira (Gerente) Francini Ferreira Dias Design Visual Pedro Paulo Alves Teixeira (Coord.) Alberto Regis Elias Alex Sandro Xavier Anne Cristyne Pereira Cristiano Neri Gonçalves Ribeiro Daiana Ferreira Cassanego Davi Pieper Diogo Rafael da Silva Edison Rodrigo Valim Fernanda Fernandes Frederico Trilha Jordana Paula Schulka Marcelo Neri da Silva Nelson Rosa Noemia Souza Mesquita Oberdan Porto Leal Piantino Multimídia Sérgio Giron (Coord.) Dandara Lemos Reynaldo Cleber Magri Fernando Gustav Soares Lima Josué Lange Conferência (e-OLA) Carla Fabiana Feltrin Raimundo (Coord.) Bruno Augusto Zunino Gabriel Barbosa Produção Industrial Marcelo Bittencourt (Coord.) Gerência Serviço de Atenção Integral ao Acadêmico Maria Isabel Aragon (Gerente) Ana Paula Batista Detóni André Luiz Portes Carolina Dias Damasceno Cleide Inácio Goulart Seeman Denise Fernandes Francielle Fernandes Holdrin Milet Brandão Jenniffer Camargo Jessica da Silva Bruchado Jonatas Collaço de Souza Juliana Cardoso da Silva Juliana Elen Tizian Kamilla Rosa Mariana Souza Marilene Fátima Capeleto Maurício dos Santos Augusto Maycon de Sousa Candido Monique Napoli Ribeiro Priscilla Geovana Pagani Sabrina Mari Kawano Gonçalves Scheila Cristina Martins Taize Muller Tatiane Crestani Trentin Avenida dos Lagos, 41 – Cidade Universitária Pedra Branca | Palhoça – SC | 88137-900 | Fone/fax: (48) 3279-1242 e 3279-1271 | E-mail: cursovirtual@unisul.br | Site: www.unisul.br/unisulvirtual Palhoça UnisulVirtual 2011 Revisão e atualização de conteúdo Gabriel Oscar Cremona Parma Design instrucional Karla Leonora Dahse Nunes Sabrina Bleicher 2ª edição Luiz Arthur Dornelles Júnior Probabilidade e Estatística Livro didático Edição – Livro Didático Professor Conteudista Luiz Arthur Dornelles Júnior Revisão e atualização de conteúdo Gabriel Oscar Cremona Parma (2ª edição) Designer Instrucional Karla Leonora Dahse Nunes Sabrina Bleicher (2ª edição) Projeto Gráfico e Capa Equipe UnisulVirtual Diagramação Fernanda Fernandes Revisão Contextuar Ficha catalográfica elaborada pela Biblioteca Universitária da Unisul Copyright © UnisulVirtual 2011 Nenhuma parte desta publicação pode ser reproduzida por qualquer meio sem a prévia autorização desta instituição. 519.5 D75 Dornelles Júnior, Luiz Arthur Probabilidade e estatística : livro didático / Luiz Arthur Dornelles Júnior; revisão e atualização de conteúdo Gabriel Oscar Cremona Parma ; design instrucional Karla Leonora Dahse Nunes, Sabrina Bleicher. – 2. ed. – Palhoça: UnisulVirtual, 2011. 336 p. : il. ; 28 cm. Inclui bibliografia. 1. Estatística. 2. Probabilidades. I. Parma, Gabriel Oscar Cremona. II. Nunes, Karla Leonora Dahse. III. Bleicher, Sabrina. IV. Título. Sumário Apresentação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .7 Palavras do professor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .9 Plano de estudo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 UNIDADE 1 - Introdução à Estatística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 UNIDADE 2 - Distribuição de frequências e representação gráfica . . . . . . 43 UNIDADE 3 - Medidas de posição e dispersão . . . . . . . . . . . . . . . . . . . . . . . . . 81 UNIDADE 4 - Cálculo e distribuição de probabilidades . . . . . . . . . . . . . . . . 147 UNIDADE 5 - Amostragem e cálculo de estimativa . . . . . . . . . . . . . . . . . . . . 205 UNIDADE 6 - Regressão linear e gráficos de controle . . . . . . . . . . . . . . . . . . 253 Para concluir o estudo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 285 Referências . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 287 Sobre os professores conteudistas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 289 Respostas e comentários das atividades de autoavaliação . . . . . . . . . . . . . 291 Anexos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 333 Biblioteca Virtual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 335 7 Apresentação Este livro didático corresponde à disciplina Probabilidade e Estatística. O material foi elaborado visando a uma aprendizagem autônoma e aborda conteúdos especialmente selecionados e relacionados à sua área de formação. Ao adotar uma linguagem didática e dialógica, objetivamos facilitar seu estudo a distância, proporcionando condições favoráveis às múltiplas interações e a um aprendizado contextualizado e eficaz. Lembre-se que sua caminhada, nesta disciplina, será acompanhada e monitorada constantemente pelo Sistema Tutorial da UnisulVirtual, por isso a “distância” fica caracterizada somente na modalidade de ensino que você optou para sua formação, pois na relação de aprendizagem professores e instituição estarão sempre conectados com você. Então, sempre que sentir necessidade entre em contato; você tem à disposição diversas ferramentas e canais de acesso tais como: telefone, e-mail e o Espaço Unisul Virtual de Aprendizagem, que é o canal mais recomendado, pois tudo o que for enviado e recebido fica registrado para seu maior controle e comodidade. Nossa equipe técnica e pedagógica terá o maior prazer em lhe atender, pois sua aprendizagem é o nosso principal objetivo. Bom estudo e sucesso! Equipe UnisulVirtual. Palavras do professor Olá! Bem-vindo(a) à disciplina Probabilidade e Estatística. Dentro desta disciplina você irá estudar o que os profissionais e cientistas chamam de probabilidade e estatística. Tendo como base a matemática, esta disciplina trata da aplicação no cotidiano, em pesquisas e avaliações. Trata também de técnicas eficientes para organizar e analisar dados e tomar decisões. Não é objetivo desta disciplina formar estatísticos e, sim, profissionais com conhecimento técnico para realizar análises e interpretação de dados, além de ter condições de argumentar, dar suporte e trocar ideias com outros profissionais. Desta forma, o esperado é que ao final da disciplina você tenha em suas mãos uma verdadeira “caixa com várias ferramentas” para apoiar suas decisões. Sinta-se, agora, convidado a estudar para obter todas as “ferramentas” que lhe serão apresentadas nesta disciplina, e cuide para ordenar as ferramentas na “caixa”, de modo a poder fazer uso delas quando for necessário. Bons estudos! Professor Luiz Arthur Dornelles Júnior Plano de estudo O plano de estudos visa a orientá-lo no desenvolvimento da disciplina. Ele possui elementos que o ajudarão a conhecer o contexto dadisciplina e a organizar o seu tempo de estudos. O processo de ensino e aprendizagem na UnisulVirtual leva em conta instrumentos que se articulam e se complementam, portanto, a construção de competências se dá sobre a articulação de metodologias e por meio das diversas formas de ação/mediação. São elementos desse processo: o livro didático; o Espaço UnisulVirtual de Aprendizagem (EVA); as atividades de avaliação (a distância, presenciais e de autoavaliação); o Sistema Tutorial. Ementa Conceitos gerais de população, amostra, parâmetro, estatística, tipos de dados, níveis de mensuração, planejamento de experimentos. Histogramas. Medidas de locação e de variabilidade. Boxplot. Ramo e folhas. Probabilidade e distribuições de probabilidade. Principais distribuições discretas. Principais distribuições contínuas. Estatísticas e distribuições amostrais. Estimação pontual de parâmetros de processos. Inferência estatística para uma amostra. Inferência estatística para duas amostras. Análise de variância com um único fator. Correlação e regressão linear. Gráficos de controle. 12 Universidade do Sul de Santa Catarina Objetivos Geral Adquirir competências para pesquisar; coletar dados, organizar e analisá-los; e delinear conclusões, testando-as na solução de problemas, sob o ponto de vista da estatística e da probabilidade. Específicos Compreender os conceitos, procedimentos e estratégias para uma pesquisa. Identificar ferramentas que apoiem decisões nas áreas de conhecimento inerentes a sua profissão. Analisar e resolver situações que envolvam coleção de dados agrupados ou não. Analisar e resolver situações que envolvam uma ou mais variáveis de estudo. Identificar ferramentas para o cálculo de estimavas para uma ou mais variáveis. Correlacionar duas variáveis. Carga Horária A carga horária total da disciplina é 60 horas-aula. 13 Probabilidade e Estatística Conteúdo programático/objetivos Veja, a seguir, as unidades que compõem o livro didático desta disciplina e os seus respectivos objetivos. Estes se referem aos resultados que você deverá alcançar ao final de uma etapa de estudo. Os objetivos de cada unidade definem o conjunto de conhecimentos que você deverá possuir para o desenvolvimento de habilidades e competências necessárias à sua formação. Unidades de estudo: 6 Unidade 1 – Introdução à Estatística É muito importante, antes de começar a ter contato com as técnicas estatísticas, conhecer bem os conceitos e definições de alguns termos que serão usados dentro desta disciplina. Por isso, nesta unidade você conhecerá alguns conceitos introdutórios da Estatística. Unidade 2 – Distribuição de frequências e representação gráfica De posse dos dados de forma desorganizada, um primeiro passo seria organizá-los em tabelas para que possibilitem a primeira análise e uma série de interpretações. Nesta unidade, você poderá aprender como se organizam dados brutos e como pode ser analisada a distribuição de frequências. Após aprender como organizar os dados, você aprenderá como representá-los graficamente. Este assunto é importante porque o seu dia a dia está impregnado de informações representadas por gráficos e, nesta unidade, você poderá conhecer os tipos de gráficos e algumas dicas de como interpretá-los. 14 Universidade do Sul de Santa Catarina Unidade 3 – Medidas de posição e dispersão Você conhecerá, nesta unidade, como calcular algumas medidas, começando por média, mediana e moda, sendo que a medida mais importante dentro da Estatística é a média. Verá também outra medida importante, a de dispersão. Muitas vezes as medidas de posição por si só não bastam para analisar uma série de dados, então, se faz necessário trabalhar com medidas de dispersão. Dentre as medidas de dispersão, a mais importante delas que é o desvio padrão. Unidade 4 – Cálculo e distribuição de probabilidades Esta unidade é um marco que divide a Estatística em duas partes: a estatística descritiva e estatística indutiva. Dar-se-á início ao estudo sobre probabilidade, estimativas e cálculo do erro de estimativa. O estudo de probabilidade é a base fundamental para concretizar o conhecimento sobre estimativas. Além disso, você conhecerá que o estudo de probabilidades pode ser dividido em duas partes: probabilidade de variáveis discretas e probabilidade de variáveis contínuas. Unidade 5 – Amostragem e cálculo de estimativa Tendo como base o estudo do cálculo de probabilidades, você poderá aprender, nesta unidade, como calcular o tamanho de uma amostra necessário para se obter um determinado erro de estimativa, bem como, descobrir maneiras de selecionar os elementos de uma amostra de forma que eles sejam realmente representativos da população objeto de pesquisa. Unidade 6 – Regressão linear e gráficos de controle Nesta unidade, você irá estudar como analisar e comparar duas variáveis correlacionando-as; assim como também aprenderá a construir e trabalhar com gráfico de controle para verificar os erros em processos de controle de qualidade, dentre outros fins. 15 Probabilidade e Estatística Agenda de atividades/Cronograma Verifique com atenção o EVA, organize-se para acessar periodicamente a sala da disciplina. O sucesso nos seus estudos depende da priorização do tempo para a leitura, da realização de análises e sínteses do conteúdo e da interação com os seus colegas e professor. Não perca os prazos das atividades. Registre no espaço a seguir as datas com base no cronograma da disciplina disponibilizado no EVA. Use o quadro para agendar e programar as atividades relativas ao desenvolvimento da disciplina. Atividades obrigatórias Demais atividades (registro pessoal) 1UNIDADE 1Introdução à Estatística Objetivos de aprendizagem Identificar o processo estatístico de pesquisa. Diferenciar censo e estimação. Entender a importância de usar amostra estatística. Identificar variáveis. Identificar dados absolutos e dados relativos. Classificar séries estatísticas. Seções de estudo Seção 1 Conceitos básicos da Estatística Seção 2 Variáveis Seção 3 Dados Seção 4 Séries 18 Universidade do Sul de Santa Catarina Para início de estudo A cada dia, nossa sociedade se torna mais complexa. Convivemos com os indicadores econômicos, com a inflação, com a reforma da previdência, com o controle de qualidade, enfim, nos deparamos com situações e informações sempre mais complexas. No que se refere à gestão das organizações, a situação não é diferente. Para se administrar uma empresa, seja pública ou privada, necessitamos de ferramentas para poder acompanhar a evolução da sociedade e, assim, analisar situações e informações bem como dar suporte às nossas decisões. Por isso, dizemos que a Estatística é um conjunto de ferramentas as quais, quando bem empregadas, podem ser de grande utilidade para a gestão de empresas. Hoje em dia, sem a Estatística, não seríamos capazes de avaliar a variação de preços, da inflação, de consumo, nem fazer controle de qualidade, pesquisa eleitoral etc. Nesta unidade, você irá conhecer alguns conceitos importantes para a Estatística. Assim, conforme a metáfora utilizada, você estará apropriando-se de mais algumas “ferramentas para colocar na sua caixa”. Seção 1 – Conceitos básicos da Estatística Para conhecer Estatística, é importante que você compreenda, antes, o significado da palavra e o seu conceito. A palavra estatística origina-se do latim, e o seu radical status, significa estado. Sendo assim, a palavra estatística significa “o estudo do estado”. Para entender o conceito de “estudo do estado”, acompanhe as seguintes definições sobre Estatística: A Estatísticaé uma coleção de métodos para planejar experimentos, obter dados e organizá-los e, deles, extrair conclusões. (TRIOLA, 1999, p. 2). 19 Probabilidade e Estatística Unidade 1 A Estatística está interessada nos métodos científicos para a coleta, organização, resumo, apresentação e análise de dados, bem como na obtenção de conclusões válidas e na tomada de decisões razoáveis, baseadas em tais análises. (SPIEGEL, 1994, p. 1). Estatística é um conjunto de métodos e processos quantitativos que serve para estudar e medir os fenômenos coletivos. (SILVA, 1999, p. 11). Você percebeu que as definições se assemelham e se completam? Então, observe, a seguir, a definição de Estatística adotada neste estudo que agora se inicia. A Estatística corresponde a um conjunto de métodos científicos para a coleta, organização, apresentação e análise de dados, bem como, para a conclusão e tomada de decisões baseadas em tais análises. Em termos gerais, convém destacar que a Estatística está dividida em duas partes: Estatística indutiva: aplicada quando é impossível realizar levantamentos com a totalidade dos objetos de uma pesquisa seja por tempo, ou por economia etc., somente uma parcela destes elementos é utilizada para realizar as observações. Partindo, neste caso, de uma parcela destes elementos, a Estatística indutiva tira conclusões e realiza previsões sobre elementos em questão (método que se fundamenta na teoria da probabilidade associado a uma margem de incerteza). Estatística descritiva: aplicada quando você se depara com uma quantidade muito grande de dados, e é difícil tirar conclusões sobre o fenômeno que descrevem. A Estatística descritiva é usada para reduzir as informações até o ponto em que se possa interpretar tal fenômeno. O objetivo da Estatística descritiva é observar fenômenos de mesma natureza, coletar, organizar, classificar, apresentar, interpretar e analisar dados referentes ao fenômeno através de gráficos e tabelas, além de calcular medidas que permitam descrever o fenômeno. 20 Universidade do Sul de Santa Catarina Para obtenção de resultados confiáveis, que reflitam a realidade dos fatos, é necessário realizar uma pesquisa cuidadosamente planejada com métodos adequados. O método é um conjunto de meios dispostos convenientemente para se chegar a um fim que se demarcou. O método estatístico, diante da impossibilidade de manter as causas constantes, admite as causas presentes, variando-as, registrando essas variações e procurando determinar, no resultado final, que influências cabem a cada uma delas. Alguns passos precisam ser seguidos para que seja aplicado o método estatístico e, assim, realizada uma boa pesquisa. Para você entender quais são estes passos, acompanhe a seguir as principais fases. a) Definição do problema: a primeira fase do trabalho estatístico consiste em uma definição ou formulação correta do problema a ser estudado. Nesta fase, você precisa definir: O que será pesquisado? Definir o tema e os objetivos de pesquisa; Em que setor geográfico? O público-alvo a ser planejado; Como será a amostra? Incluir o cálculo da amostra e as técnicas de coletas de dados. b) Planejamento: consiste em determinar o procedimento necessário para levantar informações sobre o assunto objeto do estudo. Você deverá definir como serão coletados os dados de pesquisa, já que isto pode ser feito de várias formas. Observação direta: caracteriza-se, quando o pesquisador somente faz observações para coletar os dados necessários para a pesquisa. 21 Probabilidade e Estatística Unidade 1 Entrevista oral: caracteriza-se por estabelecer perguntas orais a um indivíduo ou grupo de indivíduos. As entrevistas podem ser classificadas em estruturadas e não estruturadas; entrevistas estruturadas são aquelas em que o pesquisador estabelece um roteiro prévio de perguntas. Nas entrevistas não estruturadas, o pesquisador, por meio de uma conversa amigável, busca levantar dados que possam ser utilizados em análise qualitativa, selecionando-se os aspectos mais relevantes do problema de pesquisa. (RAUEN, 2006). Entrevista escrita ou questionário: questionário é uma lista de indagações escritas, as quais devem ser respondidas pelo informante por escrito. Sua vantagem é a possibilidade de se indagarem muitas pessoas ao mesmo tempo. Para entrevistar uma sala de universitários, basta distribuir as folhas, para que todos respondam simultaneamente (entrevista de grupo). (RAUEN, 2006). O questionário é uma forma muito utilizada na coleta de dados, mas exige ser: completo (responder tudo), concreto (perguntas claras e objetivas), secreto (sem identificação) e discreto (perguntas bem formuladas). É preciso planejar o trabalho a ser realizado, tendo em vista o objetivo que se pretende atingir. c) Coleta de dados: compreende a coleta das informações propriamente ditas. Formalmente, a coleta de dados refere-se à obtenção, à reunião e ao registro sistemático de dados com um objetivo determinado. d) Apuração dos dados: consiste em reunir os dados através de sua contagem e agrupamento. e) Apresentação dos dados: os dados estatísticos podem ser mais facilmente compreendidos quando apresentados por meio de uma representação gráfica, o que permite uma visualização instantânea de todos os dados. 22 Universidade do Sul de Santa Catarina f) Análise e interpretação de dados: nesta etapa, o interesse maior reside em tirar conclusões que auxiliam o pesquisador a atingir seu objetivo, ou seja, encontrar a resposta para a sua pergunta. Todas estas fases são realizadas quando se cumpre um processo de pesquisa. Veja a representação no esquema a seguir: População Amostra Produção de dados Estatística Descritiva Estatística Indutiva Características populacionais Estudo da amostra � tabelas � grá�cos � medidas Características amostrais Figura 1.1 – O processo da pesquisa estatística Fonte: Adaptado de Ação Local de Estatística Aplicada - ALEA (1999-2010). População e amostra Quando você prepara um alimento, pode provar (observar) uma pequena porção. Neste procedimento, você está fazendo o processo de amostragem, ou seja, extraindo do todo (população) uma parte (amostra), com o propósito de inferir (avaliar) a qualidade de todo o alimento. A partir do exemplo, podemos distinguir dois importantes conceitos da Estatística descritiva: população e amostra. População é o conjunto total de elementos com, pelo menos, uma característica em comum, cujo comportamento interessa estudar. 23 Probabilidade e Estatística Unidade 1 A definição dos elementos que serão estudados está ligada diretamente às características levantadas no objetivo da pesquisa, ou seja, é este objetivo que auxiliará na definição desta população. Estes elementos podem ser: animados: pessoas, animais etc.; inanimados: notas fiscais, produtos industrializados etc. Em relação ao número de elementos, a população pode ser: finita: quando tem um número limitado de elementos (número de funcionários de um determinado banco etc.); infinita: quando tem um número ilimitado de elementos (exemplo: número possível de análises químicos que podem ser feitos em um rio poluído etc.). A representação do tamanho da população é dada por N = número de elementos da população. São exemplos de definição de população: Ao estudar a idade e sexo de funcionários da empresa A: para definir a população, devemos considerar todos os funcionários da empresa. Ao estudar a qualidade de peças de uma linha de produção da empresa A: para definir a população, devemos considerar todas as peças produzidas pela empresa. Amostra é o conjunto de elementos ou observações, recolhidosa partir de um subconjunto da população, que se estuda com o objetivo de tirar conclusões para a população de onde foi recolhida. A amostra precisa ser representativa, ou seja, possuir as mesmas características da população. A representação do tamanho da amostra é dada por n = número de elementos da amostra. 24 Universidade do Sul de Santa Catarina Processos estatísticos de abordagem Ao estudar um fenômeno coletivo, ou seja, um fenômeno que se refere a uma determinada população, compreendendo um grande número de elementos, coisas e indivíduos, podemos optar entre os seguintes processos estatísticos: Censo: é uma coleção de dados relativos a todos os elementos de uma população; uma avaliação direta de um parâmetro que utiliza todos os componentes da população. No Brasil, por exemplo, o censo é feito de dez em dez anos, momento em que são pesquisados todos os domicílios brasileiros. Principais propriedades do censo: » admite erro processual zero e tem confiabilidade 100%; » é caro e lento; » quase sempre desatualizado; » nem sempre é viável. Parâmetro: usado para designar alguma característica descritiva dos elementos da população (percentagem, média etc.). Estimação: é uma avaliação indireta de um parâmetro com base em um estimador, através do cálculo de probabilidades. Nesse caso, utiliza-se uma amostra. Principais propriedades da estimação: » admite erro processual positivo e tem confiabilidade menor que 100%; » é barata e rápida; » é atualizada; » é sempre viável. O censo era considerado uma pesquisa desatualizada pela demora da publicação dos dados, mas a tecnologia veio para diminuir em muito esse tempo de publicação. No ano de 2010, constatamos que os dados foram publicados com mais rapidez que nas décadas anteriores. Acesse o site do Instituto Brasileiro de Geografia e Estatística (IBGE) e consulte informações da sua cidade e do seu estado. 25 Probabilidade e Estatística Unidade 1 Estimativa: é o valor assumido por certa estatística (exemplo: 60% é o valor de estimativa do referido parâmetro). Amostragem Como já foi exposto nesta unidade, as pesquisas são realizadas por meio de estudo dos elementos que compõem uma amostra extraída da população que se pretende analisar. O conceito de população é intuitivo. Trata-se do conjunto de indivíduos ou objetos que apresentam, em comum, determinadas características definidas para o estudo. Amostra é um subconjunto da população. O estudo de todos os elementos da população possibilita conhecimento preciso das variáveis que estão sendo pesquisadas; todavia nem sempre é possível obter as informações de todos os elementos da população. Limitações de tempo, custo e as vantagens do uso das técnicas estatísticas justificam o uso de planos amostrais. A representatividade da amostra dependerá do seu tamanho (quanto maior, melhor). O investigador procurará acercar-se de cuidados, visando à obtenção de uma amostra significativa, ou seja, que de fato represente toda a população da melhor maneira possível. (FONSECA, 1996). Observe, a seguir, mais alguns conceitos do processo estatístico, relacionados à amostragem: Estatística: característica descritiva dos elementos da amostra (percentagem, média etc.). Erro amostral: é a máxima diferença que o investigador/ pesquisador admite entre a média da população e a média da amostra. Em pesquisa, admite-se o uso do erro amostral entre 2% a 7%. Observe, por exemplo, as pesquisas eleitorais, a grande maioria destas pesquisas é efetuada com erro amostral de 2%. Isto significa que pode variar de −2% a +2%. Quando se diz que dois candidatos estão com empate técnico, isso quer dizer que, somando ou diminuindo 2%, estão empatados. 26 Universidade do Sul de Santa Catarina O candidato A está com 48% da preferência dos votos, e o candidato B está com 52% da preferência dos votos. O candidato A tem 48%; diminuindo os 2% = 46; com 48% mais 2% = 50%. Já, o candidato B tem 52% menos 2% = 50%; com 52% + 2% = 54%. Logo, os candidatos estão empatados tecnicamente, com 50% cada. Nível de confiança: é expressa em percentual e representa quantas vezes o percentual real da população encontra-se dentro do intervalo de confiança. O nível de confiança de 95% significa que você tem 95% de certeza. A maioria dos pesquisadores usa o nível de confiança de 95%. Como podemos ver, o uso da amostragem é vantajoso por trazer: economia: é mais econômico o levantamento de somente uma parte da população, muitas vezes pelo custo do próprio levantamento e também por não ser mais possível recuperar elementos da população; tempo: em pouco tempo, pode-se pesquisar uma amostra, ao contrário de uma população; confiabilidade: quando se pesquisa um número menor de elementos, pode-se dar mais atenção, evitando erros nas respostas. – Até aqui, vimos alguns conceitos básicos de estatística. Mas, entre os conceitos fundamentais da Estatística, é importante distinguir variáveis estatísticas de dados estatísticos. Estes assuntos serão tratados na próxima seção. Vamos adiante... Bons Estudos! 27 Probabilidade e Estatística Unidade 1 Seção 2 – Variáveis Variáveis são conjuntos de características que podem ser observadas e/ou medidas em cada elemento da população ou amostra, sob as mesmas condições. Ao analisar uma determinada experiência, um fato ou um elemento, você pode verificar que todos eles assumem diferentes características ou valores. Ao analisar um determinado setor de uma empresa, você pode verificar, entre seus funcionários, algumas características como sexo, idade, salário, assiduidade etc. Estas características variam de elemento para elemento, por isto são chamadas de variáveis. As variáveis são classificadas em dois tipos: Qualitativas: representam a informação que identifica alguma qualidade, categoria ou característica, não suscetível de medida (não numérica), mas de classificação, assumindo várias modalidades. Estado civil: casado, solteiro, viúvo, divorciado. Sexo: masculino e feminino. Escolaridade: 1º grau, 2º grau, 3º grau. As variáveis qualitativas estão divididas em: Nominais: são dados caracterizados por rótulos ou categorias. Por exemplo, sexo, estado civil, cor dos olhos etc.; Ordinais: são dados caracterizados por uma ordem, mas não podem ser diferenciados por valor numérico. Por exemplo: nível de escolaridade (1º, 2º e 3º graus), intensidade da luz (muito forte, forte, média, suave, muito suave). 28 Universidade do Sul de Santa Catarina Quantitativas: representam a informação resultante de características suscetíveis de serem medidas, apresentam-se com diferentes intensidades. Idade: 19 anos, 20 anos, 35 anos. Número de nascidos vivos: 10, 15, 22, 12, 14. Peso: 55 kg, 66 kg, 71 kg. As variáveis quantitativas estão divididas em: Variáveis discretas: se ela pode assumir um conjunto constante discreto, ou seja, enumerável, finito de valores. Geralmente são expressas por valores inteiros não negativos. Por exemplo: número de pessoas do setor, quantidade de notas fiscais (observação: não se pode considerar meia nota fiscal ou meia pessoa). Variáveis contínuas: são as variáveis em que não conseguimos enumerar seus possíveis resultados, por estes formarem um conjunto infinito de valores, num intervalo de números reais. Por exemplo: peso, altura, temperatura. Diferença entre as variáveis discreta e contínua Você, à noite, ao ir deitar, tem 1,65m e desperta pela manhã com 1,70m. Você cresce 5cm de forma instantânea? Não, você cresce aos poucos e, entre 1,65 e 1,70, você tem infinitas alturas. Para a variável discreta, observamos que não é possível aumentar o número de pessoasde 22 para 22,57. Não podemos aumentar em 0,57 pessoa. Só podemos aumentar em uma unidade. 29 Probabilidade e Estatística Unidade 1 Seção 3 – Dados Dados estatísticos são medidas da presença de um determinado conjunto de valores de uma variável numa população ou amostra. Os tipos de dados estatísticos são: dados primários: quando são observados e/ou levantados pelo próprio pesquisador ou organização que os tenha recolhido; dados secundários: quando são observados e/ou levantados por outra organização ou pesquisador. Além desta classificação, os dados também pode ser absolutos e relativos. Nesta seção, vamos aprender a transformar dados absolutos em dados relativos, mas, antes disso, vamos conhecer suas definições. Dados absolutos são dados estatísticos resultantes da coleta direta da fonte, sem outra manipulação a não ser a contagem ou medida. A leitura dos dados absolutos é sempre enfadonha e inexpressiva. Embora esses dados traduzam um resultado exato e fiel, não têm a virtude de ressaltar de imediato as suas conclusões numéricas. Daí o uso imprescindível que faz a Estatística dos dados relativos. O número de vezes que um valor da variável de uma pesquisa é citado representa a frequência absoluta daquele valor. Dados relativos são o resultado de comparações por quociente (razões) que se estabelecem entre dados absolutos e têm por finalidade realçar ou facilitar as comparações entre quantidades. Traduzem-se os dados relativos, em geral, por meio de: percentagens; coeficientes; taxas; índices. 30 Universidade do Sul de Santa Catarina A frequência relativa é o quociente entre a frequência absoluta de uma variável e o total de citações de todas as variáveis da pesquisa. Percentagens e proporções Permitem padronizar distribuições de frequência quanto ao tamanho, ou seja, comparam grupos de diferentes frequências totais. Na proporção (P), compara-se o número de sujeitos de uma dada categoria (F) com o número total de sujeitos (N). Num grupo de 20 alunos, 10 gostam de futebol. Assim, a proporção será dada por: Logo, a proporção é de 0,50, ou seja, de cada dois indivíduos um gosta de futebol. Em percentagem, entretanto, podemos multiplicar esta proporção por 100, obtendo, assim, a porcentagem ou percentagem. Então, de acordo com o exemplo dado, temos: (Porcentagem) Portanto, de cada 100 alunos, 50 gostam de futebol. No próximo exemplo, consideremos a tabela a seguir: 31 Probabilidade e Estatística Unidade 1 Tabela 1.1 – Área territorial brasileira por região – 2010 Região Área territorial em km2 Centro-Oeste 1.606.371 Nordeste 1.554.257 Norte 3.853.327 Sudeste 924.511 Sul 576.409 Total 8.514.875 Fonte: IBGE (2010). Nesse caso, vamos identificar qual percentual do território nacional cada região ocupa em relação ao total. Para isso, precisamos dividir a área territorial de cada região pela área total e multiplicar por 100. Calculemos as percentagens de cada região: Centro-Oeste = 1.606.371 ÷ 8.514.875 = 0,1886 × 100 = 18,87% Nordeste = 1.554.257 ÷ 8.514.875 = 0,1825 × 100 = 18,25% Norte = 3.853.327 ÷ 8.514.875 = 0,4525 × 100 = 45,25% Sudeste = 924.511 ÷ 8514.875 = 0,1086 × 100 = 10,86% Sul = 576.409 ÷ 8.514.409 = 0,06769 × 100 = 6,77% Agora, vamos acrescentar na tabela uma coluna com os percentuais. 32 Universidade do Sul de Santa Catarina Tabela 1.2 – Área territorial brasileira por região – 2010 Região Área territorial em km2 Percentual (%) Centro-Oeste 1.606.371 18,87 Nordeste 1.554.257 18,25 Norte 3.853.327 45,25 Sudeste 924.511 10,86 Sul 576.409 6,77 Total 8.514.875 100,0 Fonte: IBGE (2010). Observe que, no resultado do cálculo do percentual, foram aplicadas regras de arredondamento. Considerando que cada região representa uma proporção do todo, o total precisa fechar com 100%. Nesse exemplo, os dados referentes à área territorial são dados secundários e absolutos. Secundários porque não foram pesquisados por nós, e sim pelo IBGE; e absolutos porque estão na tabela como foram coletados. Já no percentual, os dados são relativos porque sofreram transformações: são dados de comparações. Coeficientes e taxas São razões que comparam o número de ocorrências de certo evento com ele mesmo, acrescido das não ocorrências (mas que poderiam ter ocorrido); e a razão entre variáveis da mesma espécie. Coeficientes São razões entre o número de ocorrências e o número total (que é o número de ocorrências e não ocorrências). Os coeficientes são multiplicados por 100, para transformá-los em taxa. 33 Probabilidade e Estatística Unidade 1 Coeficiente de natalidade = Número de nascimentos População total Coeficiente de mortalidade infantil = Número de óbitos Número de nascimento total Taxas São os coeficientes multiplicados por 100 ou 1.000. As taxas de mortalidade infantil e de natalidade são multiplicadas por 1.000, por serem números muito pequenos. A taxa nacional de mortalidade infantil do Brasil, segundo o IBGE – dados de 2007 –, é de 19,3 por mil nascimentos. Índices São métodos que comparam duas grandezas distintas, ou seja, uma não inclui a outra. Densidade demográfica = População Superfície Densidade aluno/professor = Número de alunos Número de professores Densidade aluno/ sala de aula = Número de alunos Número de sala de aula 34 Universidade do Sul de Santa Catarina Índices econômicos Produção per capita = Valor total da produção População Consumo per capita = Consumo de bem População Renda per capita = Renda População – Você pôde conhecer, nas duas últimas seções, as definições e diferen‑ ças das variáveis e dos dados estatísticos. Na próxima seção, serão apresentadas séries estatísticas... Bons estudos! Seção 4 – Séries Série estatística define-se como toda e qualquer coleção de dados estatísticos referidos a uma mesma ordem de classificação. Quantitativa em seu sentido mais amplo, o termo série refere-se a uma sucessão de números referidos a qualquer variável. Os resultados estatísticos são apresentados em quadros ou tabelas para maior clareza, objetividade e melhor visão do conjunto, oferecendo, assim, vantagens para uma análise matemática das mesmas. A série estatística pode ser definida, portanto, como qualquer tabela que apresente a distribuição de um conjunto de dados estatísticos. Tabela é a organização racional e prática de apresentação dos dados estatísticos e a sintetização dos dados no mínimo espaço para colocar o máximo de informações. 35 Probabilidade e Estatística Unidade 1 Tipos de séries Para diferenciar uma série estatística de outra, há que levar em conta três caracteres presentes na tabela que se apresenta: época: fator temporal ou cronológico a que se refere o fenômeno analisado; local: fator geográfico onde o fenômeno acontece; fenômeno: espécie ou fato ou fator específico que é descrito. Conforme a variação dos elementos da série, é possível classificá- las em temporal, geográfica específica e conjugada. a) Série temporal: identifica-se por descrever a variável no decorrer de um determinado período de tempo. Esta série também é chamada de histórica ou evolutiva. Observe a tabela que registra os nascidos vivos registrados segundo o ano do registro no Brasil. Tabela 1.3 – Nascidos vivos registrados segundo o ano do registro no Brasil Anos Nº de nascidos 1984 2.559.038 1985 2.619.604 1986 2.779.253 Fonte: IBGE (2010). b) Série geográfica: identifica-se por descrever a variável considerando o fator geográfico. Também é chamada de espacial, territorial ou de localização. Observe a tabela que registra as mulheresde dez anos ou mais de idade, total, que tiveram filhos nascidos vivos – Censo de 2000 – segundo as Mesorregiões: 36 Universidade do Sul de Santa Catarina Tabela 1.4 – Mulheres de dez anos ou mais de idade, total, tiveram filhos nascidos vivos – Censo de 2000 - segundo as Mesorregiões Mesorregiões Mulheres de dez anos ou mais de idade que tiveram filhos nascidos vivos Grande Florianópolis 211.763 Norte Catarinense 267.448 Oeste Catarinense 297.814 Serrana 106.025 Sul Catarinense 224.287 Vale do Itajaí 319.195 Fonte: IBGE (2010). c) Série específica: o caráter variável é apenas o fato ou espécie. Também é chamada de série categórica. Observe a tabela que registra as pessoas de dez anos ou mais de idade que viviam em companhia de cônjuge ou companheiro(a), por natureza da união, segundo as Mesorregiões – Santa Catarina – Censo de 2000. Tabela 1.5 – Pessoas de dez anos ou mais de idade que viviam em companhia de cônjuge ou companheiro(a), por natureza da união, segundo as Mesorregiões – Santa Catarina – Censo de 2000 Natureza da união Número de pessoas de dez anos ou mais de idade Casamento civil e religioso 1.666.621 Só casamento civil 189.741 Só casamento religioso 85.543 União consensual 521.001 Fonte: IBGE (2010). d) Séries conjugadas: também chamadas de tabelas de dupla entrada. São apropriadas à apresentação de duas ou mais séries de maneira conjugada, havendo duas ordens de classificação: uma horizontal e outra vertical. Observe a tabela a seguir, que registra a quantidade de mortes por acidente de trânsito em São Paulo, nos anos de 1997 e 1998. 37 Probabilidade e Estatística Unidade 1 Tabela 1.6 – Quantidade de mortes por acidente de trânsito em São Paulo, nos anos de 1997 e 1998 (dados fictícios) Idade 1997 1998 Até 10 anos 69 45 De 10 a 19 anos 212 165 De 20 a 49 anos 868 628 De 50 anos e mais 382 287 Idade Ignorada 51 40 Fonte: Elaboração do autor (2006). As séries conjugadas ainda podem ser geográfico- temporal e geográfico-específica. Síntese Nesta unidade, você estudou conceitos básicos e introdutórios da Estatística. Também conheceu quais são as etapas do processo de uma pesquisa para que se possa alcançar um resultado fiel, que traduza a realidade. Você pôde estudar alguns conceitos importantes como população e amostra, variáveis, dados e séries. Todos estes novos conhecimentos serão muito importantes para você dar sequência ao estudo da Estatística. 38 Universidade do Sul de Santa Catarina Atividades de autoavaliação Ao final de cada unidade, você realizará atividades de autoavaliação. O gabarito está disponível no final do livro didático, mas se esforce para resolver as atividades sem a ajuda do gabarito, pois, assim, você estará promovendo (e estimulando) a sua aprendizagem. 1) Analise os conceitos de censo e estimação e descreva a principal diferença entre os termos. 2) Ao escolher os elementos de uma amostra, o que você deve considerar para que ela seja representativa? Por quê? 39 Probabilidade e Estatística Unidade 1 3) Como você pôde acompanhar, existem dois tipos de variáveis: a qualitativa, que está dividida em nominal e ordinária, e a quantitativa, que está dividida em contínua e discreta. Identifique, no seu dia a dia, pelo menos um exemplo de cada uma destas variáveis e as escreva no quadro a seguir: Variável Exemplo Qualitativa nominal Qualitativa ordinal Quantitativa discreta Quantitativa contínua 4) Ao planejar uma pesquisa sobre uma determinada síndrome, um pesquisador tem a intenção de usar um questionário para a coleta de dados e, também, planeja fazer levantamento de dados no Ministério da Saúde, para que possa realizar comparativos. Como consequência disto, ele terá que trabalhar com dois tipos de dados: os resultantes dos questionários e os resultantes do levantamento no Ministério. Classifique os dois tipos de dados. a) Os dados coletados por meio de questionário são: ________________ b) Os dados coletados no Ministério:_____________________________ 40 Universidade do Sul de Santa Catarina 5) Classifique cada uma das variáveis a seguir em qualitativa nominal ou ordinal e em quantitativa discreta ou contínua: Descrição da variável Classificação Saldo em conta corrente em R$ Idade do cliente Sexo do cliente Classe econômica Estado civil Número de defeitos do produto Consumo de energia em kWh Grau de instrução Número de filhos Hierarquia de uma empresa Número de filhos de uma família Diâmetro da peça produzida Comprimento da peça Tempo de espera em caixa eletrônico em minutos Nome de país exportador de petróleo Grau de satisfação no atendimento numa loja comercial Número de ações negociadas na bolsa de valores Número de alunos de uma universidade Altura dos funcionários de uma empresa 41 Probabilidade e Estatística 6) Observe as duas tabelas a seguir e classifique as séries estatísticas de cada uma delas. Tabela A – Pessoas de dez anos ou mais de idade, por estado civil e condição de convivência – Santa Catarina – Censo de 2000 Estado civil Casado(a) Desquitado(a) ou separado(a) judicialmente Divorciado(a) Viúvo(a) Solteiro(a) Mesorregiões Grande Florianópolis 267.867 18.697 16.779 28.224 333.974 Norte Catarinense 380.222 21.098 13.630 38.037 379.194 Oeste Catarinense 439.967 16.130 9.174 38.856 399.587 Serrana 142.373 6.738 4.814 15.834 150.964 Sul Catarinense 314.348 14.021 12.068 32.261 302.894 Vale do Itajaí 443.839 25.825 20.433 46.595 439.800 Fonte: IBGE (2010). Tabela B – Metabolismo basal (cal/dia) em adolescentes (dados fictícios) Metabolismo basal (cal/dia) Número de adolescentes 910 |-- 989 3 989 |-- 1068 5 1068 |-- 1147 9 1147 |-- 1226 5 1226 |-- 1305 8 1305 |-- 1384 3 1384 |-- 1463 2 Fonte: Elaboração do autor (2006). 42 Universidade do Sul de Santa Catarina Saiba mais Se você desejar, aprofunde os conteúdos estudados nesta unidade ao consultar as seguintes referências: CRESPO, Antônio Arnot. Estatística fácil. 19. ed. São Paulo: Saraiva, 2009. FONSECA, Jairo Simon da; MARTINS, Gilberto de Andrade. Curso de estatística. 6. ed. São Paulo: Atlas, 1996. RAUEN, Fábio. Roteiro de pesquisa. Rio de Sul: Nova Era, 2006. SILVA, Ermes Medeiros da. Estatística para os cursos de economia, administração e ciências contábeis. 3. ed. São Paulo: Atlas, 1996. v. 1. TRIOLA, Mario F. Introdução à estatística. 7. ed. Rio de Janeiro: LTC, 1999. 2UNIDADE 2Distribuição de frequências e representação gráfica Objetivos de aprendizagem Organizar dados brutos de acordo com os tipos de variáveis. Compreender, organizar e analisar a distribuição de frequência. Montar tabelas de distribuição de frequência para variáveis qualitativas e quantitativas. Analisar e interpretar gráficos. Seções de estudo Seção 1 Representação numérica Seção 2 Tipos de frequência Seção 3 Representação gráfica 44 Universidade do Sul de Santa Catarina Para início de estudo Nesta unidade, você vai trabalhar com a organização dos dados estatísticos propriamente ditos. De posse dos dados de forma desorganizada, um primeiro passo seria organizá-los em tabelas para que possibilite uma primeira análise, além de servir para uma série de interpretações. Você poderá aprender como se organizam dados brutos e como pode ser analisada a distribuição de frequências. Você também terá a oportunidade de adquirir mais uma importante ferramenta para utilizar na análise e interpretação de dados: a representação gráfica. Você irá conhecer alguns tipos de representação gráfica mais utilizados e suas características. Poderá constatar que os dados representados por meio de gráficos,muitas vezes, facilitam a leitura e a compreensão de algum fenômeno ou acontecimento. Seção 1 – Representação numérica Para iniciar o estudo desta unidade, antes de qualquer coisa, você precisa saber o que são dados brutos e dados agrupados. Dados brutos Dados brutos são sequências de valores numéricos ou não, os quais não sofreram qualquer tratamento estatístico, nem foram organizados, obtidos diretamente da observação de um fenômeno. 45Unidade 2 Probabilidade e Estatística Mais precisamente, dados brutos são os dados apresentados da forma como foram coletados na pesquisa ou levantamento, desorganizados, sem ordenação. Acompanhe os exemplos de levantamento de dados de acordo com o tipo de variável: qualitativa, quantitativa discreta ou quantitativa contínua. Para uma variável qualitativa Em um levantamento realizado com 56 clientes de um banco, foram obtidos os seguintes dados sobre o tipo de investimento em que mais confiavam, conforme legenda: I M R P I I P R P R I P P I R I P P P M I P P P M P I I I M P R M R R P M M P R I R M P P I R P M P I P P M P I Quadro 2.1 – Levantamento sobre o tipo de investimento que os clientes do banco mais confiavam Fonte: Elaboração do autor (2006). Legenda do quadro: I – Investimentos imobiliários M – Investimento em mercado de ações P – Investimento em poupança R – Investimento em fundos de renda fixa Repare que, neste caso, foram pesquisados 56 clientes e foram anotadas as respostas na ordem das entrevistas. Para uma variável quantitativa discreta O controle de qualidade de uma fábrica de rolamentos vem analisando os lotes para detectar defeitos nas peças fabricadas. Cada lote contém 56 peças. A seguir, está relacionado o número de defeitos por peça, conforme estas são produzidas neste lote: 46 Universidade do Sul de Santa Catarina 1 1 4 1 0 0 1 6 5 0 0 0 0 0 0 0 0 1 0 0 1 0 3 2 4 2 0 0 2 0 1 0 0 0 3 3 0 0 4 0 0 1 0 2 0 0 1 0 3 0 0 0 3 0 0 0 Quadro 2.2 – Levantamento sobre o número de defeitos por peça de uma fábrica de rolamentos Fonte: Elaboração do autor (2006). Repare que foram analisadas 56 peças e foram anotados os números de defeitos por peça, na ordem em que estas foram produzidas. Para uma variável quantitativa contínua Os valores anotados a seguir representam o volume de vendas mensal de 56 representantes de uma empresa que fabrica remédios. Os valores estão em milhares de reais: 23,25 27,43 17,76 33,33 33,05 16,08 34,49 23,74 32,63 20,58 18,50 16,69 16,43 20,08 19,00 16,13 21,36 26,60 22,49 22,77 23,05 33,55 22,73 24,89 24,11 34,83 21,73 31,53 35,13 34,36 20,80 16,84 29,55 34,76 31,72 24,89 21,65 22,65 30,43 30,93 17,25 17,05 19,67 22,79 25,30 23,08 25,77 35,03 16,59 15,90 20,30 33,86 17,76 30,93 20,81 29,05 Quadro 2.3 – Levantamento sobre o volume de vendas mensal de 56 representantes de uma empresa que fabrica remédios Fonte: Elaboração do autor (2006). Dados agrupados Dados agrupados são sequências de valores numéricos, ou não, os quais se encontram já organizados, ou por semelhança (qualitativas), ou por ordenação numérica (quantitativas), em tabelas. 47 Probabilidade e Estatística Unidade 2 Tabelas para variável qualitativa Para montar uma tabela com variável qualitativa, acompanhe o exemplo, a seguir, de um levantamento de dados acerca do tipo de investimento em que os clientes de um banco mais confiavam. Veja passo a passo 1º passo: para começar, você deve organizar os dados por semelhança. I I I I I I I I I I I I I I M M M M M M M M M M P P P P P P P P P P P P P P P P P P P P P P R R R R R R R R R R Quadro 2.4 – Levantamento sobre o tipo de investimento que os clientes do banco mais confiavam Fonte: Elaboração do autor (2006). Legenda do quadro: I – Investimentos imobiliários M – Investimento em mercado de ações P – Investimento em poupança R – Investimento em fundos de renda fixa Repare que os dados estão organizados por tipo de investimento. 2º passo: agora você vai escrever, em uma coluna, cada uma das opções verificadas. Contar o número de vezes em que cada tipo aparece e marcar com traços, ao lado, para representar as aparições. Em seguida, conte o número de traços para obter o número de vezes que cada opção aparece. Observe, a seguir, a contagem dos dados. I = 14 M = 10 P = 22 R = 10 48 Universidade do Sul de Santa Catarina 3º passo: após a contagem e organização dos dados, agora é só montar a tabela, sem esquecer nenhum de seus componentes. Acompanhe: Tabela 2.1 – Tipos de investimento Tipo de investimento Número de clientes Imobiliário 14 Mercado de ações 10 Poupança 22 Fundos de renda fixa 10 Total 56 Fonte: Elaboração do autor (2006). Essas tabelas são denominadas de distribuição de frequências. Tabelas para variável quantitativa discreta Nesta seção, vamos verificar como montar uma tabela com variável quantitativa discreta. Para saber como são montados estes tipos de tabela, acompanhe os passos apresentados a seguir. Observe que a opção de montar uma tabela sem intervalos se deve ao fato de esta série ter um número de elementos distintos pequeno. 49 Probabilidade e Estatística Unidade 2 Veja passo a passo 1º passo: para começar organize os dados em ordem crescente. 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 2 2 2 2 3 3 3 3 3 4 4 4 5 6 Quadro 2.5 – Levantamento sobre o número de defeitos por peça de uma fábrica de rolamentos Fonte: Elaboração do autor (2006). Repare que foram organizados conforme uma ordem numérica crescente (de 0 a 6). 2º passo: escreva, em uma coluna, cada um dos valores observados. Conte o número de vezes em que cada tipo aparece e marque com traços, ao lado, para representar as aparições. Após, conte o número de traços para obter o número de vezes em que cada valor aparece. Observe, a seguir, a contagem dos dados. 0 33 1 9 2 4 3 5 4 3 5 1 6 1 A organização de dados na forma de lista em ordem – crescente ou decrescente –, é chamada de Rol. 50 Universidade do Sul de Santa Catarina 3º passo: agora é só montar a tabela, sem esquecer nenhum de seus componentes. Tabela 2.2 – Número de defeitos por peças analisadas do lote Fonte: Elaboração do autor (2006). Nesta tabela, utilizamos algumas expressões estatísticas para representação dos elementos: os valores que a variável pode assumir é representado por xi; o número de observações de cada linha chama-se de frequência simples, denotada por fi; e o número total de observações chama-se de frequência total e pode ser denotada por N (tamanho da população), n (tamanho da amostra) ou . 51 Probabilidade e Estatística Unidade 2 Tabelas para variável quantitativa contínua A opção de montar uma tabela com intervalos é preferível porque esta série possui um grande número de elementos distintos ou, ainda, quando os valores apresentam uma natureza de continuidade. Vamos acompanhar um exemplo para montagem das tabelas para variável quantitativa contínua. Os valores anotados a seguir representam o volume de vendas mensal de 56 representantes de uma empresa que fabrica remédios. Os valores estão em milhares de reais. Veja passo a passo 1º passo: para começar, você deve organizar os dados em ordem crescente (Rol). 15,90 16,08 16,13 16,43 16,59 16,69 16,84 17,05 17,25 17,76 17,76 18,50 19,00 19,67 20,08 20,30 20,58 20,80 20,81 21,36 21,65 21,73 22,49 22,65 22,73 22,77 22,79 23,05 23,08 23,25 23,74 24,11 24,89 24,89 25,30 25,77 26,60 27,43 29,05 29,55 30,43 30,93 30,93 31,53 31,72 32,63 33,05 33,33 33,55 33,86 34,36 34,49 34,76 34,83 35,03 35,13 Quadro 2.6 – Levantamento sobre o volumede vendas mensal de 56 representantes de uma empresa que fabrica remédios Fonte: Elaboração do autor (2006). Para a variável quantitativa contínua, utilizam-se intervalos na tabela para representar a série de dados. Estes intervalos denominam-se intervalos de classes. 52 Universidade do Sul de Santa Catarina 2º passo: você deve calcular o número e o tamanho dos intervalos. O número de intervalos (k) é obtido a partir dos seguintes critérios: critério da raiz ; fórmula de Sturges k = 1 + 3,3.log n; Sendo n = tamanho da amostra (poderá ser usado N, quando for com a população). Observe que: 1. Ainda que existam dois critérios, em geral, o critério utilizado é o da raiz: . 2. O número do intervalo (k), em alguns casos, pode ser predefinido. 3. As tabelas devem ter, no mínimo, 5 e, no máximo, 20 intervalos de classes, para que não haja nem perda, nem excesso de informação. Para este estudo, sendo n o número de elementos da amostra, n = 56, e , então , logo k = 7 e o número de intervalos utilizados será igual a 7. Agora, vamos analisar as amplitudes e os limites de classe para determinar o tamanho dos intervalos. a) Amplitude total da distribuição (AT): é a diferença entre o maior valor e o menor valor observado. AT = L(máx) – l(mín) L(máx) = Limite máximo (maior valor) l(min) = Limite mínimo (menor valor) 53 Probabilidade e Estatística Unidade 2 No exemplo que você está estudando: AT = 35,13 − 15,90 AT = 19,23 19,50 Nesta etapa, é conveniente que o resultado seja arredondado para cima, a fim de que não haja perda de informação. b) Amplitude de um intervalo de classe (h): também chamada de tamanho do intervalo de classe, é obtida da seguinte forma: No exemplo: Antes de partir para a construção da tabela, é conveniente testar se os cálculos estão corretos. Para que isso aconteça, verifique se: h.K > AT Aplique sobre o exemplo dado: 2,80 . 7 = 19,60 > 19,23 Ou seja, ao somar 19,60 ao menor valor observado resulta 35,50, que é maior que o valor da maior observação, 35,13. 15,90 + 19,60 = 35,50 > 35,13 Caso não seja satisfeita esta condição, será necessário fazer um ajuste, aumentando o tamanho do intervalo. Então, resumindo, segundo o exemplo dado, a tabela terá: 54 Universidade do Sul de Santa Catarina sete intervalos; cada um com o tamanho de 2,80. c) limites de classes: são os extremos de cada classe. O limite inferior da classe (Li) é o menor número do intervalo. O limite superior (Ls) é o maior número do intervalo. 3º passo: escreva os intervalos da tabela. Comece pela primeira classe, escreva o menor valor observado. 15,90 A este valor, some o h (2,8) e encontre o limite superior deste intervalo: 15,9 + 2,8 = 18,7. Você deve escrever na tabela: 15,90 |--- 18,70 Na segunda classe, repita o último valor da classe anterior (18,7), some o h (2,8) e encontre o limite superior deste intervalo: 18,7 + 2,8 = 21,5. Você pode escrever na tabela: 18,70 |--- 21,50 Na terceira classe, repita o último valor da classe anterior (21,5), some o h (2,8) e encontre o limite superior deste intervalo: 21,5 + 2,8 = 24,3. Você pode escrever na tabela: 21,50 |--- 24,30 Usando este procedimento para as outras classes, você terá os seguintes intervalos a seguir, até a sétima classe: 24,30 |--- 27,10 27,10 |--- 29,90 29,90 |--- 32,70 Observe que os intervalos são escritos dessa forma: 15,90 |--- 18,70. O que significa? A representação indica um intervalo fechado à esquerda e aberto à direita Þ [15,90; 18,70), ou seja, os valores deste intervalo chegam perto de 18,70, mas o valor 18,70 está no próximo intervalo: 18,70 |--- 21,50; o valor 21,50 não está neste intervalo, e sim no intervalo: 21,50 |---24,30. E assim por diante. 55 Probabilidade e Estatística Unidade 2 4º passo: agora é a vez de partir para a construção da tabela, sem se esquecer de seus componentes. Primeiro monte a tabela e escreva os intervalos. Tabela 2.3 – Volume de vendas mensal, em milhares de reais, dos representantes de uma empresa que fabrica remédios – outubro/2010 Classe Volume de vendas (em mil reais) 1 15,90 |--- 18,70 2 18,70 |--- 21,50 3 21,50 |--- 24,30 4 24,30 |--- 27,10 5 27,10 |--- 29,90 6 29,90 |--- 32,70 7 32,70 |--- 35,50 Fonte: Elaboração do autor (2006). 5º passo: agora é só contar e marcar o número de valores em cada intervalo. É aconselhável marcar os limites dos intervalos no Rol e usar os traços para indicar a contagem ou marcar como no quadro a seguir: 15,90 16,08 16,13 16,43 16,59 16,69 16,84 17,05 17,25 17,76 17,76 18,50 19,00 19,67 20,08 20,30 20,58 20,80 20,81 21,36 21,65 21,73 22,49 22,65 22,73 22,77 22,79 23,05 23,08 23,25 23,74 24,11 24,89 24,89 25,30 25,77 26,60 27,43 29,05 29,55 30,43 30,93 30,93 31,53 31,72 32,63 33,05 33,33 33,55 33,86 34,36 34,49 34,76 34,83 35,03 35,13 Quadro 2.7 – Volume de vendas mensais Fonte: Elaboração do autor (2006). 56 Universidade do Sul de Santa Catarina Tabela 2.4 – Volume de vendas mensal, em milhares de reais, dos representantes de uma empresa que fabrica remédios – outubro/2010 Classe Volume de vendas (em mil reais) Contagem Nº de representantes (fi) 1 15,9 18,7 12 2 18,7 21,5 8 3 21,5 24,3 12 4 24,3 27,1 5 5 27,1 29,9 3 6 29,9 32,7 6 7 32,7 35,5 10 Total ( ) 56 Fonte: Elaboração do autor (2006). E, no final, a tabela fica como está apresentado a seguir: Tabela 2.5 – Volume de vendas mensal, em milhares de reais, dos representantes de uma empresa que fabrica remédios – outubro/2010 Fonte: Elaboração do autor (2006). Até aqui, você estudou dois tipos de frequência: a simples e a total, e pôde aprender que: o número de observações de cada linha chama‑se frequência simples, fi; e o número total de observações chama‑se frequência total, . Na seção a seguir, você irá aprender que, além destas duas, existem outros tipos de frequência. 57 Probabilidade e Estatística Unidade 2 Seção 2 – Tipos de frequência A Estatística tem como uma de suas finalidades facilitar a análise e a leitura dos dados, e, justamente, para isso, um dos métodos utilizados é trabalhar com tipos de frequência. Estes tipos de frequência lhe serão apresentados a seguir. Frequência acumulada Na tabela, na coluna da frequência acumulada, você deverá escrever o valor acumulado das frequências, ou seja, para começar, repita a frequência simples da primeira linha e, nas linhas seguintes, some a frequência simples à frequência acumulada anterior. Este processo deverá chegar até a frequência total fa = fa(ant) + fi Sendo: fa: frequência acumulada; fa(ant): frequência crescente da classe anterior; fi: frequência simples da classe; 58 Universidade do Sul de Santa Catarina Acompanhe com atenção a tabela: Tabela 2.6 – Volume de vendas Fonte: Elaboração do autor (2006). Para que serve a frequência acumulada? Imagine que você está apresentando um relatório de vendas da empresa para a diretoria. Então, um dos diretores lhe pergunta: “Quantos representantes tiveram vendas menores que 29,9 mil reais?” Você não necessitará fazer contas, é só observar a quinta classe, na coluna da frequência acumulada na tabela e dizer: “40 representantes!” E se perguntarem: “Quantos representantes venderam abaixo de 24,3 mil reais?” Você vai encontrar a resposta na terceira classe na coluna com a frequência acumulada: “32 representantes”. Observe que o volume de vendas questionado é sempre do limite superior de cada intervalo para baixo. 59 Probabilidade e Estatística Unidade 2 Frequência relativa (fr) É o quociente entre a frequência (fi) da classe e o número total de observações. Sendo: fr: frequênciarelativa da classe; fi: frequência simples da classe; n: número total de observações (pode-se usar n ou ). Neste caso, deve-se calcular a frequência com quatro casas decimais visando ao próximo passo. Tabela 2.7 – Volume de vendas Fonte: Elaboração do autor (2006). 60 Universidade do Sul de Santa Catarina Lembre-se: use sempre quatro casas decimais para arredondar a frequência relativa. Frequência percentual (fp) É a frequência relativa multiplicada por 100. É dada em porcentagem (%). fp = fr . 100 Sendo: fp: frequência percentual; fr: frequência relativa. Tabela 2.8 – Volume de vendas Fonte: Elaboração do autor (2006). 61 Probabilidade e Estatística Unidade 2 Observe que, ao usar quatro casas decimais para a frequência relativa, o percentual ficou com duas casas decimais. Para que serve a frequência percentual? Mais uma vez você está apresentando um relatório de vendas da empresa para a diretoria. E vem aquela pergunta: “O que representa, do total, os representantes que venderam de 32,70 a 35,50 mil reais?” Você poderia responder diretamente, sem cálculos: “17,86%.” E, se perguntarem: “Quantos representantes venderam de 24,3 a 27,1 mil reais ou mais?” Você responderá: “8,93%.” Observe que, neste exemplo, o volume de vendas questionado é sempre um intervalo. Antes de acompanhar os outros tipos de frequência, entenda o que é ponto médio de uma classe. Ponto médio de uma classe são os valores da variável que se encontram exatamente na metade do intervalo de cada classe. Para calcular o ponto médio, usa-se a média aritmética simples dos limites de cada intervalo: Sendo: PM: ponto médio; Ls: limite superior do intervalo; Li: limite inferior de cada intervalo. 62 Universidade do Sul de Santa Catarina A tabela a seguir indica o cálculo do ponto médio para o exemplo que estamos estudando. Tabela 2.9 – Volume de vendas Fonte: Elaboração do autor (2006). Lembre-se deste conceito: o ponto médio será usado para outros cálculos que você irá realizar mais adiante. Seção 3 – Representação gráfica O gráfico constitui outra maneira de se apresentarem os dados estatísticos. Eles têm a finalidade de mostrar com clareza, veracidade e rapidez os dados que estão sendo estudados. Além disso, os gráficos propiciam uma noção muito boa de como algum fenômeno se comporta. Por meio de formas geométricas, os gráficos mostram, por área ou volume, as diferenças entre as opções de cada variável. 63 Probabilidade e Estatística Unidade 2 Tome cuidado ao interpretar um gráfico. Assim como os gráficos podem dar informações rápidas e precisas, sua manipulação pode distorcer a realidade, provocando tendenciosidade nas informações. Observe os gráficos a seguir: Gráfico 2.1 – Censo demográfico Brasil 1890 – 2000 Fonte: IBGE (2010). Gráfico 2.2 – Censo demográfico Brasil 1890 – 2000 Fonte: IBGE (2010). 64 Universidade do Sul de Santa Catarina Observe que, no Gráfico 2.1, a impressão é que a população aumenta abruptamente, enquanto que, no Gráfico 2.2, a impressão é que a população aumenta lentamente. E a única diferença entre os dois gráficos é a largura que se usou para cada um deles. Em alguns casos, isso pode ser muito prejudicial. Os gráficos comunicam as mesmas ideias das tabelas, porém produzem uma impressão e compreensão mais rápida, mais viva, pois eliminam detalhes desnecessários, visualizando somente as características mais importantes dos dados. O gráfico estatístico é uma forma de apresentação dos dados estatísticos, cujo objetivo é o de produzir, no investigador ou no público em geral, uma impressão mais rápida e viva do fenômeno em estudo, já que os gráficos falam mais rápido à compreensão que as séries. A representação gráfica de um fenômeno deve obedecer a certos requisitos fundamentais para ser realmente útil: a) simplicidade: o gráfico deve ser destituído de detalhes de importância secundária, assim como de traços desnecessários que possam levar o observador a uma análise morosa ou com erros; b) clareza: o gráfico deve possibilitar uma correta interpretação dos valores representativos do fenômeno em estudo; c) veracidade: o gráfico deve expressar a verdade sobre o fenômeno em estudo. Para a construção de gráficos, você deverá observar alguns itens que se fazem necessários neles: todo gráfico deve ter título e fonte (no rodapé), para que o leitor não tenha a necessidade de voltar ao texto para saber do que se trata; a escala do eixo horizontal deve ser escrita abaixo desse eixo e deverá crescer da esquerda para a direita; 65 Probabilidade e Estatística Unidade 2 a escala do eixo vertical deve ser escrita à esquerda do eixo e crescer de baixo para cima; cada eixo deve ser identificado com o que está sendo medido ou representado; não é necessário colocar linhas de grade (que saem das marcas das escalas horizontais e verticais). Estas são opcionais. Acompanhe, a seguir, um gráfico com todos os detalhes citados. Gráfico 2.3 – Censo demográfico – Brasil – 1890 – 2000 Fonte: Adaptado de IBGE (2010). Antigamente, os gráficos eram feitos a mão, com a ajuda de régua, compasso, transferidor, esquadros e canetas ou giz coloridos. Hoje, podemos contar com softwares específicos que auxiliam e facilitam na construção de gráficos e, muitas vezes, propiciam mais precisão e clareza. Além dos softwares específicos de Estatística, temos os programas aplicativos de escritório, que incluem as chamadas planilhas eletrônicas. Uma planilha eletrônica utiliza tabelas para a realização de cálculos e permite, também, a criação de vários tipos de gráficos, o que facilita a representação e análise de dados estatísticos. Os principais tipos de gráficos são os diagramas, os cartogramas e os pictogramas. 66 Universidade do Sul de Santa Catarina Na sequência deste estudo, você conhecerá alguns tipos de gráficos relevantes para a apresentação dos dados estatísticos. Vamos identificar cada tipo de gráfico, suas características e formas de análise, quando for o caso. Dentre os gráficos classificados como diagramas, os mais amplamente utilizados (e destacados a seguir) são os gráficos de colunas e de barras. Os outros tipos de gráficos classificados como os cartogramas e os pictogramas serão apresentados ao final desta seção. Diagramas Os diagramas são gráficos geométricos de, no máximo, duas dimensões; para sua construção, em geral, fazemos uso do sistema cartesiano (eixo X e Y). Os principais diagramas são os gráficos de linhas, colunas, barras, setores ou pizza e o gráfico polar. Veja cada um desses tipos. Gráfico de colunas É usado para apresentar séries temporais, geográficas e específicas. Formado por retângulos dispostos verticalmente, de mesma largura (arbitrária), com altura proporcional às grandezas (variáveis) do fenômeno a ser representado. Todos os retângulos têm base comum no eixo de x e, no eixo de y, os valores das variáveis estudadas. Observe os exemplos na tabela 2.10 e nos gráficos 2.4 e 2.5. Tabela 2.10 – Mortalidade Infantil, na região Sul e Sudeste, 2004 Estado Por mil nascimentos SC 17,2 RG 14,3 PR 20,0 SP 16,5 RJ 20,9 ES 20,1 MG 21,8 Fonte: Portal Brasil (2004). 67 Probabilidade e Estatística Unidade 2 Gráfico 2.4 – Mortalidade Infantil, na região Sul e Sudeste, 2004 Fonte: Portal Brasil (2004). Gráfico 2.5 – Porcentagem de mulheres, com filhos antes dos 20 anos, 2000 Fonte: Population Reference Bureau (2000). 68 Universidade do Sul de Santa Catarina Gráfico de barras Segue as mesmas normas do gráfico de coluna, porém os retângulos ocupam posição horizontal e, por isso, terão base comum no eixo y. É também mais indicado para séries
Compartilhar