Baixe o app para aproveitar ainda mais
Prévia do material em texto
Estatística INSTITUTO FEDERAL DO PARANÁ Campus Foz do Iguaçu Profª Drª Luciana Espíndula de Quadros luciana.quadros@ifpr.edu.br PROJETO GERAL DE PESQUISA PROJETO GERAL DE PESQUISA • Planejamento: • Defina as metas da pesquisa. • Defina a população. • Identifique cada membro da população. • Identifique o esquema de amostragem (como escolher a amostra e que tamanho ela deve ter). • Decida que método de coleta de dados utilizar (questionário postal, entrevista etc.). • Projete um questionário (igualmente apropriado para entrevistas pessoais e observação). • Selecione e treine qualquer pessoa envolvida no processo de coleta de dados. PROJETO GERAL DE PESQUISA • Trabalho de campo: • Selecione a amostra. • Colete os dados. • Vá atrás de qualquer resposta que falte sempre que possível. • Ordene e codifique as informações (principalmente se um computador for utilizado para a análise). • Análise e interpretação: • Filtre os dados buscando erros de registro e valores extremos. • Execute qualquer cálculo estatístico. • Identifique e observe qualquer causa possível de erro e/ou vício. PROJETO GERAL DE PESQUISA • Publicação; • Seção estatística detalhada que inclui: • Detalhes dos questionários utilizados; • Detalhes da amostragem; • Teoria estatística por trás da pesquisa; • Resumo dos dados coletados. Estatística Um dos objetivos da Estatística é sintetizar os valores que uma ou mais variáveis podem assumir, para que tenhamos uma visão global da variação dessas variáveis (CRESPO, 2009). Os dados numéricos, após coletados são colocados em série e apresentados em tabelas ou quadros. Séries Estatísticas Consistem na apresentação das informações (variáveis estatísticas) em formas de tabelas, objetivando sintetizar os dados estatísticos observados e tornando-os mais compreensivos. Uma tabela e mesmo um gráfico deve apresentar o cabeçalho, o corpo e o rodapé. Definição Séries Estatísticas Séries Estatísticas Séries Simples Séries Mistas São aquelas em que apenas um fator varia Séries simples − Série histórica (temporal ou cronológica ou evolutiva): onde varia o tempo, mas permanecendo fixos o espaço e a espécie do fenômeno estudado. Séries simples − Série geográfica (territorial ou regional): onde varia o espaço, permanecendo fixos o tempo e a espécie do fenômeno estudado. Séries simples − Série especificativa (qualitativa ou categórica): onde varia a espécie do fenômeno estudado, permanecendo fixos o tempo e espaço. Séries simples Séries Estatísticas Séries Estatísticas Séries Simples Séries Mistas São aquelas em que apenas um fator varia são aquelas em que mais de um fator varia ou um fator varia mais de uma vez. Séries Mistas − Série histórica geográfica (ou geográfica histórica) Séries Mistas − Série especificativa geográfica (ou geográfica especificativa) Séries Mistas − Série especificativa histórica (ou histórica especificativa) Séries Mistas − Série especificativa histórica geográfica Tabela • A tabela é a forma não discursiva de apresentar informações, das quais o dado numérico se destaca como informação central. • Sua finalidade é apresentar os dados de modo ordenado, simples e de fácil interpretação, fornecendo o máximo de informação num mínimo de espaço. • A construção de uma tabela, entretanto, deve obedecer a uma série de normas técnicas. • Estas normas podem ser encontradas na publicação do IBGE intitulada "Normas de Apresentação Tabular“. • Objetivo orientar a apresentação racional e uniforme de dados estatísticos na forma tabular. Elementos da tabela Uma tabela estatística e composta de elementos essenciais e elementos complementares. Os elementos essenciais são: − Titulo: indicação que precede a tabela contendo a designação do fato observado, o local e a época em que foi estudado. − Corpo: conjunto de linhas e colunas onde estão inseridos os dados. − Cabeçalho: parte superior da tabela que indica o conteúdo das colunas. − Coluna indicadora: parte da tabela que indica o conteúdo das linhas. Elementos da tabela Os elementos complementares são: − Fonte: entidade que fornece os dados ou elabora a tabela. − Notas: informações de natureza geral, destinadas a esclarecer o conteúdo das tabelas. − Chamadas: informações especificas destinadas a esclarecer ou conceituar dados numa parte da tabela. Gráficos estatísticos O gráfico estatístico é uma forma de apresentação dos dados estatísticos Objetivo → Proporcionar, ao leitor, uma visualização mais rápida, e de forma mais agradável e atrativa à maioria das pessoas, do conjunto de dados. Forma de resumir as informações do conjunto de dados brutos facilitando a leitura e interpretação dos dados. Requisitos básicos de um gráfico estatístico Simplicidade Trazer apenas o essencial: evitar desenhos, formas tridimensionais, excessos de cores. Clareza Possibilitar a leitura coerente dos valores do conjunto de dados. Veracidade Expressar a verdade sobre o fenômeno representado, ou seja, não apresentar distorção na escala. Escala que não começa no zero, o que dá uma impressão exagerada na taxa de mudança dos valores. Enquanto parece que o valor de mercado das empresas americanas despencou de um pico a zero, na verdade elas desvalorizaram cerca de 17% (de 17,054 para 14,082 trilhões de dólares). Mas o problema mais grave está na escala horizontal. A primeira divisão representa 6 meses (abril, maio, junho, julho, agosto e setembro), e tem 80% do tamanho da segunda divisão. A segunda divisão representa apenas 1 mês (novembro) e é maior que a primeira, que representa 6 meses, e ligeiramente maior que a terceira, que representa 2 meses (janeiro e fevereiro). Normas para representação gráfica ✓ Geralmente, são construídos em um plano cartesiano ortogonal • A variável independente é localizada no eixo horizontal (x); • A variável dependente é localizada no eixo vertical (y); ✓ Iguais intervalos para medida deverão corresponder a iguais intervalos para a escala. Exemplo: Se, ao intervalo entre 10 a 15 kg corresponde a 2 cm na escala, ao intervalo entre 40 e 45 kg també, deverá ser de 2 cm, enquanto o intervalo entre 40 e 50 kg corresponderá 4 cm. Normas para representação gráfica ✓ Deverá possuir toda informação necessária à sua compreensão, para que não precise de auxílio de texto extra. • Título, Fonte, notas e legenda. ✓ Deverá possuir formato aproximadamente quadrado. • Evitar que problemas de escala interfiram na correta interpretação. Tipos de gráficos Podemos considerar quatro tipos principais de representação gráfica: • Estereogramas • Cartogramas • Pictogramas ou gráficos pictóricos • Diagramas Estereogramas São gráficos onde as grandezas são representadas por volumes. Geralmente são construídos num sistema de eixos bidimensional, mas podem ser construídos num sistema tridimensional para ilustrar a relação entre três variáveis. Cartogramas São representações em cartas geográficas (mapas). Pictogramas São gráficos puramente ilustrativos, construídos de modo a ter grande apelo visual, dirigidos a um público muito grande e heterogêneo. Não devem ser utilizados em situações que exijam maior precisão. Diagramas São gráficos geométricos de duas dimensões, de fácil elaboração e grande utilização. Podem ser ainda subdivididos em: • gráficos de colunas, • gráficos de barras, • gráficos de linhas ou curvas e • gráficos de setores. Diagramas a) Gráfico de colunas: neste gráfico as grandezas são comparadas através de retângulos de mesma largura, dispostos verticalmente e com alturas proporcionais às grandezas. Exemplo: Veja a tabela que nos mostra os carros mais vendidos do Brasil (modelos mais emplacados) de janeiro a junho de 2013, segundo dados da Fenabrave (Federação Nacional da Distribuição de Veículos Automotores): Podemos construir um gráfico de colunas para comparar os totais obtidos.Diagramas b) Gráfico de barras: segue as mesmas instruções que o gráfico de colunas, tendo a única diferença que os retângulos são dispostos horizontalmente. Exemplo: Veja a tabela que nos mostra os carros mais vendidos do Brasil (modelos mais emplacados) de janeiro a junho de 2013, segundo dados da Fenabrave (Federação Nacional da Distribuição de Veículos Automotores): Podemos construir um gráfico de barras para comparar os totais obtidos. Diagramas c) Gráfico de linhas ou curvas: neste gráfico os pontos são dispostos no plano de acordo com suas coordenadas, e a seguir são ligados por segmentos de reta. É muito utilizado em séries históricas e em séries mistas quando um dos fatores de variação é o tempo, como instrumento de comparação. Exemplo Exemplo Podemos fazer o gráfico poligonal para os três meses juntos. Diagramas d) Gráfico em setores: é recomendado para situações em que se deseja evidenciar o quanto cada informação representa do total. A figura consiste num círculo onde o total (100%) representa 360°, subdividido em tantas partes quanto for necessário à representação. Diagramas Essa divisão se faz por meio de uma regra de três simples. Com o auxílio de um transferidor efetua-se a marcação dos ângulos correspondentes a cada divisão. Exemplo: Exemplo: Suponha que um determinado município do interior de SP tenha coletado, ao longo do mês de julho de 2012, o número de acidentes segundo o tipo, conforme mostrado na tabela a seguir: Exemplo: Suponha que um determinado município do interior de SP tenha coletado, ao longo do mês de julho de 2012, o número de acidentes segundo o tipo, conforme mostrado na tabela a seguir: Caso o gráfico seja impresso em preto e branco, a identificação de cores fica prejudicada. Utilização da legenda diretamente nos setores do gráfico utilização de texturas Exercício 1 - O gráfico abaixo fornece o número de unidades vendidas de um produto em função do tempo (dados trimestrais) a. Qual o aumento percentual de unidades vendidas do quarto trimestre de 1998 (IV/98) em relação ao mesmo período do ano anterior (IV/97)? b. Qual o aumento percentual de unidades vendidas do ano de 1998 em relação as do ano de 1997? Exercício 2 - Observe os gráficos e analise as afirmações I, II e III. Procura por graduação aumenta ano a ano I. Em 2010, o aumento percentual de matrículas em cursos tecnológicos, comparado com 2001, foi maior que 1000%. II. Em 2010, houve 100,9 mil matrículas a mais em cursos tecnológicos que no ano anterior. III. Em 2010, a razão entre a distribuição de matrículas no curso tecnológico presencial e à distância foi de 2 para 5. É correto o que se afirma em (A) I e II, apenas. (B) II, apenas. (C) I, apenas. (D) II e III, apenas. (E) I, II e III. Exercício 3 - Para uma festa junina, foi contratada uma barraca de pastéis, que levou os seguintes tipos de recheios: carne, queijo e palmito. A tabela a seguir mostra a quantidade de pastéis vendidos na festa. Recheios Número de pastéis vendidos Carne —— 56 Queijo —– 72 Palmito —- 32 Em relação ao número total de pastéis vendidos na festa, o gráfico que representa essas informações, em porcentagem, é: Distribuições de Frequências Alguns conceitos fundamentais: ROL - A sequência dos dados brutos ordenada de forma crescente. Exemplo de construção de um ROL Suponhamos uma pesquisa em que 10 casais foram entrevistados com relação ao número de filhos que possuíam. Os resultados obtidos, na ordem das entrevistas (dados brutos) foram: 2, 1, 1, 3, 0, 1, 0, 0, 0, 2. Para estes dados, podemos construir o ROL: 0, 0, 0, 0, 1, 1, 1, 2, 2, 3. Note que o ROL possui a mesma quantidade de dados inicialmente coletados. Ou seja, em nosso exemplo anterior, obteve-se 10 valores. Logo, o ROL deve possuir 10 valores também. Distribuições de Frequências A tabela de dados brutos pode não ser prática para responder às questões de interesse, portanto, a partir da tabela de dados brutos, podemos construir uma nova tabela com as informações resumidas, para cada variável. Essa tabela é denominada de tabela de frequência (ou distribuição de frequência) e, como o nome indica, conterá os valores de variável e suas respectivas contagens. A tabela de frequências mostra a relação entre a variável e a quantidade de vezes que cada valor se repete. Essa tabela pode ser representada por valor (único) ou por intervalos (classes). Distribuições de Frequências Distribuição de frequências por valores Utilizada para variáveis qualitativas ou quantitativas discretas. É construída considerando-se todos os diferentes valores ou categorias, levando em consideração suas respectivas repetições. Ou seja, é obtida pela contagem de cada valor encontrado. Frequências • Frequências simples ou absolutas (fi) É o número de vezes que se observa determinado valor. A soma de todas as frequências absolutas corresponde ao tamanho total da amostra (n). • Frequências relativas (fri) São os valores das razões (quociente) entre as frequências simples e a frequência total multiplicada por 100 para que os dados sejam apresentados em porcentagem. Frequências • Frequência Acumulada Simples (Fa) Valores obtidos adicionando a cada frequência absoluta os valores das frequências anteriores. Algumas vezes esta frequência é representada através da notação fac. • Frequência Acumulada Relativa (Far) É a frequência acumulada da classe, dividida pela frequência total da distribuição. Multiplicando-se o resultado por 100 obteremos as frequências em porcentagem. Algumas vezes esta frequência é representada através da notação facr. Exemplo Consideremos o quadro seguinte que mostra as notas de Estatística dos alunos de uma classe. Passos para construção da tabela de frequência 1° escrever o ROL do conjunto de dados; 2° identificar qual é a nossa variável de estudo (xi); 3° Montamos o esqueleto da tabela, sempre lembrando de colocar os totais na última linha; Passos para construção da tabela de frequência 1° escrever o ROL do conjunto de dados; 2° identificar qual é a nossa variável de estudo (xi); 3° Montamos o esqueleto da tabela, sempre lembrando de colocar os totais na última linha; 4° verificamos no ROL quais valores foram observados. Marcamos, em ordem crescente, esses valores na coluna dos valores observados (xi); 5° Vamos completar a coluna das frequências absolutas (fi); 6° Calculamos o total da coluna fi. Passos para construção da tabela de frequência 1° escrever o ROL do conjunto de dados; 2° identificar qual é a nossa variável de estudo (xi); 3° Montamos o esqueleto da tabela, sempre lembrando de colocar os totais na última linha; 4° verificamos no ROL quais valores foram observados. Marcamos, em ordem crescente, esses valores na coluna dos valores observados (xi); 5° Vamos completar a coluna das frequências absolutas (fi); 6° Calculamos o total da coluna fi. 7° Calcularemos, agora, as frequência relativas (fr); Passos para construção da tabela de frequência 1° escrever o ROL do conjunto de dados; 2° identificar qual é a nossa variável de estudo (xi); 3° Montamos o esqueleto da tabela, sempre lembrando de colocar os totais na última linha; 4° verificamos no ROL quais valores foram observados. Marcamos, em ordem crescente, esses valores na coluna dos valores observados (xi); 5° Vamos completar a coluna das frequências absolutas (fi); 6° Calculamos o total da coluna fi; 7° Calcularemos, agora, as frequência relativas (fr); 8° Cálculo da frequência acumulada (fa); Passos para construção da tabela de frequência 1° escrever o ROL do conjunto de dados; 2° identificar qual é a nossa variável de estudo (xi); 3° Montamos o esqueleto da tabela, sempre lembrando de colocar os totais na última linha; 4° verificamos no ROL quais valores foram observados. Marcamos, em ordem crescente, esses valores na coluna dos valores observados (xi); 5° Vamos completar a coluna das frequências absolutas(fi); 6° Calculamos o total da coluna fi; 7° Calcularemos, agora, as frequência relativas (fr); 8° Cálculo da frequência acumulada (fa); 9° Cálculo da coluna de frequências relativas acumuladas (Fra); Distribuição de frequências por intervalos ou classes Quando temos dados brutos provenientes de uma variável contínua, devemos agrupá-los, para a construção de uma tabela, em intervalos que também são conhecidos por classes. Distribuição de frequências por intervalos ou classes Quando temos dados brutos provenientes de uma variável contínua, devemos agrupá-los, para a construção de uma tabela, em intervalos que também são conhecidos por classes. Conceitos essenciais • Limite Inferior (LI) - É sempre o valor da esquerda. • Limite Superior (LS) - É sempre o valor da direita. Li |-------- Ls • Amplitude de classe (hi) - é a diferença entre o limite superior e o limite inferior da classe • Amplitude total (At) – diferença entre os valores extremos Conceitos essenciais Vamos considerar a tabela a seguir para compreender mais facilmente os conceitos sobre amplitude total, amplitude de classe, limite superior da classe e limite inferior da classe. • LI → No caso a primeira classe, temos que LI=15, na segunda classe, LI=20 e, por fim, na terceira classe temos LI=30. • LS → No caso a primeira classe, temos que LS=20, na segunda classe, LS=30 e, por fim, na terceira classe temos LS=50. • hi → Na primeira classe, a amplitude é 20-15=5. Na segunda classe, hi=30-20=10. E na terceira classe: hi=50-30=20. • AT → O mínimo é 15, enquanto que o máximo vale 50. a amplitude total da tabela é calculada como AT = mín - máx, ou seja, AT = 50 - 15 = 35 Construção de classes: determinação do número de classes 1°) Classes desiguais. Critério subjetivo. As classes variam segundo os interesses do pesquisador. As classes apresentam tamanhos (amplitudes) diferentes Construção de classes: determinação do número de classes 2°) Classes de mesmo tamanho; número de classes pré-fixado Suponhamos que desejamos construir 7 classes. O valor mínimo da nossa amostra é 10 e o máximo é 70. A amplitude total (AT) é: AT = máx. – mín → AT = 70 – 10 = 60 Como o número de classes (k) é 7, a amplitude de cada classe (h) é: h = AT / k → h = 60 / 7 >>> 8,57 Vamos utilizar h = 9. Utilizamos uma amplitude de classe um pouco superior à calculada. Por isso, a 7ª classe vai de 64 até 73 (embora o maior valor observado seja 70) Construção de classes: determinação do número de classes 3°) Regra de Sturges É uma das regras mais utilizadas na prática. k = 1 + 3,3.log 200 k = 1 + 3,3 . 2,3010 k = 1 + 7,5933 k = 8,5933 >>> 9 A amplitude de cada classe é Construção de classes: determinação do número de classes 4°) Critério da raiz quadrada O número de classes (k) é dado por A amplitude de cada classe é Vamos considerar h = 5 P/ cima Construção de classes: determinação do número de classes 5°) Critério da desigualdade O valor de k é o menor inteiro tal que 2k ≥ n. Como 27 = 128 e 28 = 256, então k = 8 A amplitude de cada classe é Comparação da Regra de Sturges com outros critérios Comparação da Regra de Sturges com outros critérios Comparação da Regra de Sturges com outros critérios Comparação da Regra de Sturges com outros critérios Comparação da Regra de Sturges com outros critérios Comparação da Regra de Sturges com outros critérios Ponto médio Mais adiante, veremos que precisaremos de um valor conhecido como ponto médio, todas as vezes em que estivermos trabalhando com tabelas contendo classes. Em outras palavras, o ponto médio nada mais é do que a média aritmética dos limites superior e inferior da classe em questão. Exemplo Construir uma tabela com as distribuições de frequências absoluta e acumulada para os 80 valores a seguir, utilizando a Regra de Sturges: Número de amostras Calcule o número de classes (k) Limite inferior, limite superior, amplitude total Amplitude da classe Monte a estrutura da tabela Histograma Quando se trata da representação gráfica de distribuição de frequências com dados agrupados em classes utilizamos um gráfico denominado histograma Histograma é um gráfico de barras contíguas, isto é, formado por um conjunto de retângulos justapostos. No eixo das abscissas (x) marcamos as classes. No eixo das ordenadas (y) marcamos as frequências absolutas, que correspondem às alturas dos retângulos. Exemplo Um radar, instalado num trecho de uma rodovia, registrou as velocidades de 50 veículos. As velocidades, em quilômetros por hora, estão indicadas na tabela de distribuição de frequências: Polígonos de Frequência A partir de uma tabela de distribuição de frequências ou histograma é possível construir um polígono de frequências. O polígono de frequência é um gráfico em linha, sendo construído a partir dos pontos médios dos intervalos de classes (eixo das abscissas) e as frequências absolutas (eixo das ordenadas). Unindo os pontos obtidos por meio de segmentos de reta formamos o polígono. Exemplo Um radar, instalado num trecho de uma rodovia, registrou as velocidades de 50 veículos. As velocidades, em quilômetros por hora, estão indicadas na tabela de distribuição de frequências: Comparação entre Histograma e Polígono de Frequências Exemplo: Considere as idades de 50 funcionários de uma empresa, agrupados conforme a tabela a seguir: Podemos construir um histograma a partir desses dados e, no mesmo gráfico, traçarmos o polígono de frequências (unindo os pontos médios dos topos de cada coluna) Erros comuns na construção de gráficos Escala errada no gráfico Erros comuns na construção de gráficos Escala errada no gráfico Erros comuns na construção de gráficos Gráfico com escala correta
Compartilhar