Baixe o app para aproveitar ainda mais
Prévia do material em texto
Estatística Aplicada Prof. Bruno Sampaio A Estatística é uma parte da Matemática Aplicada que fornece métodos para a coleta, organização, descrição, análise e interpretação de dados e para a utilização dos mesmos na tomada de decisões. Estatística � Acredita-se que o termo Estatística tenha sido primeiramente empregado para designar conjunto de dados referentes a assuntos do Estado, geralmente com finalidade de controle fiscal ou de segurança nacional. Por esse motivo, o uso da palavra, segundo estudiosos, teria a sua origem na expressão latina status, que significa Estado Origem da Estatística Algumas razões para se estudar Estatística: • Saber apresentar e descrever informações de forma adequada. • Saber tirar conclusões a partir das informações obtidas • Desenvolver a capacidade crítica e de análise. Importância: � Estatística Descritiva: conjunto de técnicas destinadas a descrever e resumir os dados, a fim de que possamos tirar conclusões a respeito da característica de interesse. � Probabilidade: teoria matemática utilizada para se estudar a incerteza oriunda de fenômenos de caráter aleatório. � Inferência Estatística: estudo de técnicas que possibilitam a extrapolação, a um grande conjunto de dados, das informações e conclusões obtidas a partir da amostra. Áreas da Estatística População: é o conjunto total de elementos que tem determinada característica que se deseja estudar. Amostra: é uma parte da população de interesse a que se tem acesso para se desenvolver o estudo estatístico. Os dados amostrais devem ser coletados de modo apropriado, de modo que os dados sejam representativos da população da qual foram extraídos. Parâmetro: é uma medida numérica que descreve alguma característica de uma população. Estatística: é uma medida numérica que descreve alguma característica de uma amostra. Conceitos Fundamentais As informações contidas num conjunto de dados são referentes a determinadas variáveis em estudo. Variável é uma característica dos elementos da população. Há dois tipos de variáveis: numéricas e não numéricas. As numéricas são denominadas quantitativas, e as não numéricas, qualitativas. Variáveis Variáveis � São variáveis que assumem como possíveis respostas atributos e /ou qualidades. Se tais respostas têm uma ordenação natural, então elas são classificadas como qualitativas ordinais. Exemplos: • Classe social: baixa, média, alta. • Tamanho de uma embalagem: pequeno, médio, grande. Variáveis Qualitativas � Quando não for possível estabelecer uma ordem natural entre suas respostas, elas são classificadas como qualitativas nominais. Exemplos: • Gênero: masculino ou feminino. • Estado civil: solteiro, casado, viúvo, divorciado. População: alunos de uma universidade. Variável: sexo (masculino ou feminino). População: moradores de uma cidade. Variável: tipo de habitação (casa, apartamento, barraco, etc.). População: peças produzidas por uma máquina. Variável: qualidade (perfeita ou defeituosa). População: Óbitos em um hospital, nos últimos cinco anos Variável: causa mortis (moléstia cardiovasculares, cânceres, etc). Exemplos de variáveis qualitativas � São variáveis que assumem como possíveis respostas números e podem ser subdivididas em discretas e contínuas. As variáveis quantitativas discretas são resultantes de contagens, assumindo assim, valores inteiros. Exemplos: • Número de irmãos: 0, 1, 2, ... • Número de peças defeituosas em um lote: 0, 1, 2, 3, ... Variáveis Quantitativas � As variáveis quantitativas contínuas assumem valores em intervalos dos números reais e, geralmente, são provenientes de uma mensuração. Exemplos: • Peso • Altura População: habitações de uma cidade. Variável: número de banheiros. População: casais residentes em uma cidade. Variável: número de filhos. População: aparelhos produzidos em uma linha de montagem. Variável: número de defeitos por unidade. População: Bolsa de valores de São Paulo. Variável: número de ações negociadas. População: estação meteorológica de uma cidade. Variável: precipitação pluviométrica durante um mês. População: pregos produzidos por uma máquina. Variável: comprimento. Exemplos de variáveis quantitativas � • Dados brutos: dados coletados sem manipulação ou ordenação. � • Rol: sequência ordenada (crescente ou decrescente) dos dados brutos. A ordenação do conjunto de dados brutos facilita a contagem do número de vezes que cada dado ocorre. Organização dos Dados � Exemplo 1: os dados abaixo são referentes às idades de funcionários do setor administrativo de uma empresa: 22 24 19 21 25 18 28 24 25 28 22 25 � Determine o Rol: Podemos representar este conjunto de dados através de uma tabela: 20 Tabela de frequência Idade Frequência de Idades 1) Para as situações descritas a seguir, identifique a população e a amostra correspondente. Discuta a validade do processo de inferência estatística para cada um dos casos. a) Para avaliar a eficácia de uma campanha de vacinação no Estado de São Paulo, 200 mães de recém nascidos, durante o primeiro semestre de um dado ano e em uma dada maternidade em São Paulo, foram entrevistadas a respeito da última vez em que vacinaram seus filhos. b) Uma amostra de sangue foi retirada de um paciente com suspeita de anemia Atividades c) A fim de avaliar a intenção de voto para presidente dos brasileiros, 122 pessoas foram entrevistadas em Brasília. 2) Um grupo de estudantes apresentou as seguintes notas na primeira prova semestral da disciplina de Matemática: 2,1; 7,1; 4,3; 3,3; 4,7; 6,9; 6,1; 5,2; 5,8; 7,8; 1,1; 9,5; 2,4; 8,5; 5,3; 2,1 Encontre o rol para este conjunto de dados. Ao se trabalhar com grandes conjuntos de dados, em geral, é útil organizá-los e resumi-los em uma tabela, chamada distribuição de frequências. Esta tabela lista as respostas dos dados, juntamente com suas frequências correspondentes. Distribuição de Frequências Exemplo 1: informações de funcionários de uma empresa. � Tabela 1: distribuição de frequências Uma tabela contém, basicamente, 3 colunas: � Os dados abaixo são referentes às idades de funcionários do setor administrativo de uma empresa: 22 24 19 21 25 18 28 24 25 28 22 25 22 19 27 a) Classifique e indique a variável em estudo. b) Organize os dados numa distribuição de frequências. c) Qual o percentual de funcionários com pelo menos 25 anos? d) Qual o percentual de funcionários com até 23 anos? Exemplo No cálculo de medidas separatrizes (quartis, decis e percentis) e na construção de um gráfico denominado ogiva precisamos da frequência acumulada. Então, vamos aprender como se calcula. Frequência acumulada (fa): é a soma de cada frequência com as que lhe são anteriores na distribuição. Frequência relativa acumulada (fra): é o quociente da frequência acumulada pelo número total de dados. Esta frequência também pode ser expressa em porcentagem. O valor de (fra x100) é definido como fra (%). Observações Idade f fr(%) fa fra(%) � Quando estamos trabalhando com um conjunto de dados que apresenta um grande número de valores diferentes, é conveniente construir classes ou faixas de valores e contar o número de ocorrências em cada classe. Agrupamento de Dados Os salários pagos (R$) em determinada empresa da cidade estão apresentados a seguir. Agrupe os dados em classes de frequências. O que podemos concluir sobre as remunerações pagas na empresa? Exemplo: Roteiro: 1º) Ache o mínimo e o máximo dos dados. 2º) Determinar o número de classes através da Regra de Sturges: 3º) Determinar o tamanho das classes através do cálculo h = R/i, onde R é a diferença entre o valor máximo e o valor mínimo. Através dos dados brutos, vamos construir uma distribuição de frequências agrupando as informações em intervalos de classes. � De modo geral, a quantidade de classes não deve ser inferior a 5 e nem superior a 25. � Os valores de h devem ser arredondados para o maior valor. Observações: Saláriof (Número de funcionários) fr(%) fa far(%) Resolução: � O objetivo da utilização de gráficos em análise de dados é o de facilitar a compreensão do fenômeno estatístico por meio do efeito visual imediato que os gráficos proporcionam. Tipos de gráficos: � Diagramas de área (colunas, barras e setores). � Gráfico para representar distribuições de frequências agrupadas em classes: histograma, polígono de frequências e ogiva. Gráficos � Os gráficos em colunas, barras e setores são bastante utilizados quando estamos trabalhando com variáveis qualitativas. � As colunas (ou barras) comparam rapidamente o tamanho das categorias por meio das frequências oufrequências relativas (%). Diagramas de Área Exemplo 3: a tabela abaixo apresenta o número de turistas que chegaram ao Brasil em 2010, segundo vias de acesso. Gráfico em colunas: Gráfico em Barras: Gráfico em Setores: � Os gráficos apresentados a seguir são bastante utilizados quando queremos representar um conjunto de dados cujo os mesmos foram agrupados em classes. � Um histograma é semelhante ao diagrama em barras, porém não há espaços entre as barras. � Os intervalos de classes são colocados no eixo horizontal enquanto as frequências são colocadas no eixo vertical. As frequências podem ser absolutas ou relativas. Gráficos para Dados Agrupados em Classes Figura 1.1: histograma para a variável salário(R$) dos funcionários de uma empresa. � O polígono de frequências é um gráfico de linha de uma distribuição de frequências. No eixo horizontal, são colocados os pontos médios de cada intervalo de classe e no eixo vertical são colocadas as frequências absolutas ou relativas (como no histograma). O histograma e o polígono de frequências são gráficos alternativos e contêm a mesma informação. Fica a critério de quem está conduzindo o estudo a escolha de qual deles utilizar. 1 Polígono de Frequência Polígono de Frequência: � Outro gráfico que podemos construir para dados agrupados em classes é a Ogiva. Para construí-lo, devemos usar o limite superior de cada intervalo no eixo horizontal e a frequência acumulada no eixo vertical. A frequência acumulada relacionada com o limite inferior da primeira classe é sempre zero. 1 Ogiva: Ogiva: O departamento de atendimento ao consumidor de uma concessionária de veículos recebe, via telefone, as reclamações dos clientes. O número de chamadas dos últimos 30 dias foram anotados e os resultados foram: 5 4 4 5 6 8 4 4 5 6 4 3 6 7 4 5 4 5 7 8 8 5 7 5 4 5 7 6 3 4 a) Indique e classifique a variável em estudo. b) Organize os dados numa distribuição de frequências. c) Qual o percentual de dias com pelo menos 5 reclamações. Exercício de Fixação: Resolução:
Compartilhar