Baixe o app para aproveitar ainda mais
Prévia do material em texto
Apostila de Estatística I– Autor: Diogo Eduardo Pasqual Penna Prof. Adjunto do Departamento de Matemática e Estatística da UCS desde 1994 e do Curso de Administração da Faculdade Nossa Senhora de Fátima desde 2004. Prof. da UNISINOS em1988. Mestre em Ciências – Geofísica pela Universidade Federal do Pará – Belém-PA -convênio Petrobrás em 1994. _________________________________________________________________________ ___________________________________________________________ Estatística para os cursos de Administração, Economia, Ciências Contábeis, Tecnólogo em Processamento de Dados, Psicologia, Secretário Executivo, Gestão Imobiliária e de Micro e Pequenas Empresas - deppenna@ucs.br– Fone: 54 9104 2488 –- ano: 2006 1 ÍNDICE CAPÍTULOS I-INTRODUÇÃO.................................................................... pág.4 Estatística Descritiva Estatística Indutiva ou Inferencial a) coleta contínua b) coleta periódica c) coleta ocasional Apuração dos Dados; Apresentação dos Dados; Análise dos resultados; A Estatística nas Empresas II-POPULAÇÃO e AMOSTRA (ESTIMADOR ESTATÍSTICO)....pág.5 Variável;Variável qualitativa (qualidade);Variável quantitativa (quantidade); População;Amostra Simbologia Utilizada para o estudo de uma população; Simbologia Utilizada para o estudo de uma amostra; III-SOMATÓRIOS ....................................................................................pág.7 IV- MEDIDAS DE TENDÊNCIA CENTRAL – DADOS NÃO AGRUPADOS ...........................................................................................pág.8 a)Cálculo da Média (mean): b)Cálculo da Moda (mode) c)Cálculo da Mediana (median): V- A DISTRIBUIÇÃO DE FREQUÊNCIA DE DADOS AGRUPADOS – MAS SEM INTERVALOS DE CLASSES..............................................pág.10 Diagramas de freqüência - tabelas Média; Mediana e Moda – Exercícios diversos Dados Brutos e Rol VI – MEDIDAS DE DISPERSÃO OU VARIABILIDADE ................pág.14 Desvio Médio; Variância; Desvio Padrão; Coeficiente de Variação de Pearson e de Thorndike; VI-a – SEPARATRIZES.........................................................................pág.19 (Quartis- Decis- Percentis) – Medidas de Posição – Coeficiente Percentílico de Curtose - Apostila de Estatística I– Autor: Diogo Eduardo Pasqual Penna Prof. Adjunto do Departamento de Matemática e Estatística da UCS desde 1994 e do Curso de Administração da Faculdade Nossa Senhora de Fátima desde 2004. Prof. da UNISINOS em1988. Mestre em Ciências – Geofísica pela Universidade Federal do Pará – Belém-PA -convênio Petrobrás em 1994. _________________________________________________________________________ ___________________________________________________________ Estatística para os cursos de Administração, Economia, Ciências Contábeis, Tecnólogo em Processamento de Dados, Psicologia, Secretário Executivo, Gestão Imobiliária e de Micro e Pequenas Empresas - deppenna@ucs.br– Fone: 54 9104 2488 –- ano: 2006 2 Classificação das Curvas ( leptocúrtica; mesocúrtica e platicúrtica); Rol e Dados Brutos – Exercícios VI-b –COEFICIENTE DE ASSIMETRIA.............................................pág.23 VI–c–SÉRIES ESTATÍSTICAS DISCRETAS COM CÁLCULO ABREVIADO DA VARIÂNCIA E DESVIO PADRÃO (SEM CALCULAR O DESVIO MÉDIO)................................................................................pág.24 VII – DISTRIBUIÇÃO DE FREQÜÊNCIA EM CLASSE ( DADOS AGRUPADOS).........................................................................................pág.25 Dados Brutos e Rol Conceitos Básicos: 1.Limites de Observação 2.Intervalo de Observação 3.Amplitude de Observação 4.Definição do número de classes – Regra de Sturges 5.Construção da Distribuição de Freqüência : 6.Construção da Distribuição de Freqüência 7.Classe de uma (Distribuição de Freqüência) 8.Limites de Classe 9.Amplitude de Classe (h) 10.Limites da Distribuição de Freqüência 11.Amplitude da Distribuição de Freqüência 12.Número de observações 13.Variável: 14.Ponto Médio de Classe Fórmulas para calcular a mediana, a Moda calculada e a Curtose: 15.O Cálculo da Mediana na Distribuição de Freqüência com Dados Agrupados ou Grupados 16.O cálculo da Moda Calculada 17.O cálculo da CURTOSE (Coeficiente percentílico de Curtose) na Distribuição de Freqüência em Classes ( Dados Agrupados). 18.Fórmulas para o cálculo dos quartis; Fórmula para o cálculo dos percentis; 19.Classificação das Curvas; Gráfico da curva polida 20.A freqüência calculada Apostila de Estatística I– Autor: Diogo Eduardo Pasqual Penna Prof. Adjunto do Departamento de Matemática e Estatística da UCS desde 1994 e do Curso de Administração da Faculdade Nossa Senhora de Fátima desde 2004. Prof. da UNISINOS em1988. Mestre em Ciências – Geofísica pela Universidade Federal do Pará – Belém-PA -convênio Petrobrás em 1994. _________________________________________________________________________ ___________________________________________________________ Estatística para os cursos de Administração, Economia, Ciências Contábeis, Tecnólogo em Processamento de Dados, Psicologia, Secretário Executivo, Gestão Imobiliária e de Micro e Pequenas Empresas - deppenna@ucs.br– Fone: 54 9104 2488 –- ano: 2006 3 VIII – PROBABILIDADE.......................................................................pág36 Experimento Aleatório Definição Espaço Amostral Tipos de Probabilidade: probabilidade clássica ( ou teórica) probabilidade empírica ( ou estatística) Probabilidade Subjetiva VIII. a) DISTRIBUIÇDE PROBABILIDADE.......................................pág.42 VIII b) PROBABILIDADE CLÁSSICA.................................................pág.45 Probabilidade de um Evento Probabilidade da não ocorrência de um evento Probabilidade de uma união (eventos mutuamente excludentes) ou“o terceiro postulado de probabilidade” Probabilidade de uma intersecção Intersecção e união no mesmo exercício – utilização conjunta de ambos na mesma fórmula: evento elementar: apenas um ponto amostral evento certo: igual ao espaço amostral S evento impossível: conjunto vazio Princípio da Multiplicação Amostragem com reposição Amostragem sem reposição Arranjos ! ( )! n n k Combinações Probabilidade Condicional Pr( )Pr( ) Pr( ) A B A B B Eventos independentes: são dois eventos que não se afetam mutuamente. Probabilidade Condicional: é a probabilidade de ocorrência de um determinado evento, quando se sabe que outro evento ocorreu. Eventos complementares (p + q =1 q = 1- p) Apostila de Estatística I– Autor: Diogo Eduardo Pasqual Penna Prof. Adjunto do Departamento de Matemática e Estatística da UCS desde 1994 e do Curso de Administração da Faculdade Nossa Senhora de Fátima desde 2004. Prof. da UNISINOS em1988. Mestre em Ciências – Geofísica pela Universidade Federal do Pará – Belém-PA -convênio Petrobrás em 1994. _________________________________________________________________________ ___________________________________________________________ Estatística para os cursos de Administração, Economia, Ciências Contábeis, Tecnólogo em Processamento de Dados, Psicologia, Secretário Executivo, Gestão Imobiliária e de Micro e Pequenas Empresas - deppenna@ucs.br– Fone: 54 9104 2488 –- ano: 2006 4 Eventos Independentes Pr( ) Pr( )A B A Pr( ) Pr( )A B A Eventos Mutuamente Exclusivos Exercícios Trabalho em grupo IX – BIBLIOGRAFIA......................................................................... pág.64 ---------------------------------------------------------------------------------------------- I-INTRODUÇÃO: A Estatística é uma parte da Matemática Aplicada que fornece métodos para a coleta, organização, descrição, análise e interpretação de dados e para a utilização dos mesmos na tomada de decisões.Estatística Descritiva: trata da coleta, da organização e da descrição dos dados. Estatística Indutiva ou Inferencial : trata da análise e da interpretação dos dados. A coleta pode ser direta ou indireta. A direta pode ser: a)coleta contínua: registro de nascimentos e óbitos e da freqüência dos alunos às aulas. b)coleta periódica: feita em intervalos constantes como os censos (10 em 10 anos) e as avaliações mensais de alunos. c)coleta ocasional: quando feita extemporaneamente. Exemplo: no caso de epidemias que assolam ou dizimam rebanhos inteiros. A coleta indireta é feita através de dados colhidos por uma coleta direta (exemplo: pesquisa sobre a mortalidade infantil). Apuração dos Dados: é a soma e o processamento dos dados obtidos e a disposição mediante critérios de classificação. Pode ser manual ou eletrônica. Apresentação dos Dados: Os dados devem ser apresentados sob forma adequada (tabelas e/ou gráficos) tornando mais fácil o exame e o tratamento estatístico. Análise dos resultados: O objetivo último da Estatística é tirar conclusões sobre o todo (população) a partir de informações fornecidas por parte representativa do todo (amostra). Nesta fase entramos na Estatística Indutiva ou Inferencial da onde tiramos conclusões e previsões. Apostila de Estatística I– Autor: Diogo Eduardo Pasqual Penna Prof. Adjunto do Departamento de Matemática e Estatística da UCS desde 1994 e do Curso de Administração da Faculdade Nossa Senhora de Fátima desde 2004. Prof. da UNISINOS em1988. Mestre em Ciências – Geofísica pela Universidade Federal do Pará – Belém-PA -convênio Petrobrás em 1994. _________________________________________________________________________ ___________________________________________________________ Estatística para os cursos de Administração, Economia, Ciências Contábeis, Tecnólogo em Processamento de Dados, Psicologia, Secretário Executivo, Gestão Imobiliária e de Micro e Pequenas Empresas - deppenna@ucs.br– Fone: 54 9104 2488 –- ano: 2006 5 A Estatística nas Empresas : no mundo atual , a empresa é uma das vigas- mestras da Economia dos Povos. A direção de uma empresa, de qualquer tipo, privadas estatais ou governamentais (públicas), exige de seu administrador a importante tarefa de tomar decisões, e o conhecimento e o uso da Estatística facilitarão seu tríplice trabalho de organizar, dirigir e controlar a empresa. Por meio de sondagem, de coleta de dados e de recenseamento de opiniões, podemos conhecer a realidade geográfica e social, os recursos naturais, humanos e financeiros disponíveis, as expectativas da comunidade sobre a empresa, e estabelecer suas metas, seus objetivos com maior possibilidade de serem alcançados a curto, médio ou longo prazos. A Estatística ajudará em tal trabalho, como também na seleção e organização da estratégia a ser adotada do empreendimento e, ainda, na escolha das técnicas de verificação e avaliação da quantidade e da qualidade do produto e mesmo dos possíveis lucros e /ou perdas. Tudo isso que se pensou, que se planejou, precisa ficar registrado, documentado, para evitar esquecimentos, a fim de garantir o bom uso do tempo, da energia e do material e, ainda, para um controle eficiente do trabalho. O esquema do planejamento é o plano, que pode ser resumido, com auxílio da Estatística, em tabelas e gráficos, que facilitarão a compreensão visual dos cálculos matemático-estatísticos que lhes deram origem. O homem e a mulher de hoje, em suas múltiplas atividades, lançam mão de processos e técnicas estatísticas, e só estudando-as evitaremos o erro das generalizações apressadas à respeito de tabelas e gráficos apresentados em jornais e revistas e na televisão, frequentemente cometido quando se conhece apenas “por cima” um pouco de Estatística. Concluído este curso o aluno terá um conhecimento básico que deverá ser aperfeiçoado no futuro, mas o pontapé inicial será dado aqui. II-POPULAÇÃO e AMOSTRA (ESTIMADOR ESTATÍSTICO) variável: é o conjunto de resultados possíveis de um fenômeno. Matematicamente é representada pelas últimas letras do alfabeto: r, s, t, u. v, w, x, y e z. A soma de todas as variáveis será representada aqui pela letra “n” ou 1 n i fi . Símbolo de somatório . Apostila de Estatística I– Autor: Diogo Eduardo Pasqual Penna Prof. Adjunto do Departamento de Matemática e Estatística da UCS desde 1994 e do Curso de Administração da Faculdade Nossa Senhora de Fátima desde 2004. Prof. da UNISINOS em1988. Mestre em Ciências – Geofísica pela Universidade Federal do Pará – Belém-PA -convênio Petrobrás em 1994. _________________________________________________________________________ ___________________________________________________________ Estatística para os cursos de Administração, Economia, Ciências Contábeis, Tecnólogo em Processamento de Dados, Psicologia, Secretário Executivo, Gestão Imobiliária e de Micro e Pequenas Empresas - deppenna@ucs.br– Fone: 54 9104 2488 –- ano: 2006 6 Variável qualitativa (qualidade): é quando seus valores são expressos por atributos:sexo masculino ou feminino, cor da pele (amarela, branca, negra, vermelha, parda, etc.) . Variável quantitativa (quantidade):quando seus valores são expressos em números (salários, idades etc). Podem ser Contínuas ou Discretas. População: Conjunto a ser estudado Amostra: subconjunto finito de uma população. - a amostra deve ser suficientemente grande. - seus constituintes devem ter sido selecionados ao acaso. A Estatística Indutiva tem por objetivo tirar conclusões sobre as populações, com base em resultados verificados em amostras retiradas dessa população. Mas para as inferências serem corretas, é necessário garantir que a amostra seja representativa da população, isto é, deve possuir as mesmas características básicas da população, no que diz respeito ao fenômeno que desejamos pesquisar. É preciso que a amostra seja obtida por processos adequados.A amostragem pode ser simples ou complexa. É importante que cada elemento da população tenha a mesma chance de ser amostrado. Técnicas de Amostragem: Amostragem casual ou aleatória simples. Amostragem estratificada: utilizada quando a população se divide em subpopulações – estratos.(90 alunos(as) de uma escola) sexo população 10% Amostra MASCULINO 54 10x54/100 = 5,4 5 FEMININO 36 10x36/100 = 3,6 4 total 90 10x90/100 = 9 9 Tabela n.º 01 Amostragem Sistemática: é quando os elementos da população já se acham ordenados, não havendo necessidade de construir o sistema de referência. São exemplos os prontuários médicos de um hospital, os prédios de uma rua, as linhas de produção. Exemplo: Suponhamos uma rua contendo novecentos prédios, dos quais desejamos obter uma amostra formada de cinqüenta prédios. 900/50=18. Seriam selecionados 18 prédios através de sorteio sistemático. Apostila de Estatística I– Autor: Diogo Eduardo Pasqual Penna Prof. Adjunto do Departamento de Matemática e Estatística da UCS desde 1994 e do Curso de Administração da Faculdade Nossa Senhora de Fátima desde 2004. Prof. da UNISINOS em1988. Mestre em Ciências – Geofísica pela Universidade Federal do Pará – Belém-PA -convênio Petrobrás em 1994. _________________________________________________________________________ ___________________________________________________________ Estatística para os cursos de Administração, Economia, Ciências Contábeis, Tecnólogo em Processamento de Dados, Psicologia, Secretário Executivo, Gestão Imobiliária e de Micro e Pequenas Empresas - deppenna@ucs.br– Fone: 54 9104 2488 –- ano: 2006 7 Simbologia Utilizada para o estudo de uma população: = mi ou mu (utilizada para representar a média da população). = sigma ( utilizada para representar o desvio padrão da população) 2 = sigma ao quadrado. (utilizado para representar a variância da população) N = n.º total de elementos da população (’N’ maiúsculo) Simbologia Utilizadapara o estudo de uma amostra: X = X BARRA ( utilizado para representar a média da amostra). S = do inglês – standard deviation (utilizado para representar o desvio padrão da população. 2S = S ao quadrado (utilizada para representar a variância da amostra) n = n.º total de elementos da amostra ( ‘n’ minúsculo) III-SOMATÓRIOS símbolo = = Letra sigma maiúscula do alfabeto grego que representa uma soma. Exemplo: 1 2 3 4 5 6X X X X X X pode ser representado abreviadamente por 6 1 i i X (lê-se: somatório de iX com i variando de 1 a 6) Neste caso 1 é o limite inferior do somatório e 6 o limite superior do somatório. lim sup lim inf ite erior i ite erior X Exemplo: calcule 5 2 1 3 i i resolução: 2 2 2 2 23.1 3.2 3.3 3.4 3.5 5 2 1 3 i i =3 + 12 + 27 + 48 + 75 5 2 1 3 i i = 165 Exercícios de Aprendizagem: 1- Calcule: a) 6 1 (5 2) i i Resp: 93 ; b) 2 3 (1 ) i i Resp: 9 2- Calcule: 10 0 1 2i i Resp: 22 Apostila de Estatística I– Autor: Diogo Eduardo Pasqual Penna Prof. Adjunto do Departamento de Matemática e Estatística da UCS desde 1994 e do Curso de Administração da Faculdade Nossa Senhora de Fátima desde 2004. Prof. da UNISINOS em1988. Mestre em Ciências – Geofísica pela Universidade Federal do Pará – Belém-PA -convênio Petrobrás em 1994. _________________________________________________________________________ ___________________________________________________________ Estatística para os cursos de Administração, Economia, Ciências Contábeis, Tecnólogo em Processamento de Dados, Psicologia, Secretário Executivo, Gestão Imobiliária e de Micro e Pequenas Empresas - deppenna@ucs.br– Fone: 54 9104 2488 –- ano: 2006 8 3- Encontre S, sendo S = 3 5 2 2 1 1 ( 2 ) j r j r r Resp: 39 4- Calcule 3 4 2 0 1 ( 1) (4 ) n j n j Resp: -12 5- Calcule 1 1 2nn Resp: 0 (aproximadamente zero) IV- MEDIDAS DE TENDÊNCIA CENTRAL – DADOS NÃO AGRUPADOS Média, mediana, moda. Separatrizes: Mediana, quartis, decis e percentis Estudaremos a seguir três medidas de tendência central, são elas: Media – Mediana – Moda Dados os seguintes valores: 7, 8, 10, 10, 10, 9, 15, 13, 12, 11 a) Cálculo da Média (mean): = 7 8 9 10 10 10 11 12 13 15 10 = 10,5 A média é utilizada quando desejamos obter a medida de posição que possui maior estabilidade e quando houver necessidade de um tratamento algébrico ulterior. Desvantagem: é afetada pelos valores extremos. b) Cálculo da Moda: A moda é o valor que ocorre com maior freqüência. Mo = 10 Se nenhum valor se repetisse a distribuição seria amodal (sem moda). Assim como poderia haver duas modas (bimodal), três modas (trimodal) e mais de três modas (multimodal). A moda é utilizada quando desejamos obter uma medida rápida e aproximada de posição e quando a medida de posição deve ser o valor mais típico da distribuição. Apostila de Estatística I– Autor: Diogo Eduardo Pasqual Penna Prof. Adjunto do Departamento de Matemática e Estatística da UCS desde 1994 e do Curso de Administração da Faculdade Nossa Senhora de Fátima desde 2004. Prof. da UNISINOS em1988. Mestre em Ciências – Geofísica pela Universidade Federal do Pará – Belém-PA -convênio Petrobrás em 1994. _________________________________________________________________________ ___________________________________________________________ Estatística para os cursos de Administração, Economia, Ciências Contábeis, Tecnólogo em Processamento de Dados, Psicologia, Secretário Executivo, Gestão Imobiliária e de Micro e Pequenas Empresas - deppenna@ucs.br– Fone: 54 9104 2488 –- ano: 2006 9 c)Cálculo da Mediana (median): é uma medida de posição definida como o n.º que se encontra no centro de uma série de números, estando estes dispostos segundo uma ordem (crescente ou decrescente). É o valor situado de tal forma no conjunto que o separa em dois subconjuntos de mesmo n.º de elementos. Md = 7, 8, 9,10, 10, 10, 11, 12, 13, 15 Verificamos que, estando ordenados os valores de uma série e sendo “n” o n.º de elementos da série, o valor mediano será: -O termo de ordem 1 2 n , se n for ímpar -A média aritmética dos termos de ordem 1 2 2 n n e se n for par. No exemplo acima n é par. Então o cálculo da mediana será a soma dos termos centrais divididos por dois. 10 + 10 = 10. Ou então: 2 0 010 10 1 5 6 2 2 e e (é a média aritmética entre o quinto e o sexto elemento da distribuição) Mediana: 10 + 10 = 10 2 Exercícios: )calcular a média, a moda e a mediana da série abaixo relacionada: 5, 13, 10, 2, 18, 15, 6, 16, 9 Resp: Md = 10; = 10,4; amodal ) 2, 6, 7, 10, 12, 13, 18, 21 ) 5, 7, 13, 15 )5, 7, 10, 13, 65 )2, 3, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9 Apostila de Estatística I– Autor: Diogo Eduardo Pasqual Penna Prof. Adjunto do Departamento de Matemática e Estatística da UCS desde 1994 e do Curso de Administração da Faculdade Nossa Senhora de Fátima desde 2004. Prof. da UNISINOS em1988. Mestre em Ciências – Geofísica pela Universidade Federal do Pará – Belém-PA -convênio Petrobrás em 1994. _________________________________________________________________________ ___________________________________________________________ Estatística para os cursos de Administração, Economia, Ciências Contábeis, Tecnólogo em Processamento de Dados, Psicologia, Secretário Executivo, Gestão Imobiliária e de Micro e Pequenas Empresas - deppenna@ucs.br– Fone: 54 9104 2488 –- ano: 2006 10 V- A DISTRIBUIÇÃO DE FREQUÊNCIA DE DADOS AGRUPADOS – MAS SEM INTERVALOS DE CLASSES Quando trabalhamos com dados discretos (valores inteiros) utilizamos a seguinte organização dos dados: Suponha uma população com uma distribuição estatística conforme a tabela abaixo: Disciplina: Geografia – Turma: 8.ª Série n.º 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 nota 5 4 6 8 3 5 7 6 8 4 6 9 7 5 7 5 6 8 7 9 4 6 6 8 7 (tabela n.º 2) - População estatística: grupo dos 25 alunos da 8.ª série - Unidade estatística: cada aluno desta série - Variável estatística: as notas de uma prova de geografia Organização destes dados através de uma Tabela de Freqüência iX if iF rif riF 3 1 1 1/25 = 4 % 4% 4 3 4 3/25 = 12% 16% 5 4 8 4/25 = 16% 32% 6 6 14 6/25 = 24% 56% 7 5 19 5/25 = 20% 76% 8 4 23 4/25 = 16% 92% 9 2 25 2/25 = 8 % 100% 25 100% (tabela n.º 03) iX = variável estatística: nota de cada aluno podendo variar de 0 a 10. if = freqüência simples ou absoluta é os valores que realmente representam o n.º de dados. iF = frequência acumulada é o total das freqüências de todos os valores inferiores ao limite superior de cada dado. Apostila de Estatística I– Autor: Diogo Eduardo Pasqual Penna Prof. Adjunto do Departamento de Matemática e Estatística da UCS desde 1994 e do Curso de Administração da Faculdade Nossa Senhora de Fátima desde 2004. Prof. da UNISINOS em1988. Mestre em Ciências – Geofísica pela Universidade Federal do Pará – Belém-PA -convênio Petrobrás em 1994. _________________________________________________________________________ ___________________________________________________________ Estatística para os cursos de Administração, Economia, Ciências Contábeis, Tecnólogo em Processamento de Dados, Psicologia, Secretário Executivo, Gestão Imobiliária e de Micro e Pequenas Empresas - deppenna@ucs.br– Fone: 54 9104 2488 –- ano: 2006 11 rif = frequência relativa: são os valores das razões entre as freqüências simples e a freqüência total: rif = if / 1 n i fi . Pergunta-se: Quanto por cento dos alunos tirou nota igual ou inferior a 6? Resp: 56%. Qual o percentual de alunosque tirou nota igual ou superior a 7 ? Resp: 44% Qual a nota que obteve o maior percentual de ocorrência ? Resp: 6 (24%). Desta forma, com os dados organizados, é possível tirar conclusões. Utilizando os dados das tabelas n.ºs 2 e 3, pág 5, calcule a média, a mediana e a moda. iX if iF iX . if 3 1 1(até o prim.) 3x1 = 3 4 3 4(até o quar.) 4x3 = 12 5 4 8(até o oitavo) 5x4 = 20 6 6 14(até o 14 ) 6x6=36 7 5 19 7x5=35 8 4 23 8x4=32 9 2 25 9x2=18 25 156 Tabela n.º 4 Quando os dados estão agrupados utiliza-se as seguintes fórmulas para o cálculo da: Média = = i i i X f f =156 25 = 6,24 Obs: Quando não temos freqüência utiliza-se: i ri f f n , sendo n minúsculo quando se trata de amostra e N maiúsculo quando é toda a população que está sendo calculada. (n = total da amostra; N = total da população). Moda = não é necessário cálculos para obtenção da moda, basta observar na coluna das freqüências simples ou absolutas qual o valor que mais ocorre (aquele que têm a maior freqüência), neste caso é a nota 6. Mo = 6 Mediana = Utiliza-se a fórmula : 2 ifP = 25/2 = 12,5 Apostila de Estatística I– Autor: Diogo Eduardo Pasqual Penna Prof. Adjunto do Departamento de Matemática e Estatística da UCS desde 1994 e do Curso de Administração da Faculdade Nossa Senhora de Fátima desde 2004. Prof. da UNISINOS em1988. Mestre em Ciências – Geofísica pela Universidade Federal do Pará – Belém-PA -convênio Petrobrás em 1994. _________________________________________________________________________ ___________________________________________________________ Estatística para os cursos de Administração, Economia, Ciências Contábeis, Tecnólogo em Processamento de Dados, Psicologia, Secretário Executivo, Gestão Imobiliária e de Micro e Pequenas Empresas - deppenna@ucs.br– Fone: 54 9104 2488 –- ano: 2006 12 Ou utiliza-se a regra: 1 2 n 025 1 13 2 Ou seja, a mediana está situada entre o 012 e o 013 elementos (soma-se os dois e divide-se por dois). Observa-se então na coluna das freqüências acumulada aonde se encontra o 13 (décimo-terceiro) elemento. Este corresponde a variável 6. Md = 6 Exercícios de Aprendizagem ) Um dado foi jogado 20 vezes, sendo obtidos os seguintes pontos:1, 5, 6, 5, 2, 2, 2, 4, 6, 5, 2, 3, 3, 1, 6, 6, 5, 5, 4, 2. Elabore um quadro com distribuição de freqüências absolutas, frequências absolutas acumuladas, freqüências relativas e freqüências relativas acumuladas. Qual a média, a mediana e a moda desta distribuição de freqüências com dados agrupados mas “sem intervalos de classe”. )Após montar a tabela do exercício anterior ‘ ’ responda as questões abaixo: a)Quantas vezes o n.º 2 foi obtido no dado ? resp: 5 vezes b)Quantas vezes o n.º obtido do dado foi menor do que 5 ? resp: 11 vezes c)Qual o índice em % em que o n.º 6 foi obtido no dado ? resp: 20% d)Qual o índice em % em que n.ºs maiores do que 4 foram obtidos no dado? Resp: 45% ) A tabela abaixo mostra a média dos 25 alunos de uma turma de um curso de Administração noturno na disciplina de Matemática Aplicada. Responda as perguntas abaixo: a)Elabore uma quadro de freqüências absolutas, absolutas acumuladas; de freqüências relativas e relativas acumuladas. Calcule a média, a mediana e a moda desta distribuição. b)Quantos alunos obtiveram a média 6? Resp: 6 c)Quantos alunos obtiveram média menor do que 6 ? resp: 12 d)Quantos alunos obtiveram média superior a 6 ? 7 Apostila de Estatística I– Autor: Diogo Eduardo Pasqual Penna Prof. Adjunto do Departamento de Matemática e Estatística da UCS desde 1994 e do Curso de Administração da Faculdade Nossa Senhora de Fátima desde 2004. Prof. da UNISINOS em1988. Mestre em Ciências – Geofísica pela Universidade Federal do Pará – Belém-PA -convênio Petrobrás em 1994. _________________________________________________________________________ ___________________________________________________________ Estatística para os cursos de Administração, Economia, Ciências Contábeis, Tecnólogo em Processamento de Dados, Psicologia, Secretário Executivo, Gestão Imobiliária e de Micro e Pequenas Empresas - deppenna@ucs.br– Fone: 54 9104 2488 –- ano: 2006 13 e)qual o índice em % de reprovação considerando a média 5? Resp: 20% f)Qual o índice em % de alunos eu obtiveram média maior do que 7? 16% g) Qual o índice em % de alunos que obtiveram média maior ou igual a 5,0 e menor do que 7? Resp: 52 %. Quadro - Disciplina: Matemática Aplicada – Turma de Administração - n.º 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 nota 4 7 5 5 5 4 9 4 5 6 6 7 6 6 5 4 4 8 7 6 6 8 5 5 8 Tabela n.º 5 iX if iF iX if rif riF 4 5 6 7 8 9 Tabela n.º 6 ) Em uma escola, o conceito de cada bimestre é representado por letras: A, B, C, D e E. Em um determinado bimestre, os conceitos dos alunos em geografia foram os seguintes: Disciplina: geografia – conceitos do bimestre n.º 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 C B A C C D C D A A C E D D C B C B C C B Tabela n.º 7 Elabore um quadro de distribuição de frequências absolutas e freqüências absolutas acumuladas. ) Os salários mensais, em dezenas de reais, dos 20 funcionários de uma empresa são: 72, 72, 80, 88, 84, 72, 76, 80, 92, 72, 76, 80, 84, 72, 68, 76, 80, 72, 88 e 76 Elabore um quadro de distribuição de freqüências absolutas e absolutas acumuladas. Calcule os salários: médio, mediano e modal. Apostila de Estatística I– Autor: Diogo Eduardo Pasqual Penna Prof. Adjunto do Departamento de Matemática e Estatística da UCS desde 1994 e do Curso de Administração da Faculdade Nossa Senhora de Fátima desde 2004. Prof. da UNISINOS em1988. Mestre em Ciências – Geofísica pela Universidade Federal do Pará – Belém-PA -convênio Petrobrás em 1994. _________________________________________________________________________ ___________________________________________________________ Estatística para os cursos de Administração, Economia, Ciências Contábeis, Tecnólogo em Processamento de Dados, Psicologia, Secretário Executivo, Gestão Imobiliária e de Micro e Pequenas Empresas - deppenna@ucs.br– Fone: 54 9104 2488 –- ano: 2006 14 Tabela 8 (completar) VI – MEDIDAS DE DISPERSÃO OU VARIABILIDADE Estudaremos aqui o Desvio Médio (dm); a Variância [ ( 2 2ou S ]; o desvio padrão [ ou S ] e os Coeficientes de Variação de Pearson e de Thorndike. Desvio Médio: O quadro abaixo mostra o n.º de acidentes ocorridos durante um ano, subdivididos em 4 trimestres em uma Fundição Trimestre 1.º 2.º 3.º 4.º Acidentes 5 8 6 9 Tabela 9 Cálculo da média de acidentes: = 1 2 3 4 5 8 6 9 4 4 X X X X = 7 Calculemos agora as diferenças entre cada uma das notas e a média X ou X X dm = 6 1,5 4 4 Daí podemos dizer que a fórmula para calcular o desvio médio quando não temos freqüência é a seguinte: 1 1 n n i i i i X X X dm ou dm N n Apostila de Estatística I– Autor: Diogo Eduardo Pasqual Penna Prof. Adjunto do Departamento de Matemática e Estatística da UCS desde 1994 e do Curso de Administração da Faculdade Nossa Senhora de Fátima desde 2004. Prof. da UNISINOS em1988. Mestre em Ciências – Geofísica pela Universidade Federal do Pará – Belém-PA -convênio Petrobrás em 1994. _________________________________________________________________________ ___________________________________________________________ Estatística para os cursos de Administração, Economia, Ciências Contábeis, Tecnólogo em Processamento de Dados, Psicologia, Secretário Executivo, GestãoImobiliária e de Micro e Pequenas Empresas - deppenna@ucs.br– Fone: 54 9104 2488 –- ano: 2006 15 x f X (media) d(desvio) f.d 2d f. 2d 5 1 7 2 2 4 4 8 1 7 1 1 1 1 6 1 7 1 1 1 1 9 1 7 2 2 4 4 4 10 2 2 1 f X X S f (fórmula para o cálculo da variância de uma amostra) 2 2 f X f (fórmula para o cálculo da variância da população) 10 4 = 2,5 (variância = somatório dos desvios elevados ao quadrado divididos pelo tamanho total da população) 2s s (fórmula para calcular o desvio padrão da amostra) 2 (fórmula para o calculo do desvio padrão da população) 2,5 = 1,58 (desvio padrão = raiz quadrada da variância) CV= Coeficiente de Variação de Pearson CV = 1,58.100 .100 7 S X 0,2257.100 = 22,57% Exercício: Qual o desvio médio do conjunto de dados: 7, 12,, 20, 16, 10 Resp: 4; Calcular o desvio padrão. Cálculo do Desvio Médio quando temos freqüências. Apostila de Estatística I– Autor: Diogo Eduardo Pasqual Penna Prof. Adjunto do Departamento de Matemática e Estatística da UCS desde 1994 e do Curso de Administração da Faculdade Nossa Senhora de Fátima desde 2004. Prof. da UNISINOS em1988. Mestre em Ciências – Geofísica pela Universidade Federal do Pará – Belém-PA -convênio Petrobrás em 1994. _________________________________________________________________________ ___________________________________________________________ Estatística para os cursos de Administração, Economia, Ciências Contábeis, Tecnólogo em Processamento de Dados, Psicologia, Secretário Executivo, Gestão Imobiliária e de Micro e Pequenas Empresas - deppenna@ucs.br– Fone: 54 9104 2488 –- ano: 2006 16 Fórmula a ser utilizada: 1 n i X N Exemplo: O quadro a seguir nos mostra a distribuição dos erros cometidos por 25 alunos numa prova de Biologia. Nessas condições, qual é o desvio médio dessa distribuição ? n.º de erros ( ix ) n.º de alunos ( if ) frequencia simples aF (FREQ. ACUMULADA) X (MÉDIA) d= x X .i if d 0 3 3 2 d= 0 2 =2 3x2=6 1 6 9 2 d= 1 2 1 6x1=6 2 8 17 2 d= 2 2 0 8x0=0 3 5 22 2 d= 3 2 1 5x1=5 4 2 24 2 d= 4 2 2 2x2=4 5 1 25 2 d= 5 2 3 1x3=3 25 24 25 1 . 24 0,96 25 i i i fi d f . Então o desvio médio é de 0,96. Calcular o desvio padrão e o coeficiente de variação da população acima. Dada a tabela abaixo, calcule o desvio padrão e o coeficiente de variação amostral: x f x.f X X = d 2 2X X d 2 2. .f X X f d 0 10 1 19 2 7 3 7 4 2 5 1 6 4 50 91 145,40 Apostila de Estatística I– Autor: Diogo Eduardo Pasqual Penna Prof. Adjunto do Departamento de Matemática e Estatística da UCS desde 1994 e do Curso de Administração da Faculdade Nossa Senhora de Fátima desde 2004. Prof. da UNISINOS em1988. Mestre em Ciências – Geofísica pela Universidade Federal do Pará – Belém-PA -convênio Petrobrás em 1994. _________________________________________________________________________ ___________________________________________________________ Estatística para os cursos de Administração, Economia, Ciências Contábeis, Tecnólogo em Processamento de Dados, Psicologia, Secretário Executivo, Gestão Imobiliária e de Micro e Pequenas Empresas - deppenna@ucs.br– Fone: 54 9104 2488 –- ano: 2006 17 2 2 145,4 ~ 1,7 1 49 f X X s s n ; 1,7 .100 94,44% 1,8 X X . 91 1,8 50 X f X n C.V= 1,7.100 94,44% 1,8 X X Exercícios complementares: a) O tempo gasto por 6 alunos para fazer um trabalho foi, em minutos: 6, 5, 5, 3, 3 e 2. Nessas condições, calcule a média aritmética, o desvio médio, a variância, o desvio padrão e o coeficiente de variação dessa distribuição. x f F x.f x d f.d d² f.d² 2 1 3 2 5 2 6 1 Respostas: Dm(desvio médio) = 1,33; Média = 4; variância = 2; desvio padrão=1,41; Coeficiente de variação: 35,25%. Calcule também a mediana e a moda. b- A tabela a seguir nos mostra o n.º de operários acidentados por mês numa fábrica durante o ano de 1991. x f F x.f x d f.d 2d f. 2d 3 4 4 3 6 1 7 2 8 2 Respostas: media = 5; desvio médio = 1,83; variância = 3,83; desvio padrão = 1,96; coeficiente de variação = 39,2%. Calcule a mediana e a média. Apostila de Estatística I– Autor: Diogo Eduardo Pasqual Penna Prof. Adjunto do Departamento de Matemática e Estatística da UCS desde 1994 e do Curso de Administração da Faculdade Nossa Senhora de Fátima desde 2004. Prof. da UNISINOS em1988. Mestre em Ciências – Geofísica pela Universidade Federal do Pará – Belém-PA -convênio Petrobrás em 1994. _________________________________________________________________________ ___________________________________________________________ Estatística para os cursos de Administração, Economia, Ciências Contábeis, Tecnólogo em Processamento de Dados, Psicologia, Secretário Executivo, Gestão Imobiliária e de Micro e Pequenas Empresas - deppenna@ucs.br– Fone: 54 9104 2488 –- ano: 2006 18 c-O quadro nos mostra o n.º de defeitos por carro de uma determinada marca numa frota de 40 veículos, calcule as medidas de dispersão e de tendência central. x f F x.f x d f.d 2d f. 2d 0 6 1 9 2 7 3 4 4 9 5 5 Respostas: media = 2,4; desvio médio= 1,49; variância = 2,79; desvio padrão = 1,67; mediana = 2 ; moda = 1 e 4; moda calculada: 1,2. d- Determine a média aritmética, a moda, a mediana, o desvio padrão, o desvio médio, a variância e o coeficiente de variação de Pearson e de Thorndike, dos valores apresentados na tabela seguinte: x f F x.f x D f.d 2d f. 2d 2 5 3 10 4 15 5 12 6 5 7 3 Respostas: media = 4,22; desvio médio = 1,06; variância = 1,72; desvio padrão = 1,31 ; mediana = 4; moda = 4; moda calculada: e- As alturas dos elementos de uma equipe de basquete são, em centímetros = 195, 198, 201, 192, e 204. Nessas condições determine as medidas de tendência central (média, mediana e moda) e as de dispersão (desvio médio, variância, desvio padrão e coeficiente de Pearson). Apostila de Estatística I– Autor: Diogo Eduardo Pasqual Penna Prof. Adjunto do Departamento de Matemática e Estatística da UCS desde 1994 e do Curso de Administração da Faculdade Nossa Senhora de Fátima desde 2004. Prof. da UNISINOS em1988. Mestre em Ciências – Geofísica pela Universidade Federal do Pará – Belém-PA -convênio Petrobrás em 1994. _________________________________________________________________________ ___________________________________________________________ Estatística para os cursos de Administração, Economia, Ciências Contábeis, Tecnólogo em Processamento de Dados, Psicologia, Secretário Executivo, Gestão Imobiliária e de Micro e Pequenas Empresas - deppenna@ucs.br– Fone: 54 9104 2488 –- ano: 2006 19 i (contador) x x d 2d 1 192 198 2 195 198 3 198 198 4 201 198 5 204 198 Respostas: 1 n i i X X n = 990/5 = 198; desvio médio = 1 n i i d n = 18/5 = 3,6 2 2 1 n i i d n 2 2 1 n i i d n =90/5 = 18; 2 18 ~ 4,24 VI-a – SEPARATRIZES (Quartis- Decis- Percentis) – Medidas de Posição Assim como a média, a mediana e a moda são medidas de posição, os quartis, decis e percentis também são. Os quartis, decis e percentis são muito similares à mediana, uma vez que também subdividem a distribuição de medidas de acordo com a proporção das freqüências observadas, enquanto que a mediana divide a distribuição em duas metades ( à mediana ocupa a posição central de duas partes iguais deixando 50% dos valores para cada lado), os quartisdividem-na em 4 quartos (4 partes de 25% cada), os decis em 10 décimos ( 10 partes de 10% cada uma) e os pontos percentis dividem-na em 100 partes iguais. Em função de que à fórmula para o cálculo da Curtose (coeficiente percentílico de curtose), utilizar apenas o 1Q primeiro quartil = (n + 1) 1 4 ; 3Q terceiro quartil = (n + 1) 3 4 ; 90P = percentil 90 (noventa) = (n +1) 90 100 e 10P percentil 10(dez) = (n + 1) 10 100 , utilizaremos apenas estas quatro separatrizes. A Fórmula de Curtose utilizada é a seguinte: 3 1 90 102( ) Q Q c P P Apostila de Estatística I– Autor: Diogo Eduardo Pasqual Penna Prof. Adjunto do Departamento de Matemática e Estatística da UCS desde 1994 e do Curso de Administração da Faculdade Nossa Senhora de Fátima desde 2004. Prof. da UNISINOS em1988. Mestre em Ciências – Geofísica pela Universidade Federal do Pará – Belém-PA -convênio Petrobrás em 1994. _________________________________________________________________________ ___________________________________________________________ Estatística para os cursos de Administração, Economia, Ciências Contábeis, Tecnólogo em Processamento de Dados, Psicologia, Secretário Executivo, Gestão Imobiliária e de Micro e Pequenas Empresas - deppenna@ucs.br– Fone: 54 9104 2488 –- ano: 2006 20 Em função da curtose temos a classificação das curvas em relação à curva normal ou curva de Gauss. Relativamente à curva normal temos: C=0,263 C = 0,263 curva mesocúrtica ( curva de frequência com grau de achatamento igual ao da curva de Gauss) C < 0,263 curva leptocúrtica ( curva de freqüência com grau de achatamento menor do que o da curva de Gauss) C > 0,263 curva platicúrtica ( curva de freqüência com grau de achatamento maior do que a curva de Gauss). Formato das curvas classificadas conforme o grau de achatamento: CURVA MESOCÚRTICA CURVA LEPTOCÚRTICA CURVA PLATICÚRTICA Exemplo: Sabendo-se que uma distribuição de frequência apresenta as seguintes medidas: 1 1 1 13 ( 1). (12 1). 3,25 4 4 4 Q n 1Q = 24,4 cm; 3Q = 41,2 cm; 10P = 20,2 cm; 90P = 49,5 cm 41, 2 24, 4 16,8 0, 2866 2(49,5 20,2) 58,6 C onde concluímos que a distribuição é platicúrtica em relação a normal ou em relação a curva de frequência de Gauss, pois 0,2866 > 0,263. Exercícios de Fixação: Apostila de Estatística I– Autor: Diogo Eduardo Pasqual Penna Prof. Adjunto do Departamento de Matemática e Estatística da UCS desde 1994 e do Curso de Administração da Faculdade Nossa Senhora de Fátima desde 2004. Prof. da UNISINOS em1988. Mestre em Ciências – Geofísica pela Universidade Federal do Pará – Belém-PA -convênio Petrobrás em 1994. _________________________________________________________________________ ___________________________________________________________ Estatística para os cursos de Administração, Economia, Ciências Contábeis, Tecnólogo em Processamento de Dados, Psicologia, Secretário Executivo, Gestão Imobiliária e de Micro e Pequenas Empresas - deppenna@ucs.br– Fone: 54 9104 2488 –- ano: 2006 21 a) Consideremos as seguintes temperaturas elevadas registradas em 12 cidades européias em graus Fahrenheit em um dia de junho ( verão europeu): Dados Brutos coletados: 90 75 86 77 85 72 78 79 94 82 74 93 Rol: dados organizados: 72 74 75 77 78 79 82 85 86 90 93 94 A temperatura mediana corresponde ao quartil 2 e vale 80,5 ºF. 80.5 ºF valem 26,94 ºC. Então n = 12. 1 1 1 13 ( 1). (12 1). 3,25 4 4 4 Q n ( 1Q está entre o 3.º e o 4 º valor). 1Q = 3.º + ( 4.º - 3.º ) x parte principal. 1Q =75 + ( 77 – 75) x 0,25; 1Q = 75 + 2 x 0,25; 1Q = 75 + 0,5; 1Q = 75,5 3 3 3 3 39 ( 1). (12 1) 13. 9,75 4 4 4 4 Q n ( 3Q está entre o 9º e o 10º valor) 3Q = 9.º + (10.º - 9.º) x parte decimal 3Q = 86 + (90 – 86) . 0,75; 3Q = 86 + 3 ; 3Q =89 90P = (n+1). 90 100 ; 90P = (12 + 1 ) 90 100 ; 90P =13 90 100 ; 90P = 11,7 ( 90P está entre o 11.º e o 12.º valor). 90P = 11.º + (12.º - 11.º ) x parte decimal 90P = 93 + (94 – 93) x 0,7; 90P = 93 + 1 x 0,7; 90P = 93 + 0,7; 90P = 93,7 10 10 ( 1). 100 P n = (12 + 1). 10 100 = 13. 10 100 = 20,75 15 5,75 5,75 0, 2376 2(24, 4 12,3) 2(12,10) 24,2 C 130 1,3 100 ( 10P está entre o 1.º e o 2.º valor). 10P = 72 + (74-72) x 0,3 10P = 72 + (2 x 0,3); 10P = 72,6 89 75,5 13,5 13,5 0,319 2(93,7 72,6) 2(21,10) 42,2 C . Conclusão: como 0,319 > 0,263 a curva é platicúrtica em relação a normal. (é achatada). Apostila de Estatística I– Autor: Diogo Eduardo Pasqual Penna Prof. Adjunto do Departamento de Matemática e Estatística da UCS desde 1994 e do Curso de Administração da Faculdade Nossa Senhora de Fátima desde 2004. Prof. da UNISINOS em1988. Mestre em Ciências – Geofísica pela Universidade Federal do Pará – Belém-PA -convênio Petrobrás em 1994. _________________________________________________________________________ ___________________________________________________________ Estatística para os cursos de Administração, Economia, Ciências Contábeis, Tecnólogo em Processamento de Dados, Psicologia, Secretário Executivo, Gestão Imobiliária e de Micro e Pequenas Empresas - deppenna@ucs.br– Fone: 54 9104 2488 –- ano: 2006 22 b) dados os valores coletados: 12 13 15 15 16 17 18 19 20 21 23 25, sendo n = 12, determine a Curtose, o Intervalo Interquartil e a amplitude. Respostas: Intervalo interquartil 25 12 13MAX MINA A 3 1Q Q = 20,75 – 15= 5,75 Amplitude: 25 12 13MAX MINA A Q3 =20,75; 1 15Q ; 90 24,4P ; 10 12,3P 20,75 15 5,75 5,75 0, 2376 2(24, 4 12,3) 2(12,10) 24,2 C que é < 0,263, originando uma curva leptocúrtica. c) Observando os dois conjuntos abaixo diga qual dos dois apresenta maior dispersão: 10 11 11 11 12 12 12 12 13 14 14 ; amplit: 14-10= 4 1 5 6 9 11 12 12 15 18 21 22 ; amplt: 22 -1= 21 O 2.º conjunto é mais disperso do que o 1.º d) Os dados abaixo referem-se ao número de reclamações diárias que um supermercado recebe devido ao erro do caixa. A pesquisa foi feita durante 18 dias consecutivos. 1 3 3 6 8 15 13 5 5 8 10 14 3 2 4 7 10 2 Calcule a curtose, a amplitude e o intervalo interquartil. RESP: Curtose = 0,2868 ou aproximadamente 0,287 > 0,263 = platic. Respostas: a serem resolvidos em casa e discutidos em aula. e)Os dados abaixo referem-se ao peso, em kilogramas, de 25 pacientes de um hospital: 51,4 63,5 64,3 71,3 85,7 68,8 77,8 76,5 89,3 43,5 74,6 76,5 50,7 55,7 59,7 77,8 75,6 61,3 68,7 69,8 64,5 65,7 63,7 81,0 46,7 Apostila de Estatística I– Autor: Diogo Eduardo Pasqual Penna Prof. Adjunto do Departamento de Matemática e Estatística da UCS desde 1994 e do Curso de Administração da Faculdade Nossa Senhora de Fátima desde 2004. Prof. da UNISINOS em1988. Mestre em Ciências – Geofísica pela Universidade Federal do Pará – Belém-PA -convênio Petrobrás em 1994. _________________________________________________________________________ ___________________________________________________________ Estatística para os cursos de Administração, Economia, Ciências Contábeis, Tecnólogo em Processamento de Dados, Psicologia, Secretário Executivo, Gestão Imobiliária e de Micro e Pequenas Empresas - deppenna@ucs.br– Fone: 54 9104 2488 –- ano: 2006 23 Calcule a media, mediana, moda, moda calculada; quartil 1, quartil 3, percentil, 10, percentil 90, amplitude, intervalo interquartil, desvio medio, variância, desvio padrão, coeficiente de variação de Pearson e de Thorndike, assimetria de Pearson, Curtose e frequências relativas e acumuladas. Resposta emkilos: =67,36; md=68,70; moda=76,5; moda calculada: 71,38; Quartil 1 =60,65; Quartil 3 = 76,50; percentil 10 = 49,10; percentil 90 = 82,88; amplitude = 45,8; intervalo interquartil = 15,85 ; desvio médio = 9,41; variância = 133,73; desvio padrão = 11,56; Coeficiente de Variação de Pearson = 17,17 %; C.V. de Thorndike =16,83%; Assimetria = -0,3478 Curtose = 0,234 VI-b –COEFICIENTE DE ASSIMETRIA Calcula-se o coeficiente de assimetria através da fórmula abaixo, tendo-se conhecidas a média, a mediana e o desvio padrão. 3( ) S Md A Se o coeficiente estiver no intervalo de 0,15 < SA < 1 a assimetria é moderada. Se o coeficiente de assimetria for SA > 1 a assimetria é forte. Se a media e a mediana forem iguais 0SA e a curva é simétrica. Se a mediana for maior do que a média a assimetria é negativa.(cauda para a esquerda onde mo md ). Se a mediana for menor do que a média a assimetria é positiva ( cauda para à direita onde mo md ). Cálculo da variância e do Desvio Padrão da População: Fórmula: 2 2 ( )x N e 2 N maiúsculo = n.º total da população Cálculo da variância e do Desvio Padrão da Amostra: 2 2 ( ) 1 x X s n e 2s s n minúsculo = n.º total da amostra. Apostila de Estatística I– Autor: Diogo Eduardo Pasqual Penna Prof. Adjunto do Departamento de Matemática e Estatística da UCS desde 1994 e do Curso de Administração da Faculdade Nossa Senhora de Fátima desde 2004. Prof. da UNISINOS em1988. Mestre em Ciências – Geofísica pela Universidade Federal do Pará – Belém-PA -convênio Petrobrás em 1994. _________________________________________________________________________ ___________________________________________________________ Estatística para os cursos de Administração, Economia, Ciências Contábeis, Tecnólogo em Processamento de Dados, Psicologia, Secretário Executivo, Gestão Imobiliária e de Micro e Pequenas Empresas - deppenna@ucs.br– Fone: 54 9104 2488 –- ano: 2006 24 VI–C–SÉRIES ESTATÍSTICAS DISCRETAS COM CÁLCULO ABREVIADO DA VARIÂNCIA E DESVIO PADRÃO (SEM CALCULAR O DESVIO MÉDIO) Exercícios: 1-calcule: média; mediana; moda; quartil 3 e quartil 1; variância; desvio padrão; coeficiente de variação de Pearson e de Thorndike dos dados: Cruzamento (i) n.º de acidentes (X) X² 1 7 49 2 5 25 3 8 64 4 6 36 5 4 16 X = 30 X² =190 a)=6 acidentes; b)md=6 acidentes; c) mo=amodal; d) 3Q = calculado = 7,5 deduzido = 7 acidentes; e) 1Q = 5 acidentes; calculado 4,5; f)variância: calcula-se pela fórmula: 22 2 190 30 5 5 X X n n =38- 36 =2 acidentes g)desvio padrão = = 2 2 1,41 acidentes. h)CV de Pearson = 23,50%; i) CV de Thorndike = 23,50% Exercício n.º 2- Calcule a media, o desvio padrão e o coefic. de variação de Pearson: n.º de dependentes (X) n.º de empregados (f) f.X X² f.X² 0 8 0 0 0 1 7 7 1 7 2 9 18 4 36 3 3 9 9 27 4 2 8 16 32 5 1 5 25 25 30 47 / 127 a)=1,57 dependentes; b) 22 2 . . 127 47 4, 23 2, 46 1,77 30 30 f x f x n n b) desvio padrão 2 1,77 1,33 dependentes c) Coeficiente de variabilidade de Pearson = 84,71 % Apostila de Estatística I– Autor: Diogo Eduardo Pasqual Penna Prof. Adjunto do Departamento de Matemática e Estatística da UCS desde 1994 e do Curso de Administração da Faculdade Nossa Senhora de Fátima desde 2004. Prof. da UNISINOS em1988. Mestre em Ciências – Geofísica pela Universidade Federal do Pará – Belém-PA -convênio Petrobrás em 1994. _________________________________________________________________________ ___________________________________________________________ Estatística para os cursos de Administração, Economia, Ciências Contábeis, Tecnólogo em Processamento de Dados, Psicologia, Secretário Executivo, Gestão Imobiliária e de Micro e Pequenas Empresas - deppenna@ucs.br– Fone: 54 9104 2488 –- ano: 2006 25 Até aqui trabalhamos com a estatística discreta, valores inteiros. Daqui para frente trabalharemos com dados contínuos (valores reais). Exercício n.º 3 - Calcule a media, a mediana e a moda calculada, o intervalo interquartil, a amplitude e o coeficiente de assimetria e de curtose do conjunto abaixo: 13 9 18 15 14 21 7 10 11 20 5 18 37 16 17 Resp: =15,4; md= 2Q 15; mo=18; 90 27, 4P 1Q 10; 3Q 18; 10P = 6,2; 90 27, 4P Amplitude= 32; intervalo interquartil=8; C = 0,1887 ; Assimetria= 0,162 Desvio padrão =7,4. Exercício n.º 4- A partir dos dados abaixo calcule a media, moda, mediana, variância, desvio padrão; coeficiente de variação, coeficiente de assimetria , curtose, amplitude e intervalo interquartil dos dados a seguir que referem-se aos custos das mensalidades, em milhares de dólares, para 25 faculdades de artes estão relacionados abaixo: 23 25 30 23 20 22 21 15 25 24 30 25 30 20 23 29 20 19 22 23 29 23 28 22 28 respostas: =24; md=23; mo=23;moda-calculada= 3 28Q ; 10 19,6P ; CV Pearson = 16,1; CV Thorndike = ; Coef. Assim= 0,7692; 3 28Q ; 1 21,5Q ; 90 30P ; 10 19,6P ; curtose = VII – DISTRIBUIÇÃO DE FREQÜÊNCIA EM CLASSE ( DADOS AGRUPADOS) Dados Brutos : São aqueles que ainda não foram numericamente organizados. Rol: é um arranjo de dados numéricos brutos colocados em ordem crescente ou em ordem decrescente de grandeza. Quando se resumem grandes massas de dados brutos costuma-se frequentemente distribuí-los em classes ou categorias, determinando o número de indivíduos pertencentes a cada uma das classes. Essa distribuição em classes é denominada distribuição de freqüência. Apostila de Estatística I– Autor: Diogo Eduardo Pasqual Penna Prof. Adjunto do Departamento de Matemática e Estatística da UCS desde 1994 e do Curso de Administração da Faculdade Nossa Senhora de Fátima desde 2004. Prof. da UNISINOS em1988. Mestre em Ciências – Geofísica pela Universidade Federal do Pará – Belém-PA -convênio Petrobrás em 1994. _________________________________________________________________________ ___________________________________________________________ Estatística para os cursos de Administração, Economia, Ciências Contábeis, Tecnólogo em Processamento de Dados, Psicologia, Secretário Executivo, Gestão Imobiliária e de Micro e Pequenas Empresas - deppenna@ucs.br– Fone: 54 9104 2488 –- ano: 2006 26 Exemplo: Sejam as notas de 50 alunos (avaliadas de zero a cem) abaixo (dados brutos): 80 67 60 98 25 31 49 39 12 27 45 40 46 53 59 64 71 85 87 53 59 28 61 57 53 22 57 36 29 22 18 05 03 20 38 08 07 09 79 65 58 55 48 41 15 63 75 79 75 37 Rol: o próximo passo é colocar os dados brutos acima em ordem crescente ou decrescente para a seguir estudar e entender os conceitos básicos a seguir: 3 5 7 8 9 12 15 18 20 22 22 25 27 28 29 31 36 37 38 39 40 41 45 46 48 49 51 53 53 53 55 57 57 58 59 59 60 63 64 65 67 71 75 75 79 79 80 85 87 98 Conceitos Básicos 1.Limites de Observação: são os valores extremos encontrados nos dados brutos. iL limite inferior (menor valor dos dados coletados) iL 03 sL = limite superior (maior valor dos dados coletados) sL = 98 2.Intervalo de Observação: é definido pelos limites de observação. ; 3;98i SL L 3.Amplitude de Observação:é a diferença entre os limites de observação. 98 03 95s iL L 98 03 95s iL L 4.Definição do número de classes: Para determinar o número de classes há diversos métodos. A regra de Sturges, um dos métodos, estabelece que o n.º de classes é igual a: 101 3.3logk n onde k representa o n.º de classes e n o número total de observações. No exemplo acima n =50 e log de 50 = 1,69897 então aplicando a regra de Sturges temos: Apostila de Estatística I– Autor: Diogo Eduardo PasqualPenna Prof. Adjunto do Departamento de Matemática e Estatística da UCS desde 1994 e do Curso de Administração da Faculdade Nossa Senhora de Fátima desde 2004. Prof. da UNISINOS em1988. Mestre em Ciências – Geofísica pela Universidade Federal do Pará – Belém-PA -convênio Petrobrás em 1994. _________________________________________________________________________ ___________________________________________________________ Estatística para os cursos de Administração, Economia, Ciências Contábeis, Tecnólogo em Processamento de Dados, Psicologia, Secretário Executivo, Gestão Imobiliária e de Micro e Pequenas Empresas - deppenna@ucs.br– Fone: 54 9104 2488 –- ano: 2006 27 Poderíamos então montar a nossa distribuição em 07 classes. Mas podemos utilizar, por exemplo, 5 classes, nada impede nossa decisão. Definindo a largura da classe: Como temo uma amplitude 95 de observação então dividindo-se 95 por 7 (classe) teremos aproximadamente 14. podemos assim definir a nossa distribuição em sete classes com largura 14 para cada classe. 5.Construção da Distribuição de Freqüência : 00 14-----6 14 28-----7 28 42-----9 42 56-----8 56 70----11 70 84-----6 84 98----3 6.Construção da Distribuição de Freqüência:poderia ser assim: 03 17 17 31 31 45 45 59 63 77 77 91 91 105 Como existe a probabilidade de um aluno tirar a nota 0 e também a nota 100, a amplitude da DF é 100 e a nossa DF deveria conter as notas extremas 0 e 100 e a DF ficaria com largura 15 e sete classes, com o seguinte formato: 00 15 15 30 30 45 45 60 60 75 75 90 90 105 Apostila de Estatística I– Autor: Diogo Eduardo Pasqual Penna Prof. Adjunto do Departamento de Matemática e Estatística da UCS desde 1994 e do Curso de Administração da Faculdade Nossa Senhora de Fátima desde 2004. Prof. da UNISINOS em1988. Mestre em Ciências – Geofísica pela Universidade Federal do Pará – Belém-PA -convênio Petrobrás em 1994. _________________________________________________________________________ ___________________________________________________________ Estatística para os cursos de Administração, Economia, Ciências Contábeis, Tecnólogo em Processamento de Dados, Psicologia, Secretário Executivo, Gestão Imobiliária e de Micro e Pequenas Empresas - deppenna@ucs.br– Fone: 54 9104 2488 –- ano: 2006 28 O símbolo significa que o intervalo de observação de cada classe é fechado à esquerda e aberto à direita, assim todos os limites superiores de classe não estão contidos nelas mas sempre na classe seguinte. Por exemplo: a 1.ª classe vai de 0 a 14, mas o 14 não está contido nessa classe e sim na 2.ª classe que vai de 14 a 28 e assim por diante. 7.Classe de uma (Distribuição de Freqüência): é o nome dado a cada subintervalo da distribuição. 8.Limites de Classe: são os valores extremos encontrados em cada classe e representados por l (éle) minúsculo. il = limite inferior de classe; sl = limite superior de classe Exemplo: il = 00 na classe 1 e sl =14 na classe 1 9.Amplitude de Classe (h): é a diferença entre os limites de classe. A amplitude de classe pode ser variável ou constante. Exemplo: Largura da 1.ª classe s ih l l = 14 - 00 = 14 10.Limites da Distribuição de Freqüência: são o limite inferior da primeira classe e o limite superior da última classe. Esses limites geralmente não coincidem com os limites de observação. Deveria ser 00 e 100, mas como o limite superior observado foi 98, com 7 classes e largura 14 nossos limites ficaram: 00 98S Li L No nosso casso o limite inferior da distribuição é 00 e o limite inferior observado é 03. O limite superior da distribuição e o limite superior observado são , neste caso, igual, ou seja, 98. 11.Amplitude da Distribuição de Freqüência: é a diferença entre os limites da distribuição. 98 00 98DFH , já a amplitude da observação é de 95. Apostila de Estatística I– Autor: Diogo Eduardo Pasqual Penna Prof. Adjunto do Departamento de Matemática e Estatística da UCS desde 1994 e do Curso de Administração da Faculdade Nossa Senhora de Fátima desde 2004. Prof. da UNISINOS em1988. Mestre em Ciências – Geofísica pela Universidade Federal do Pará – Belém-PA -convênio Petrobrás em 1994. _________________________________________________________________________ ___________________________________________________________ Estatística para os cursos de Administração, Economia, Ciências Contábeis, Tecnólogo em Processamento de Dados, Psicologia, Secretário Executivo, Gestão Imobiliária e de Micro e Pequenas Empresas - deppenna@ucs.br– Fone: 54 9104 2488 –- ano: 2006 29 98 03 95obsH 12.Número de observações: é o número que representa a quantidade dos dados a serem organizados. Símbolo: n (amostra) ou N (população) ou 1 n i i f , em nosso exercício N = 50. 13.Variável: Variável é um símbolo que associamos ao conjunto objeto de estudo que representa esse conjunto. Atribuímos o símbolo x para esta variável. 14.Ponto Médio de Classe: é a média aritmética simples dos extremos de cada classe. 2 i s i l l x em nosso exercício somando-se o limite inferior com o superior da 1.ª classe, por exemplo, obtemos: 00 14 7 2i x , que é o ponto médio da 1.ª classe. 15.O Cálculo da Mediana na Distribuição de Freqüência com Dados Agrupados ou Grupados Fórmula utilizada: Md = 2 . anterior f F li h f Onde li = limite inferior da CME (classe mediana) 2 f = Ponto central da distribuição – local aonde se encontra a md anteriorF = Freqüência acumulada anterior à CME h = largura da CME f = freqüência simples ou absoluta da CME 16.O cálculo da Moda Calculada: 3( ) 2( )calculadaMo mediana média Apostila de Estatística I– Autor: Diogo Eduardo Pasqual Penna Prof. Adjunto do Departamento de Matemática e Estatística da UCS desde 1994 e do Curso de Administração da Faculdade Nossa Senhora de Fátima desde 2004. Prof. da UNISINOS em1988. Mestre em Ciências – Geofísica pela Universidade Federal do Pará – Belém-PA -convênio Petrobrás em 1994. _________________________________________________________________________ ___________________________________________________________ Estatística para os cursos de Administração, Economia, Ciências Contábeis, Tecnólogo em Processamento de Dados, Psicologia, Secretário Executivo, Gestão Imobiliária e de Micro e Pequenas Empresas - deppenna@ucs.br– Fone: 54 9104 2488 –- ano: 2006 30 17.O cálculo da CURTOSE (Coeficiente percentílico de Curtose) na Distribuição de Freqüência em Classes ( Dados Agrupados). 3 1 90 102( ) Q Q C P P 18.Fórmulas para o cálculo dos quartis: 3 3 4 f Q ; 1 1. 4 f Q Fórmula para o cálculo dos percentis: 10 10 100 f P ; 90 90 100 f P 19.Classificação das Curvas: =0,263: mesocúrtica (curva de Gauss) 0,263: platicúrtica < 0,263 : leptocúrtica Exercícios de Distribuição de Freqüência em Classes: a- Sabemos que a fração mínima de terras escriturava é de 2 (dois) hectares em zonas rurais, e que são taxadas com ITR (imposto territorial rural) em vez de IPTU (imposto predial e territorial urbano) e cujo fracionamento em módulos é feito pelo INCRA. A distribuição abaixo nos mostra as terras cultivadas de uma determinada região em hectares (h a). Frações territoriais rurais menores do que dois hectares devem ser licenciados pela FEPAM ou pela SEMMA, para terem escrituras reconhecidas e registradas em cartório. classe x f F x.f X D F.d 2d f. 2d 2 8 10 8 14 9 14 20 21 20 26 7 26 32 3 Resposta: media = 15,08; Desvio médio: 5,5; variância = 45,27; Desvio Padrão = 6,72; Coeficiente de variação = 44,56%. ; Mediana = 15,7; moda = Apostila de Estatística I– Autor: DiogoEduardo Pasqual Penna Prof. Adjunto do Departamento de Matemática e Estatística da UCS desde 1994 e do Curso de Administração da Faculdade Nossa Senhora de Fátima desde 2004. Prof. da UNISINOS em1988. Mestre em Ciências – Geofísica pela Universidade Federal do Pará – Belém-PA -convênio Petrobrás em 1994. _________________________________________________________________________ ___________________________________________________________ Estatística para os cursos de Administração, Economia, Ciências Contábeis, Tecnólogo em Processamento de Dados, Psicologia, Secretário Executivo, Gestão Imobiliária e de Micro e Pequenas Empresas - deppenna@ucs.br– Fone: 54 9104 2488 –- ano: 2006 31 Moda Calculada= ;Quartil 1 = 9,7; Quartil 3 = 19,3; Percentil 10 = 5; Percentil 90 = 24,3; Curtose 0,2; Assimetria= -0,3. b- Na tabela a seguir estão relacionados os valores correspondentes ao consumo individual de energia elétrica medido em quilowatts-hora em um grupo de 50 usuários particulares. Dados Brutos 58 62 80 57 8 126 136 96 144 19 90 86 38 94 82 75 148 114 131 28 66 95 121 158 64 105 118 73 83 81 50 92 60 52 89 58 10 90 94 74 9 75 72 157 125 76 88 78 84 36 Rol 8 9 10 19 28 36 38 50 52 57 58 58 60 62 64 66 72 73 74 75 75 76 78 80 81 82 83 84 86 88 89 90 90 92 94 94 95 96 105 114 118 121 125 126 131 136 144 148 157 158 Utilize a regra de Sturges (k = 1+ 3,3 log n) para determinar o número de classes. Lembre-se que o log 50 = 1,69897 K = 1 + 3,3 log 50; K = 1+3,3 . 1,69807; K= 6,6 Total = 7 classes. Definindo a largura das classes: 158 – 8 = 150/7 = 22,7 classes x f F x.f X d f.d 2d f. 2d 8 30 30 52 52 74 74 96 96 118 118 140 140 162 Apostila de Estatística I– Autor: Diogo Eduardo Pasqual Penna Prof. Adjunto do Departamento de Matemática e Estatística da UCS desde 1994 e do Curso de Administração da Faculdade Nossa Senhora de Fátima desde 2004. Prof. da UNISINOS em1988. Mestre em Ciências – Geofísica pela Universidade Federal do Pará – Belém-PA -convênio Petrobrás em 1994. _________________________________________________________________________ ___________________________________________________________ Estatística para os cursos de Administração, Economia, Ciências Contábeis, Tecnólogo em Processamento de Dados, Psicologia, Secretário Executivo, Gestão Imobiliária e de Micro e Pequenas Empresas - deppenna@ucs.br– Fone: 54 9104 2488 –- ano: 2006 32 Respostas: Média = 83,24; Mediana = 82,1; moda não calculada: 81,5; moda calculada (3md - 2 ) = ; Q1 =61,9; Q3 = 99,7; P10 = 30; P 90 = 136,3 Variância = 1255,3; Desvio Padrão= 35,4; CV= 42,6; Assimetria = 0,0966; Curtose= 0,177 (curva leptocúrtica); Intervalo Interquartil = 37,8; c-Em um estudo de seguro de acidentes com veículos motorizados no estado de Nova York, classificam-se as colisões fatais de acordo com a hora da manhã. Conforme tabelas abaixo. [fonte: dados do New York State Department of Motor Vehicles – Departamento de Veículos motorizados do Estado de Nova York] Manhã (fi) n.º de acidentes fatais (freqüência com que ocorrem os acidentes hora (fi) F x x.f x d f.d 2d f. 2d relativaf F rel.acum. 0⌐ 2 194 2⌐ 4 149 4⌐ 6 100 6⌐ 8 131 8⌐10 119 10 ⌐12 160 Responda as questões abaixo: a) Média =.................................... b) Mediana =................................. c) Moda =...................................... d) Desvio médio =......................... e) Variância =................................. f) Desvio padrão =............................ g) Coeficiente de Variação de Pearson =.............................. h) Coeficiente de Variação de Thorndike=.............................. i) Assimetria =..................................................................... j) Quartil 1 =.................................................. k) Quartil 3 =............................................. l) Percentil 10 =........................................ m) Percentil 90 = n) Curtose (SEPARATRIZES) e classificação da curva em leptocúrtica, Mesocúrtica ou platicúrtica =.................................................. o) Intervalo Interquartil =............................................. p) Amplitude =................................................... q) Qual o percentual de acidentes fatais entre as zero (0) horas e às 4 da madrugada................... Apostila de Estatística I– Autor: Diogo Eduardo Pasqual Penna Prof. Adjunto do Departamento de Matemática e Estatística da UCS desde 1994 e do Curso de Administração da Faculdade Nossa Senhora de Fátima desde 2004. Prof. da UNISINOS em1988. Mestre em Ciências – Geofísica pela Universidade Federal do Pará – Belém-PA -convênio Petrobrás em 1994. _________________________________________________________________________ ___________________________________________________________ Estatística para os cursos de Administração, Economia, Ciências Contábeis, Tecnólogo em Processamento de Dados, Psicologia, Secretário Executivo, Gestão Imobiliária e de Micro e Pequenas Empresas - deppenna@ucs.br– Fone: 54 9104 2488 –- ano: 2006 33 r) Qual o percentual de acidentes fatais entre as 8 da manhã e o meio dia (12 horas)...................... HORA (f) (F) x .f.x cf Xx (d) f.d 2d f. 2d fr. Fra 00 02 194 02 04 149 04 06 100 06 08 131 08 10 119 10 12 160 d)Exercício utilizando fórmulas da variância e do desvio padrão amostral: Considerando que distribuição de freqüência acima tenha seus dados obtidos através de uma amostragem calcule: a variância e o desvio padrão amostral utilizando as fórmulas: 2 2 ( ) var 1 X X S n ; = desvio padrão amostral: e)Exemplo: Determine a média e o desvio padrão da amostra do conjunto de dado. n.º de crianças em 50 famílias: 1 3 1 1 1 1 2 2 1 0 1 1 0 0 0 1 5 0 3 6 3 0 3 1 1 Apostila de Estatística I– Autor: Diogo Eduardo Pasqual Penna Prof. Adjunto do Departamento de Matemática e Estatística da UCS desde 1994 e do Curso de Administração da Faculdade Nossa Senhora de Fátima desde 2004. Prof. da UNISINOS em1988. Mestre em Ciências – Geofísica pela Universidade Federal do Pará – Belém-PA -convênio Petrobrás em 1994. _________________________________________________________________________ ___________________________________________________________ Estatística para os cursos de Administração, Economia, Ciências Contábeis, Tecnólogo em Processamento de Dados, Psicologia, Secretário Executivo, Gestão Imobiliária e de Micro e Pequenas Empresas - deppenna@ucs.br– Fone: 54 9104 2488 –- ano: 2006 34 1 1 6 0 1 3 6 6 1 2 2 3 0 1 1 4 1 1 2 2 0 3 0 2 4 Você coletou uma amostra aleatória do n.º de crianças por família em uma região. Os resultados estão dispostos na tabela acima. X f x.f X X 2( )X X 2( )X X .f 0 10 0 -1,8 3,24 32,40 1 19 19 -0,8 0,64 12,16 2 7 14 0,2 0,04 0,28 3 7 21 1,2 1,44 10,08 4 2 8 2,2 4,84 9,68 5 1 5 3,2 10,24 10,24 6 4 24 4,2 17,64 70,56 =50 =91 =145,40 (media da amostra); 2 2 ( ) . 145,4 1,7 1 50 1 X X f s s n (desvio padrão de 1,7 crianças) 20. A curva de freqüência. Curva polida. Como, em geral, os dados coletados pertencem a uma amostra extraída de uma população, podemos imaginaras amostras tornando-se cada vez mais amplas e a amplitude das classes ficando cada vez menor, o que nos permite concluir que a linha poligonal (contorno do polígono de freqüência) tende a se transformar numa curva -a curva de freqüência. Podemos dizer, então que, enquanto o polígono de freqüência dos dá a imagem real do fenômeno estudado, a curva de freqüência nos dá a imagem tendencial. Para obtermos a curva polida utiliza-se uma fórmula bastante simples a qual a partir das freqüências reais nos fornece novas freqüências – frequências calculadas, que se localizarão nos pontos médios. Fórmula utilizada para a obtenção da curva de freqüência calculada: 1 12 4 i i i i f f f fc , onde 1fc é a freqüência calculada da classe considerada; ifc é a freqüência simples da classe considerada; 1ifc é a freqüência simples da classe anterior à classe considerada; Apostila de Estatística I– Autor: Diogo Eduardo Pasqual Penna Prof. Adjunto do Departamento de Matemática e Estatística da UCS desde 1994 e do Curso de Administração da Faculdade Nossa Senhora de Fátima desde 2004. Prof. da UNISINOS em1988. Mestre em Ciências – Geofísica pela Universidade Federal do Pará – Belém-PA -convênio Petrobrás em 1994. _________________________________________________________________________ ___________________________________________________________ Estatística para os cursos de Administração, Economia, Ciências Contábeis, Tecnólogo em Processamento de Dados, Psicologia, Secretário Executivo, Gestão Imobiliária e de Micro e Pequenas Empresas - deppenna@ucs.br– Fone: 54 9104 2488 –- ano: 2006 35 1ifc é a freqüência simples da classe posterior à classe considerada; Dada a distribuição de freqüência abaixo, a qual representa as altura em centímetros de funcionários de uma fábrica, ache a a curva de freqüência e construa um gráfico, plotando no eixo das abcissas a variável altura e no eixo das ordenadas as freqüências. i Estaturas ( cm) if ifc 1 150 154 4 4,25 2 154 158 9 8,25 3 158 162 11 9,75 4 162 166 8 8 5 166 170 5 5,25 6 170 174 3 2,75 = 40 Utilizando régua ou papel milimetrado trace o gráfico de freqüência polida. 1 0 (2 4) 9 4,25 4 x fc ; 2 4 (2 9) 11 8,25 4 x fc ; 3 9 (2 11) 8 9,75 4 x fc 4 11 (2 8) 5 8 4 x fc ; 5 8 (2 5) 3 5, 25 4 x fc ; 6 5 (2 3) 0 2,75 4 x fc VIII – P ROBABILIDADE O cálculo das probabilidades pertence ao campo da Matemática. Sua inclusão neste estudo, cujo objetivo é essencialmente a Estatística encontra explicação no fato de que a maioria dos fenômenos de que trata a Estatística são de natureza aleatória ou probabilística. Conseqüentemente, o conhecimento dos aspectos mais fundamentais, do cálculo de probabilidades é uma necessidade essencial para o estudo da Estatística. Experimento Aleatório Em quase tudo, em maior ou menor grau, vislumbramos o acaso. Assim a afirmação: “é provável que meu time do coração ganhe a partida hoje”, pode resultar: Apostila de Estatística I– Autor: Diogo Eduardo Pasqual Penna Prof. Adjunto do Departamento de Matemática e Estatística da UCS desde 1994 e do Curso de Administração da Faculdade Nossa Senhora de Fátima desde 2004. Prof. da UNISINOS em1988. Mestre em Ciências – Geofísica pela Universidade Federal do Pará – Belém-PA -convênio Petrobrás em 1994. _________________________________________________________________________ ___________________________________________________________ Estatística para os cursos de Administração, Economia, Ciências Contábeis, Tecnólogo em Processamento de Dados, Psicologia, Secretário Executivo, Gestão Imobiliária e de Micro e Pequenas Empresas - deppenna@ucs.br– Fone: 54 9104 2488 –- ano: 2006 36 a)que apesar do favoritismo perca; b)que, como pensamos, ganhe; c)que empate. Como vimos , o resultado final depende do acaso. Fenômenos como esse denominamos fenômenos aleatórios ou experimentos aleatórios. ----------------------------------------------------------------------------------------------. Aleatório: é aquilo que depende de acontecimentos futuros incertos; casual; fortuito; contingente; que pode ou não suceder; eventual; duvidoso; inopinado. Os postulados da probabilidade: 1.º POSTULADO: As probabilidades são números reais positivos ou zero ; simbolicamente:P(A) 0 para qualquer evento A . 2.º POSTULADO: Qualquer espaço amostral tem probabilidade 1; simbolicamente P(S) = 1 para qualquer espaço amostral S. Definição Experimentos ou fenômenos aleatórios são aqueles que, mesmo repetidos várias vezes sob condições semelhantes apresentam resultados imprevisíveis, isto é, não podem ser previstos ou vistos com antecedência. Exemplos: 1. O lançamento de uma moeda ( probabilidade: ½); 2. A aposta em um jogo qualquer da loteria esportiva (probabilidade:1/3); 3. A disputa de par ou ímpar (probabilidade: ½) 4. O lançamento de uma dado (probabilidade: 1/6) 5. O lançamento de um tetraedro ( probabilidade: ¼) 6. Tirar uma dama num baralho de 52 cartas (probabilidade: 1/52) Espaço Amostral O conjunto S (space), de todos os resultados possíveis de um dado experimento aleatório chama-se espaço amostral. Qualquer elemento do espaço amostral é chamado de amostra ou ponto amostral. Exemplo 1: No lançamento de um dado o espaço amostral é o conjunto S = {1, 2, 3, 4, 5, 6} n(S) = 6 Exemplo 2: Quando jogamos uma moeda o espaço amostral é o conjunto: S = {CARA, COROA}. n(S) = 2. Exemplo 3: Ao disputarmos um par ou ímpar o espaço amostral da soma dos Resultados, é S={PAR, IMPAR}. n(S) = 2. Apostila de Estatística I– Autor: Diogo Eduardo Pasqual Penna Prof. Adjunto do Departamento de Matemática e Estatística da UCS desde 1994 e do Curso de Administração da Faculdade Nossa Senhora de Fátima desde 2004. Prof. da UNISINOS em1988. Mestre em Ciências – Geofísica pela Universidade Federal do Pará – Belém-PA -convênio Petrobrás em 1994. _________________________________________________________________________ ___________________________________________________________ Estatística para os cursos de Administração, Economia, Ciências Contábeis, Tecnólogo em Processamento de Dados, Psicologia, Secretário Executivo, Gestão Imobiliária e de Micro e Pequenas Empresas - deppenna@ucs.br– Fone: 54 9104 2488 –- ano: 2006 37 Tipos de Probabilidade Há três tipos de probabilidade: clássica, empírica e subjetiva. A probabilidade de um evento E ocorrer é escrita com P(E) – lê-se “a probabilidade do evento E”. Definição- a) A probabilidade clássica ( ou teórica) é usada quando cada resultado no espaço amostral tem a mesma probabilidade de ocorrer. A probabilidade clássica para um evento E é dada por: P (E) = número de resultados em E , onde S = espaço amostral e 0 P(E) 1 n.º total de resultados em S Exemplo: Um dado de seis faces é jogado. Obtenha a probabilidade dos seguintes eventos: 1.Evento A: obter um 3 – Solução: { P (3) = 1/6 ( ) f fP E ou n f 0,167} 2.Evento B: obter um 7 – Solução: { P (7) = 0/6 = zero 3.Evento C: obter um n.º menor do que 5. – Solução: há 4 resultados menores do que 5 - C={1, 2, 3 e 4}. Assim, 4/6 = 2/3 0,667. b) A probabilidade empírica ( ou estatística) baseia-se em observações obtidas de experimentos probabilísticos. A probabilidade empírica de um evento E é a freqüência relativa desse evento P(E) = Freqüência do Evento E onde 0 P(E) 1 frequência Total ( ) f f P E ou n f Exemplo: obtendo probabilidades empíricas. Um açude contém três tipos de peixes: carpa húngara; catfish e bagre africano. Cada peixe no açude tem a mesma probabilidade de ser capturado. Você pesca 40 peixes e anota seu tipo. Após cada captura, você devolve o peixe ao açude. A seguinte distribuição de freqüência
Compartilhar