Prévia do material em texto
Introdução à Estatística Econômica– Autor: Diogo Eduardo Pasqual Penna- deppenna@gmail.com 54 996470481_______________________________________________________________ ____________________________________________________________________ – outubro de 2021 - 1 ÍNDICE CAPÍTULOS I-INTRODUÇÃO.................................................................... pág.4 Estatística Descritiva Estatística Indutiva ou Inferencial a) coleta contínua b) coleta periódica c) coleta ocasional Apuração dos Dados; Apresentação dos Dados; Análise dos resultados; A Estatística nas Empresas II-POPULAÇÃO e AMOSTRA (ESTIMADOR ESTATÍSTICO)....pág.5 Variável;Variável qualitativa (qualidade);Variável quantitativa (quantidade); População;Amostra Simbologia Utilizada para o estudo de uma população; Simbologia Utilizada para o estudo de uma amostra; III- CONSTRUÇÃO DE GRÁFICOS: em Barras, em Colunas, de Setores IV- MEDIDAS DE TENDÊNCIA CENTRAL – DADOS NÃO AGRUPADOS ...........................................................................................pág.8 a)Cálculo da Média (mean): b)Cálculo da Moda (mode) c)Cálculo da Mediana (median): V- A DISTRIBUIÇÃO DE FREQUÊNCIA DE DADOS AGRUPADOS – MAS SEM INTERVALOS DE CLASSES..............................................pág.10 Diagramas de freqüência - tabelas Média; Mediana e Moda – Exercícios diversos Dados Brutos e Rol VI – MEDIDAS DE DISPERSÃO OU VARIABILIDADE ................pág.14 Desvio Médio; Variância; Desvio Padrão; Coeficiente de Variação de Pearson e de Thorndike; VI-a – SEPARATRIZES.........................................................................pág.19 (Quartis- Decis- Percentis) – Medidas de Posição – Coeficiente Percentílico de Curtose - Classificação das Curvas ( leptocúrtica; mesocúrtica e platicúrtica); Rol e Dados Brutos – Exercícios Introdução à Estatística Econômica– Autor: Diogo Eduardo Pasqual Penna- deppenna@gmail.com 54 996470481_______________________________________________________________ ____________________________________________________________________ – outubro de 2021 - 2 VI-b –COEFICIENTE DE ASSIMETRIA.............................................pág.23 VI–c–SÉRIES ESTATÍSTICAS DISCRETAS COM CÁLCULO ABREVIADO DA VARIÂNCIA E DESVIO PADRÃO (SEM CALCULAR O DESVIO MÉDIO)................................................................................pág.24 VII – DISTRIBUIÇÃO DE FREQÜÊNCIA EM CLASSE ( DADOS AGRUPADOS).........................................................................................pág.25 Dados Brutos e Rol Conceitos Básicos: 1.Limites de Observação 2.Intervalo de Observação 3.Amplitude de Observação 4.Definição do número de classes – Regra de Sturges 5.Construção da Distribuição de Freqüência : 6.Construção da Distribuição de Freqüência 7.Classe de uma (Distribuição de Freqüência) 8.Limites de Classe 9.Amplitude de Classe (h) 10.Limites da Distribuição de Freqüência 11.Amplitude da Distribuição de Freqüência 12.Número de observações 13.Variável: 14.Ponto Médio de Classe Fórmulas para calcular a mediana, a Moda calculada e a Curtose: 15.O Cálculo da Mediana na Distribuição de Freqüência com Dados Agrupados ou Grupados 16.O cálculo da Moda Calculada 17.O cálculo da CURTOSE (Coeficiente Percentílico de Curtose) na Distribuição de Freqüência em Classes ( Dados Agrupados). 18.Fórmulas para o cálculo dos quartis; Fórmula para o cálculo dos percentis; 19.Classificação das Curvas; Gráfico da curva polida 20.A freqüência calculada VIII – PROBABILIDADE.......................................................................pág31 Experimento Aleatório Definição Espaço Amostral Tipos de Probabilidade: Introdução à Estatística Econômica– Autor: Diogo Eduardo Pasqual Penna- deppenna@gmail.com 54 996470481_______________________________________________________________ ____________________________________________________________________ – outubro de 2021 - 3 probabilidade clássica ( ou teórica) probabilidade empírica ( ou estatística) Probabilidade Subjetiva VIII. a) DISTRIBUIÇÃO DE PROBABILIDADE..............................pág.37 VIII b) PROBABILIDADE CLÁSSICA.................................................pág.41 Probabilidade de um Evento Probabilidade da não ocorrência de um evento Probabilidade de uma união (eventos mutuamente excludentes) ou“o terceiro postulado de probabilidade” Probabilidade de uma intersecção Intersecção e união no mesmo exercício – utilização conjunta de ambos na mesma fórmula: evento elementar: apenas um ponto amostral evento certo: igual ao espaço amostral S evento impossível: conjunto vazio Princípio da Multiplicação Amostragem com reposição Amostragem sem reposição Arranjos ! ( )! n n k Combinações Probabilidade Condicional Pr( )Pr( ) Pr( ) A B A B B Eventos independentes: são dois eventos que não se afetam mutuamente. Probabilidade Condicional: é a probabilidade de ocorrência de um determinado evento, quando se sabe que outro evento ocorreu. Eventos complementares (p + q =1 q = 1- p) Eventos Independentes Pr( ) Pr( )A B A Pr( ) Pr( )A B A Eventos Mutuamente Exclusivos Exercícios IX – Distribuição Binomial................................................. pág.51 X – Distribuição de Poisson............................................................... pág 54 Introdução à Estatística Econômica– Autor: Diogo Eduardo Pasqual Penna- deppenna@gmail.com 54 996470481_______________________________________________________________ ____________________________________________________________________ – outubro de 2021 - 4 XI–Distribuição Normal Reduzida.................................................... pág.55 XII- Intervalos de Confiança para a Média....................................... .pág 59 XIII-Testes de Hipóteses e Níveis de Significância......................... pág 65 XIV – BIBLIOGRAFIA........................................................................pág.69 Fórmulas ............................................................................... págs. 71 – 74 Tabela z....................................................................................... pág.76 ---------------------------------------------------------------------------------------------- I-INTRODUÇÃO: A Estatística é uma parte da Matemática Aplicada que fornece métodos para a coleta, organização, descrição, análise e interpretação de dados e para a utilização dos mesmos na tomada de decisões. Estatística Descritiva: trata da coleta, da organização e da descrição dos dados. Estatística Indutiva ou Inferencial : trata da análise e da interpretação dos dados. A coleta pode ser direta ou indireta. A direta pode ser: a)coleta contínua: registro de nascimentos e óbitos e da freqüência dos alunos às aulas. b)coleta periódica: feita em intervalos constantes como os censos (10 em 10 anos) e as avaliações mensais de alunos. c)coleta ocasional: quando feita extemporaneamente. Exemplo: no caso de epidemias que assolam ou dizimam rebanhos inteiros. A coleta indireta é feita através de dados colhidos por uma coleta direta (exemplo: pesquisa sobre a mortalidade infantil). Apuração dos Dados: é a soma e o processamento dos dados obtidos e a disposição mediante critérios de classificação. Pode ser manual ou eletrônica. Apresentação dos Dados: Os dados devem ser apresentados sob forma adequada (tabelas e/ou gráficos) tornando mais fácil o exame e o tratamento estatístico. Introdução à Estatística Econômica– Autor: Diogo Eduardo Pasqual Penna- deppenna@gmail.com 54 996470481_______________________________________________________________ ____________________________________________________________________ – outubro de 2021 - 5 Análise dosresultados: O objetivo último da Estatística é tirar conclusões sobre o todo (população) a partir de informações fornecidas por parte representativa do todo (amostra). Nesta fase entramos na Estatística Indutiva ou Inferencial da onde tiramos conclusões e previsões. A Estatística nas Empresas : no mundo atual , a empresa é uma das vigas- mestras da Economia dos Povos. A direção de uma empresa, de qualquer tipo, privadas estatais ou governamentais (públicas), exige de seu administrador a importante tarefa de tomar decisões, e o conhecimento e o uso da Estatística facilitarão seu tríplice trabalho de organizar, dirigir e controlar a empresa. Por meio de sondagem, de coleta de dados e de recenseamento de opiniões, podemos conhecer a realidade geográfica e social, os recursos naturais, humanos e financeiros disponíveis, as expectativas da comunidade sobre a empresa, e estabelecer suas metas, seus objetivos com maior possibilidade de serem alcançados a curto, médio ou longo prazos. A Estatística ajudará em tal trabalho, como também na seleção e organização da estratégia a ser adotada do empreendimento e, ainda, na escolha das técnicas de verificação e avaliação da quantidade e da qualidade do produto e mesmo dos possíveis lucros e /ou perdas. Tudo isso que se pensou, que se planejou, precisa ficar registrado, documentado, para evitar esquecimentos, a fim de garantir o bom uso do tempo, da energia e do material e, ainda, para um controle eficiente do trabalho. O esquema do planejamento é o plano, que pode ser resumido, com auxílio da Estatística, em tabelas e gráficos, que facilitarão a compreensão visual dos cálculos matemático-estatísticos que lhes deram origem. O homem e a mulher de hoje, em suas múltiplas atividades, lançam mão de processos e técnicas estatísticas, e só estudando-as evitaremos o erro das generalizações apressadas à respeito de tabelas e gráficos apresentados em jornais e revistas e na televisão, frequentemente cometido quando se conhece apenas “por cima” um pouco de Estatística. Concluído este curso o aluno terá um conhecimento básico que deverá ser aperfeiçoado no futuro, mas o pontapé inicial será dado aqui. II-POPULAÇÃO e AMOSTRA (ESTIMADOR ESTATÍSTICO) variável: é o conjunto de resultados possíveis de um fenômeno. Matematicamente é representada pelas últimas letras do alfabeto: r, s, t, u. v, Introdução à Estatística Econômica– Autor: Diogo Eduardo Pasqual Penna- deppenna@gmail.com 54 996470481_______________________________________________________________ ____________________________________________________________________ – outubro de 2021 - 6 w, x, y e z. A soma de todas as variáveis será representada aqui pela letra “n” ou 1 n i fi . Símbolo de somatório . Variável qualitativa (qualidade): é quando seus valores são expressos por atributos:sexo masculino ou feminino, cor da pele (amarela, branca, negra, vermelha, parda, etc.) . Variável quantitativa (quantidade):quando seus valores são expressos em números (salários, idades etc). Podem ser Contínuas ou Discretas. População: Conjunto a ser estudado Amostra: subconjunto finito de uma população. - a amostra deve ser suficientemente grande. - seus constituintes devem ter sido selecionados ao acaso. A Estatística Indutiva tem por objetivo tirar conclusões sobre as populações, com base em resultados verificados em amostras retiradas dessa população. Mas para as inferências serem corretas, é necessário garantir que a amostra seja representativa da população, isto é, deve possuir as mesmas características básicas da população, no que diz respeito ao fenômeno que desejamos pesquisar. É preciso que a amostra seja obtida por processos adequados.A amostragem pode ser simples ou complexa. É importante que cada elemento da população tenha a mesma chance de ser amostrado. Técnicas de Amostragem: Amostragem casual ou aleatória simples. Amostragem estratificada: utilizada quando a população se divide em subpopulações – estratos.(90 alunos(as) de uma escola) sexo população 10% Amostra MASCULINO 54 10x54/100 = 5,4 5 FEMININO 36 10x36/100 = 3,6 4 total 90 10x90/100 = 9 9 Tabela n.º 01 Amostragem Sistemática: é quando os elementos da população já se acham ordenados, não havendo necessidade de construir o sistema de referência. São exemplos os prontuários médicos de um hospital, os prédios de uma rua, as linhas de produção. Exemplo: Suponhamos uma rua contendo novecentos prédios, dos quais desejamos obter uma amostra formada de cinqüenta prédios. 900/50=18. Seriam selecionados 18 prédios através de sorteio sistemático. Introdução à Estatística Econômica– Autor: Diogo Eduardo Pasqual Penna- deppenna@gmail.com 54 996470481_______________________________________________________________ ____________________________________________________________________ – outubro de 2021 - 7 Simbologia Utilizada para o estudo de uma população: = mi ou mu (utilizada para representar a média da população). = sigma ( utilizada para representar o desvio padrão da população) 2 = sigma ao quadrado. (utilizado para representar a variância da população) N = n.º total de elementos da população (’N’ maiúsculo) Simbologia Utilizada para o estudo de uma amostra: X = X BARRA ( utilizado para representar a média da amostra). S = do inglês – standard deviation (utilizado para representar o desvio padrão da amostra. 2S = S ao quadrado (utilizada para representar a variância da amostra) n = n.º total de elementos da amostra ( ‘n’ minúsculo) III-SOMATÓRIOS símbolo = = Letra sigma maiúscula do alfabeto grego que representa uma soma. Exemplo: 1 2 3 4 5 6X X X X X X pode ser representado abreviadamente por 6 1 i i X (lê-se: somatório de iX com i variando de 1 a 6) Neste caso 1 é o limite inferior do somatório e 6 o limite superior do somatório. lim sup lim inf ite erior i ite erior X Exemplo: calcule 5 2 1 3 i i resolução: 2 2 2 2 23.1 3.2 3.3 3.4 3.5 5 2 1 3 i i =3 + 12 + 27 + 48 + 75 5 2 1 3 i i = 165 Exercícios de Aprendizagem: 1- Calcule: a) 6 1 (5 2) i i Resp: 93 ; b) 2 3 (1 ) i i Resp: 9 Introdução à Estatística Econômica– Autor: Diogo Eduardo Pasqual Penna- deppenna@gmail.com 54 996470481_______________________________________________________________ ____________________________________________________________________ – outubro de 2021 - 8 2- Calcule: 10 0 1 2i i Resp: 22 3- Encontre S, sendo S = 3 5 2 2 1 1 ( 2 ) j r j r r Resp: 39 4- Calcule 3 4 2 0 1 ( 1) (4 ) n j n j Resp: -12 5- Calcule 1 1 2nn Resp: 0 (aproximadamente zero) IV- MEDIDAS DE TENDÊNCIA CENTRAL – DADOS NÃO AGRUPADOS Média, mediana, moda. Separatrizes: Mediana, quartis, decis e percentis Estudaremos a seguir três medidas de tendência central, são elas: Media – Mediana – Moda Dados os seguintes valores: 7, 8, 10, 10, 10, 9, 15, 13, 12, 11 a) Cálculo da Média (mean): = 7 8 9 10 10 10 11 12 13 15 10 = 10,5 A média é utilizada quando desejamos obter a medida de posição que possui maior estabilidade e quando houver necessidade de um tratamento algébrico ulterior. Desvantagem: é afetada pelos valores extremos. b) Cálculo da Moda: A moda é o valor que ocorre com maior freqüência. Mo = 10 Se nenhum valor se repetisse a distribuição seria amodal (sem moda). Assim como poderia haver duas modas (bimodal), três modas (trimodal) e mais de três modas (multimodal). A moda é utilizada quando desejamos obter uma medida rápida e aproximada de posição e quando a medida de posição deve ser o valor mais típico da distribuição. Introdução à Estatística Econômica– Autor: Diogo Eduardo Pasqual Penna- deppenna@gmail.com 54 996470481___________________________________________________________________________________________________________________________________ – outubro de 2021 - 9 c)Cálculo da Mediana (median): é uma medida de posição definida como o n.º que se encontra no centro de uma série de números, estando estes dispostos segundo uma ordem (crescente ou decrescente). É o valor situado de tal forma no conjunto que o separa em dois subconjuntos de mesmo n.º de elementos. Md = 7, 8, 9,10, 10, 10, 11, 12, 13, 15 Verificamos que, estando ordenados os valores de uma série e sendo “n” o n.º de elementos da série, o valor mediano será: -O termo de ordem 1 2 n , se n for ímpar -A média aritmética dos termos de ordem 1 2 2 n n e se n for par. No exemplo acima n é par. Então o cálculo da mediana será a soma dos termos centrais divididos por dois. 10 + 10 = 10. Ou então: 2 0 010 10 1 5 6 2 2 e e (é a média aritmética entre o quinto e o sexto elemento da distribuição) Mediana: 10 + 10 = 10 2 Exercícios: )calcular a média, a moda e a mediana da série abaixo relacionada: 5, 13, 10, 2, 18, 15, 6, 16, 9 Resp: Md = 10; = 10,4; amodal ) 2, 6, 7, 10, 12, 13, 18, 21 ) 5, 7, 13, 15 )5, 7, 10, 13, 65 )2, 3, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9 Introdução à Estatística Econômica– Autor: Diogo Eduardo Pasqual Penna- deppenna@gmail.com 54 996470481_______________________________________________________________ ____________________________________________________________________ – outubro de 2021 - 10 V- A DISTRIBUIÇÃO DE FREQUÊNCIA DE DADOS AGRUPADOS – MAS SEM INTERVALOS DE CLASSES Quando trabalhamos com dados discretos (valores inteiros) utilizamos a seguinte organização dos dados: Suponha uma população com uma distribuição estatística conforme a tabela abaixo: Disciplina: BIOESTATÍSTICA n.º 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 nota 5 4 6 8 3 5 7 6 8 4 6 9 7 5 7 5 6 8 7 9 4 6 6 8 7 (tabela n.º 2) - População estatística: grupo dos 25 alunos de Bioestatística. - Unidade estatística: cada aluno desta turma - Variável estatística: as notas de uma prova de Bioestatística. Organização destes dados através de uma Tabela de Freqüência iX if iF rif riF 3 1 1 1/25 = 4 % 4% 4 3 4 3/25 = 12% 16% 5 4 8 4/25 = 16% 32% 6 6 14 6/25 = 24% 56% 7 5 19 5/25 = 20% 76% 8 4 23 4/25 = 16% 92% 9 2 25 2/25 = 8 % 100% 25 100% (tabela n.º 03) iX = variável estatística: nota de cada aluno podendo variar de 0 a 10. if = freqüência simples ou absoluta é os valores que realmente representam o n.º de dados. iF = frequência acumulada é o total das freqüências de todos os valores inferiores ao limite superior de cada dado. rif = frequência relativa: são os valores das razões entre as freqüências simples e a freqüência total: rif = if / 1 n i fi . Pergunta-se: Quanto por cento dos alunos tirou nota igual ou inferior a 6? Resp: 56%. Introdução à Estatística Econômica– Autor: Diogo Eduardo Pasqual Penna- deppenna@gmail.com 54 996470481_______________________________________________________________ ____________________________________________________________________ – outubro de 2021 - 11 Qual o percentual de alunos que tirou nota igual ou superior a 7 ? Resp: 44% Qual a nota que obteve o maior percentual de ocorrência ? Resp: 6 (24%). Desta forma, com os dados organizados, é possível tirar conclusões. Utilizando os dados das tabelas n.ºs 2 e 3, pág 5, calcule a média, a mediana e a moda. iX if iF iX . if 3 1 1(até o prim.) 3x1 = 3 4 3 4(até o quar.) 4x3 = 12 5 4 8(até o oitavo) 5x4 = 20 6 6 14(até o 14 ) 6x6=36 7 5 19 7x5=35 8 4 23 8x4=32 9 2 25 9x2=18 25 156 Tabela n.º 4 Quando os dados estão agrupados utiliza-se as seguintes fórmulas para o cálculo da: Média = = i i i X f f =156 25 = 6,24 Obs: Quando não temos freqüência utiliza-se: i ri f f n , sendo n minúsculo quando se trata de amostra e N maiúsculo quando é toda a população que está sendo calculada. (n = total da amostra; N = total da população). Moda = não é necessário cálculos para obtenção da moda, basta observar na coluna das freqüências simples ou absolutas qual o valor que mais ocorre (aquele que têm a maior freqüência), neste caso é a nota 6. Mo = 6 Mediana = Utiliza-se a fórmula : 2 ifP = 25/2 = 12,5 Ou utiliza-se a regra: 1 2 n 025 1 13 2 Ou seja, a mediana está situada entre o 012 e o 013 elementos (soma-se os dois e divide-se por dois). Observa-se então na coluna das freqüências acumulada aonde se encontra o 13 (décimo-terceiro) elemento. Este corresponde a variável 6. Introdução à Estatística Econômica– Autor: Diogo Eduardo Pasqual Penna- deppenna@gmail.com 54 996470481_______________________________________________________________ ____________________________________________________________________ – outubro de 2021 - 12 Md = 6 Exercícios de Aprendizagem ) Um dado foi jogado 20 vezes, sendo obtidos os seguintes pontos:1, 5, 6, 5, 2, 2, 2, 4, 6, 5, 2, 3, 3, 1, 6, 6, 5, 5, 4, 2. Elabore um quadro com distribuição de freqüências absolutas, frequências absolutas acumuladas, freqüências relativas e freqüências relativas acumuladas. Qual a média, a mediana e a moda desta distribuição de freqüências com dados agrupados mas “sem intervalos de classe”. )Após montar a tabela do exercício anterior ‘ ’ responda as questões abaixo: a)Quantas vezes o n.º 2 foi obtido no dado ? resp: 5 vezes b)Quantas vezes o n.º obtido do dado foi menor do que 5 ? resp: 11 vezes c)Qual o índice em % em que o n.º 6 foi obtido no dado ? resp: 20% d)Qual o índice em % em que n.ºs maiores do que 4 foram obtidos no dado? Resp: 45% ) A tabela abaixo mostra a média dos 25 alunos de uma turma de um curso de Administração noturno na disciplina de Matemática Aplicada. Responda as perguntas abaixo: a)Elabore uma quadro de freqüências absolutas, absolutas acumuladas; de freqüências relativas e relativas acumuladas. Calcule a média, a mediana e a moda desta distribuição. b)Quantos alunos obtiveram a média 6? Resp: 6 c)Quantos alunos obtiveram média menor do que 6 ? resp: 12 d)Quantos alunos obtiveram média superior a 6 ? 7 e)qual o índice em % de reprovação considerando a média 5? Resp: 20% f)Qual o índice em % de alunos eu obtiveram média maior do que 7? 16% g) Qual o índice em % de alunos que obtiveram média maior ou igual a 5,0 e menor do que 7? Resp: 52 %. Quadro - Disciplina: Matemática Aplicada – Turma de Administração - Introdução à Estatística Econômica– Autor: Diogo Eduardo Pasqual Penna- deppenna@gmail.com 54 996470481_______________________________________________________________ ____________________________________________________________________ – outubro de 2021 - 13 n.º 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 nota 4 7 5 5 5 4 9 4 5 6 6 7 6 6 5 4 4 8 7 6 6 8 5 5 8 Tabela n.º 5 iX if iF iX if rif riF 4 5 6 7 8 9 Tabela n.º 6 ) Em uma escola, o conceito de cada bimestre é representado por letras: A, B, C, D e E. Em um determinado bimestre, os conceitos dos alunos em geografia foram os seguintes: Disciplina: geografia – conceitos do bimestre n.º 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 C B A C C D C D A A C E D D C B C B C C B Tabela n.º 7 Elabore um quadro de distribuição de frequências absolutas e freqüências absolutas acumuladas. ) Os salários mensais, em dezenas de reais, dos 20 funcionários de uma empresa são: 72, 72, 80, 88, 84, 72, 76, 80, 92, 72, 76, 80, 84, 72, 68, 76, 80, 72, 88 e 76 Elaboreum quadro de distribuição de freqüências absolutas e absolutas acumuladas. Calcule os salários: médio, mediano e modal. Tabela 8 (completar) VI – MEDIDAS DE DISPERSÃO OU VARIABILIDADE Introdução à Estatística Econômica– Autor: Diogo Eduardo Pasqual Penna- deppenna@gmail.com 54 996470481_______________________________________________________________ ____________________________________________________________________ – outubro de 2021 - 14 Estudaremos aqui o Desvio Médio (dm); a Variância [ ( 2 2ou S ]; o desvio padrão [ ou S ] e os Coeficientes de Variação de Pearson e de Thorndike. Desvio Médio: O quadro abaixo mostra o n.º de acidentes ocorridos durante um ano, subdivididos em 4 trimestres em uma Fundição Trimestre 1.º 2.º 3.º 4.º Acidentes 5 8 6 9 Tabela 9 Cálculo da média de acidentes: = 1 2 3 4 5 8 6 9 4 4 X X X X = 7 Calculemos agora as diferenças entre cada uma das notas e a média X ou X X dm = 6 1,5 4 4 Daí podemos dizer que a fórmula para calcular o desvio médio quando não temos freqüência é a seguinte: 1 1 n n i i i i X X X dm ou dm N n x f X (media) d(desvio) f.d 2d f. 2d 5 1 7 2 2 4 4 8 1 7 1 1 1 1 6 1 7 1 1 1 1 9 1 7 2 2 4 4 4 10 2 2 1 f X X S f (fórmula para o cálculo da variância de uma amostra) 2 2 f X f (fórmula para o cálculo da variância da população) Introdução à Estatística Econômica– Autor: Diogo Eduardo Pasqual Penna- deppenna@gmail.com 54 996470481_______________________________________________________________ ____________________________________________________________________ – outubro de 2021 - 15 10 4 = 2,5 (variância = somatório dos desvios elevados ao quadrado divididos pelo tamanho total da população) 2s s (fórmula para calcular o desvio padrão da amostra) 2 (fórmula para o calculo do desvio padrão da população) 2,5 = 1,58 (desvio padrão = raiz quadrada da variância) CV= Coeficiente de Variação de Pearson CV = 1,58.100 .100 7 S X 0,2257.100 = 22,57% Exercício: Qual o desvio médio do conjunto de dados: 7, 12,, 20, 16, 10 Resp: 4; Calcular o desvio padrão. Cálculo do Desvio Médio quando temos freqüências. Fórmula a ser utilizada: 1 n i X N Exemplo: O quadro a seguir nos mostra a distribuição dos erros cometidos por 25 alunos numa prova de Biologia. Nessas condições, qual é o desvio médio dessa distribuição ? n.º de erros( ix ) n.º de alunos ( if ) aF (FREQ. ACUMULADA) X (MÉDIA) d= x X .i if d 0 3 3 2 d= 0 2 =2 3x2=6 1 6 9 2 d= 1 2 1 6x1=6 2 8 17 2 d= 2 2 0 8x0=0 3 5 22 2 d= 3 2 1 5x1=5 4 2 24 2 d= 4 2 2 2x2=4 5 1 25 2 d= 5 2 3 1x3=3 25 24 Introdução à Estatística Econômica– Autor: Diogo Eduardo Pasqual Penna- deppenna@gmail.com 54 996470481_______________________________________________________________ ____________________________________________________________________ – outubro de 2021 - 16 25 1 . 24 0,96 25 i i i fi d f . Então o desvio médio é de 0,96. Calcular o desvio padrão e o coeficiente de variação da população acima. Dada a tabela abaixo, calcule o desvio padrão e o coeficiente de variação amostral: x f F x.f X X = d f.d 2 2X X d 2 2. .f X X f d 0 10 1 19 2 7 3 7 4 2 5 1 6 4 50 91 145,40 2 2 145,4 ~ 1,7 1 49 f X X s s n ; 1,7 .100 94,44% 1,8 X X . 91 1,8 50 X f X n C.V= 1,7.100 94,44% 1,8 X X Exercícios complementares: a) O tempo gasto por 6 alunos para fazer um trabalho foi, em minutos: 6, 5, 5, 3, 3 e 2. Nessas condições, calcule a média aritmética, o desvio médio, a variância, o desvio padrão e o coeficiente de variação dessa distribuição. x f F x.f x d f.d d² f.d² 2 1 3 2 5 2 6 1 Introdução à Estatística Econômica– Autor: Diogo Eduardo Pasqual Penna- deppenna@gmail.com 54 996470481_______________________________________________________________ ____________________________________________________________________ – outubro de 2021 - 17 Respostas: Dm(desvio médio) = 1,33; Média = 4; variância = 2; desvio padrão=1,41; Coeficiente de variação: 35,25%. Calcule também a mediana e a moda. b- A tabela a seguir nos mostra o n.º de operários acidentados por mês numa fábrica durante o ano de 1991. x f F x.f x d f.d 2d f. 2d 3 4 4 3 6 1 7 2 8 2 Respostas: media = 5; desvio médio = 1,83; variância = 3,83; desvio padrão = 1,96; coeficiente de variação = 39,2%. Calcule a mediana e a média. c-O quadro nos mostra o n.º de defeitos por carro de uma determinada marca numa frota de 40 veículos, calcule as medidas de dispersão e de tendência central. x f F x.f x d f.d 2d f. 2d 0 6 1 9 2 7 3 4 4 9 5 5 Respostas: media = 2,4; desvio médio= 1,49; variância = 2,79; desvio padrão = 1,67; mediana = 2 ; moda = 1 e 4; moda calculada: 1,2. d- Determine a média aritmética, a moda, a mediana, o desvio padrão, o desvio médio, a variância e o coeficiente de variação de Pearson e de Thorndike, dos valores apresentados na tabela seguinte: x f F x.f x d f.d 2d f. 2d 2 5 3 10 4 15 5 12 Introdução à Estatística Econômica– Autor: Diogo Eduardo Pasqual Penna- deppenna@gmail.com 54 996470481_______________________________________________________________ ____________________________________________________________________ – outubro de 2021 - 18 6 5 7 3 Respostas: media = 4,22; desvio médio = 1,06; variância = 1,72; desvio padrão = 1,31 ; mediana = 4; moda = 4; moda calculada: e- As alturas dos elementos de uma equipe de basquete são, em centímetros = 195, 198, 201, 192, e 204. Nessas condições determine as medidas de tendência central (média, mediana e moda) e as de dispersão (desvio médio, variância, desvio padrão e coeficiente de Pearson). i (contador) x x d 2d 1 192 198 2 195 198 3 198 198 4 201 198 5 204 198 Respostas: 1 n i i X X n = 990/5 = 198; desvio médio = 1 n i i d n = 18/5 = 3,6 2 2 1 n i i d n 2 2 1 n i i d n =90/5 = 18; 2 18 ~ 4,24 VI-a – SEPARATRIZES (Quartis- Decis- Percentis) – Medidas de Posição Assim como a média, a mediana e a moda são medidas de posição, os quartis, decis e percentis também são. Os quartis, decis e percentis são muito similares à mediana, uma vez que também subdividem a distribuição de medidas de acordo com a proporção das freqüências observadas, enquanto que a mediana divide a distribuição em duas metades ( à mediana ocupa a posição central de duas partes iguais deixando 50% dos valores para cada lado), os quartis dividem-na em 4 quartos (4 partes de 25% cada), os decis em 10 décimos ( 10 partes de 10% cada uma) e os pontos percentis dividem-na em 100 partes iguais. Introdução à Estatística Econômica– Autor: Diogo Eduardo Pasqual Penna- deppenna@gmail.com 54 996470481_______________________________________________________________ ____________________________________________________________________ – outubro de 2021 - 19 Em função de que à fórmula para o cálculo da Curtose (coeficiente percentílico de curtose), utilizar apenas o 1Q primeiro quartil = (n + 1) 1 4 ; 3Q terceiro quartil = (n + 1) 3 4 ; 90P = percentil 90 (noventa) = (n +1) 90 100 e 10P percentil 10(dez) = (n + 1) 10 100 , utilizaremos apenas estas quatroseparatrizes. A Fórmula de Curtose utilizada é a seguinte: 3 1 90 102( ) Q Q c P P Em função da curtose temos a classificação das curvas em relação à curva normal ou curva de Gauss. Relativamente à curva normal temos: C=0,263 C = 0,263 curva mesocúrtica ( curva de frequência com grau de achatamento igual ao da curva de Gauss) C < 0,263 curva leptocúrtica ( curva de freqüência com grau de achatamento menor do que o da curva de Gauss) C > 0,263 curva platicúrtica ( curva de freqüência com grau de achatamento maior do que a curva de Gauss). Formato das curvas classificadas conforme o grau de achatamento: CURVA MESOCÚRTICA CURVA LEPTOCÚRTICA CURVA PLATICÚRTICA Exemplo: Sabendo-se que uma distribuição de frequência apresenta as seguintes medidas: 1 1 1 13 ( 1). (12 1). 3,25 4 4 4 Q n 1Q = 24,4 cm; 3Q = 41,2 cm; 10P = 20,2 cm; 90P = 49,5 cm Introdução à Estatística Econômica– Autor: Diogo Eduardo Pasqual Penna- deppenna@gmail.com 54 996470481_______________________________________________________________ ____________________________________________________________________ – outubro de 2021 - 20 41, 2 24, 4 16,8 0, 2866 2(49,5 20,2) 58,6 C onde concluímos que a distribuição é platicúrtica em relação a normal ou em relação a curva de frequência de Gauss, pois 0,2866 > 0,263. Exercícios de Fixação: a) Consideremos as seguintes temperaturas elevadas registradas em 12 cidades européias em graus Fahrenheit em um dia de junho ( verão europeu): Dados Brutos coletados: 90 75 86 77 85 72 78 79 94 82 74 93 Rol: dados organizados: 72 74 75 77 78 79 82 85 86 90 93 94 A temperatura mediana corresponde ao quartil 2 e vale 80,5 ºF. 80.5 ºF valem 26,94 ºC. Então n = 12. 89 75,5 13,5 13,5 0,319 2(93,7 72,6) 2(21,10) 42,2 C . Conclusão: como 0,319 > 0,263 a curva é platicúrtica em relação a normal. (é achatada). b) Observando os dois conjuntos abaixo diga qual dos dois apresenta maior dispersão: 10 11 11 11 12 12 12 12 13 14 14 ; Amplitude: 14-10= 4 1 5 6 9 11 12 12 15 18 21 22 ; Amplitude : 22 -1= 21 O 2.º conjunto é mais disperso do que o 1.º e)Os dados abaixo referem-se ao peso, em kilogramas, de 25 pacientes de um hospital: 51,4 63,5 64,3 71,3 85,7 68,8 77,8 76,5 89,3 43,5 Introdução à Estatística Econômica– Autor: Diogo Eduardo Pasqual Penna- deppenna@gmail.com 54 996470481_______________________________________________________________ ____________________________________________________________________ – outubro de 2021 - 21 74,6 76,5 50,7 55,7 59,7 77,8 75,6 61,3 68,7 69,8 64,5 65,7 63,7 81,0 46,7 Calcule a media, mediana, moda, moda calculada; quartil 1, quartil 3, percentil, 10, percentil 90, amplitude, intervalo interquartil, desvio medio, variância, desvio padrão, coeficiente de variação de Pearson e de Thorndike, assimetria de Pearson, Curtose e frequências relativas e acumuladas. Resposta em kilos: =67,36; md=68,70; moda=76,5; moda calculada: 71,38; Quartil 1 =60,65; Quartil 3 = 76,50; percentil 10 = 49,10; percentil 90 = 82,88; amplitude = 45,8; intervalo interquartil = 15,85 ; desvio médio = 9,41; variância = 133,73; desvio padrão = 11,56; Coeficiente de Variação de Pearson = 17,17 %; C.V. de Thorndike =16,83%; Assimetria = -0,3478 Curtose = 0,234 VI-b –COEFICIENTE DE ASSIMETRIA Calcula-se o coeficiente de assimetria através da fórmula abaixo, tendo-se conhecidas a média, a mediana e o desvio padrão. 3( ) S Md A Se o coeficiente estiver no intervalo de 0,15 < SA < 1 a assimetria é moderada. Se o coeficiente de assimetria for SA > 1 a assimetria é forte. Se a media e a mediana forem iguais 0SA e a curva é simétrica. Se a mediana for maior do que a média a assimetria é negativa.(cauda para a esquerda onde mo md ). Se a mediana for menor do que a média a assimetria é positiva ( cauda para à direita onde mo md ). Cálculo da variância e do Desvio Padrão da População: Fórmula: 2 2 ( )x N e 2 N maiúsculo = n.º total da população Cálculo da variância e do Desvio Padrão da Amostra: 2 2 ( ) 1 x X s n e 2s s Introdução à Estatística Econômica– Autor: Diogo Eduardo Pasqual Penna- deppenna@gmail.com 54 996470481_______________________________________________________________ ____________________________________________________________________ – outubro de 2021 - 22 n minúsculo = n.º total da amostra. VI–C–SÉRIES ESTATÍSTICAS DISCRETAS COM CÁLCULO ABREVIADO DA VARIÂNCIA E DESVIO PADRÃO (SEM CALCULAR O DESVIO MÉDIO) Exercícios: 1-calcule: média; mediana; moda; quartil 3 e quartil 1; variância; desvio padrão; coeficiente de variação de Pearson e de Thorndike dos dados: Cruzamento (i) n.º de acidentes (X) X² 1 7 49 2 5 25 3 8 64 4 6 36 5 4 16 X = 30 X² =190 a)=6 acidentes; b)md=6 acidentes; c) mo=amodal; d) 3Q = calculado = 7,5 deduzido = 7 acidentes; e) 1Q = 5 acidentes; calculado 4,5; f)variância: calcula-se pela fórmula: 22 2 190 30 5 5 X X n n =38- 36 =2 acidentes g)desvio padrão = = 2 2 1,41 acidentes. h)CV de Pearson = 23,50%; i) CV de Thorndike = 23,50% Exercício n.º 2- Calcule a media, o desvio padrão e o coefic. de variação de Pearson: n.º de dependentes (X) n.º de empregados (f) f.X X² f.X² 0 8 0 0 0 1 7 7 1 7 2 9 18 4 36 3 3 9 9 27 4 2 8 16 32 5 1 5 25 25 30 47 / 127 a)=1,57 dependentes; b) 22 2 . . 127 47 4, 23 2, 46 1,77 30 30 f x f x n n b) desvio padrão 2 1,77 1,33 dependentes c) Coeficiente de variabilidade de Pearson = 84,71 % Introdução à Estatística Econômica– Autor: Diogo Eduardo Pasqual Penna- deppenna@gmail.com 54 996470481_______________________________________________________________ ____________________________________________________________________ – outubro de 2021 - 23 Até aqui trabalhamos com a estatística discreta, valores inteiros. Daqui para frente trabalharemos com dados contínuos (valores reais). Exercício n.º 3 - Calcule a media, a mediana e a moda calculada, o intervalo interquartil, a amplitude e o coeficiente de assimetria e de curtose do conjunto abaixo: 13 9 18 15 14 21 7 10 11 20 5 18 37 16 17 Resp: =15,4; md= 2Q 15; mo=18; 90 27, 4P 1Q 10; 3Q 18; 10P = 6,2; 90 27, 4P Amplitude= 32; intervalo interquartil=8; C = 0,1887 ; Assimetria= 0,162 Desvio padrão =7,4. Exercício n.º 4- A partir dos dados abaixo calcule a media, moda, mediana, variância, desvio padrão; coeficiente de variação, coeficiente de assimetria , curtose, amplitude e intervalo interquartil dos dados a seguir que referem-se aos custos das mensalidades, em milhares de dólares, para 25 faculdades de artes estão relacionados abaixo: 23 25 30 23 20 22 21 15 25 24 30 25 30 20 23 29 20 19 22 23 29 23 28 22 28 respostas: =24; md=23; mo=23;moda-calculada= 3 28Q ; 10 19,6P ; CV Pearson = 16,1; CV Thorndike = ; Coef. Assim= 0,7692; 3 28Q ; 1 21,5Q ; 90 30P ; 10 19,6P ; curtose = VII – DISTRIBUIÇÃO DE FREQÜÊNCIA EM CLASSE ( DADOS AGRUPADOS) Dados Brutos : São aqueles que ainda não foram numericamente organizados. Rol: é um arranjo de dados numéricos brutos colocados em ordem crescente ou em ordem decrescente de grandeza. Quando se resumem grandes massas de dados brutos costuma-se frequentemente distribuí-los em classes ou categorias, determinando o número de indivíduos pertencentes a cada uma das classes. Essa distribuição em classes é denominada distribuição de freqüência. Introdução à EstatísticaEconômica– Autor: Diogo Eduardo Pasqual Penna- deppenna@gmail.com 54 996470481_______________________________________________________________ ____________________________________________________________________ – outubro de 2021 - 24 Exemplo: Sejam as notas de 50 alunos (avaliadas de zero a cem) abaixo (dados brutos): 80 67 60 98 25 31 49 39 12 27 45 40 46 53 59 64 71 85 87 53 59 28 61 57 53 22 57 36 29 22 18 05 03 20 38 08 07 09 79 65 58 55 48 41 15 63 75 79 75 37 Rol: o próximo passo é colocar os dados brutos acima em ordem crescente ou decrescente para a seguir estudar e entender os conceitos básicos a seguir: 3 5 7 8 9 12 15 18 20 22 22 25 27 28 29 31 36 37 38 39 40 41 45 46 48 49 51 53 53 53 55 57 57 58 59 59 60 63 64 65 67 71 75 75 79 79 80 85 87 98 Conceitos Básicos 1.Limites de Observação: são os valores extremos encontrados nos dados brutos. iL limite inferior (menor valor dos dados coletados) iL 03 sL = limite superior (maior valor dos dados coletados) sL = 98 2.Intervalo de Observação: é definido pelos limites de observação. ; 3;98i SL L 3.Amplitude de Observação:é a diferença entre os limites de observação. 98 03 95s iL L 98 03 95s iL L 4.Definição do número de classes: Para determinar o número de classes há diversos métodos. A regra de Sturges, um dos métodos, estabelece que o n.º de classes é igual a: 101 3.3logk n onde k representa o n.º de classes e n o número total de observações. No exemplo acima n =50 e log de 50 = 1,69897 então aplicando a regra de Sturges temos: Poderíamos então montar a nossa distribuição em 07 classes. Mas podemos utilizar, por exemplo, 5 classes, nada impede nossa decisão. Introdução à Estatística Econômica– Autor: Diogo Eduardo Pasqual Penna- deppenna@gmail.com 54 996470481_______________________________________________________________ ____________________________________________________________________ – outubro de 2021 - 25 Definindo a largura da classe: Como temo uma amplitude 95 de observação então dividindo-se 95 por 7 (classe) teremos aproximadamente 14. podemos assim definir a nossa distribuição em sete classes com largura 14 para cada classe. 5.Construção da Distribuição de Freqüência : 00 14-----6 14 28-----7 28 42-----9 42 56-----8 56 70----11 70 84-----6 84 98----3 6.Construção da Distribuição de Freqüência:poderia ser assim: 03 17 17 31 31 45 45 59 63 77 77 91 91 105 Como existe a probabilidade de um aluno tirar a nota 0 e também a nota 100, a amplitude da DF é 100 e a nossa DF deveria conter as notas extremas 0 e 100 e a DF ficaria com largura 15 e sete classes, com o seguinte formato: 00 15 15 30 30 45 45 60 60 75 75 90 90 105 O símbolo significa que o intervalo de observação de cada classe é fechado à esquerda e aberto à direita, assim todos os limites superiores de classe não estão contidos nelas mas sempre na classe seguinte. Por exemplo: a 1.ª classe Introdução à Estatística Econômica– Autor: Diogo Eduardo Pasqual Penna- deppenna@gmail.com 54 996470481_______________________________________________________________ ____________________________________________________________________ – outubro de 2021 - 26 vai de 0 a 14, mas o 14 não está contido nessa classe e sim na 2.ª classe que vai de 14 a 28 e assim por diante. 7.Classe de uma (Distribuição de Freqüência): é o nome dado a cada subintervalo da distribuição. 8.Limites de Classe: são os valores extremos encontrados em cada classe e representados por l (éle) minúsculo. il = limite inferior de classe; sl = limite superior de classe Exemplo: il = 00 na classe 1 e sl =14 na classe 1 9.Amplitude de Classe (h): é a diferença entre os limites de classe. A amplitude de classe pode ser variável ou constante. Exemplo: Largura da 1.ª classe s ih l l = 14 - 00 = 14 10.Limites da Distribuição de Freqüência: são o limite inferior da primeira classe e o limite superior da última classe. Esses limites geralmente não coincidem com os limites de observação. Deveria ser 00 e 100, mas como o limite superior observado foi 98, com 7 classes e largura 14 nossos limites ficaram: 00 98S Li L No nosso casso o limite inferior da distribuição é 00 e o limite inferior observado é 03. O limite superior da distribuição e o limite superior observado são , neste caso, igual, ou seja, 98. 11.Amplitude da Distribuição de Freqüência: é a diferença entre os limites da distribuição. 98 00 98DFH , já a amplitude da observação é de 95. 98 03 95obsH 12.Número de observações: é o número que representa a quantidade dos dados a serem organizados. Introdução à Estatística Econômica– Autor: Diogo Eduardo Pasqual Penna- deppenna@gmail.com 54 996470481_______________________________________________________________ ____________________________________________________________________ – outubro de 2021 - 27 Símbolo: n (amostra) ou N (população) ou 1 n i i f , em nosso exercício N = 50. 13.Variável: Variável é um símbolo que associamos ao conjunto objeto de estudo que representa esse conjunto. Atribuímos o símbolo x para esta variável. 14.Ponto Médio de Classe: é a média aritmética simples dos extremos de cada classe. 2 i s i l l x em nosso exercício somando-se o limite inferior com o superior da 1.ª classe, por exemplo, obtemos: 00 14 7 2i x , que é o ponto médio da 1.ª classe. 15.O Cálculo da Mediana na Distribuição de Freqüência com Dados Agrupados ou Grupados Fórmula utilizada: Md = 2 . anterior f F li h f Onde li = limite inferior da CME (classe mediana) 2 f = Ponto central da distribuição – local aonde se encontra a md anteriorF = Freqüência acumulada anterior à CME h = largura da CME f = freqüência simples ou absoluta da CME 16.O cálculo da Moda Calculada: 3( ) 2( )calculadaMo mediana média 17.O cálculo da CURTOSE (Coeficiente percentílico de Curtose) na Distribuição de Freqüência em Classes ( Dados Agrupados). 3 1 90 102( ) Q Q C P P Introdução à Estatística Econômica– Autor: Diogo Eduardo Pasqual Penna- deppenna@gmail.com 54 996470481_______________________________________________________________ ____________________________________________________________________ – outubro de 2021 - 28 18.Fórmulas para o cálculo dos quartis: 3 3 4 f Q ; 1 1. 4 f Q Fórmula para o cálculo dos percentis: 10 10 100 f P ; 90 90 100 f P 19.Classificação das Curvas: =0,263: mesocúrtica (curva de Gauss) 0,263: platicúrtica < 0,263 : leptocúrtica Exercícios de Distribuição de Freqüência em Classes: a- Sabemos que a fração mínima de terras escriturava é de 2 (dois) hectares em zonas rurais, e que são taxadas com ITR (imposto territorial rural) em vez de IPTU (imposto predial e territorial urbano) e cujo fracionamento em módulos é feito pelo INCRA. A distribuição abaixo nos mostra as terras cultivadas de uma determinada região em hectares (h a). Frações territoriais rurais menores do que dois hectares devem ser licenciados pela FEPAM ou pela SEMMA, para terem escrituras reconhecidas e registradas em cartório. Classe x f F x.f X d F.d 2d f. 2d 2 8 10 8 14 9 14 20 21 20 26 7 26 32 3 Resposta: media = 15,08; Desvio médio: 5,5; variância = 45,27; Desvio Padrão = 6,72; Coeficiente de variação = 44,56%. ; Mediana = 15,7; moda = Moda Calculada= ;Quartil 1 = 9,7; Quartil 3 = 19,3; Percentil 10 = 5; Percentil 90 = 24,3; Curtose 0,2; Assimetria= -0,3. b- Na tabela a seguir estão relacionados osvalores correspondentes ao consumo individual de energia elétrica medido em quilowatts-hora em um grupo de 50 usuários particulares. Introdução à Estatística Econômica– Autor: Diogo Eduardo Pasqual Penna- deppenna@gmail.com 54 996470481_______________________________________________________________ ____________________________________________________________________ – outubro de 2021 - 29 Dados Brutos 58 62 80 57 8 126 136 96 144 19 90 86 38 94 82 75 148 114 131 28 66 95 121 158 64 105 118 73 83 81 50 92 60 52 89 58 10 90 94 74 9 75 72 157 125 76 88 78 84 36 Rol 8 9 10 19 28 36 38 50 52 57 58 58 60 62 64 66 72 73 74 75 75 76 78 80 81 82 83 84 86 88 89 90 90 92 94 94 95 96 105 114 118 121 125 126 131 136 144 148 157 158 Utilize a regra de Sturges (k = 1+ 3,3 log n) para determinar o número de classes. Lembre-se que o log 50 = 1,69897 K = 1 + 3,3 log 50; K = 1+3,3 . 1,69807; K= 6,6 Total = 7 classes. Definindo a largura das classes: 158 – 8 = 150/7 = 22,7 classes x f F x.f X d f.d 2d f. 2d 8 30 30 52 52 74 74 96 96 118 118 140 140 162 Respostas: Média = 83,24; Mediana = 82,1; moda não calculada: 81,5; moda calculada (3md - 2 ) = ; Q1 =61,9; Q3 = 99,7; P10 = 30; P 90 = 136,3 Variância = 1255,3; Desvio Padrão= 35,4; CV= 42,6; Assimetria = 0,0966; Curtose= 0,177 (curva leptocúrtica); Intervalo Interquartil = 37,8; c-Em um estudo de seguro de acidentes com veículos motorizados no estado de Nova York, classificam-se as colisões fatais de acordo com a hora da manhã. Conforme tabelas abaixo. [fonte: dados do New York State Department of Motor Vehicles – Departamento de Veículos motorizados do Estado de Nova York] Introdução à Estatística Econômica– Autor: Diogo Eduardo Pasqual Penna- deppenna@gmail.com 54 996470481_______________________________________________________________ ____________________________________________________________________ – outubro de 2021 - 30 Observou-se o n. de 100 sapatos vendidos em uma loja de calçados. Os resultados obtidos estão na tabela abaixo: classes x f F x.f d 2d f. 2d frelativa Frel 25 28 26,5 2 2 53 -9,6 92,16 184,32 - - 28 31 29,5 9 11 265,5 -6,6 43,56 392,32 - - 31 34 32,5 17 28 552,5 -3,6 12,96 220,32 - - 34 37 35,5 35 63 1242,5 -0,6 0,36 12,60 - - 37 40 38,5 20 83 770 2,4 5,76 115,20 - - 40 43 41,5 10 93 415 5,4 29,16 291,60 - - 43 46 44,5 7 100 311,5 8,4 70,56 493,92 - - soma 100 ---- 3610 1710,0 - - Calcule: a) amédia b)a moda bruta e a moda calculada c)a mediana d) o desvio padrão. a)média: 36,1 b)moda bruta: 35,5 c) mediana 35,9 d) desvio padrão: 4,2 e)quartil 1: 33,5; quartil 3: 38,8; percentil 10: 30,7; percentil 90: 42,1; Curtose: 0,232 (leptocúrtica) Responda as questões abaixo: a) Média =.................................... b) Mediana =................................. c) Moda =...................................... d) Desvio médio =......................... e) Variância =................................. f) Desvio padrão =............................ g) Coeficiente de Variação de Pearson =.............................. h) Coeficiente de Variação de Thorndike=.............................. i) Assimetria =..................................................................... j) Quartil 1 =.................................................. k) Quartil 3 =............................................. l) Percentil 10 =........................................ m) Percentil 90 = n) Curtose (SEPARATRIZES) e classificação da curva em leptocúrtica, Mesocúrtica ou platicúrtica =.................................................. o) Intervalo Interquartil =............................................. p) Amplitude =................................................... q) Qual o percentual de acidentes fatais entre as zero (0) horas e às 4 da madrugada................... r) Qual o percentual de acidentes fatais entre as 8 da manhã e o meio dia (12 horas)...................... HORA (f) (F) x .f.x cf Xx (d) f.d 2d f. 2d fr. Fra 00 02 194 Introdução à Estatística Econômica– Autor: Diogo Eduardo Pasqual Penna- deppenna@gmail.com 54 996470481_______________________________________________________________ ____________________________________________________________________ – outubro de 2021 - 31 02 04 149 04 06 100 06 08 131 08 10 119 10 12 160 d)Exercício utilizando fórmulas da variância e do desvio padrão amostral: Considerando que distribuição de freqüência acima tenha seus dados obtidos através de uma amostragem calcule: a variância e o desvio padrão amostral utilizando as fórmulas: 2 2 ( ) var 1 X X S n ; = desvio padrão amostral: e)Exemplo: Determine a média e o desvio padrão da amostra do conjunto de dado. n.º de crianças em 50 famílias: 1 3 1 1 1 1 2 2 1 0 1 1 0 0 0 1 5 0 3 6 3 0 3 1 1 1 1 6 0 1 3 6 6 1 2 2 3 0 1 1 4 1 1 2 2 0 3 0 2 4 Você coletou uma amostra aleatória do n.º de crianças por família em uma região. Os resultados estão dispostos na tabela acima. X f x.f X X 2( )X X 2( )X X .f 0 10 0 -1,8 3,24 32,40 Introdução à Estatística Econômica– Autor: Diogo Eduardo Pasqual Penna- deppenna@gmail.com 54 996470481_______________________________________________________________ ____________________________________________________________________ – outubro de 2021 - 32 1 19 19 -0,8 0,64 12,16 2 7 14 0,2 0,04 0,28 3 7 21 1,2 1,44 10,08 4 2 8 2,2 4,84 9,68 5 1 5 3,2 10,24 10,24 6 4 24 4,2 17,64 70,56 =50 =91 =145,40 (media da amostra); 2 2 ( ) . 145,4 1,7 1 50 1 X X f s s n (desvio padrão de 1,7 crianças) VIII – P ROBABILIDADE O cálculo das probabilidades pertence ao campo da Matemática. Sua inclusão neste estudo, cujo objetivo é essencialmente a Estatística encontra explicação no fato de que a maioria dos fenômenos de que trata a Estatística são de natureza aleatória ou probabilística. Conseqüentemente, o conhecimento dos aspectos mais fundamentais, do cálculo de probabilidades é uma necessidade essencial para o estudo da Estatística. Experimento Aleatório Em quase tudo, em maior ou menor grau, vislumbramos o acaso. Assim a afirmação: “é provável que meu time do coração ganhe a partida hoje”, pode resultar: a)que apesar do favoritismo perca; b)que, como pensamos, ganhe; c)que empate. Como vimos , o resultado final depende do acaso. Fenômenos como esse denominamos fenômenos aleatórios ou experimentos aleatórios. ----------------------------------------------------------------------------------------------. Aleatório: é aquilo que depende de acontecimentos futuros incertos; casual; fortuito; contingente; que pode ou não suceder; eventual; duvidoso; inopinado. Os postulados da probabilidade: 1.º POSTULADO: As probabilidades são números reais positivos ou zero ; simbolicamente:P(A) 0 para qualquer evento A . 2.º POSTULADO: Qualquer espaço amostral tem probabilidade 1; simbolicamente P(S) = 1 para qualquer espaço amostral S. Introdução à Estatística Econômica– Autor: Diogo Eduardo Pasqual Penna- deppenna@gmail.com 54 996470481_______________________________________________________________ ____________________________________________________________________ – outubro de 2021 - 33 Definição Experimentos ou fenômenos aleatórios são aqueles que, mesmorepetidos várias vezes sob condições semelhantes apresentam resultados imprevisíveis, isto é, não podem ser previstos ou vistos com antecedência. Exemplos: 1. O lançamento de uma moeda ( probabilidade: ½); 2. A aposta em um jogo qualquer da loteria esportiva (probabilidade:1/3); 3. A disputa de par ou ímpar (probabilidade: ½) 4. O lançamento de uma dado (probabilidade: 1/6) 5. O lançamento de um tetraedro ( probabilidade: ¼) 6. Tirar uma dama num baralho de 52 cartas (probabilidade: 1/52) Espaço Amostral O conjunto S (space), de todos os resultados possíveis de um dado experimento aleatório chama-se espaço amostral. Qualquer elemento do espaço amostral é chamado de amostra ou ponto amostral. Exemplo 1: No lançamento de um dado o espaço amostral é o conjunto S = {1, 2, 3, 4, 5, 6} n(S) = 6 Exemplo 2: Quando jogamos uma moeda o espaço amostral é o conjunto: S = {CARA, COROA}. n(S) = 2. Exemplo 3: Ao disputarmos um par ou ímpar o espaço amostral da soma dos Resultados, é S={PAR, IMPAR}. n(S) = 2. Tipos de Probabilidade Há três tipos de probabilidade: clássica, empírica e subjetiva. A probabilidade de um evento E ocorrer é escrita com P(E) – lê-se “a probabilidade do evento E”. Definição- a) A probabilidade clássica ( ou teórica) é usada quando cada resultado no espaço amostral tem a mesma probabilidade de ocorrer. A probabilidade clássica para um evento E é dada por: P (E) = número de resultados em E , onde S = espaço amostral e 0 P(E) 1 n.º total de resultados em S Introdução à Estatística Econômica– Autor: Diogo Eduardo Pasqual Penna- deppenna@gmail.com 54 996470481_______________________________________________________________ ____________________________________________________________________ – outubro de 2021 - 34 Exemplo: Um dado de seis faces é jogado. Obtenha a probabilidade dos seguintes eventos: 1.Evento A: obter um 3 – Solução: { P (3) = 1/6 ( ) f fP E ou n f 0,167} 2.Evento B: obter um 7 – Solução: { P (7) = 0/6 = zero 3.Evento C: obter um n.º menor do que 5. – Solução: há 4 resultados menores do que 5 - C={1, 2, 3 e 4}. Assim, 4/6 = 2/3 0,667. b) A probabilidade empírica ( ou estatística) baseia-se em observações obtidas de experimentos probabilísticos. A probabilidade empírica de um evento E é a freqüência relativa desse evento P(E) = Freqüência do Evento E onde 0 P(E) 1 frequência Total ( ) f f P E ou n f Exemplo: obtendo probabilidades empíricas. Um açude contém três tipos de peixes: carpa húngara; catfish e bagre africano. Cada peixe no açude tem a mesma probabilidade de ser capturado. Você pesca 40 peixes e anota seu tipo. Após cada captura, você devolve o peixe ao açude. A seguinte distribuição de freqüência mostra seus resultados. Tipo de Peixe (x) n.º de vezes em que foi pescado (f) Carpa húngara 13 Catfish 17 Bagre africano 10 Se após isso você capturar um novo peixe, qual será a probabilidade de que ele seja uma carpa húngara ? P(Carpa Húngara) = 1.000f Na tabela abaixo temos algumas probabilidades de alguns eventos: Aparecer na televisão Uma em 490.000 Cair um raio na Cabeça (U.S.A) Uma em 700.000 Ganhar na Loteria de New York (acertar 6 de 54 números) Uma em 25.827.165 Introdução à Estatística Econômica– Autor: Diogo Eduardo Pasqual Penna- deppenna@gmail.com 54 996470481_______________________________________________________________ ____________________________________________________________________ – outubro de 2021 - 35 Probabilidade de acertar a placa de um automóvel 3 426 17.576;10 10.000 Uma em 175.760.000 Ser vítima de um crime sério 5% O congresso derrubar um veto 4% Escrever um livro de sucesso 0,00205 Obter um Ph.D (doutorado em Filosofia) 0,008 Usando as distribuições de freqüência para obter as probabilidades Exemplo: você levanta uma amostra de mil funcionários em uma companhia e registra a idade de cada um deles, os resultados estão a seguir na distribuição de freqüência abaixo. Pergunta: se você selecionar ao acaso outro funcionário, qual será a probabilidade de a idade dele estar entre 25 e 34 anos ? (x) idade dos funcionários Freqüência (f) 15 a 24 54 25 a 34 366 35 a 44 233 45 a 54 180 55 a 64 125 65 ou mais 42 1.000f Solução: P(faixa etária entre 25 e 34)=366/1000 = 0,366 x 100 = 36,6% Qual a probabilidade de o funcionário não estar nesta faixa etária. P(E’) = 1 – P(E) = 1- 0,366 = 0,634. c)Probabilidade Subjetiva O terceiro tipo de probabilidade é a subjetiva. A probabilidade subjetiva resulta de intuição, estimativa, ou de um “palpite bem fundamentado”. Por exemplo, dado o estado de saúde do paciente e a extensão dos ferimentos , um médico pode sentir que esse paciente tem uma chance de 90% de se recuperar completamente. Um analista de negócios pode predizer que a chance dos funcionários de uma determinada companhia entrarem em greve é de 0,25. Um geólogo sismologista ou geofísico pode prever que a Introdução à Estatística Econômica– Autor: Diogo Eduardo Pasqual Penna- deppenna@gmail.com 54 996470481_______________________________________________________________ ____________________________________________________________________ – outubro de 2021 - 36 probabilidade de ocorrer um terremoto acima de 5 na escala Richter, em Los Angeles, nos próximos 100 anos é de 30%. Na tabela abaixo temos um resumo dos 3 tipos de probabilidade: Tipo Resumo Fórmula Probabilidade Clássica O n.º de resultados em S é conhecido e cada resultado é equiprovável P(E) = n.º de resultados no evento E n.º de resultados no espaço amostral Probabilidade Empírica (estatística) A freqüência de resultados em S é estimada a partir da experimentação P(E) = frequencia do evento E = f = f frequência Total n f Probabilidade Subjetiva As probabilidades resultam de intuição, experiência ou estimativa Nenhuma Exercícios usando a distribuição de freqüência (probabilidade empírica) para obter probabilidades: Utilizando a TABELA abaixo responda: A probabilidade de um eleitor escolhido ao acaso ter entre 21 e 24 anos e a de não ter entre 18 e anos. Idade dos eleitores (x) Freqüência ( em milhões) (f ) 18 a 20 anos de idade 10,8 21 a 24 anos de idade 13,9 25 a 34 anos de idade 40,1 35 a 44 anos de idade 43,3 45 a 64 anos de idade 53,7 65 anos de idade ou mais 31,9 Resposta: Exercícios – ESPAÇOS DE PROBABILIDADES: 1.Seja um experimento aleatório deixar cair um dado e verificar o n.º da face voltada para cima. S = { 1, 2, 3, 4, 5, 6 } n(S) = 6 a) Qual é a probabilidade de ocorrer um n.º menor ou igual a 4 ? Introdução à Estatística Econômica– Autor: Diogo Eduardo Pasqual Penna- deppenna@gmail.com 54 996470481_______________________________________________________________ ____________________________________________________________________ – outubro de 2021 - 37 A= {1, 2, 3, 4} P(A) = 4/6 =2/3 ou 0,67 ou 67 % n(A) = 4 b) Qual é a probabilidade de ocorrer um múltiplo de 3 ? B={3, 6} P(B) = 2/6 = 0,33 ou 33% n(B) = 2 c)Qual é a probabilidade de ocorrer um n.º maior do que 6 ? C= P (C) = 0/6 P( C ) = 0 n( C ) = 0 d)Qual é a probabilidade de ocorrer um n.º menor ou igual a 6 ? D = { 1, 2, 3, 4, 5, 6}; P(D) = 6/6 = 1 ou 100% n(D) = 6 e)Qual é a probabilidade de ocorrer um n.º maior ou igual a 2 ? E ={2, 3, 4, 5, 6}; P(E) = 5/6 = 0,8333 ou 83,3 % n(E) = 5 2.No lançamento sucessivo de dois dados, cujos elementos do espaço amostral são equiprováveis determine: (1,1) (1,2) (1,3) (1,4) (1,5) (1,6) (2,1) (2,2)(2,3) (2,4) (2,5) (2,6) (3,1) (3,2) (3,3) (3,4) (3,5) (3,6) (4,1) (4,2) (4,3) (4,4) (4,5) (4,6) (5,1) (5,2) (5,3) (5,4) (5,5) (5,6) (6,1) (6,2) (6,3) (6,4) (6,5) (6,6) Observe que na diagonal principal os valores se repetem.(i = j ); Acima da diagonal principal i < j; Abaixo da diagonal principal i > j; a)qual a probabilidade dos pares de números serem iguais ? P(a) = 6/36; P(a) = 0,1667; P(a) = 16,67% Introdução à Estatística Econômica– Autor: Diogo Eduardo Pasqual Penna- deppenna@gmail.com 54 996470481_______________________________________________________________ ____________________________________________________________________ – outubro de 2021 - 38 b) qual a probabilidade da soma dos n.ºs ser 3 ? (1,2) (2,1); P(b) = 2/36; P(b) = 0,0556; P(b) = 5,56% c)qual a probabilidade dos números serem 5 ou 7 ? Observação: “ou “ significa união ou adição. d)qual a probabilidade do n.º do 1.º dado ser menor do que o do 2.º dado ? P(d) = 15/36; P(d) = 41,67% VIII. a) DISTRIBUIÇÃO DE PROBABILIDADE O conjunto dos valores de uma variável, associado às respectivas probabilidades, constitui uma distribuição de probabilidade. Onde 1 ( ) 1 n i i P x Exemplos: 1-Consideremos a distribuição do n.º de caras obtido ao se lançar uma moeda 3 vezes. As possibilidades são: 0, 1, 2, 3 (caras) e as probabilidades são: P(0) = 1/8; P(1) = 3/8; P(2) = 3/8; P(3) = 1/8. Introdução à Estatística Econômica– Autor: Diogo Eduardo Pasqual Penna- deppenna@gmail.com 54 996470481_______________________________________________________________ ____________________________________________________________________ – outubro de 2021 - 39 Denominando ix os valores da variável e P ( ix ) as probabilidades respectivas, temos a seguinte distribuição de probabilidades: (variável) ix P( ix ) 0 1/8 1 3/8 2 3/8 3 1/8 1 A representação gráfica desta distribuição de probabilidade é: 2. Tomemos a distribuição do n.º de crianças do sexo masculino em famílias de 4 filhos. Construa a árvore de probabilidades. Introdução à Estatística Econômica– Autor: Diogo Eduardo Pasqual Penna- deppenna@gmail.com 54 996470481_______________________________________________________________ ____________________________________________________________________ – outubro de 2021 - 40 As probabilidades correspondentes são: , ! !( !)n x n c x n x P(0) = P(1) = P(2) = P(3) = P(4) = A distribuição de probabilidades e o gráfico correspondente são: i r i f f f P( ix ) 0 1/16 1 4/16 2 6/16 3 4/16 4 1/16 1 Freqüência Relativa (porcentagem da classe) Quando o conjunto universo das possibilidades de uma prova é indeterminado, não de pode fixar a probabilidade que se associa a cada valor da variável. Nesse caso, usamos a freqüência relativa (fi) como estimativa da probabilidade. Seja, por exemplo, uma prova que consiste em verificar o n.º de peças produzidas com defeito, semanalmente, por uma máquina durante 30 semanas. ix 0 1 2 3 4 5 6 if 2 5 8 6 4 2 3 Introdução à Estatística Econômica– Autor: Diogo Eduardo Pasqual Penna- deppenna@gmail.com 54 996470481_______________________________________________________________ ____________________________________________________________________ – outubro de 2021 - 41 ix = n.º semanal de peças defeituosas onde: rif = i f N ou i i f f if = n.º de semanas A freqüência relativa (fr), que constitui a estimativa da probabilidade de cada valor / 30ri if f , é dada por: ir i f f f ix if / 30ri if f 0 2 1 5 2 8 3 6 4 4 5 2 6 3 30 P(0) = …. ; P(1) = ….. ; P(2) = ……. ; P(3) = ….. ; P(4) = …… ; P(5) =……. ; P(6) =…….. ; VIII – b - PROBABILIDADE CLÁSSICA Probabilidade de um Evento a-) ( )( )r N E p E S ( ) ( )r N E p E S . Exemplos de determinação da probabilidade de um evento. 1-Qual a probabilidade de obter-se uma cara em 3 jogadas de uma moeda honesta ? Resp: há 32 8 , resultados possíveis e, assim, S =8. Há 3 resultados que dão uma cara {KCC, CKC, CCK} e assim se “E” é o evento que resulta em uma cara, então N(E) = 3. Portanto, Pr(E) = 3/8 = 0,3740 = 37,40% Construa a árvore de probabilidades. Introdução à Estatística Econômica– Autor: Diogo Eduardo Pasqual Penna- deppenna@gmail.com 54 996470481_______________________________________________________________ ____________________________________________________________________ – outubro de 2021 - 42 2-Qual é a probabilidade de obter-se o total 5 na jogada de 2 dados ? Resp: Há 36 resultados possíveis: s=36. Seja E o evento que consiste em obter 5 nos dados; E contém 4 resultados: E = {(1, 4), ( 2, 3), (3, 2), (4, 1)}, então N(E) = 4 e Pr(E) = 4/36 = 1/9 = 11,11% 4- Qual é a probabilidade de sair um às na extração de uma carta de um baralho ? Resp: como há 52 resultados possíveis, s =52. E seja “E”, o evento “extrair uma às, então “E” contém 4 resultados: Às de Copas (); Às de Ouros (); Às de Paus () e Às de Espadas () Então N(E) = 4 e Pr(E) =4/52 = 1/13 = 7,69%. Um baralho de cartas contém 4 naipes () com as seguintes cartas: As () Às() Às() Às() 2 () 2 () 2() 2() 3 () 3 () 3() 3() 4 () 4 () 4() 4() 5 () 5 () 5() 5() Introdução à Estatística Econômica– Autor: Diogo Eduardo Pasqual Penna- deppenna@gmail.com 54 996470481_______________________________________________________________ ____________________________________________________________________ – outubro de 2021 - 43 6 () 6 () 6() 6() 7 () 7 () 7() 7() 8 () 8 () 8() 8() 9 () 9 () 9() 9() 10 () 10() 10() 10() Figura Figuras Figura Figuras Vermelha Vermelhas Preta Pretas J () J() J() J() Q () Q() Q() Q() K () K() K() K() _____ _____ ______ ______ 13 () 13 () 13 () 13 () TOTAL = 52 CARTAS 26 são pretas ()() – naipes de paus e espadas ; 26 ()() são vermelhas- naipes de copas e ouro – Figuras: temos 4 figuras de cada naipe, Valete, Dama, Rei e Às, totalizando 12 figuras ( 6 pretas e 6 vermelhas). Encima destes dados podemos estudar todas as probabilidades em que estamos interessados. Probabilidade da não ocorrência de um evento Muitas vezes interessa-nos saber a probabilidade de não ocorrência de um evento. Por exemplo, se, no jogo de dois dados, estamos interessados em não obter 7, e esta é 1/6 então há 5/6 de chances de não obter 7. N(E) = 30 e Pr(E) = 30/36 = 5/6. De um modo geral, se p é a probabilidade de ocorrência de um evento E, então 1-p é a probabilidade de não ocorrência deste evento. Podemos chamar de complemento de E ao conjunto que contém todos os resultados que não estão em E. Então Pr( CE ) = 1 – Pr ( E) e podemos chamar de CE de complemento de E. Outra forma é: p = 1 - q onde q é a não probabilidade ou o insucesso e p a probabilidade ou o sucesso. Este resultado é importante para os cálculos, pois, às vezes, é mais fácil calcular a probabilidade de não ocorrência de um evento do que a probabilidade de sua ocorrência. Probabilidade de uma união (eventos mutuamente excludentes) ou “o terceiro postulado de probabilidade” Introdução à Estatística Econômica– Autor: Diogo Eduardo Pasqual Penna- deppenna@gmail.com 54 996470481_______________________________________________________________ ____________________________________________________________________ – outubro de2021 - 44 A probabilidade de ocorrência de um ou outro evento é igual a soma de suas probabilidades. Por exemplo: a probabilidade de as condições meteorológicas melhorarem no decorrer de certa semana é de 0,62 e a probabilidade de se manterem inalteradas é de 0,23, então a probabilidade de às condições melhorarem ou se manterem alteradas é de 0,62 + 0,23 = 0,85. Suponhamos que nos interesse o total 5 ou o total 7 na jogada de dois dados. Evento A = obter 7: A={(1, 6) (2, 5) (3, 4) (4, 3) (5, 2) (6, 1)} Evento B = obter 5: B ={(1, 4) (2, 3) (3, 2) (4, 1)}. Seja C o evento obter 5 ou 7, então C = {(1, 6) (2, 5) (3, 4) (4, 3) (5, 2) (6, 1) (1, 4) (2, 3) (3, 2) (4, 1)}. Sendo assim C = A união com B Ou, representado matematicamente por C = A B. E se quiséssemos saber qual a probabilidade de ocorrer pelo menos um deles ? então basta somar as probabilidades: Pr(A ou B) = Pr(AB) = Pr (A) + Pr (B). Este resultado só é válido quando não há possibilidade de os eventos A e B ocorrerem simultaneamente. No caso de uma jogada de dois dados não é possível obter 5 e 7 em uma única jogada de um par de dados. Dois eventos que não podem ocorrer simultaneamente dizem-se disjuntos ou mutuamente excludentes. Exemplo: Ao jogar um dado honesto “ o n.º da face voltada para cima” é par: A = {2, 4, 6} e n(A) = 3 O “n.º da face voltada para cima” é divisor de 6: B = { 1, 2, 3 , 6 } e n(B) = 4 O “n.º da face voltada para cima” é um n.º par OU ( ) é um n.º divisor de 6. C = AB={ 1, 2, 3, 4, 6 } e n(AB) = 5 Probabilidade de uma intersecção Consideremos agora o caso de dois eventos que podem ocorrer simultaneamente. Evento intersecção. No caso do exemplo anterior, se quiséssemos saber: “ o n.º da face voltada para cima” é um n.º par E ( ) é um n.º divisor de 6; C = AB= {2,6} e n(A B) = 2 Eis alguns exemplos de intersecção: - se V é um conjunto de vogais e C é o conjunto de consoantes, então V C = (conjunto vazio). Introdução à Estatística Econômica– Autor: Diogo Eduardo Pasqual Penna- deppenna@gmail.com 54 996470481_______________________________________________________________ ____________________________________________________________________ – outubro de 2021 - 45 - Se A é o conjunto de mãos com cinco cartas em sequência e B é o conjunto de mãos com cinco cartas do mesmo naipe, então AB é o conjunto de todos os “straight flushes”. Intersecção e união no mesmo exercício – utilização conjunta de ambos na mesma fórmula: Consideremos agora a possibilidade de obter uma figura ou uma carta vermelha de um baralho comum. Se F é o evento “obter figura” e V o evento “obter carta vermelha” não podemos usar a soma das probabilidades já que existem figuras que são vermelhas assim teremos que utilizar, escrito matematicamente, o seguinte raciocínio: N(AB) = N(A) + N(B) – N(A B) Esta fórmula vale para dois eventos eventos arbitrários, quer sejam mutuamente excludentes ou não. Se A e B são mutuamente excludentes, então Pr (A e B) = 0, e voltamos a fórmula já achada anteriormente: Pr(A ou B) = Pr(A) + Pr (B). Pr(F) = 12 52 ; Pr(V) = 26 52 então N(F V) = 12 52 + 26 52 - 6 52 = 32 52 = 0,6154 ou 61,54 % de probabilidade de ser carta vermelha ou figura. Exemplo 2: Qual é a probabilidade de obter-se um único seis na jogada de dois dados: PR(E1E2) = Pr(E1) + Pr(E2) – Pr (E1 E2) = 1 6 + 1 6 - 1 36 = 11/36 Exemplos de união ( ) e intersecção ( ) Considere duas apostas sucessivas de par ou ímpar, indicando o resultado par por (p) e o resultado ímpar por (i): S = {(p,i) (p,p) (i,p) (i,i)} Introdução à Estatística Econômica– Autor: Diogo Eduardo Pasqual Penna- deppenna@gmail.com 54 996470481_______________________________________________________________ ____________________________________________________________________ – outubro de 2021 - 46 Pergunta-se: a)Qual o evento B da ocorrência de um resultado par e um resultado ímpar ? B={(p,i) (i,p)} n(B) = 2 b)Qual o evento D da ocorrência de pelo menos um resultado para ou um resultado ímpar ? D={(p,i) (p,p) (i,p) (i,i)} n(D) = 4 Outras perguntas sobre o espaço amostral de duas apostas sucessivas de para ou ímpar: c)Qual é o evento A da ocorrência de pelo menos um resultado par ? Lembre que pelo menos um pode ser dois, três ou n resultados. A={(p,i) (p,p) (i,p)} n(A) = 3 d)Qual é o evento C da ocorrência de nenhum resultado par ? C={(i,i)} n(C) = 1 e)Qual é o evento E da ocorrência de nenhum resultado par nem ímpar ? E={} = conjunto vazio n(E) = 0 Observações: O evento C, por ter apenas um ponto amostral, é dito evento elementar. O evento D, por ser igual ao espaço amostral S, é dito evento certo. O evento E, por ser igual ao conjunto vazio, é dito evento impossível. Lembre-se que se A e B são eventos mutuamente excludentes (não podem ocorrer conjuntamente) então: Pr(A ou B) = Pr (A) + Pr (B). Mas se A e B não são mutuamente excludentes, então: Pr(A ou B = Pr(A) + Pr (B) – Pr (A e B). Princípio da Multiplicação a x b Exemplos: 1.Jogando-se duas moedas, cada uma pode apresentar dois resultados; logo, o n.º total de resultados é 2 x 2. Introdução à Estatística Econômica– Autor: Diogo Eduardo Pasqual Penna- deppenna@gmail.com 54 996470481_______________________________________________________________ ____________________________________________________________________ – outubro de 2021 - 47 2. Na jogada de 2 dados, cada um pode apresentar 6 resultados, logo o n.º total de resultados possíveis é 6 x 6 =36. 3.Se uma sorveteria oferece mini-sundaes com escolha de 20 sabores diferentes, associados a 8 coberturas diferentes, de quantas maneiras um cliente pode pedir um mini-sundae ? m =20 sabores; n= 8 coberturas; m x n = 20 x 8 = 160 escolhas diferentes. 4.Uma lanchonete oferece uma refeição especial constante de um sanduíche (utilizando um dentre 8 tipos diferentes de carne e um dentre 4 tipos diferentes de pão) acrescido de sopa e bebida ( um dentre 4 tipos diferentes de sopa e um dentre 3 tipos diferentes de bebida). De quantas maneiras um cliente pode escolher uma refeição especial ? N1 X N2 X N3 X N4 = 8 X 4 X 4 X 3 = 384 maneiras de escolher. Amostragem com reposição a)Suponha agora o leitor que tem cinco blusas em sua gaveta, cada manhã abre a gaveta e escolhe uma ao acaso, repondo-o na gaveta ao voltar à tarde. De quantas maneiras podem ser escolhidas as blusas em uma semana ? 75 = 5 X 5 X 5 X 5 X 5 X 5 X 5 =78.125 Qual é a probabilidade de escolher a mesma blusa todos os sete dias ? P = 5 78.125 = 0,000064. A idéia fundamental da amostragem com reposição é que, escolhido um elemento, nada impede que esse elemento volte a ser escolhido. d) Suponha o leitor que esteja querendo adivinhar o n.º da licença do carro de uma amigo. Cada placa consiste de três letras e três algarismos. Por exemplo: LXD 898. Solução: Probabilidade para as 3 letras, supondo alfabeto de 26 letras: 310 1.000 326 17.576 ; Introdução à Estatística Econômica– Autor: Diogo Eduardo Pasqual Penna- deppenna@gmail.com 54 996470481_______________________________________________________________ ____________________________________________________________________ – outubro de 2021 - 48 Algarismos decimais: 10. Então 310 1.000 . Como a combinação de letras pode associar-se a cada combinação de algarismos então: 17.576 x 1.000 = 17.576.000 licenças