Baixe o app para aproveitar ainda mais
Prévia do material em texto
UNIVERSIDADE FEDERAL RURAL DO SEMI-ÁRIDO-UFERSA DEPARTAMENTO DE CIÊNCIAS VEGETAIS-DCV DISCIPLINA: ESTATÍSTICA UFERSA MOSSORÓ-RN 2013 1 Introdução 2 O Método Estatístico 3 Definições Preliminares 4 Distribuição de freqüência: Coleta, organização e apresentação de dados 5 Medidas de posição 6 Medidas de dispersão 1. INTRODUÇÃO No nosso dia a dia fazemos uso da Estatística. Exemplos: O jornal anuncia que o candidato x ganha a eleição por apenas 2% a mais de votos; O meteorologista informa que a probabilidade de chover hoje é de 50%; A probabilidade de um acidente mais grave sem auxílio do cinto de segurança. A razão do nome Estatística vem do fato de que os primeiros trabalhos eram de catalogação de dados, sendo onerosos, somente o estado podia arcar com as despesas. Daí a origem do nome. ESTADO - STATUS – ESTATÍSTICA O que é Estatística? 1. “É a parte da Matemática Aplicada que trata de chegar a conclusões a partir de dados observados.” 2. “É a ciência que trata da organização, descrição, análise e interpretação dos dados experimentais.” 3. “É o estudo dos métodos e procedimentos para recolher, classificar, resumir e analisar dados e, a partir deles, estabelecer inferências científicas.” Evolução histórica da Estatística As necessidades que exigiam o conhecimento numérico dos recursos disponíveis começaram a surgir quando as sociedades primitivas se organizaram. Os Estados, desde tempos remotos, precisaram conhecer determinadas características da população, efectuar a sua contagem e saber a sua composição ou os seus rendimentos. Para que os governantes das grandes civilizações antigas tivessem conhecimento dos bens que o Estado possuía e como estavam distribuídos pelos habitantes, realizaram-se as primeiras estatísticas, nomeadamente para determinarem leis sobre impostos e números de homens disponíveis para combater. Estas estatísticas, eram frequentemente limitadas à população adulta masculina. O primeiro dado disponível sobre um levantamento estatístico foi referido por Heródoto, que afirmava ter-se efectuado em 3050 a. C. um estudo das riquezas da população do Egipto com a finalidade de averiguar quais os recursos humanos e económicos disponíveis para a construção das pirâmides. Há também notícia de que no ano 2238 a. C. se realizou um levantamento estatístico com fins industriais e comerciais ordenado pelo imperador chinês Yao. Existem indícios, que constam da Bíblia, relativamente a recenseamentos feitos por Moisés (1490 a.C.). Outra estatística referida pelos investigadores foi feita no ano 1400 a. C., quando Ramsés II mandou realizar um levantamento das terras do Egipto. Também os romanos faziam o recenseamento dos cidadãos e dos bens. Eram os censores, magistrados romanos, que asseguravam o censo dos cidadãos. Uma das convenções da História é ligar a datação (a.C. ou d.C.) ao recenseamento populacional ordenado pelo imperador César Augusto. As estatísticas realizadas por Pipino, em 758, e por Carlos Magno, em 762, sobre as terras que eram propriedade da Igreja, são algumas das estatísticas importantes de que há referências desde a queda do império romano. Guilherme, “O Conquistador”, que reinou entre 1066 e 1087, ordenou que se fizesse um levantamento estatístico da Inglaterra. Este levantamento deveria incluir informações sobre terras, proprietários, uso da terra, animais... e serviria de base, também, para o cálculo de impostos. Para responder ao desenvolvimento social surgiram estas primeiras técnicas estatísticas: classificar, apresentar, interpretar os dados recolhidos foram para os censos e são para a Estatística um aspecto essencial do método utilizado. Mas, um longo caminho havia de ser percorrido até aos dias de hoje. Até ao início do séc. XVII, a Estatística limitou-se ao estudo dos “assuntos de Estado”. O desenvolvimento do Cálculo das Probabilidades surge também no século XVII. A ligação das probabilidades com os conhecimentos estatísticos veio dar uma nova dimensão à Estatística, que progressivamente se foi tornando um instrumento científico poderoso e indispensável. Considera-se assim uma nova fase, a terceira, em que se começa a fazer inferência estatística: quando a partir de observações se procurou deduzir relações causais, entre variáveis, realizando- se previsões a partir daquelas relações. A palavra Estatística surge, pela primeira vez, no séc. XVIII. Alguns autores atribuem esta origem ao alemão Gottfried Achemmel (1719-1772), que teria utilizado pela primeira vez o termo statistik, do grego statizein; outros dizem ter origem na palavra estado, do latim status, pelo aproveitamento que dela tiravam os políticos e o Estado. Na sua origem, a Estatística estava ligada ao Estado. Hoje, não só se mantem esta ligação, como todos os Estados e a sociedade em geral dependem cada vez mais dela. Por isso, em todos os Estados existe um Departamento ou Instituto Nacional de Estatística. Na actualidade, a Estatística já não se limita apenas ao estudo da Demografia e da Economia. O seu campo de aplicação alargou-se à análise de dados em Biologia, Medicina, Física, Psicologia, Indústria, Comércio, Meteorologia, Educação, etc., e ainda a domínios aparentemente desligados, como estrutura de linguagem e estudo de formas literárias. Quando a Estatística nos engana... A Estatística é muito frequentemente pretexto para anedotas e caricaturas. Mas, tal como na primeira metade do século XX se pretendeu responsabilizar os físicos atómicos e nucleares pelas decisões políticas da utilização destes conhecimentos para efeitos de guerra, é a utilização abusiva e não a própria Estatística que gera absurdos e enganos frequentes. Uma acusação que frequentemente se faz à Estatística é a de induzir em erro, não só porque apresenta dados obtidos por procedimentos que podem ser questionados no seu rigor, mas também porque, apesar de serem correctos e obtidos por métodos válidos, esses dados podem ser apresentados de maneira a induzir confusão a quem não está especialmente familiarizado com esta linguagem. Desta forma, parece de extrema importância a capacidade de se detectar este tipo de confusões e, consequentemente, é imprescindível conhecê-las. Por outro lado, a análise e a procura de erros, desenvolvem a capacidade de observação e fomentam o sentido crítico. 1. RAMOS DA ESTATÍSTICA Estatística Descritiva Trata da observação de fenômenos de mesma natureza, da coleta de dados numéricos referentes a esses fenômenos,da sua organização e classificação através de tabelas e gráficos, bem como da análise e interpretação. → Tornar as coisas fáceis de entender, relatar e discutir. Probabilidade Estatística Utilizado para situações que envolvem o acaso (aleatoriedade). → Jogos de cartas e dados. Inferência Estatística Estuda as características de uma população com base em dados obtidos de amostras-Amostragem. → Provar um pedaço de bolo; folhear um novo livro. 1. A população é composta de todas as lâmpadas produzidas com o novo filamento. A durabilidade média é desconhecida. 4. A média da amostra é usada para estimar a média da população. 3. Os dados amostrais fornecem uma durabilidade média de 76 horaspor lâmpada da amostra. 2. Uma amostra de 200 lâmpadas é produzida com o novo filamento. 2. O MÉTODO ESTATÍSTICO A realização de uma pesquisa deve passar necessariamente, pelas fases resumidas no diagrama abaixo, se um resultado satisfatório e preciso é desejado. 3. DEFINIÇÕES PRELIMINARES População: É um conjunto de observações (valores, pessoas, medidas, etc.), com pelo menos uma característica em comum. Ex: Estudantes da turma 5 da disciplina de Estatística. Simbologia N = X1, X2, X3, ... XN. Tipos: 1) Finita: É aquela que tem um número limitado de elementos. Ex: Estudantes do sexo feminino que cursam administração. 2) Infinita: É aquela onde o número de elementos é muito grande. Ex: As possíveis vazões da cessão de um rio. Amostra: É um subconjunto de uma população. É necessariamente finita - todos os seus elementos são examinados. A amostra é uma redução da população a dimensões menores, sem perda das características essenciais. Simbologia n= x1=x2+x3+...+xn Tamanho da amostra Nº de elementos da amostra n. Ex: População: Os alunos da turma A. N=25 Amostra: Alunos com menos de 20 anos. n= 6. Amostragem É o processo de obtenção de amostras de uma população. Variável É a característica pela qual se deseja que a população seja descrita. Pode assumir diferentes valores de elemento para elemento. Notação: Variável X,Y,Z, etc. X: Idade dos alunos da disciplina de Estatística Y: Altura dos alunos da disciplina de Estatística Dado ou observação É o valor registrado para um elemento. Notação: Amostra: uma parte dos eleitores População: Eleitores brasileiros Variável x,y,z,etc x1: 24 anos; x2=36 anos; x3=30 anos y1: 1,75m; y2=1,60m; y3=1,52m; Tipos de Variáveis Variável qualitativa São aquelas variáveis que correspondem a atributos ou categorias. Ex: Sexo, profissão, estado civil, cor, etc. 1) Variável qualitativa nominal: Quando os atributos não são possíveis de ordenação. Ex: Sexo dos alunos da turma A e B. Masculino, Feminino SEXO Feminino 20% Masculino 80% TOTAL 100% Feminino Masculino Ex: Estado civil Solteiro, casado e divorciado Solteiro 37% Casado 57% Divorciado 16% TOTAL 100% Solteiro Casado Divorciado 2) Variável qualitativa ordinal: Quando os atributos são passíveis de ordenação. Ex: Nível de conhecimento de inglês dos alunos de Estatística - Nível Básico, Médio, Avançado. Ex: Grau de instrução de um indivíduo - 1º grau, 2º grau e 3º grau. Variável quantitativa É aquela cuja estrutura é numérica. 1) Variável quantitativa discreta São próprias de dados de contagem, isto é, estão definidas em um conjunto enumerável (números inteiros racionais). Ex: número de filhos Ex: número de empregados de uma firma Ex: número de ovos depositados por um inseto Ex:número de defeitos 2) Variável quantitativa contínua São aquelas em que as realizações resultam de uma medida (uma mensuração) que pode assumir qualquer valor real entre dois extremos. Ex: Estatura dos alunos de Estatística Ex: Peso de crianças ao nascer Ex: Velocidade um carro Atividade em classe - Estatística Descritiva 1. População ou universo é: a) Um conjunto de pessoas; b) Um conjunto de elementos quaisquer; c) Um conjunto de pessoas com uma característica comum; d) Um conjunto de pessoas com pelo menos uma característica em comum; 2. Uma parte da população retirada para analisá-la denomina-se: a) Universo b) Dados brutos c) Pedaço d) Amostra 3. A parte da estatística que se preocupa somente com a descrição de determinadas características de um grupo, sem tirar conclusões sobre um grupo maior denomina-se: a) Estatística da população; b) Estatística de Amostra; c) Estatística Inferencial; d) Estatística Descritiva. 4. Diga qual tipo de variável estamos trabalhando nos casos abaixo: a) Nº de inscrições no seguro social. ______________________ b) Cor dos olhos. ______________________ c) Escolaridade. ______________________ d) Peso médio dos Recém Nascidos. ______________________ e) Altitude acima do nível do mar. ______________________ f) Uma pesquisa efetuada com 1015 pessoas indica que 40 delas são assinantes de um serviço 4. DISTRIBUIÇÃO DE FREQÜÊNCIA (Coleta, organização e apresentação de dados) A utilização de tabelas com grandes quantidades de números de dados são cansativas e não dão uma visão rápida e geral do fenômeno. Dessa forma é necessário que os dados sejam organizados em uma distribuição de freqüências (simples ou em classe). SUMARIZAÇÃO DOS DADOS Representação Tabular Consiste em dispor os dados em linhas e colunas, distribuídas de modo ordenado, segundo algumas regras práticas e obedecendo à Resolução número 886/66, de 26 de Outubro de 1966, do Conselho Nacional de Estatística. Componentes das tabelas a) Título: Explica o que a tabela contém. Responde a perguntas como: O quê?(fenômeno); Onde? (local); Quando (época). b) Cabeçalho: Indica o conteúdo das colunas. c) Coluna indicadora: Especifica o conteúdo das linhas. d) Cabeçalho ou coluna da Indicadora: Indica o conteúdo da coluna indicadora. e) Corpo: Caselas ou células onde são registrados os dados. f) Rodapé: Notas de identificação da fonte de onde foram coletados dados. Obs.: A fonte corresponde à indicação da entidade ou órgão responsável pelo fornecimento dos dados ou pela sua elaboração. Tabela 01 - Casos registrados de intoxicação humana, segundo a causa determinante. Brasil, 1993. Causas Freqüência Absoluta Freqüência Relativa Acidente 29.601 29.601/43.905=0,67 Abuso 2.604 2.604/43.905=0,06 Suicídio 7.965 7.965/43.905=0,18 Profissional 3.735 3.735/43.905=0,09 Total 43.905 1,00 Fonte: IBGE 4.1- Séries estatísticas: Conjunto de dados associados a um fenômeno expresso em que os dados são agrupados em classes, com suas respectivas freqüências absolutas, relativas e percentuais. De acordo com a época de ocorrência, o fenômeno e o local classificam-se, respectivamente, em: Temporal, Especificativa e Geográfica. a) Série Temporal: os dados são observados segundo a época de sua ocorrência. b) Série Geográfica: os dados são observados segundo o local onde ocorram. c) Série Especificativa: os dados são agrupados segundo a modalidade (espécie) de ocorrência. d) Série Mista ou Dupla Entrada: corresponde a fusão de duas ou mais séries simples. Pode ser visto como uma Tabela de Contingência, a qual ocorre quando os elementos da amostra ou da população são classificados de acordo com dois fatores. Exemplos: Tabela 01 - População brasileira no período de 1940 a 1970. Anos População 1940 41.236.315 1950 51.944.397 1960 70.119.071 1970 93.139.037 Fonte: Livro de Estatística ______________________ Tabela 02 – Região de origem de universitários. São Paulo, 2000. Região f f% Urbana 240 12 Suburbana 1400 70 Rural360 18 Total 2000 100 Fonte: Livro de Estatística ______________________ Tabela 03 – Entrevistados segundo a distribuição ocupacional. Natal, 2001. Distribuição ocupacional Nº de Entrevistados Artesanato 52 Gerencial 29 Serviços Burocráticos 34 Trabalho Não Qualificado 65 Total 180 Fonte: Livro de Estatística ______________________ Tabela 04 – Número de alunos em uma exposição de pintura segundo sexo e o tipo de arte preferida. São Paulo, 2000. Sexo Tipo de arte Arte Clássica Arte Moderna Masculino 80 70 Feminino 20 30 Fonte: Livro de Estatística ______________________ 4.2- Distribuição de freqüência É a série em que os dados são agrupados com suas respectivas freqüências. Elementos de uma distribuição de frequência a) Freqüência (absoluta) É o número de vezes ou repetições que elemento aparece na amostra, ou o número de elementos pertencentes a uma classe. b) Dados brutos São aqueles que não sofreram nenhum tipo de organização. c) Rol É a organização dos dados brutos em ordem de freqüência crescente ou decrescente. d) Amplitude total (At) É determinada pela diferença entre o maior valor (limite superior) e o menor valor (limite inferior) de um conjunto de dados. At=Ls-Li e) Classes de freqüência É cada um dos sub-intervalos em que se subdivide a amplitude total do conjunto de dados de valores da variável. Métodos para se determinar o melhor número de classes (K) 1) Método de Sturges: K= 1 + 3,3logn 2) Método de Oliveira: K = √n; f) Intervalo de classes É um símbolo que define uma classe. Ex: Li Ls 0 10 [ ) * mais utilizado g) Ponto médio de classe (xi) (P) A média aritmética dos limites inferior e superior de uma classe define o ponto médio ou centro da classe. É o elemento mais importante por que para fins de análise matemática todas as observações contidas num intervalo de classe, são considerados iguais ao seu ponto médio. Esta é a hipótese tabular. 2 LsLi xi h) Comprimento do intervalo da classe (c ou h) Obtido dividindo-se a amplitude da classe pelo número de classes. K At c i) Determinar o limite inferior da primeira classe (Liª), dado por: Liª= Li (menor valor do rol) 2 ª c LiLi j) Tipos de frequência a) Frequência simples - Absoluta - Relativa b) Freqüências acumuladas - Abaixo de ↓ (crescentes) Absoluta e relativa - Acima de ↑ (decrescentes) Absoluta e relativa l) Representações gráficas Gráficos representativos das distribuições de frequências A) Freqüências simples a) Dados discretos Gráfico em haste ou bastão b) Dados contínuos I – Histograma de frequência II – Polígono de freqüência. B) Freqüências acumuladas a) Dados discretos Gráfico em escada b) Dados contínuos I – A) Abaixo de II – B) Acima de DISTRIBUIÇÃO DE FREQUÊNCIA PARA DADOS DISCRETOS Variável: Número de cáries em crianças. Dados brutos: 1 3 1 1 0 1 0 1 1 0 2 2 0 0 0 1 2 1 2 0 0 1 6 4 3 3 1 2 4 0 Rol 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 3 3 3 4 4 6 Distribuição de freqüência Nº de cáries em crianças Fi Fr f% Fac↓ fac↑ 0 9 0,30 30 9 30 1 10 0,33 33 19 21 2 5 0,17 17 24 11 3 3 0,10 10 27 6 4 2 0,07 7 29 3 6 1 0,03 3 30 1 Total (Σ) 30 1,0 100 - - REPRESENTAÇÃO GRÁFICA PARA VARÁVEIS ALEATÓRIAS DISCRETAS GRÁFICO EM HASTE OU BASTÃO GRÁFICO EM ESCADAS DISTRIBUIÇÃO DE FREQUÊNCIA PARA DADOS CONTÍNUOS Variável: Idade dos 30 alunos da turma de Estatística. Dados brutos: 24 23 22 28 35 21 23 23 33 34 33 34 21 31 25 24 21 25 36 26 22 30 32 25 26 31 26 25 35 33 Rol 21 21 21 22 22 23 23 23 24 24 25 25 25 25 26 26 26 28 30 31 31 32 33 33 33 34 34 35 35 36 Determinar a amplitude do dados A= Ls – Li A= 36-21 =15 Determinar o número de classes pela regra de Sturges K = 1+ 3,3log n K = 1+ 3,3log 30 K =5,87~6 Determinar o comprimento de classes (c ou h) c = At = 15 = 2,5~3 K 6 Determinar os limites de classe Liª= menor valor do rol Construir a tabela de freqüência Idades Xi Fi fr f% fac↓ fac↑ [21 – 24) 22,5 8 0,267 26,7 8 30 [24 – 27) 25,5 9 0,300 30,0 17 22 [27 – 30) 28,5 1 0,033 3,3 18 13 [30 – 33) 31,5 4 0,133 13,3 22 12 [33 – 36) 34,5 7 0,233 23,3 29 8 [36 – 39) 37,5 1 0,033 3,3 30 1 Total (Σ) 30 0,999 99,9 - - REPRESENTAÇÃO GRÁFICA DAS VARÁVEIS ALEATÓRIAS CONTÍNUAS HISTOGRAMA DE FREQUÊNCIA E POLÍGONO DE FREQUÊNCIA MEDIDAS DESCRITIVAS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA 1.1 Finalidade: Resumir certas informações importantes das distribuições de freqüências. 1.2 Tipos: Medidas de posição ou tendência central Média: Aritmética Mediana Moda Medidas de dispersão Amplitude total Variância Desvio padrão Coeficiente de variação Medidas de assimetria Medidas de curtose MEDIDAS DE POSIÇÃO: 1- Média Aritmética A média aritmética é a idéia que ocorre a maioria das pessoas quando se fala em médias. É a soma dos valores do conjunto dividido pelo número de valores no conjunto. A simbologia usada para a média é a seguinte: - Para a população usa-se: . - Para a amostra usa-se: x . Características da média aritmética 1) É uma medida influenciada por valores extremos podendo em alguns casos não representar a série; 2) É uma medida facilmente calculável; 3) É rigorosa definida e exata; 4) Descreve todos os dados de uma série e é de fácil compreensão; 5) Não pode ser empregada para dados qualitativos. 6) Ela não pode ser calculada para distribuições de frequência em classes abertas (limites indefinidos). Cálculo da média Dados não agrupados 1) Para a população Sejam {x1, x2, x3,...., xn} dados de uma população. N xi N xnxxx n i 1 ...321 2) Para a amostra Sejam {x1, x2, x3,...., xn} dados de uma amostra. n xi n xnxxx x n i 1 ...321 Exemplo: 1) Seja Yi a variável referente a salários mensais em reais de cinco empregados de uma agroindústria: Determine o salário médio mensal dos trabalhadores. Yi = {R$780,00, R$790,00, R$800,00, R$810,00 e R$820,00}, n=5. x = 780 + 790 + 800 + 810 + 820 = R$ 800,00 5 Dados agrupados Dados agrupados sem intervalo de classes (Discreta) n fixi x n i 1 onde n i fin 1 Exemplo: 2) Seja Yi a variável referente o número de cáries em crianças: Determine o número médio de cáries por criança. 1 2 1 2 0 0 1 6 4 3 3 1 2 4 0 Xi fi Xifi 0 3 0 1 4 4 2 3 6 3 2 6 4 2 8 6 1 6 ∑ 15 30 n fixi x n i 1 = 2 15 30 x cáries/criança Dados agrupados Dados agrupados com intervalo de classes (Contínua) Obs. Quando dados discretos apresentam-se muito dispersos. n fixi x n i 1 onde n i fin 1 e xi é o ponto médio da classe. Exemplo: 3) Seja Yi a variável referente ao número de residentes por quarto avaliados em 40 casas da residência universitária: Determine o número médio de residentes por quarto. Classes fi xi Xifi [2, 4) 5 3 15 [4, 6) 10 5 50 [6, 8) 14 7 98 [8, 10) 8 9 72 [10, 12) 3 11 33 ∑ 40 - 268 n fixi x n i 1 = 7,6 40 268 x moradoras/quarto 2- Mediana Colocando-se os valores de uma série em ordem crescente ou decrescente, a mediana é o valor que ocupa a posição central. Características da mediana 1) É uma medida separatriz, definida e exata, é de fácil compreensão, a cálculo é simples e ela serve para análise comparativa. 2) É uma medida que depende da ordem (posição) e não dos elementos da distribuição. 3) A mediana pode ser usada como uma medida alternativa em relação a média aritmética para caracterizar o centro do conjunto de dados, como por exemplo, a distribuição de renda de uma população. Exemplo: 136, 250, 480, 1.000, 6.000, 10.000 4) mediana é empregada nas distribuições de freqüências que apresentam nos extremos classes abertas. Xi Fi Fac Menos de 25 2 2 [25, 50) 4 6 [50, 75) 12 18 [75,100) 1 19 19 - 5) A mediana pela sua própria característica define exatamente o centro da distribuição. Cálculo da mediana Mediana para dados discretos Obs.: Os dados estão dispostos em forma de rol ou em distribuição de freqüência simples. Se “n” for impar: A mediana é igual ao valor de ordem (n+1)/2 do conjunto. 0 2 1 n Med Exemplo 1: Calcular a mediana da série: 2, 3, 7, 11, 15, 18, 22. n =7 0 2 1 n Med = º4 2 17 0 elemento da série =11 2, 3, 7, 11, 15, 18, 22. Exemplo 2:Calcular a mediana da série: 3, 4, 5, 6, 7, 8, 9. n =7 0 2 1 n Med = º4 2 17 0 elemento da série = 6 3, 4, 5, 6, 7, 8, 9. Se “n” for par: A mediana é definida como qualquer valor situado entre os valores de ordem Md1=n/2 e Md2 =(n+1)/2. Para simplificarmos a determinação da mediana consideramos como sendo o valor médio entre esses valores. 2 1 22 2 21 00 nn MdMd Med Exemplo 1: Calcular a mediana da série: 12, 13, 14, 15, 16, 16, 17, 20 n = 8 Md1= º4 2 8 Md2= º51 2 8 E = 12, 13, 14, 15, 16, 16, 17, 20 5,15 2 1615 Med Mediana para dados contínuos 1. Os dados estão agrupados em uma distribuição de freqüências em classes, então: Passos: (1º Passo) Calcular a ordem, ou posição da mediana, PMed= ( 2 n ). Não importa se n é impar ou par. (2º Passo) Através da fac↓ identificar a classe que contém a mediana. (3º Passo) Aplicar na fórmula: c fiMd antfac n LiMd .2 , onde Md = Mediana Limed = Limite inferior da classe mediana n = ∑fi ∑fac↓.ant = A soma da freqüência acumuladas anterior a classe mediana fi Md = Freqüência da classe mediana c = comprimento da classe mediana = Amplitude da classe da mediana Exemplo: Calcular a mediana dos dados da distribuição de freqüência abaixo: Classes F fac [35, 45) 5 5 [45, 55) 12 17 [55, 65) 18 35 [65, 75) 14 49 [75, 85) 6 55 [85, 95) 3 58 ∑ 58 - c fiMd antfac n LiMd .2 º29 2 n Md At = 65-55 = 10 10. 18 17 2 58 55 Md 18 120 55Md Md=55+6,67 Md=61,67 3- Moda É a medida que indica o valor que ocorre com maior frequência num conjunto de dados. Características da moda 1) É uma medida de posição de fácil compreensão, não é rigorosamente definida e exata, podendo não existir em uma série ou ocorrer mais de uma vez em outras. 2) É muito utilizada quando há valores extremos que afetam de maneira acentuada o valor da média 3) Não é afetada pelos valores extremos da distribuição 4) É uma medida bastante empregada na estatística econômica e na indústria Dados qualitativos E= excelente O=ótimo B=bom R=regular P=péssimo Exemplo: Notas atribuídas a comida de um restaurante A. Restaurante A= P, R, B, B, O, O, O, O, E, E. Qual é a moda? O unimodal Restaurante B= R, B, B, B, B, O, O, O, O, E. Qual é a moda? B e O bimodal Restaurante C= P,P, R,R, B, B, O, O,E, E. Qual é a moda? Não existe moda amodal Dados quantitativos A: {2, 3, 7, 9, 12, 15} amodal B: {1, 1, 2, 2, 3, 3, 6, 6} amodal C: {2, 3, 4, 4, 4, 5, 5, 6, 6, 8, 9} Mo= 4 (unimodal) D: {2, 3, 7, 7, 7, 9, 9, 11, 11, 11, 12, 13, 14, 15} Mo=7 e Mo=11 (bimodal) E: {2, 3, 3, 4, 4, 5, 5, 6, 7, 8} Mo= 3; Mo= 4 e Mo=5 (plurimodal) Moda para dados discretos Os dados são apresentados em forma de rol ou em uma distribuição de freqüência simples. Obs.: A moda é o valor que ocorre com maior freqüência. xi fi 0 15 1 10 2 13 3 6 4 3 5 3 50 Mo= 0 Moda para dados contínuos 1. Os dados estão agrupados em uma distribuição de freqüências em classes, então: Passos: (1º Passo) Identificar a classe modal: A classe modal é aquela que apresenta o valor que ocorre com maior freqüência; (2º Passo) Utilizar a fórmula: Moda de King c fpostfant fpost LiMo . , onde Mok = Moda Limo = Limite inferior da classe modal fpost = freqüência absoluta da classe posterior à classe modal fant = frequência absoluta da classe anterior à classe modal Imo = Intervalo (comprimento) da classe modal - At Exemplo: Calcular a moda dos dados da distribuição de freqüência abaixo: Classes f fac [35, 45) 5 5 [45, 55) 12 17 [55, 65) 18 35 [65, 75) 14 49 [75, 85) 6 55 [85, 95) 3 58 ∑ 58 - At = 65-55 = 10 10. 1412 14 55 Mo 4,555Mo 4,0Mo 4. Separatrizes Atividade em classe- Estatística Descritiva - Medidas de posição 1. Calcule para cada caso abaixo a respectiva média, mediana e moda. a) 7, 8, 9, 12, 14 b) xi fi 3 2 4 5 7 8 8 4 12 3 ∑ 22 c) Classes fi 68-72 8 72-76 20 76-80 35 80-84 40 ∑ 103 MEDIDAS DE DISPERSÃO As medidas de dispersão de uma distribuição são valores que indicam o grau de afastamento dos valores da variável em relação à média. Finalidade: Caracterizar a variação de um grupo de dados estatísticos Amplitude total A amplitude total (AT) de uma distribuição de frequência é a diferença entre o maior e o menor valor da variável, dos dados, da classe. Exemplo:Seja Yi a variável referente a salários mensais em reais de cinco empregados de uma agroindústria: Determine a amplitude total dos salários dos trabalhadores. Yi = {R$780,00, R$790,00, R$800,00, R$810,00 e R$820,00}, n=5. At=820 - 780= 40 Variância ou quadrado médio A variância de uma distribuição é a média dos quadrados dos desvios. A variância de uma amostra é representada por S ² e constitui uma estimativa da variância da população 2 (sigma ao quadrado). Assim, se x1, x2, x3, ...xn, é uma amostra de n elementos da variável xi, então 1 ² ² 2 n n xi xi S Obs. Para (n<25) o denominador de S² deve ser n-1 em lugar de n. Dados não agrupados Exemplo 1: Seja Yi a variável referente a salários mensais em reais de cinco empregados de uma agroindústria: Determine a variância dos salários dos trabalhadores. Yi = {R$780,00, R$790,00, R$800,00, R$810,00 e R$820,00}, n=5. ∑x = 780 + 790 + 800 + 810 + 820 =4000 ∑x² = (780)² + (790)² + (800)² + (810)² + (820)² = 3201000 1 ² ² 2 n n xi xi S ²S Dados agrupados Exemplo 2) Seja Yi a variável referente o número de cáries em crianças: Determine a variância do número de cáries das criança. xi fi Xifi xi² xi²fi 0 3 1 4 2 3 3 2 4 2 6 1 ∑ 15 1 ² ² 2 n n fixi fixi S ²S Dados agrupados em classe Classes fi xi fixi xi² fixi² [35, 45) 5 40 200 [45, 55) 12 50 600 [55, 65) 18 60 1080 [65, 75) 14 70 980 [75, 85) 6 80 480 [85, 95) 3 90 270 ∑ 58 3610 1 ² ² 2 n n xifi fixi S ²S Desvio padrão O desvio padrão de uma distribuição é a raiz quadrada positiva da variância. O desvio padrão é representado por (sigma) e o desvio padrão da amostra por S. Assim na distribuição amostral anterior, o desvio padrão é: - Dados não agrupados S=√S² S= - Dados agrupados sem intervalo de classes S=√S² S= - Dados agrupados em classe S=√S² S= Coeficiente de variação O coeficiente de variação é a relação entre o desvio-padrão e a média. CV= S x Exemplo 1: X= R$ 800,00 ; S=R$ 88,00 CV= S . 100 x Exemplo 2: X= 2 ; S= 1,67 CV= S .100 = x Exemplo 3: X= 62,24 ; S= 12,73 CV= S .100 = x ASSIMETRIA E CURTOSE a) Assimetria Assimétrica positiva Simétrica Assimétrica positiva b) Curtose Mesocúrtica Leptocúrtica Platicúrtica Exercício Geral- Estatística Descritiva- Data de entrega: ____/____/___ Questão 1. Pede-se: 1 – Diferencie estatística descritiva e inferencial. 2 – Defina dados contínuos e discretos, nominal e ordinal e dê exemplos. 3 – Defina população e amostra. Cite exemplos. 4 – Defina conjunto e subconjunto. 5 – Defina espaço amostral e evento. 6 – Diferencie probabilidade e chance. Questão 2 – De acordo com a amostra dada A (número de defeitos de um produto uma linha de produção), com n = 50. X = (5, 8, 0, 4, 6, 10, 9, 6, 2, 2, 6, 8, 9, 9, 7, 6, 5, 4, 0, 1, 0, 1, 1, 3, 4, 3, 3, 9, 9, 8, 6, 6, 5, 4, 7, 9. 10, 8, 10, 10, 5, 1, 3, 3, 4, 5, 5, 8, 5, 5). a - Complete a tabela de uma distribuição simples: Xi fa fr fr% fa ↓ fa ↑ frac ↓ frac ↑ 1 2 3 4 5 6 7 8 9 10 Total b – Represente os dados na forma de gráficos de barra para fa. Questão 3 – Foram realizadas 40 observações em propriedades produtoras de melão no RN e obteve-se a seguinte produtividade em t ha -1 . 20,4 15,6 26,1 24,4 20,3 16,5 25,5 25,4 34,6 35,6 22,2 23,4 24,4 25,4 21,3 27,5 18,9 30,1 33,3 32,3 30,2 32,7 25,6 26,6 30,5 30,9 34,3 36,0 14,0 25,0 24,5 23,0 25,9 28,5 33,6 38,0 21,4 24,7 26,5 28,0 a – Construa uma tabela de distribuição de freqüências em classe contendo as freqüências absoluta, relativa e percentual. b – Construa o histograma e polígono das freqüências absolutas dos dados da amostra. Questão 4 – Calcule a média, mediana e moda da amostra: (26, 25, 23, 34, 31, 26, 26, 20, 35, 30, 24,30). Questão 5 - Calcule a média, mediana e moda da distribuição de freqüência em classes abaixo: Intervalo de classes fa 15,5 – 25,5 6 25,5 – 35,5 10 35,5 – 45,5 18 45,5 – 55,5 8 55,5 – 65,5 5 ∑ Questão 6 – Os dados seguintes referem-se a uma amostra de n = 10. (10, 8, 12, 9, 15, 6, 7, 5, 12, 10). Calcule a amplitude, variância, desvio padrão, desvio padrão da média e coeficiente de variação. Questão 7 - Calcule a amplitude, variância e desvio padrão da distribuição em classes de freqüências. Classes fi xi xifi xi 2 fi 20 – 25 5 25 – 30 6 30 – 35 15 35 – 40 8 40 – 45 4 45 – 50 2 Total 40 Questão 8 Escreva em notação sigma: a) x1 + x2+ x3+ ... + xn b) (x1 + x2+ x3+ ... + xn)² c) x1 + x2+ x3+ x4 + x5 + x3 + x7] d) [( O1 – Oe1)²/Oe1] + [( O2 – Oe2)²/Oe2] + [( O3 – Oe3)²/Oe3] + [( O4 – Oe4)²/Oe4] Questão 9 Sejam os conjuntos dados a seguir: X = {2, 4, 4, 3, 2} Y = {1, 2, 3, 6, 7} Obtenha: a) 4 1j Xj b) 5 1j Yj c) 4 1 ² j X d) 4 1 ² j Y e) 5 1 ²4 j jX f) 5 1j XjYj g) 5 1 )23( j YjXj h) 1 4 1 ² jj jyXjYj Questão 10. Seja a média aritmética = n x n xxx n i i n 121 ... e a variância S 2 = 1 )( 2 2 n n x x i i . Dado o conjunto de dados x = {2, 4, 5, 6, 1, 8}, calcule a sua média e variância. 2.1 Conjuntos e subconjuntos 2.2 Operações com conjuntos 2.3 Espaço amostral 2.4 Probabilidades e suas leis 2.5 Probabilidade condicional 2.1 Conjuntos e Subconjuntos 2.2 Representação de conjuntos a) Tabular A= {1, 2, 3, 4, 5, 6} b) Uma propriedade S={x/x seja as faces de uma dados} c) Diagrama de Venn 1.1. Conceitos Experimentos aleatórios Os resultados não são previsíveis, mesmo que haja um grande número de repetições do mesmo fenômeno. Ex: - Lançamento de uma moeda honesta - Lançamento de um dado - Retirada de uma carta de baralho de 52 cartas - Determinação da vida útil de um componente eletrônico Espaço amostral Define-se espaço amostral (S) ao conjunto de todos os resultados possíveisde um experimento. Ex: S = {c, k} Ex: S = {1, 2, 3, 4, 5,6} Ex: S = {t є R/ t ≥ 0} 4 6 3 2 1 5 Evento Chamamos de Evento (E) a qualquer subconjunto do espaço amostral S de um experimento aleatório. Se E = S, E é chamado evento certo Se E S e E é um conjunto unitário, E é chamado evento elementar. Se E = Ф, E é chamado evento impossível. 1.2. Operações com conjuntos 1.4.1 – União 1.4.2 – Interseção 1.4.3 – Complementar de A 1.4.4 –Eventos Mutuamente Excludentes 1.4.5 – Eventos Independentes 1.4.6 – Eventos dependentes 1.5 Probabilidade e suas leis 1.5.1 Conceitos de probabilidades Conceito clássico ou Probabilidade “a priori” Seja “E” um experimento aleatório e “S” um espaço amostral a ele associado, composto de “n” pontos amostrais todos equiprováveis. Se existe em “S”, “m” pontos favoráveis à realização de um evento “A” então a probabilidade da ocorrência do evento “A”, indicada por P(A); será: P(A)= m/n Frequência relativa ou probabilidade “a posteriori” Seja “E” um experimento e “A” um evento. Se após “n” realizações do experimento “E”,”n” suficientemente grande, forem observados “m” resultados favoráveis à “A”, então uma estimativa da probabilidade P(A) é dada pela frequência relativa. F=m/n Conceito Moderno ou Axiomático Seja “S” um espaço amostral e seja “A” qualquer evento S, isto é um evento subconjunto de S. Então por definição, a probabilidade de ocorrer A é dada pela medida de A, que satisfaça as seguintes probabilidades: a) A medida do universo é igual a 1 P(S) = 1 b) A medida é não negativa P(A)≥ 0 0 P(A) 1 c) Para um número qualquer de eventos mutuamente exclusivos A e B. P(A B) =P(A) + P(B) 1.5.2 Alguns teoremas importantes a) Se (Ф) é o conjunto vazio, então P(Ф)=0 Seja A um conjunto qualquer, onde A e Ф são mutuamente excludente, então A Ф=A, logo: P(A Ф)= P(A) então P(A)+P(Ф)= P(A) P(Ф) = P(A) – P(A) P(Ф) = 0 b) Se A’ for evento complementar de A, então P(A’) = 1 – P(A). O espaço amostral “S” pode ser decomposto nos eventos mutuamente exclusivos A e A’, ou seja, S= A A’, assim: P(S) = P(A) + P(A’), mas P(S)=1 P(A) + P(A’) = 1 P(A’) = 1- P(A) c) Se A e B forem dois eventos quaisquer, então P(A B) = P(A) + P(B) – P(A∩B) Note que A B pode ser decomposto nos eventos mutuamente exclusivos A\B e B, ou seja, A B = P(A\B) B, como mostra o diagrama, temos P( A B) = P(A\B) + P(B) P( A B) = P(A) – P(A∩B) + P(B) P( A B) = P(A) + P(B) – P(A∩B) P( A B) = P(A) + P(B) = Mutuamente exclusivos d) Se A B, então P(A) P(B). Se A B, então B pode ser decomposto nos eventos mutuamente exclusivos A e B\A, como mostra o diagrama. Assim P(B) = P(A)+P(B\A) P(B\A) 0 e) Para quaisquer eventos A, B e C, P(A B C) = P(A) + P(B) + P(C) - P(A∩B) - P(A∩C) - P(B∩C) + P(A∩B∩C). U A B U A B U A B U A B C 1.5.3 Probabilidade condicional e Teorema do Produto A probabilidade de ocorrência de um evento B quando se sabe que algum evento A tenha ocorrido é conhecida como uma probabilidade condicional, e é representada por P(B\A). P(B\A)= P(B∩A) , se P(A)>0 P(A) Exemplo 1: Considere que dois dados foram equilibrados são lançados, registrando-se o resultado como (x1, x2). Por isso, o espaço amostral S pode ser representado pela seguinte lista de 36 resultados equiprováveis. n=36 (1,1) (1,2) (1,3) (1,4) (1,5) (1,6) (2,1) (2,2) (2,3) (2,4) (2,5) (2,6) (3,1) (3,2) (3,3) (3,4) (3,5) (3,6) S= (4,1) (4,2) (4,3) (4,4) (4,5) (4,6) (5,1) (5,2) (5,3) (5,4) (5,5) (5,6) (6,1) (6,2) (6,3) (6,4) (6,5) (6,6) Considere os dois eventos seguintes: A={(x1,x2)/ x1 +x2 =10} , B={(x1,x2)/ x1>x2} A={ } B={ a) Qual a probabilidade da soma ser 10? Isto é, qual o valor de P(A)? P(A) = b) Qual a probabilidade de sair um número maior no 1º dado? Qual a probabilidade de P(B)? P(B)= c) Qual a probabilidade de sair um valor maior no 1º dado, tendo ocorrido a soma 10, no primeiro caso? Isto é, quanto vale P(B-A)? P(B\A)= P(A\B)= d) Vamos calcular P(A∩B). P(A∩B)= P(B\A)= P(B∩A) P(A\B)= P(B∩A) P(A) P(B) P(B\A)= P(A\B)= Exemplo 2 Suponha-se que a UFERSA possua 100 máquinas de calcular. Algumas dessas máquinas são Elétricas (E), enquanto outras são manuais (M), e algumas são novas (N), enquanto outras são muito usadas (U). A tabela a seguir dá o número de máquinas de cada categoria. E M Total N 40 30 70 U 20 10 30 60 40 100 Uma pessoa entra no escritório, pega uma máquina ao acaso, e descobre que é nova. Qual será a probabilidade de que seja elétrica? Logo P(E-N)? Obs: P(A∩B) = P(B\A) . P(A), ou P(A∩B) = P(A\B) . P(B) Teorema do produto 1.5.4 Eventos independentes Um evento B é dito independente de um evento A, se a probabilidade de B ocorrer não é influenciada pelo fato de A ter ocorrido ou não. P(B)=P(B\A) substituindo P(B\A) por P(B) no teorema do produto temos P(B∩A) = P(A). P(B\A) - (Eventos dependentes) P(B∩A) = P(A). P(B) - (Eventos independentes) Se dois dados são lançados, qual a probabilidade de que cada um mostre no mínimo 5 pontos. A1= 5 ou 6 no lançamento do 1º dado A2= 5 ou 6 no lançamento do 2º dado Espaço amostral para cada dado: S1={1, 2, 3, 4, 5, 6}; S2={1, 2, 3, 4, 5, 6} Solução direta pela contagem dos pontos do espaço amostral: Seja o evento: A={(5,5), (5,6), (6,5), (6,6)} (1,1) (1,2) (1,3) (1,4) (1,5) (1,6) (2,1) (2,2) (2,3) (2,4) (2,5) (2,6) (3,1) (3,2) (3,3) (3,4) (3,5) (3,6) S= (4,1) (4,2) (4,3) (4,4) (4,5) (4,6) (5,1) (5,2) (5,3) (5,4) (5,5) (5,6) (6,1) (6,2) (6,3) (6,4) (6,5) (6,6) n=36 Exercício Geral- Estatística Descritiva- Data de entrega: ____/____/___ Regras de Probabilidade 1. Complementar de A P(A’) = 1 – P(A). 2. P(A ou B) Eventos dependentes P(A B) = P(A) + P(B) – P(A∩B) Eventos mutuamente excludentes ] P(A B) = P(A) + P(B) 3. P(A e B) P(A∩B) = P(B\A) . P(A) P(A∩B) = P(A\B) . P(B) (Eventos dependentes) P(A∩B) = P(A). P(B) - (Eventos independentes) 1. Lançando-se um dado, qual a probabilidadede ocorrer o ponto 4 ou um ponto ímpar? S = {1, 2, 3, 4, 5, 6} 2. Retirando-se, aleatoriamente, uma carta de um baralho, qual a probabilidade de ocorrer “figura” e “espada”? 3. Um experimento aleatório consiste em retirar ao acaso 3 cartas de um baralho com 52 cartas. Qual é a probabilidade de saírem duas figuras e um ás? 4. Num baralho de 52 cartas, colocados numa urna, uma carta é escolhida aleatoriamente, qual é a probabilidade de se obter 1 carta de ouro, ou 1 carta de paus. 5. Num baralho de 52 cartas, colocados numa urna, uma carta é escolhida casualmente, qual é a probabilidade de se obter 1 áz ou uma carta de espada na retirada dessa carta? 6. Um baralho de 52 cartas tira-se uma carta ao acaso. Qual a probabilidade de ser ouros ou figura a carta tirada? 7. No lançamento de dois dados, qual a probabilidade de sete pontos? (1,1) (1,2) (1,3) (1,4) (1,5) (1,6) (2,1) (2,2) (2,3) (2,4) (2,5) (2,6) (3,1) (3,2) (3,3) (3,4) (3,5) (3,6) S= (4,1) (4,2) (4,3) (4,4) (4,5) (4,6) (5,1) (5,2) (5,3) (5,4) (5,5) (5,6) (6,1) (6,2) (6,3) (6,4) (6,5) (6,6) 8. No mesmo baralho, do exemplo anterior. Qual é a probabilidade de se tirar 2 figuras ou 2 azes? 9. Uma caixa contém 4 bolas pretas e 2 bolas brancas. Retirando-se, ao acaso, duas bolas sem reposição, qual a probabilidade de ambas serem pretas? 10. No lançamento de 3 moedas, qual a probabilidade de ocorrer duas “caras” e uma “coroa”? 11. Das 10 alunas de uma classe, 3 tem olhos azuis. Se duas delas são escolhidas ao acaso, qual é a probabilidade de ambas terem olhos azuis? Calcule também a probabilidade de nenhuma ter olhos azuis. 12. Um casal tem dois filhos. Qual é a probabilidade de: (a) O primogênito ser homem? (b) Os dois filhos serem homens? (c) Pelo menos um dos filhos ser homem? 13. Considere o lançamento de dois dados (Hexaedro). Considere os eventos: A: Soma dos números obtidos iguais a 9 e B: número do primeiro dado maior ou igual a 4. Enumere os elementos de A e B. Obtenha A B, A∩B e Ac. Obtenha as probabilidades dos eventos. (1,1) (1,2) (1,3) (1,4) (1,5) (1,6) (2,1) (2,2) (2,3) (2,4) (2,5) (2,6) (3,1) (3,2) (3,3) (3,4) (3,5) (3,6) S= (4,1) (4,2) (4,3) (4,4) (4,5) (4,6) (5,1) (5,2) (5,3) (5,4) (5,5) (5,6) (6,1) (6,2) (6,3) (6,4) (6,5) (6,6) 14. Numa escola fez-se uma enquête com duas perguntas: Gosta de matemática? Gosta de Estatística? Os resultados obtidos foram: 86 respostas sim à primeira pergunta; 75 respostas sim à segunda; 23 respostas sim às duas perguntas e 42 respostas não às duas perguntas. Pede-se: a) Quantos alunos foram entrevistados? b) Sorteando, ao acaso, um dos alunos entrevistados, qual a probabilidade de que ele tenha respondido sim à primeira pergunta? c) Sorteando, ao acaso, um dos alunos entrevistados, qual a probabilidade de que ele tenha respondido sim à primeira pergunta e não à segunda pergunta? 23 A 63 63 B 52 42
Compartilhar