Baixe o app para aproveitar ainda mais
Prévia do material em texto
FACULDADE PITÁGORAS DE SÃO LUÍS Curso de ciências DA COMPUTAÇÃO ESTATÍSTICA e probabilidade Prof. Otonilson ribeiro Material parte 1 SÃO LUÍS – MA 2013 2 1. Introdução O termo Estatística provém da palavra latina status, que significa “Estado” e foi utilizado originalmente para denominar levantamentos de dados, cuja finalidade era orientar o Estado em suas decisões. Como todas as ciências, a estatística tem suas raízes na história do homem. Embora nem existisse a palavra escrita como a conhecemos hoje, há indícios que desde a antiguidade, os povos já registravam o número de nascimentos, levantam informações sobre homens aptos a guerrear, cobravam impostos e realizavam inquéritos quantitativos por processos que, hoje, chamaríamos de Estatística. A estatística trata dos métodos científicos para coleta, organização, resumo, apresentação e análise de dados, visando também a tomada de decisões. 2. População e amostra Ao coletar dados sobre as características de um conjunto de elementos, como, por exemplo, as peças de automóveis produzidas por uma indústria, os carros que passam por um determinado farol ou as preferências da população sobre candidatos a uma determinada eleição, nem sempre é possível considerar todos os elementos, ou seja, toda a população ou universo. Considera-se, então, apenas uma pequena parte do todo, chamada amostra. No caso da eleição, a população é formada por todos os cidadãos com direito a voto e amostra é formada por pelos eleitores que serão entrevistados. 3. Estatística descritiva A parte da estatística que apenas descreve e analisa um conjunto de dados é chama Estatística descritiva. Nela não são tiradas conclusões. 4. Estatística indutiva Também é chamada de Inferência estatística. A partir da análise de dados são tiradas conclusões. A Estatística indutiva trata das inferências e conclusões. 5. Variáveis contínuas e discretas Uma variável que pode assumir qualquer valor entre dois valores dados é uma variável contínua. Se isto não for possível, a variável é chamada variável discreta. Exemplos 1) Os resultados do lançamento de um dado podem assumir os valores 1, 2, 4, etc., mas não os valores 2,3 ou 4,2. Logo a variável é discreta. 2) Os pesos ou alturas de um conjunto de pessoas podem assumir, teoricamente, qualquer valor. Logo, a variável é contínua. Observação: De modo geral as contagens resultam em variáveis discretas e as medições em variáveis contínuas. Exemplos de variáveis 1) População: Bolsa de valores de São Paulo - Variável: número de ações negociadas. R: Variável discreta 2) População: Pregos produzidos por uma máquina - Variável: comprimento. R: Variável contínua 3) População: Pessoas residentes em uma cidade - variável: idade. R: Variável contínua 3 Para atingir os objetivos da Estatística descritiva, os dados observados são muitas vezes sistematizados e apresentados em formas de tabelas ou gráficos, os quais irão fornecer rápidas e seguras informações a respeito das variáveis em estudo. Uma das tabelas mais utilizadas na estatística é distribuição de frequências. Os gráficos associados a ela são o gráfico de frequências (denominados histogramas, para o caso de variáveis quantitativas contínuas), o polígono de frequências, o gráfico de frequência acumulada e o polígono de frequência acumulada. 6. Coleta de Dados Após a definição do problema a ser estudado e o estabelecimento do planejamento da pesquisa (forma pela qual os dados serão coletados; cronograma das atividades; custos envolvidos; exame das informações disponíveis; delineamento da amostra, etc.), o passo seguinte é a coleta dos dados, que consiste na busca ou compilação dos dados das variáveis, componentes do fenômeno a ser estudado. A coleta pode ser direta e indireta. A coleta dos dados é direta quando os dados são obtidos diretamente da fonte originária, como no caso da empresa que realiza uma pesquisa para saber a preferência dos consumidores pela sua marca. A coleta dos dados é indireta quando é inferida a partir dos elementos conseguidos pela coleta direta, como por exemplo a pesquisa sobre mortalidade infantil, que é feita através de dados colhidos por uma coleta direta. A coleta de dados direta pode ser classificada em contínua, periódica, ocasional. Contínua – quando feita continuamente, como as frequências dos alunos às aulas. Periódica – quando feita em intervalos constante de tempo, como os sensos em 10 e 10 anos. Ocasional – quando feita esporadicamente, como no caso de epidemias. 7. Gráficos Os gráficos permitem a representação da relação entre variáveis e podem facilitar a compreensão dos dados, se apresentados de forma clara e objetiva. Em Estatística são usados os gráficos de linha, de barras, de setores, de colunas, pictóricos, cartograma. Gráficos de Linhas Os dados são colocados num sistema cartesiano ortogonal. Em geral representam dados de uma tabela. 4 Gráficos de Barras Nesse tipo de gráfico usamos retângulos com bases de mesma medida e separados por distâncias. As frequências dos fatos observados são dadas pelas as alturas (comprimentos) dos retângulos. Anotadas no eixo x, se as barras forem horizontais e anotadas no eixo y se forem verticais. Gráficos de Setores Os dados são apresentados em setores circulares que são proporcionais aos valores. Fazemos corresponder a uma volta do círculo (360°) o total (100%) dos dados e estabelecemos através de uma regra de três, o ângulo relativo ao setor circular de acordo com cada valor. Pictograma Os dados nos gráficos de barras podem ser representados por diferentes formas de figuras, tais como pessoas, objetos, etc. Esses gráficos recebem o nome de pictóricos. 5 Cartograma O cartograma é a representação sobre uma carta geográfica. Este gráfico é empregado quando o objetivo é o de figurar os dados estatísticos diretamente relacionados com áreas geográficas ou políticas. Exercícios propostos 1) Para você o que é estatística 2) Como uma amostra é relacionada a uma população? 3) Para você o que é coletar dados? 4) Como podem ser apresentados ou expostos os dados? 5) Classifique em verdadeiro ou falso a) Um dado estatístico é uma medida que descreve as características de uma população. b) Uma amostra é um subgrupo de uma população. c) É impossível para o Bureau que realiza os censos nos EUA obter todos os dados de censo sobre a população dos Estados Unidos. d) A estatística inferencial envolve o uso de uma população para chegar a conclusões sobre a amostra correspondente. e) A palavra estatística deriva do grego status, que significa “estado”. 6 8. Distribuição de frequências 8.1 Dados brutos (rol) Vamos considerar as notas de 40 alunos do curso Ciências da Computação 3° período da Faculdade Pitágoras. 1 8 4 9 6,5 6 9 10 2 3 8,5 4 9 6 5 5,5 6,5 9 8 7 4,5 6 6,5 7,5 5 6 5,5 8 9 8 6 7 8 9 10 3 2,5 1,5 4 7 Colocando estes dados em ordem crescente, vamos obter uma nova tabela denominada rol: 1 1,5 2 2,5 3 3 4 4 4 4,5 5 5 5,5 5,5 6 6 6 6 6 6,5 6,5 6,5 7 7 7 7,5 8 8 8 8 8 8,5 9 9 9 9 9 9 10 10 Vamos estabelecer a amplitude do rol, que é a diferença entre o maior e menor valor. No caso, temos 10 – 1 = 9 como amplitude do rol. O número de vezes que um determinado valor se repete é denominado como frequência deste valor. Podemos então formular uma nova tabela onde a cada valor associado a sua frequência. Notas Frequências 1 1 1,5 1 2 1 2,5 1 3 2 4 3 4,5 1 5 2 5,5 2 6 56,5 3 7 3 7,5 1 8 5 8,5 1 9 6 10 2 A tabela continua muito extensa. Vamos agrupar de 0 a 2 (0 ⊢2, fechado em 0 e aberto em 2, que não é do intervalo), de 2 a 4 (2⊢4), de 4 a 6 (4⊢6), de 6 a 8 (6⊢8) e de 8 a 10 (8⊢⊣10). Assim, temos: 7 Notas Frequências 0 ⊢2 2 2⊢4 4 4⊢6 8 6⊢8 12 8⊢⊣10 14 A esta tabela chamamos de distribuição de frequências com intervalos de classe. Observe que esta última distribuição pode ser feita sem passar pela distribuição intermediária. Na distribuição feita temos cincos intervalos de classe (0 ⊢2, 2 ⊢4, ..., 8 ⊢⊣10). Cada intervalo de classe tem amplitude 2 (2 – 0 = 4 – 2 = ... = 10 - 8 ). Aos extremos de cada classe chamamos de limites, que podem ser inferior ou superior. Assim, 0, 2, 4, 6 e 8 são os limites inferiores e 2, 4, 6, 8 e 10 são limites superiores. Temos também a frequência relativa ou percentual (Fr), onde a frequência de cada classe associa-se o percentual que esta representa em relação à frequência total. Já a frequência acumulada (Fa) de cada classe é dada pela soma das frequências de todas as classes desde a 1ª até a classe considerada. Notas Frequências Fr Fa 0 2 2 5% 2 2 4 4 10% 6 4 6 8 20% 14 6 8 12 30% 26 8 10 14 35% 40 ∑ f𝑖 = 40 Exemplo 1 Sejam as alturas em (em centímetros) de 25 alunos de uma determinada classe: 150 159 157 151 152 156 153 163 159 175 162 162 164 158 159 164 168 166 160 162 170 169 174 165 167 a) Dispor os dados em ordem crescente. b) Calcular a amplitude do rol. c) Calcular a amplitude de cada intervalo de classe. d) Achar a distribuição de frequências com intervalos de classe, a frequência relativa ou percentual (Fr) e a frequência acumulada (Fa). 8 solução a) 150 151 152 153 156 157 158 159 159 159 160 162 162 162 163 164 164 165 166 167 168 169 170 174 175 b) Amplitude do Rol = 175 – 150 = 25 (diferença entre o maior e menor valor) c) Procuramos estabelecer um número razoável de classes, considerando que a amplitude total é 25. Assim, podemos formar 5 classes, tendo cada intervalo de classe a amplitude 5 (25:5). Embora o número i de intervalos seja dado por 𝒊 = 𝟏 + 𝟑, 𝟑 ∙ 𝐥𝐨𝐠n, o aluno pode usar o bom senso para cada caso. Temos então os intervalos de classe 𝟏𝟓𝟎 ⊢ 𝟏𝟓𝟓, 𝟏𝟓𝟓 ⊢ 𝟏𝟔𝟎, 𝟏𝟔𝟎 ⊢ 𝟏𝟔𝟓, 𝟏𝟔𝟓 ⊢ 𝟏𝟕𝟎, e 𝟏𝟕𝟎 ⊢⊣ 𝟏𝟕𝟓. d) Altura (cm) Frequência 𝟏𝟓𝟎 ⊢ 𝟏𝟓𝟓 4 𝟏𝟓𝟓 ⊢ 𝟏𝟔𝟎 6 𝟏𝟔𝟎 ⊢ 𝟏𝟔𝟓 7 𝟏𝟔𝟓 ⊢ 𝟏𝟕𝟎 5 𝟏𝟕𝟎 ⊢⊣ 𝟏𝟕𝟓 3 Frequência relativa (%) • De 𝟏𝟓𝟎 ⊢ 𝟏𝟓𝟓, vem: • De 𝟏𝟓𝟓 ⊢ 𝟏𝟔𝟎, vem: {𝟐𝟓 ⊢ 𝟏𝟎𝟎% 𝟒 ⟶ 𝐱 ⟶ x = 16% { 𝟐𝟓 ⟶ 𝟏𝟎𝟎% 𝟔 ⟶ 𝐱 ⟶ x = 24% • De 𝟏𝟔𝟎 ⊢ 𝟏𝟔𝟓, vem: • De 𝟏𝟔𝟓 ⊢ 𝟏𝟕𝟎, vem: {𝟐𝟓 ⟶ 𝟏𝟎𝟎% 𝟕 ⟶ 𝐱 ⟶ x = 28% { 𝟐𝟓 ⟶ 𝟏𝟎𝟎% 𝟓 ⟶ 𝐱 ⟶ x = 20% • De 𝟏𝟕𝟎 ⊢⊣ 𝟏𝟕𝟓, vem: { 𝟐𝟓 ⟶ 𝟏𝟎𝟎% 𝟑 ⟶ 𝐱 ⟶ x = 12% Frequência acumulada 𝟏𝟓𝟎 ⊢ 𝟏𝟓𝟓, temos 4. 𝟏𝟓𝟓 ⊢ 𝟏𝟔𝟎, temos 4 + 6 = 10. 𝟏𝟔𝟎 ⊢ 𝟏𝟔𝟓, temos 4 + 6 + 7 = 17. 𝟏𝟔𝟓 ⊢ 𝟏𝟕𝟎, temos 4 + 6 + 7 + 5 = 22. 𝟏𝟕𝟎 ⊢ 𝟏𝟕𝟓, temos 4 +6 + 7 + 5 + 3 = 25. Logo: Alturas (cm) Frequências Fr (%) Fa 𝟏𝟓𝟎 ⊢ 𝟏𝟓𝟓 4 16 4 𝟏𝟓𝟓 ⊢ 𝟏𝟔𝟎 6 24 10 𝟏𝟔𝟎 ⊢ 𝟏𝟔𝟓 7 28 17 𝟏𝟔𝟓 ⊢ 𝟏𝟕𝟎 5 20 22 𝟏𝟕𝟎 ⊢⊣ 𝟏𝟕𝟓 3 12 25 9 O cálculo de classes e suas amplitudes pode ser obtido pelas seguintes fórmulas: 𝒌 = √𝒏 e 𝒉 = 𝑨𝒓 𝒌 Onde: K é o número de classes n é o número de elementos(dados) h é a amplitude das classes Ar é a amplitude do rol Exemplo 2 sejam as alturas (em centímetros) de 25 alunos de uma classe: a) Dispor os dados em rol; b) Calcular a amplitude do rol; c) Calcular o nº de classes e a amplitude para cada intervalo de classe; d) Achar a distribuição de frequências com intervalos de classe, a frequência relativa e a frequência acumulada. Solução: Colocando os dados em ordem crescente: AR = 175 – 150 = 25 (diferença entre o maior e menor valor) k = √25 = 5 ℎ = 𝐴𝑟 𝑘 = 25 5 = 5 Altura freq fr fa 150 ⊢ 155 4 16% 4 155 ⊢ 160 6 24% 10 160 ⊢ 165 7 28% 17 165 ⊢ 170 5 20% 22 170 ⊢ 175 3 12% 25 ∑ 𝑓𝑖= 25 150 159 157 151 152 156 153 163 159 175 162 162 164 158 159 164 168 166 160 162 170 169 174 165 167 150 151 152 153 156 157 158 159 159 159 160 162 162 162 163 164 164 165 166 167 168 169 170 174 175 10 Exercícios propostos 1) Os números abaixo, nos fornece, por faixa etária, a frequência com que ocorre determinada doença, para um grupo de 50 pessoas estudadas. Agrupe os dados acima em uma distribuição de frequência. 2) Um teste para aferir o quociente de inteligência da turma do 3° período do curso de Engenharia Ambiental da Faculdade Pitágoras São Luís deu origem a sequência de valores. 111 90 121 105 122 61 128 112 128 93 108 138 88 110 112 112 97 128 102 125 87 119 104 116 96 114 107 113 80 113 123 95 115 70 115 101 114 127 92 103 78 118 100 115 116 98 119 72 125 109 79 139 75 109 123 124 108 125 116 83 94 106 117 82 122 99 124 84 91 130 Escreva a distribuição de frequência para os dados acima. 72 60 64 41 57 42 45 59 43 55 43 45 47 62 69 48 59 50 51 52 40 52 59 53 57 55 44 56 53 57 57 41 58 59 43 50 59 52 63 40 62 47 60 41 64 65 68 48 69 52 11 8.2 Representações Gráficas de uma Distribuição de Frequência A representação gráfica de uma distribuição de frequências é feita pelo o histograma e pelo polígono de frequências. Utilizaremos nos gráficos mencionados o plano cartesiano xOy, onde no eixo das abscissas colocaremos os valores das variáveis e o eixo das ordenadas as frequências. 8.2.1 Histograma O histograma é formado por um conjunto de retângulos justapostos, cujas bases se localizam no eixo das abscissas, de tal modo que seus pontos médios coincidem com os pontos médios dos intervalos de classe. Obs. As larguras dos retângulos são iguais às amplitudes dos intervalos de classe e as alturas proporcionais às frequências das classes. Exemplo: 8.2.2 Polígono de Frequências É um gráfico de linhas, sendo as frequências marcadas sobre perpendiculares ao eixo horizontal, levantadas pelos os pontos médios dos intervalos de classe. Exemplo: 12 9. Medidas de Tendência Central ou Medidas de Posição Essas medidas têm como objetivo ressaltar as tendências características de cada distribuição, isoladamente, ou em confronto com as outras. Dentre as medidas de uma distribuição, usaremos a média aritmética, a mediana e a moda, pois ocupam posições especiais. São medidas de tendência central, devido ao fato de ocuparem posições centrais numa distribuição. 9.1 Média Aritmética (X̅) É o quociente da divisão da soma dos valores pelo número de elementos. Se x1, x2, x3, ..., xn são os elementos, então: �̅� = x1 + x2 + ⋯ + xn n = ∑ x𝑖 n 𝑖=1 n Exemplo Para os elementos 2, 4, 5, 8 e 9, temos: �̅�= Média aritmética para uma distribuição de frequências Sem intervalos de classe Se os elementos x1, x2,..., xn apresentam, respectivamente, frequências f1, f2, ..., fn, então: �̅� = ∑ fixi n i=1 ∑ fi Onde: ∑ fixi n i=1 = 𝑥1𝑓1 + 𝑥2𝑓2 + ⋯ + 𝑥𝑛𝑓𝑛 Trata-se da média aritmética pondera. Exemplo Notas (xi)Frequências (fi) xi fi 2,0 2 4,5 3 6,0 10 8,0 9 9,0 7 �̅� = Com intervalos de classe Nesse caso, consideramos todos os valores de um determinado intervalo como coincidentes com o ponto médio (mi) do intervalo. Temos então: �̅� = ∑ fimi n i=1 ∑ 𝑓𝑖 13 Exemplo Notas Frequências (fi) Ponto médio (mi) fi ∙mi 0 ⊢ 2 5 2 ⊢ 4 7 4 ⊢ 6 12 6 ⊢ 8 15 8 ⊢⊣ 10 9 ∑ fi = ∑ Fimi = �̅� = ∑ fimi n i=1 ∑ 𝑓𝑖 9.2 Mediana (Md) Mediana para dados não agrupados Dispondo os elementos em ordem crescente, a mediana é o valor intermediário ou a média dos valores intermediários. a) O número de valores observados é ímpar. Exemplo: Considere o conjunto de dados A = {5, 4, 10, 8, 7, 3, 6}. Md = b) O número de valores observados é par. Exemplo: Considere o conjunto de dados A = {12, 6, 7, 9, 8, 11, 5, 2}. Md = Mediana para uma distribuição de frequências Sem intervalos de classe Basta considerar a frequência acumulada e elementos intermediários Exemplo Salários fi fa 90 10 110 14 130 10 150 7 170 9 Com intervalos de classe Devemos inicialmente localizar a classe mediana, ou seja, a que contém o elemento ∑ fi 2 , Em seguida, calculamos seu valor usando a fórmula: Md = ℓd + ( ∑ fi 2 − Fant) fd ∙ hd 14 Onde: ℓd: limite inferior da classe mediana Fant: soma das frequências das classes anteriores à classe mediana. hd: amplitude da classe mediana fd: frequência da classe mediana. Exemplo Calcule a mediana para a seguinte distribuição: Salários fi fa 0 ⊢ 4 7 4 ⊢ 8 8 8 ⊢ 12 13 12 ⊢ 16 14 16 ⊢⊣ 20 6 ∑ fi = Md = 9.3 Moda (Mo) A moda de um conjunto de elementos é o elemento que ocorre com maior frequência. Um conjunto de elementos pode ter uma moda, mais de uma ou não ter moda. Exemplos 1) A moda do conjunto de números 2, 3, 4, 4, 4, 5, 6, 6, 7. Mo = 4, que ocorre com frequência 3. 2) No conjunto 2, 3, 3, 4, 5, 5, 6, 7, 7 e 8, temos os números 3, 5 e 7 com frequência 2. Temos, portanto, três modas que são 3, 5 e 7. 3) No conjunto 2, 3, 4, 5, 6, 7 e 8, não temos moda. Moda para uma distribuição de frequências Sem intervalos de classe Basta considerar a medida com maior frequência. Exemplo x fi 2 10 5 14 8 10 9 7 10 9 Mo = 15 Com intervalos de classe Devemos considerar a classe modal, que é a classe que apresenta maior frequência. Consideramos como moda de uma distribuição de frequências o valor compreendido entre os limites da classe modal. Tal valor, pelo processo de Czuber, é dado por: Mo = ℓo + Δ1 ∙ ho (Δ1 + Δ2) Onde: ℓo: limite inferior da classe modal ho: amplitude da classe modal Δ1: frequência da classe modal menos frequência da classe anterior à modal Δ2: frequência da classe modal menos frequência da classe posterior à modal. Exemplo Calcular a moda para a distribuição de frequências que apresentam tempos gastos por jogadores de um clube para percorrer uma certa distância: Tempo (s) fi 10 ⊢ 15 3 15 ⊢ 20 4 20 ⊢ 25 7 25 ⊢ 30 12 30 ⊢⊣ 35 6 𝑴𝒐 = 10. Medidas de Dispersão As medidas de tendência central (média, mediana e moda) descrevem apenas uma das características dos valores numéricos de um conjunto de observações, o da tendência central. Porém, nenhuma delas informa sobre o grau de variação ou dispersão dos valores observados. Em qualquer grupo de dados os valores numéricos não são semelhantes e apresentam desvios variáveis em relação a tendência geral de média. As medidas de dispersão (amplitude total, desvio médio, variância e desvio padrão) servem para avaliar o quanto os dados são semelhantes, descreve então o quanto os dados distam do valor central. Desse jeito, as medidas de dispersão servem também para avaliar qual o grau de representação da média. É fácil demonstrar que apenas a média é insuficiente para descrever um grupo de dados. Dois grupos podem ter a mesma média, mas serem muito diferentes na amplitude de variação de seus dados. Por exemplo: -Grupo A (dados observados): 5; 5; 5. -Grupo B (dados observado): 4; 5; 6. -Grupo C (dados observados): 0; 5; 10. A média dos três grupos é a mesma (5), mas no grupo “A” não há variação entre os dados, enquanto no grupo “B” a variação é menor que no grupo “C”. Dessa forma, uma maneira mais completa de apresentar os dados (além de aplicar uma medida de tendência central como a média) é aplicar uma medida de dispersão. 16 10. 1 Amplitude total Trata-se da diferença entre o maior e o menor valor ocorridos numa distribuição de frequências. Exemplos 1) Para os números 3, 4, 6, 8, 9, 10, 11 e 15 a amplitude total é 15 – 3 = 12. 2) Se considerarmos uma distribuição de frequências com intervalos 160 ⊢ 165, 165 ⊢ 170,..., 195 ⊢⊣ 200, a amplitude total é igual a 200 – 160 = 40, ou seja, a diferença entre o maior limite superior e o menor limite inferior. 10. 2 Desvio Médio Para um conjunto de números x1, x2, ..., xn, de média aritmética �̅�, definimos o desvio médio (dm) por: dm = ∑|xi − �̅�| n Exemplo 1) Calcular o desvio médio para os números 1, 2, 4, 9, 11 e 15. Solução �̅� = ∑|xi − �̅�| = dm = Desvio Médio para uma distribuição de frequências Sem intervalos de classe Se os elementos x1, x2,..., xn apresentam, respectivamente, frequências f1, f2, ..., fn. Então, definimos desvio médio para uma distribuição de frequência sem intervalo de classe por: dm = ∑|xi − �̅�|𝑓𝑖 ∑ 𝑓𝑖 Lembrando que: �̅� = ∑ fi𝑥i n i=1 ∑ 𝑓𝑖 Exemplo: Calcule o desvio médio para a distribuição abaixo: x fi x fi |xi − �̅�|𝒇𝒊 2 10 5 14 8 10 9 7 10 9 ∑ = ∑ = ∑ = �̅� = dm = 17 Com intervalos de classe Se os elementos x1, x2,..., xn apresentam, respectivamente, frequências f1, f2, ..., fn. Então, definimos desvio médio para uma distribuição de frequência com intervalo de classe por: dm = ∑|mi − �̅�|𝑓𝑖 ∑ 𝑓𝑖 Lembrando que: �̅� = ∑ fimi n i=1 ∑ 𝑓𝑖 Exemplo: Calcule o desvio médio para a duração de uma determinada lâmpada: Horas fi 10 ⊢ 15 3 15 ⊢ 20 4 20 ⊢ 25 7 25 ⊢ 30 12 30 ⊢⊣ 35 6 Solução Para calcularmos a média aritmética, precisamos encontrar os valores médios (mi) e os produtos (fimi). Assim: Nº de horas (fi) (mi) mifi fi|mi − �̅�| 10 ⊢ 15 3 15 ⊢ 20 4 20 ⊢ 25 7 25 ⊢ 30 12 30 ⊢⊣ 35 6 ∑ fi = ∑ fimi = ∑ fi|mi − �̅�| = Então: �̅� = ∑ fimi ∑ fi ⟹ �̅� = Portanto dm = ∑|mi−�̅�|𝑓𝑖 ∑ 𝑓𝑖 ⟹ dm = 10. 3 Desvio Padrão (dp ou 𝝆(𝒙)) No estudo do desvio médio observa-se que a dificuldade em se operar com o mesmo, se deve à presença do módulo, para que as diferenças xi − �̅� possam ser 18 interpretadas como distâncias. Então, uma maneira de se resolver essa problemática é considerar o quadrado dessas diferenças(xi − �̅�) 2, com isso obtemos uma nova medida de dispersão, chamada variância. Portanto, variância é uma média aritmética calculada a partir dos quadrados dos desvios obtidos entre os elementos da série e a sua média. O desvio padrão é a raiz quadrada positiva da variância. Obs: A variância será denotada por 𝑉𝑎𝑟(𝑥) e o desvio padrão por 𝜌(𝑥). O cálculo da variância é dado pela fórmula: 𝑉𝑎𝑟(𝑥) = ∑(𝑥𝑖 − �̅�) 2 𝑛 e o desvio padrão, por: 𝜌(𝑥) = √𝑉𝑎𝑟(𝑥) Exemplo: Calcule a variância e o desvio padrão para a sequência: X: 3, 4, 9. �̅� = 𝑉𝑎𝑟(𝑥)= 𝜌(𝑥) = Desvio Padrão para uma distribuição de frequências Sem intervalos de classe Definimos a variância para uma distribuição de frequência sem intervalos de classe, como sendo uma média aritmética ponderada dos quadrados dos desvios dos elementos da série para a média da série. O cálculo da variância é dado pela fórmula: 𝑉𝑎𝑟(𝑥) = ∑(𝑥𝑖 − �̅�) 2𝑓𝑖 ∑ 𝑓𝑖 e o desvio padrão, por: 𝜌(𝑥) = √𝑉𝑎𝑟(𝑥) Exemplo Calcule o desvio para a distribuição abaixo Notas (xi) (fi) xi fi (𝒙𝒊 − �̅�) 𝟐 (𝒙𝒊 − �̅�) 𝟐𝒇𝒊 4 5 6 3 7 3 8 4 10 6 ∑ fi = ∑ fimi = 𝑉𝑎𝑟(𝑥) = 19 𝜌(𝑥) = Com intervalos de classe A definição é a mesma da anterior, a diferença está no cálculo de obtenção, pois devemos substituir os valores de xi por mi. O cálculo da variância é dado pela fórmula: 𝜌2(𝑥) = ∑(𝑚𝑖 − �̅�) 2𝑓𝑖 ∑ 𝑓𝑖 e o desvio padrão, por: 𝜌(𝑥) = √𝑉𝑎𝑟(𝑥) Exemplo Calcule o desvio padrão da distribuição dada: Custo fi 10 ⊢ 20 3 20 ⊢ 30 5 30 ⊢ 40 8 40 ⊢⊣ 50 4 Vamos precisar das colunas mi, fimi e fi(mi) 𝟐. Assim: Custo fi mi fimi (𝒎𝒊 − �̅�) 𝟐𝒇𝒊 10 ⊢ 20 20 ⊢ 30 30 ⊢ 40 40 ⊢⊣ 50 ∑ fi = ∑ 𝒇imi = ∑ = Logo: dp = 20 11. Exercício propostos 1) Considerando os conjuntos de dados: A= {3, 5, 2, 6, 5, 9, 5, 2, 8, 6}, B = {20, 9, 7, 2, 12, 7, 20, 15, 7}, C = {51,6; 48,7; 50,3; 49,15; 48,9}, D = { 15, 18, 20, 13, 10, 16, 14}. Calcule: a) a média b) a mediana c) a moda 2) A distribuição dada apresenta os pares de calçados vendidos numa loja em um determinado dia, de acordo com o número usado de uma certa marca. Calcule a média aritmética, e a mediana. Número usado Frequência 34 6 35 8 36 7 37 11 38 10 39 8 40 9 41 7 3) Calcule a média, moda e a mediana para as notas da distribuição dada: Notas fi 0 ⊢ 4 3 4 ⊢ 8 6 8 ⊢ 12 14 12 ⊢ 16 11 16 ⊢⊣ 20 7 4) Calcule a média, mediana e moda para a distribuição que apresenta os salários de uma empresa: Salários Frequência 100 ⊢ 150 15 150 ⊢ 200 3 200 ⊢ 250 9 250 ⊢ 300 3 300 ⊢ 350 2 350 ⊢⊣ 400 1 5) Calcule o desvio médio e o desvio padrão para as seguintes distribuições: Intervalos Frequência 2 ⊢ 7 5 7 ⊢ 12 7 12 ⊢ 17 9 17 ⊢ 22 15 22 ⊢ 27 14 27 ⊢⊣ 34 7 21 6) Os números abaixo, nos fornece, por faixa etária, a frequência com que ocorre determinada doença, para um grupo de 50 pessoas estudadas, com idade entre 40 e 72 anos. Calcule a média, moda e mediana. 7) Para a distribuição das notas abaixo, determine: 68 85 33 52 65 77 84 65 74 57 71 35 81 50 35 64 74 47 54 68 80 61 41 91 55 73 59 53 77 45 41 55 78 48 69 85 67 39 60 76 94 98 66 66 73 42 65 94 88 89 a) o histograma e o polígono de frequências b) a média aritmética c) a moda d) a mediana e) o desvio médio f) o desvio padrão 8) Uma empresa automobilística selecionou ao acaso, uma amostra de 40 revendedores autorizados em todo o Brasil e anotou em determinado mês o número de unidades adquiridas por estes revendedores. Obteve os seguintes dados: 10 15 25 21 6 23 15 21 26 32 09 14 19 20 32 18 16 26 24 20 07 18 17 28 35 22 19 39 18 21 15 15 22 20 25 28 30 16 12 20 Agrupe por frequência e em seguida encontre: a) o histograma e o polígono de frequências b) a média aritmética c) a moda d) a mediana e) o desvio médio f) o desvio padrão 9) Um banco selecionou ao acaso 25 contas de pessoas físicas em uma agência, em determinado dia, obtendo os seguintes saldos em dólares: 52.500,00 18.300,00 35.700,00 43.800,00 22.150,00 6.830,00 3.250,00 17.603,00 35.600,00 7.800,00 16.323,00 42.130,00 27.606,00 18.350,00 12.521,00 25.300,00 31.452,00 39.610,00 22.450,00 7.380,00 28.000,00 21.000,00 14.751,00 39.512,00 17.319,00 Agrupe, por frequência, estes dados e calcule: a) a média aritmética; b) a moda c) a mediana; d) o desvio médio; f) o desvio padrão. 72 60 64 41 57 42 45 59 43 55 43 45 47 62 69 48 59 50 51 52 40 52 59 53 57 55 44 56 53 57 57 41 58 59 43 50 59 52 63 40 62 47 60 41 64 65 68 48 69 52
Compartilhar