Baixe o app para aproveitar ainda mais
Prévia do material em texto
0 CÁLCULO DAS PROBABILIDADES E ESTATÍSTICA I NOTAS DE AULANOTAS DE AULANOTAS DE AULANOTAS DE AULA PERÍODO: 98.1 Para aprender, primeiramente você precisa desejar ser ensinado. - Reeves PROFESSORES: CLAUDIA REGINA O. P. LIMA MANOEL R. DE SENA JR. JOZEMAR P. DOS SANTOS 1 UNIDADE I. ANÁLISE DE DADOS ESTATÍSTICOS -ESTATÍSTICA “Podemos considerar a Estatística como um conjunto de métodos e processos quantitativos que serve para estudar e medir os fenômenos coletivos”. A estatística teve acelerado desenvolvimento a partir do século XVII, através dos estudos de BERNOULLI, FERMAT, PASCAL, LAPLACE, GAUSS, GALTON, PEARSON, FISHER, POISSON, KOLMOGOROV e outros que estabeleceram suas características essenciais. Ela não alcançou ainda um estado definitivo. Continua a progredir na ação direta do desejo de investigação dos fenômenos coletivos. A Estatística é considerada como Ciência no sentido do estudo de uma população. Mantém com a Matemática uma relação de dependência, solicitando-lhe auxílio, sem o qual não poderia desenvolver-se. Com as outras Ciências mantém a relação de complemento, quando utilizada como instrumento de pesquisa. Em especial a relação de complemento é a forma que a Estatística, através de seus MÉTODOS ESTATÍSTICOS, mantém com as Áreas Tecnológicas, as Ciências Exatas e outras, servindo como instrumento auxiliar na tomada de decisões. A Estatística tem como OBJETIVO o estudo dos fenômenos coletivos. Objetivando o estudo quantitativo e qualitativo dos dados (ou informações), obtidos nos vários campos da atividade científica, a Estatística manipula dois conjuntos de dados fundamentais: a "população" e a "amostra". POPULAÇÃO ( ou Universo) É o conjunto dos seres, objetos ou informações que interessam ao estudo de um fenômeno coletivo segundo alguma(s) característica(s). É, portanto, um conjunto definido de informações relativas a qualquer área de interesse, podendo, quanto ao número de elementos, ser: finita (tamanho N) ou infinita. Na maioria das vezes, não é conveniente, ou mesmo possível realizar o levantamento dos dados referentes a todos os elementos de uma população. Portanto, analisamos parte da população, isto é amostramos. AMOSTRA É um subconjunto não vazio ou parte da população. Duas considerações devem ser feitas sobre o estudo amostral dos fenômenos. Uma diz respeito aos cuidados que se deve tomar para assegurar que a amostra seja representativa da população. Para atender a essa exigência, deve-se selecionar os elementos de forma aleatória, de modo que todo e qualquer elemento da população tenha a mesma chance de participar da amostra. A outra exigência diz respeito à precisão dos dados coletados, buscando minimizar os erros que poderiam induzir a conclusões equivocadas. O número de elementos de uma amostra é chamado o tamanho da amostra, e denotado por n. 1. CONCEITOS FUNDAMENTAIS DE ESTATÍSTICA 2 OBS: Parâmetro, Estimador e Estimativa a) Uma característica numérica estabelecida para toda uma população é denominada parâmetro. b) Uma característica numérica estabelecida para uma amostra é denominada estimador. c) O valor numérico assumido pelo estimador numa determinada amostra é denominada estimativa. Por exemplo: no fenômeno coletivo eleição para prefeito do município de João Pessoa, a população é o conjunto de todos os eleitores habilitados na respectiva cidade. Um parâmetro é a proporção de votos do candidato A. Uma amostra pode ser um grupo de 1.000 eleitores selecionados em todo o município. Um estimador é a proporção de votos do candidato A obtida na amostra. O valor resultante do estimador, a proporção amostral, é a estimativa. Em aplicações efetivas, onde aplica-se o processo de amostragem, o número de elementos componentes de uma amostra é, geralmente, bastante reduzido em relação ao número de elementos componentes da população. - PROCESSOS ESTATÍSTICOS DE ABORDAGEM Quando solicitados a estudar um fenômeno coletivo podemos optar entre os seguintes processos estatísticos: a) CENSO - avaliação direta de um parâmetro, utilizando-se todos os componentes da população. Propriedades Principais do Censo: Admite erro processual zero e tem confiabilidade 100% - É caro. É lento - É quase sempre desatualizado - Nem sempre é viável. b) AMOSTRAGEM (Inferência) - avaliação indireta de um parâmetro, com base em um estimador através do cálculo das probabilidades. Propriedades Principais da Estimação: Admite erro processual positivo e tem confiabilidade menor que 100% - É barata - É rápida - É atualizada - É sempre viável. No sentido de disciplina, a Estatística ensina métodos racionais para a obtenção de informações a respeito de um fenômeno coletivo, além de obter conclusões válidas para o fenômeno e também permitir tomada de decisões, através de alguma(s) característica(s) de valores numéricos observados. Desta forma, a Estatística pode ser dividida em duas grandes áreas: Descritiva e Inferencial. I) ESTATÍSTICA DESCRITIVA - é a parte da Estatística que tem por objetivo descrever os dados observados. São atribuições da Estatística Descritiva: a) A organização dos dados. b) A redução dos dados. 3 c) A representação dos dados. d) A obtenção de algumas informações que auxiliam a descrição do fenômeno observado. • A organização dos dados consiste na ordenação e crítica quanto à correção dos valores observados, falhas humanas, omissões, abandono de dados duvidosos, etc. • Redução dos dados - O entendimento e compreensão de grande quantidade de dados através de simples leitura de seus valores individuais é uma tarefa extremamente árdua e difícil mesmo para o mais experimentado pesquisador, portanto deveremos tabular os dados. • A representação dos dados - Os dados estatísticos podem ser mais facilmente compreendidos quando apresentados através de uma representação gráfica, a qual permite uma visualização instantânea de todos os dados. Os gráficos quando bem representativos, tornam-se importantes instrumentos de trabalho. • A obtenção de algumas informações que sumarizam os dados, facilitando a descrição dos fenômenos observados. Isto encerra as atribuições da Estatística Descritiva. II) ESTATÍSTICA INFERENCIAL (ou Indutiva) - é a parte da Estatística que tem por objetivo obter e generalizar conclusões para a população a partir de uma amostra. Complementando o processamento estatístico, no caso de uma estimação, a Estatística Indutiva estuda os parâmetros a partir do uso de estimadores usando o cálculo das probabilidades, elemento este que viabiliza a inferência estatística. Em resumo, um estudo estatístico completo que recorra às técnicas de Estatística Inferencial irá envolver também, direta ou indiretamente, tópicos de Estatística Descritiva, Cálculo das Probabilidades e Amostragem. Logo, para se desenvolver um curso completo e razoável de Estatística, todos esses assuntos devem ser abordados. No diagrama abaixo está indicado como essas áreas estão relacionadas. Figura 1: Esquema Geral de um Curso de Estatística DADOS e VARIÁVEIS ESTATÍSTICAS Normalmente, no trabalho estatístico o pesquisador se vê obrigado a lidar com grande quantidade de valores numéricos resultantes de um censo ou de uma amostragem. Estes valores numéricos são chamados dados estatísticos. Amostragem Estatística Descritiva Cálculo das Probabilidades Estatística Inferencial 4 As informações ou dados característicos dosfenômenos ou populações são denominados variáveis estatísticas ou simplesmente variáveis. Conforme suas características particulares, podem ser classificadas como: Quantitativas e Qualitativas. QUANTITATIVAS - São aquelas que podem ser expressas em termos numéricos. Em geral são as resultantes de medições, enumerações ou contagens. São subdivididas em contínuas e discretas. conforme abaixo. Contínuas - são aquelas que podem assumir qualquer valor num certo intervalo de medida, podendo ser associados ao conjunto dos números reais, ou seja, seus valores possíveis formam um conjunto não enumerável. Entre outras, enquadram-se nesta categoria as medidas de tempo, comprimento, espessura, área, volume, peso e velocidade. Discretas (ou descontínuas) - quando só podem assumir determinados valores num certo intervalo, podendo ser associadas ao conjunto dos números inteiros, ou seja, seus possíveis valores formam um conjunto finito ou enumerável. Em geral, representam números inteiros resultantes do processo de contagem, como o número de alunos por sala, de créditos por disciplinas, de pacientes atendidos diariamente num hospital, etc. De modo geral, as medições dão origem as variáveis contínuas e as contagens ou enumerações, as variáveis discretas. Designamos estas variáveis por letras latinas, em geral , as últimas: X, Y, Z. QUALITATIVAS - Nem sempre os elementos de uma população são exclusivamente contáveis. Muitas vezes, eles podem ser qualificados também segundo algumas de suas características típicas. Nesses casos, as variáveis podem ser agrupadas em nominais ou ordinais( por postos ). Nominais - quando puderem ser reunidas em categorias ou espécies com idênticos atributos. Aqui se incluem os agrupamentos por sexo, área de estudo, desempenho, cor, raça, nacionalidade e religião. Ordinais - quando os elementos forem reunidos segundo a ordem em que aparecem dispostos numa lista ou rol. São típicos desta forma de agrupamento, as listas classificatórias de concursos e as tabelas de campeonatos. Em geral, uma mesma população pode ser caracterizada por mais de um tipo de variável. Assim os inscritos num vestibular, por exemplo, podem ser contados, medidos ou pesados, podem ser agrupados segundo o sexo ou área de estudo e podem ainda ser classificados segundo as notas obtidas nas provas prestadas. O objetivo de estudarmos os níveis de mensuração das variáveis estatísticas consiste em determinar a complexidade da análise das variáveis (características de interesse) envolvidas no estudo de uma população ou de uma amostra. As pessoas de uma comunidade podem ser estudadas sob diversos ângulos. Por exemplo, podem ser classificadas quanto ao SEXO (masculino/feminino), quanto à ESTATURA (baixa/média/alta), quanto à RENDA (pobres/ricas) etc. SEXO, - NÍVEIS DE MENSURAÇÃO - 5 ESTATURA, RENDA são variáveis, isto é, são características às quais podemos associar conceitos ou números e assim expressar, de certa maneira, informações sob a forma de medidas. 1o. nível: - É o nível de mensuração mais baixo, mais rudimentar possível. A escala de medida desse nível chama-se NOMINAL. O fundamento para a atribuição dos números é de natureza qualitativa. Exemplos: VARIÁVEL QUALITATIVA NOMINAL - 1° Nível - Escala Nominal (classificação por tipos ou atributos). a) População: moradores de um cidade Variável: cor dos olhos (pretos, castanhos, azuis, etc.) b) População: funcionários da empresa X Variável: sexo (masculino, feminino) 2o. nível: - Este nível já é um pouco mais elaborado que o anterior e corresponde ao que popularmente se designa por ordenação; a escala de medida chama-se ORDINAL. As grandezas de 2o. nível podem ser avaliadas em termos de mais que ou menos que, embora a quantificação precisa seja impossível. Exemplos: VARIÁVEL QUALITATIVA ORDINAL - 2° Nível - Escala Ordinal ( ordenação ou postos). c) População: estudantes de uma escola de 2o. grau Variável: grau de escolaridade (1a. série, 2a. série, 3a. série) d) População: pessoas adultas economicamente ativas Variável: renda (baixa, média, alta) 3o. nível: - É no 3o. nível que surge, pela primeira vez, uma escala de medida propriamente dita. É a escala INTERVALAR, onde a contagem resulta números inteiros e com eles são possíveis algumas das operações aritméticas ( adição, subtração e multiplicação). Neste nível o ZERO da escala é relativo. Exemplos : As Escalas Termométricas, fuso horário. 4o. nível: O 4o. nível define a chamada escala das razões ou RACIONAL. Essa escala é muito parecida com a de 3o. nível, exceto quanto à origem. O zero é absoluto, isto é, é zero mesmo. No 4o. nível todas as operações aritméticas são possíveis, isto é, adição, subtração, multiplicação e divisão. Exemplos: 6 VARIÁVEL QUANTITATIVA DISCRETA - 4° Nível - Escala das Razões (processo de contagem e ordenação). e) População: casais residentes em uma cidade Variável: número de filhos (0, 1, 2, 3, 4 ou mais filhos) f) População: peças produzidas por uma máquina Variável: número de defeituosas da produção diária (0, 1, 2, 3, 4, 5, ... ) VARIÁVEL QUANTITATIVA CONTÍNUA - 4° Nível - Escala das Razões (processo de medição). g) População: peças produzidas por uma máquina Variável: diâmetro externo (p. ex., 0,96 cm) h) População: estudantes de uma escola Variável: tempo de estudo diário em certa disciplina (p. ex., 2,30 h) A Complexidade da análise das variáveis aumenta quanto maior for o nível desta variável, como é indicado no diagrama abaixo. Figura 2: Grau de complexidade da análise dos dados 1o. NÍVEL 2o. NÍVEL 3o. NÍVEL 4o. NÍVEL Escala Nominal Escala Ordinal Escala Intervalar Escala das Razões 7 Em linhas gerais, podemos distinguir na análise estatística as seguintes etapas: Planejamento, Coleta, Crítica, Apuração e Exposição dos dados, além da análise dos dados. PLANEJAMENTO É o trabalho inicial de coordenação no qual define-se a população a ser estudada estatisticamente, formulando-se o trabalho de pesquisa através da elaboração de questionário, entrevistas, etc. A organização do plano geral, implica em obter respostas para uma série tradicional de perguntas, antes mesmo do exame das informações disponíveis sobre o assunto, perguntas que procuram justificar a necessidade efetiva da pesquisa, a saber: - "quem", "o que", "sempre", "por que", "para que", "para quando". Imaginemos, por exemplo, que a Biblioteca Central da UFPb tenha necessidade de obter informações acerca dos usuários em potencial que utilizam-na. O primeiro trabalho da equipe encarregada da pesquisa, será evidentemente, o de obter resposta para aquelas perguntas. Seriam então: - Quem deseja as informações? - O que devemos perguntar no questionário? - Será executada sempre? A pesquisa será periódica ou ocasional? - Por que desejam as informações? - Para que desejam as informações? - Quando deverá estar concluída a pesquisa? - Qual a época oportuna para a aplicação dos questionários? Ainda na fase do planejamento, temos: O EXAME DAS INFORMAÇÕES DISPONÍVEIS, ou seja, análise da reunião de tudo que foi publicado sobre o assunto, obtendo-se relatórios sobre atividades semelhantes ou correlatas. A DEFINIÇÃO DO UNIVERSO, isto é, saber qual o conjunto a ser pesquisado, distribuindo, classificando ou agrupando os elementos desse conjunto em populações, para permitir um trabalho mais fácil, mais lógico, mais racional. O tipo de levantamento, CENSO ou AMOSTRAGEM, deverá ser decidido com a devida antecedênciae a necessária análise das vantagens e desvantagens de um e de outro, em virtude do custo financeiro e do prazo determinado para a conclusão do trabalho. COLETA DE DADOS Após cuidadoso planejamento e a devida determinação das características mensuráveis do fenômeno coletivamente típico que se quer pesquisar, damos início à coleta dos dados numéricos necessários à sua descrição. A coleta dos dados poderá ser feita de diversas formas. A ideal é aquela que maximiza os recursos disponíveis, dados os objetivos e a precisão previamente estipulados. 2. FASES DO MÉTODO OU TRABALHO ESTATÍSTICO 8 No seu planejamento, deve-se considerar o tipo de dado a ser coletado, o local onde este se manifestará, a frequência de sua ocorrência, e outras particularidades julgadas importantes. Quando os dados se referirem ou estiverem em poder de pessoas, sua coleta poderá ser realizada mediante respostas a questionários previamente elaborados. Esses questionários podem ser enviados aos entrevistados para devolução posterior ou podem ser aplicados pelos próprios pesquisadores ou por entrevistadores externos ou contratados, devidamente treinados. Os dados ou informações representativas dos fenômenos ou problema em estudo podem ser obtidos de duas formas: por via direta ou por via indireta. Por via direta - quando feita sobre elementos informativos de registro obrigatório (p. ex.: nascimentos, casamentos, óbitos, matrículas de alunos etc.) ou, ainda, quando os dados são coletados pelo próprio pesquisador através de entrevistas ou questionários. A coleta direta de dados, com relação ao fator tempo, pode ser classificada em: a) contínua, também denominada registro, é feita continuamente, tal como a de nascimentos, óbitos, etc.; b) periódica, quando feita em intervalos constantes de tempo, como os censos(de 10 em 10 anos), os balanços de uma empresa comercial, etc.; c) ocasional, quando feita extemporaneamente, a fim de atender a uma conjuntura ou a uma emergência, como no caso de epidemias que assolam ou dizimam seres humanos Por via indireta - quando é inferida de elementos conhecidos (coleta direta) e/ou conhecimento de outros fenômenos relacionados com o fenômeno estudado. Como exemplo, podemos citar a pesquisa sobre a mortalidade infantil, que é feita através de dados colhidos via coleta direta. CRÍTICA DOS DADOS Os dados colhidos por qualquer via ou forma e não previamente organizados são chamados de dados brutos. Esses dados brutos, antes de serem submetidos ao processamento estatístico propriamente dito, devem ser "criticados", visando eliminar valores impróprios e erros grosseiros que possam interferir nos resultados finais do estudo. A crítica é externa quando visa às causas dos erros por parte do informante, por distração ou má interpretação das perguntas que lhe foram feitas; é interna quando se observa o material constituído pelos dados coletados. É o caso, por exemplo, da verificação de somas de valores anotados. APURAÇÃO OU PROCESSAMENTO DOS DADOS Uma vez assegurado que os dados brutos são consistentes, devemos submetê-los ao processamento adequado aos fins pretendidos. A apuração ou processamento dos dados pode ser manual ou eletrônica. Os processos e métodos estatísticos a que um conjunto de dados pode ser submetido serão nosso objeto de estudo nas seções seguintes. EXPOSIÇÃO OU APRESENTAÇÃO DOS DADOS 9 Por mais diversa que seja a finalidade que se tenha em vista, os dados devem ser apresentados sob forma adequada (tabelas ou gráficos), tornando mais fácil o exame daquilo que está sendo objeto de tratamento estatístico e ulterior obtenção de medidas típicas. No caso particular da estatística descritiva, o objetivo do estudo se limita, na maioria dos casos, à simples apresentação dos dados, assim entendida a exposição organizada e resumida das informações coletadas através de tabelas ou quadros, bem como dos gráficos resultantes. ANÁLISE DOS RESULTADOS Como já dissemos, o objetivo último da Estatística é tirar conclusões sobre o todo (população) a partir de informações fornecidas por parte representativa do todo (amostra). Assim, realizadas as fases anteriores (Estatística descritiva), fazemos uma análise dos resultados obtidos, através dos métodos da Estatística Inferencial, que tem por base a indução ou inferência, e tiramos desses resultados conclusões e previsões. 10 Os dados numéricos, após coletados são colocados em série e apresentados em tabelas ou quadros. Quando se estuda uma variável (qualitativa ou quantitativa), o maior interesse do pesquisador é conhecer a distribuição dessa variável através das possíveis realizações (valores) da mesma. Iremos, pois, ver uma maneira de se dispor um conjunto de valores, de modo a se ter uma boa idéia global sobre esses valores, ou seja, de sua distribuição. Consideremos, para efeito de estudo, o quadro (banco de dados) apresentado abaixo: TABELA 1.1 - Informações sobre sexo, curso, idade (anos), procedência, renda familiar, número de disciplinas matriculado(a), peso (kg) e altura (cm) de 31 alunos matriculados na disciplina CÁLC. das PROB. e ESTATÍSTICA I, período 97.1 - turma: 04 - turno da manhã. ID SEXO CURSO IDADE (anos) PROCEDÊNCIA RENDA FAMILIAR NO. DISCIP MATRIC PESO (kg) ALTURA (cm) 01 Masc Ciências 27 Capital Baixa 3 68 170 02 Masc Eng Civil 18 Interior Média 7 60 175 03 Fem Ciências 21 Capital Média 6 57 168 04 Masc Eng Mec 23 Interior Baixa 5 54 N.Inf 05 Masc Eng Mec 23 Interior Baixa 5 54 N.Inf 06 Fem Ciências 21 O.Região Média 7 47 153 07 Fem Ciências 21 Capital Média 8 46 162 08 Masc Eng Mec 27 Interior Média 4 90 174 09 Masc Eng Civil 21 Capital Alta 5 51 172 10 Fem Eng Civil 19 Capital Média 6 43 158 11 Masc Eng Civil 18 O.Região Média 5 73 177 12 Masc Eng Civil 18 O.Região Alta 6 69 175 13 Fem Eng Mec 22 Capital Média 6 70 172 14 Fem Eng Civil 19 Capital Média 5 57 165 15 Masc Eng Civil 19 Capital Média 5 73 183 16 Masc Eng Civil 18 Capital Alta 6 55 167 17 Masc Eng Civil 19 Capital Média 5 82 181 18 Masc Eng Civil 23 Capital Média 4 65 175 19 Masc Eng Civil 19 O.Região Média 5 71 170 20 Fem Eng Civil 18 Capital Média 5 68 170 21 Masc Eng Civil 18 Capital Média 5 70 170 22 Masc Eng Civil 20 Capital Média 5 67 177 23 N.Inf. Eng Civil 19 Capital Média 7 68 170 24 Masc Eng Civil 24 Capital Média 7 70 170 25 Fem Eng Civil 20 Capital Média 6 58 161 26 Fem Eng Civil 21 Capital Média 5 51 158 27 Masc Eng Civil 20 Capital Média 5 84 180 28 Masc Eng Civil 21 Interior Média 6 65 167 29 Masc Eng Civil 20 Interior Baixa 6 62 164 30 Masc Eng Civil N.Inf Capital Média 3 84 170 31 Fem Eng Civil 21 Capital Média 6 62 173 FONTE: Questionário aplicado - aula 18/03/97 3. DISTRIBUIÇÕES DE FREQUÊNCIAS 11 Uma distribuição de frequências pode ser apresentada nas seguintes maneiras: - DISTRIBUIÇÃO DE FREQUÊNCIAS POR VALORES (variável qualitativa ou quantitativa discreta) É construída considerando-se todos os diferentes valores ou categorias, levando em consideração suas respectivas repetições EXEMPLO 1 - A tabela 1.2 apresenta a distribuição de frequência da variável PROCEDÊNCIA, usando-se os dados da tabela 1.1 . Tabela 1.2 - Frequências e Percentuais dos 31 estudantes de Calc. Prob. Est I - Turno: Manhã, Turma: 04, Período: 97.1 - segundo a Região de Procedência PROCEDÊNCIA NO de Estudantes fi Percentual fi % Capital 21 67,7 Interior 6 19,4 O. Região 4 12,9 Total 31 100 FONTE: Tabela 1.1 EXEMPLO 2 - A tabela 1.3 apresenta adistribuição de frequência da variável NO DE DISCIPLINAS MATRICULADO(A), usando-se os dados da tabela 1.1 - ( DADOS NÃO - AGRUPADOS ) Tabela 1.3 - Distribuição de frequências e percentuais do NO de Disciplinas Matriculado(a) dos 31 estudantes de Calc. Prob. Est I - Turno: Manhã, Turma: 04, Período: 97.1. NO DISC MATRIC ( Xi ) Nº de Estudantes fi Percentual fi % 3 2 6,5 4 2 6,5 5 13 41,9 6 9 29,0 7 4 12,9 8 1 3,2 Total ou ∑ 31 100 FONTE: Tabela 1.1 OBS.: ∑ ==> letra grega "SIGMA", indica total ou somatório. DISTRIBUIÇÃO DE FREQUÊNCIAS POR INTERVALOS OU CLASSES (variável quantitativa). Constrói-se classes de valores, quando a variabilidade dos dados é grande, levando em consideração o número de valores que pertencem a cada classe. A construção de tabelas de frequências para variáveis contínuas necessita de certos cuidados. 12 EXEMPLO 3 - A tabela 1.4 apresenta a distribuição de frequências da variável ALTURA (medida em cm), usando-se os dados da tabela 1.1 - ( DADOS AGRUPADOS ) Tabela 1.4 - Frequências e percentuais das ALTURAS dos 31 estudantes de CALC. PROB. EST I Turno: Manhã, Turma: 04, Período: 97.1. ALTURAS (cm) Nº de Estudantes fi Percentual fi % 150 |------ 157 1 3,4 157 |------ 164 4 13,8 164 |------ 171 12 41,5 171 |------ 178 9 31,0 178 |------ 185 3 10,3 Total ou ∑ 29 100,0 FONTE: Tabela 1.1 NOTA: Dos 31 respondentes, 2 não informaram a altura. OBSERVAÇÃO: 1) De um modo geral tem-se a destacar em uma tabela (disposição escrita que se obtém referindo-se a uma coleção de dados numéricos a uma determinada ordem de classificação): i) Elementos essenciais: Título: Indicação que precede a tabela e que contém a designação do fato observado, o local e a época em foi registrado. Cabeçalho: Parte superior da tabela que especifica o conteúdo das colunas. Coluna Indicadora: Parte da tabela que especifica o conteúdo das linhas. Corpo da tabela: Conjunto de colunas e linhas que contém as informações sobre a variável em estudo. ii) Elementos complementares: Fonte: Indicação da entidade responsável pelo fornecimento dos dados ou pela sua elaboração. Notas: Informações de natureza geral destinadas a conceituar ou esclarecer o conteúdo das tabelas ou a indicar a metodologia adotada no levantamento ou na elaboração dos dados. Chamadas: Informações de natureza específica sobre determinada parte da tabela, destinada a conceituar ou a esclarecer dados 2) As tabelas apresentadas oficialmente devem atender às normas do IBGE. - REGRAS BÁSICAS PARA ELABORAÇÃO DE UMA DISTRIBUIÇÃO DE FREQUÊNCIAS POR INTERVALOS - (DADOS AGRUPADOS) 1. Efetua-se um ROL ESTATÍSTICO (ordenação crescente ou decrescente de grandeza) nos Dados Brutos (aqueles ainda não organizados numericamente). 2. Determina-se a AMPLITUDE TOTAL dos dados 13 AT = Xmáx - Xmín ,onde Xmáx : maior valor observado e Xmín : menor valor observado 3. Escolhe-se convenientemente o número de classes K (no. inteiro) , 5 15≤ ≤K onde podemos tomar K n≅ ou a fórmula de Sturges K n≅ + ⋅1 3 3, log , n ≥ 25 (total de observações). Se possível determina-se, ou seja, constrói-se classes de mesma amplitude, tomando h AT K ≅ . 4. Efetua-se o AGRUPAMENTO EM CLASSES e, a seguir, toma-se as FREQUÊNCIAS SIMPLES DE CLASSES, elaborando-se, portanto, a tabela de distribuição de frequências. EXEMPLO 4 - Elabore uma tabela de distribuição de frequências (dados agrupados) da variável IDADE (em anos) dos 30 estudantes de Calc. Prob. Est I, Turno: Manhã, Turma 04, Período: 97.1, conforme Dados Brutos abaixo: DADOS BRUTOS ROL ESTATÍSTICO (crescente) 27 18 21 23 23 21 21 27 18 18 18 18 18 18 19 19 21 19 18 18 22 19 19 18 19 19 19 19 20 20 20 20 19 23 19 18 18 20 19 24 21 21 21 21 21 21 21 22 20 21 20 21 20 21 23 23 23 24 27 27 Passo 1: Efetuar o Rol Estatístico Passo 2: Amplitude Total -----> AT = 27 - 18 = 9 Passo 3: Número de classes ---> k = ≈30 5 ( aproximação por falta ) e Amplitude de classe � h AT k≈ = = ≅ 9 5 1 8 2, anos Passo 4: AGRUPAMENTO EM CLASSES + FREQUÊNCIAS SIMPLES DE CLASSES Tabela 1.5 - DISTRIBUIÇÃO DE FREQUÊNCIAS DAS IDADES (em anos) DE 30 ESTUDANTES DE CALC. PROB. ESTATÍSTICA I - TURNO: MANHÃ, TURMA: 04, PERÍODO: 97.1 IDADES (anos) NO Estudantes fi 18 |------ 20 12 20 |------ 22 11 22 |------ 24 4 24 |------ 26 1 26 |------ 28 2 Total ou ∑ 30 FONTE: Tabela 1.1 NOTA: Dos 31 respondentes, 1 não informou a idade. 14 A seguir, analisaremos alguns CONCEITOS ESSENCIAIS numa Distribuição de Frequência por Intervalos ou Classes. i. LIMITES DE CLASSES: Li : Limite inferior de classe ; Ls : Limite superior de classe Classe ou Intervalo de classe -------> Li (incluir) |------ Ls (excluir) Por exemplo, distribuição das Idades, tabela 1.5: 1a classe -----> Li = 18|----- Ls = 20 ; 2a classe -----> Li = 20 |----- Ls = 22 , etc. ii. AMPLITUDE DE CLASSE: hi = Ls - Li, amplitude da i-ésima classe. Por exemplo, distribuição das Idades, tabela 1.5: 1a classe --> h1 = 20 - 18 = 2 ; 2 a classe --> h2 = 22 - 20 = 2 ; . . . ; 5a classe --> h5 = 28 - 26 = 2 Como as classes têm mesma amplitude denominamos, simplesmente, por h = Li - Ls = 2 iii. PONTO MÉDIO DE CLASSE: X L Li i s= + 2 , ponto médio da i-ésima classe. Por exemplo, distribuição das Idades, tabela 1.5: 1a classe ---> X1 18 20 2 19= + = ; 2a classe ---> X 2 20 22 2 21= + = No caso de classes com mesma amplitude h, tomamos: X X hi i+ = +1 , ou seja por ex.: 2a classe -----> X1 + h = 19 + 2 = 21 3a classe -----> X2 + h = 21 + 2 = 23 etc. iv. FREQUÊNCIA SIMPLES OU ABSOLUTA DE CLASSE fi : frequência simples da i-ésima classe (número de observações) f f ni i k i = ∑ ∑= = 1 (número total de observações) Por ex.; f1 = 12 ; f2 = 11 ; f3 = 4 ; f4 = 1 ; f5 = 2 e f ni∑ = = 30 - TIPOS DE FREQUÊNCIAS - 15 5. FREQUÊNCIA RELATIVA E PERCENTUAL DE CLASSE FREQUÊNCIA RELATIVA (i-ésima classe ou valor) : fr f n i i = (Razão entre a frequência simples e o total de observações) fri =∑ 1 (soma das frequências relativas) FREQUÊNCIA PERCENTUAL (i-ésima classe ou valor) : f fri i% = ⋅100 ou f f n i i% = ⋅100 f i % =∑ 100 (soma das frequências percentuais) 6. FREQUÊNCIA SIMPLES ACUMULADA (do tipo "abaixo de") F f f f fi i= + + + ⋅⋅⋅ +1 2 3 , frequência simples acumulada da i-ésima classe ou valor 7. FREQUÊNCIA RELATIVA E PERCENTUAL ACUMULADA Fr fr fr fr fri i= + + + ⋅⋅⋅+1 2 3 , frequência relativa acumulada da i-ésima classe ou valor F f f f fi i% % % % %= + + + ⋅⋅⋅ +1 2 3 , frequência percentual acumulada da i-ésima classe ou valor Tabela 1.4 (estendida) - DISTRIBUIÇÃO DE FREQUÊNCIAS DAS ALTURAS ALTURAS (cm) P. Médio Xi Freq. Simples fi Freq. Relativa fri Freq. Percentual fi % Freq.Simples Acum. Fi Freq.Perc. Acum. Fi % 150 |----- 157 153,5 1 0,034 3,4 1 3,4 157 |----- 164 160,5 4 0,138 13,8 5 17,2 164 |----- 171 167,5 12 0,415 41,5 17 58,7 171 |----- 178 174,5 9 0,310 31,0 26 89,7 178 |----- 185 181,5 3 0,103 10,3 29 100,0Total ou ∑ 29 1,000 100,0 O gráfico estatístico é uma forma de apresentação dos dados estatísticos, cujo objetivo é o de produzir, no investigador ou no público em geral, uma impressão rápida e viva do fenômeno em estudo, já que os gráficos falam mais rápidos que as séries ( tabelas ). Para tornarmos possível uma representação gráfica, estabelecemos uma correspondência entre os termos da série e determinada figura geométrica, de tal modo que cada elemento da série seja representado por uma figura proporcional. 4 - REPRESENTAÇÕES GRÁFICAS DAS DISTRIBUIÇÕES DE FREQUÊNCIAS 16 - REQUISITOS A representação gráfica de um fenômeno deve obedecer aos seguintes requisitos primordiais: a) Simplicidade - indispensável devido à necessidade de levar a uma rápida apreensão do sentido geral do fenômeno apresentado a fim de não nos perdermos na observação de minúcias de importância secundária. b) Clareza - o gráfico deve possibilitar uma correta interpretação dos valores representativos do fenômeno em estudo. c) Veracidade - indispensável qualquer comentário, posto que, se não representa uma realidade, o gráfico perde sua finalidade. Os principais tipos de gráficos estatísticos para as distribuições de frequências são os DIAGRAMAS, os quais são gráficos geométricos de, no máximo duas dimensões. Para sua construção, em geral, fazemos uso do sistema cartesiano. Dentre os principais tipos de diagramas destacamos, segundo a variável em estudo: Variável Qualitativa � GRÁFICOS EM BARRAS OU COLUNAS, GRÁFICOS EM SETORES Distribuição por Valores � GRÁFICO EM COLUNAS (ou Bastão) Variável Quantitativa � Distribuição por Intervalos � HISTOGRAMA, POLÍGONO DE FREQUÊNCIAS � GRÁFICO EM COLUNAS OU BARRAS - É a representação de uma série por meio de retângulos, dispostos horizontalmente (em barras) ou verticalmente (em colunas). Exemplo: Gráfico 1. � GRÁFICO POR SETORES - É o gráfico que representa as partes de um todo, por setores de um círculo, visando justamente comparar estas partes entre si e em relação ao todo. Exemplo: Gráfico 2. Procedência dos Estudantes de Calc. Prob. Estatística I Turno: Manhã, Turma: 04, Período: 97.1 Gráfico 1 Gráfico 2 Procedência O.RegiãoInteriorCapital Fr eq u ên ci a 30 20 10 0 O,Região Interior Capital 17 • HISTOGRAMA - É a representação gráfica de uma distribuição de frequências de uma variável quantitativa (dados agrupados) por meio de retângulos justapostos centrados nos pontos médios das classes e cujas áreas são proporcionais às frequências das classes. Exemplo: Gráfico 3 Gráfico 3: Alturas dos estudantes de Calc. Prob. Estatística I Turno: Manhã, Turma: 04, Período: 97.1 • POLÍGONO DE FREQUÊNCIAS - É a representação gráfica de uma distribuição de frequências por meio de uma linha poligonal fechada ou polígono, cuja área total é igual a do histograma. Exemplo: Gráfico 4. Gráfico 4: Alturas dos estudantes de Calc. Prob. Est I Turno: Manhã, Turma: 04, Período: 97.1 18 Vimos anteriormente a sintetização dos dados sob a forma de tabelas, gráficos e distribuições de frequências. Aqui, vamos aprender o cálculo de medidas que possibilitem representar um conjunto de dados (valores de uma variável quantitativa, isto é, informações numéricas), relativos à observação de determinado fenômeno de forma reduzida. Estes índices estatísticos são as MEDIDAS DE POSIÇÃO e, dentre as mais importantes, citamos as Medidas de Tendência Central, que recebem tal denominação pelo fato dos dados observados tenderem, em geral, a se concentrar em torno de valores centrais. Dentre as medidas de tendência central, destacamos: • a Média aritmética ou Média; • a Moda; • a Mediana. As outras medidas de posição são as SEPARATRIZES, que englobam: • a própria mediana; • os quartis; • os percentis. 1. MÉDIA ARITMÉTICA (ou simplesmente MÉDIA) Definição 5.1: (a) Dada uma população constituída de N elementos, X1, X2, ..., XN sua média, denotada por µ , mede o valor médio do conjunto de dados, sendo expressa na mesma unidade, e definida por: µ = + + +X X X N N1 2 ... ou µ = ∑ X N i ( Média populacional ) Eq. (1) (b) Dada uma amostra constituída de n elementos, X1, X2, ..., Xn , sua média, denotada X , será definida por: X = X X X n n1 2+ + ⋅⋅⋅ + ou X = X n i∑ ( Média amostral ) Eq. (2) Exemplo: Determinar a média do seguinte conjunto (amostra) de valores Xi : 3, 7, 8, 10, 11 Logo, X = X n i∑ = 3 7 8 10 11 5 + + + + ⇒ X = 7,8 5 - MEDIDAS DE POSIÇÃO 19 (c) MÉDIA ARITMÉTICA PARA DISTRIBUIÇÕES DE FREQUÊNCIA Seja um conjunto de dados ( uma amostra ) constituída de n valores da variável X, isto é, X1, X2, ..., Xk ocorrendo com respectivas frequências f1, f2, ..., fk de modo que ∑fi = n . A média aritmética (ou simplesmente média) de X, denotada X , é definida por: X = X f f i i i ⋅∑ ∑ ou simplesmente X = X f n i i⋅∑ Eq. (3) onde n = ∑fi é o número de elementos do conjunto. OBS.: A expressão acima é usada tanto no caso de distribuição de frequências por valores, como para dados agrupados em classes. No segundo caso, os X’is representam os pontos médios de classes. Exemplo: Determinar a média do seguinte conjunto de valores, Xi : 2, 3, 8, 8, 5, 2, 2, 2, 8, 5, 3, 8, 2, 2, 5, 8, 2, 5, 8 e 2 Xi fi Xi∗fi 2 8 16 3 2 6 5 4 20 8 6 48 ∑ 20 90 Portanto, aplicando a Eq. (3), vem: X = X f f i i i ⋅ = ∑ ∑ 90 20 ⇒ X = 4,5 n = ∑ fi = 20 OBS.: A Equação (3) é uma adequação da equação (2) no caso de um conjunto de valores X’is com elementos repetidos. VANTAGENS E DESVANTAGENS DA MÉDIA 1. É uma medida de tendência central que por uniformizar os valores de um conjunto de dados, não representa bem os conjuntos que revelam tendências extremas. Ou seja, é grandemente influenciada pelos valores extremos (grandes) do conjunto. 2. Não pode ser calculada para distribuições de frequências com limites indeterminados (indefinidos). 20 Exemplo: É impossível calcular a média da distribuição abaixo, representativa das idades de um grupo de 300 pessoas. IDADES (Anos) No de Pessoas fi Menos de 33 1 33 |------- 35 21 35 |------- 37 52 37 |------- 39 186 39 |------- 41 38 41 ou mais 2 Total ou ∑ 300 3. É o promédio mais conhecido e de maior emprego. 4. É facilmente calculável. 5. Pode ser tratada algebricamente (ver propriedades). 6. Serve para compararmos conjuntos semelhantes. 7. É particularmente indicada para séries (conjuntos) que possuem os valores simétricos em relação a um valor médio e de frequência máxima. 8. Depende de todos os valores do conjunto de dados. Propriedades: 1 - A soma dos desvios tomados em relação à média é nula, isto é, ( )X Xi i n − = = ∑ 1 0 . 2 - Somando-se ou subtraindo-se uma constante (c) a todos os valores de uma variável, a média do conjunto fica aumentada ou diminuída dessa constante, isto é, Y X c Y X ci i= ± ⇒ = ± . 3 - Multiplicando-se ou dividindo-se todos os valores de uma variável por uma constante (c), a média do conjunto fica multiplicada ou dividida por essa constante, isto é, Y X c Y X ci i= ∗ ⇒ = ∗ ou Y X c Y X ci i= ÷ ⇒ = ÷ , para c≠0. 2. MODADesprezando as classes abertas, isto é, com limites indeterminados, aí sim, poderíamos calcular a referida média. 21 Definição 5.2: Dado um conjunto de valores, a moda, denotada Mo, é o valor que ocorre com maior frequência, ou seja, é o valor mais frequente do conjunto de dados. OBS.: i) A moda de um conjunto de dados pode não existir (figura (a) ) ii) A moda de um conjunto de dados pode não ser única (figura (c) ) Exemplo: Determine a moda dos seguintes conjuntos de dados abaixo a) 2, 2, 3, 3, 5, 5, 8, 8 ⇒ Não existe moda. b) 2, 2, 3, 5, 5, 5, 8, 8 ⇒ Mo = 5 c) 2, 2, 2, 3, 3, 5, 5, 5, 8 ⇒ Mo = 2 e Mo = 5 - CÁLCULO DA MODA PARA DADOS AGRUPADOS Em uma distribuição de frequências com dados agrupados em classes, denominamos classe modal à que possui a maior frequência, e, conseqüentemente, será esta classe que conterá a moda. FÓRMULA de CZUBER (interpretação geométrica através de Histograma) Mo L hmo mo= + + ⋅ ∆ ∆ ∆ 1 1 2 onde: Lmo : limite inferior da classe modal hmo : amplitude da classe modal ∆1 = fmodal - fanterior ∆2 = fmodal - fposterior 22 Exemplo: Utilizando os dados apresentados na tabela 1.4, determine a ALTURA MODAL dos 29 estudantes de Cálculo das . Probabilidades. e Estatística I - Turno: Manhã, Turma: 04, Período: 97.1 Classe modal (2a.) 164 |----- 171 , Lmo = 164 , fmo = 12 , hmo = 7 ∆1 12 4 8= − = − =f fmax ant ; ∆2 12 9 3= − = − =f fmax post Logo, Mo cm= + + ∗ =164 8 8 3 7 169 1, ou Mo = 169 cm VANTAGENS E DESVANTAGENS DA MODA 1. Não depende de todos os valores do conjunto de dados, podendo mesmo não se alterar com a modificação de alguns deles. 2. Não é influenciada por valores extremos (grandes) do conjunto de dados. 3. Pode ser calculada para distribuições com limites indeterminados (indefinidos) na maioria dos casos. 3. MEDIANA Definição 5.3: Considere uma série (conjunto de dados) ordenada, constituído de n valores. A mediana, denotada Me , é o valor que divide o conjunto em duas partes iguais ( isto é, em duas partes de 50% cada). Exemplos: a) Calcular a mediana do seguinte conjunto de dados: 2, 3, 5, 8, 9, 11, 13 (n = 7 ímpar) Me = 8 (termo de ordem central ) b) Calcular a mediana do seguinte conjunto de dados: 2, 3, 5, 8, 9, 11, 13, 15 (n = 8 par) Me = + = 8 9 2 8 5, (Média aritmética dos termos de ordens centrais) Verificamos que, estando ordenados os valores de uma série (conjunto de dados) e sendo n o número de elementos da série, o valor mediano será: - o termo de ordem central n +1 2 , Me X n = +1 2 se n for ímpar; 23 - a média aritmética dos termos de ordem n n 2 2 1e + , Me X X n n = + + 2 2 1 2 se n for par. CÁLCULO DA MEDIANA NUMA DISTRIBUIÇÃO DE FREQUÊNCIAS a) Dados Não-agrupados Neste caso, para a série de valores ordenados em ordem crescente de grandeza (i. e., em um rol), a mediana é o valor médio ou a média aritmética dos valores centrais, caso tenhamos um número ímpar ou par de valores na série. b) Dados Agrupados em Classes No caso de dados agrupados, relembramos que uma distribuição de frequências pode ser representada por meio de um Histograma. Dizemos então que a mediana será o valor de X (abscissa) cuja ordenada divide a área total do Histograma em duas partes iguais. Assim, para dados agrupados, a mediana é obtida através de interpolação de acordo com a seguinte fórmula: Me L n F f hme ant me me= + − ⋅ 2 onde: Exemplo: Determinar a ALTURA MEDIANA dos 29 estudantes da turma de Cal. Prob. Est I, Turno: Manhã, Turma: 04, Período: 97.1 - Turno da tarde, conforme os dados agrupados na tabela 1.4 (estendida). Lme é o limite inferior da classe mediana; fme é a frequência simples da classe mediana; Fant é a frequência acumulada da classe anterior à classe mediana; hme é a amplitude da classe mediana; n é o total de observações. 24 Conjunto A ====> 7, 7, 7, 7, 7 Conjunto B ====> 5, 6, 7, 8, 9 Conjunto C ====> 4, 5, 7, 9, 10 Conjunto D ====> 0, 5, 10, 10, 10 n/2 = 29/2 = 14,5 (50%) ====> Classe mediana (2a.) : 164 |----- 171 (Classe mediana: primeira classe que ultrapassar 50% (n/2) ou mais das observações) Lme = 164 ; fme = 12 ; hme =7 ; Fant = 5 ⇒ Md cm= + − ∗ = + =164 14 5 5 12 7 164 5 5 169 5 , , , ou Md = 170cm PROPRIEDADES DA MEDIANA i) A mediana não é influenciada por valores extremos (grandes) de uma série ou conjunto de dados. ii) A mediana de uma série de dados agrupados de classes extremas indefinidas pode ser calculada. Na seção anterior, aprendemos a calcular e entender convenientemente as medidas de posição representativas de um determinado conjunto de dados, onde destacamos a média, a moda e a mediana. Sejam quatro conjuntos A, B, C e D com os seguintes valores: Observando-os mais detalhadamente, notamos que em cada grupo os valores se distribuem diferentemente em relação à média 7. Necessitamos assim de uma medida estatística complementar para melhor caracterizar cada conjunto apresentado. As medidas estatísticas responsáveis pela variação ou dispersão dos valores de um conjunto são as medidas de dispersão ou de variabilidade, onde se destacam a amplitude total, a variância, o desvio padrão e o coeficiente de variação. Em princípio, diremos que entre dois ou mais conjuntos de dados, o mais disperso ( ou menos homogêneo ) é aquele que tem a maior medida de dispersão. 1 - A AMPLITUDE TOTAL Medida já apresentada na elaboração de uma distribuição de frequências com dados agrupados em classes, denotamos AT. 6. MEDIDAS DE DISPERSÃO Para representarmos cada conjunto, podemos calcular a sua respectiva média (Eq.(1)),encontrando X X X XA B C D= = = = 7 . Vemos assim que apesar de constituídos de valores diferentes, os grupos revelam uma mesma média aritmética. 25 AT X Xmáx mín= − , onde Xmáx = maior valor do conjunto e Xmín = menor valor do conjunto. 2- A VARIÂNCIA A variância de um conjunto de dados ( amostra ou população ) mede a variabilidade do conjunto em termos de desvios quadrados em relação à média aritmética do conjunto. É uma quantidade sempre não negativa e expressa em unidades quadradas do conjunto de dados, sendo de difícil interpretação. Definição 6.1: a) Seja um conjunto ( população ) constituído de N elementos X1, X2, . . ., XN. Sua variância denotada σ2 , é definida por: ( ) σ µ2 2 = −∑ X N i Eq (5) , onde µ = ∑ X N i é a média populacional b) Seja um conjunto ( amostra ) constituído de n elementos X1, X2, . . . , Xn. Sua variância, denotada S2 , é definida por: ( ) S X X n i2 2 1 = − − ∑ Eq (6) , onde X X n i = ∑ é a média amostral OBS.: A equação (6) é utilizada quando nosso interesse não se restringe à descrição dos dados mas, partindo da amostra, visamos tirar inferências válidas para sua respectiva população. No caso de estarmos interessados apenas na descrição dos dados, podemos usar no divisor n em lugar de n - 1 Exemplo 2: Determine a variância do seguinte conjunto(amostra) Xi : 2, 3, 5, 7, 8 De acordo com a equação (6) temos: ( ) ( ) ( ) ( ) ( ) S 2 2 2 2 2 22 5 3 5 5 5 7 5 8 5 5 1= − + − + − + − + − − , onde X X n i = = = ∑ 25 5 5 ( ) ( ) ( ) ( ) ( ) ∴ = − + − + + + = + + + + =S 2 2 2 2 2 23 2 0 2 3 4 9 4 0 4 9 4 26 4 =====> S2 = 6,5 CÁLCULO DA VARIÂNCIA EM UMA DISTRIBUIÇÃO DE FREQUÊNCIAS ( Caso de amostra ) Analogamente, a definição apresentada na Equação (6), temos 26 ( ) S X X f n i i2 2 1 = − ⋅ − ∑ Eq. ( 7 ) , onde fi : frequências de classes e n f i=∑ OBS.: No caso de dados agrupados os X is' são os pontos médios de classes. FÓRMULA ALTERNATIVA derivada da Equação ( 7 ) : ( ) S X f X f n n i i i i 2 2 2 1 = ⋅ − ⋅ − ∑ ∑ ou ( ) ( )S n X f X f n n i i i i2 2 2 1 = ⋅ − ⋅ × − ∑∑ Eq. ( 8 ) 3 - O DESVIO PADRÃO É uma outra medida de dispersão mais comumente empregada do que a variância, por ser expresso na mesma unidade do conjunto de dados. Mede a "DISPERSÃO ABSOLUTA" de um conjunto de valores e é obtida a partir da variância. Desvio Padrão = + Variância ( Raiz quadrada positiva da Variância ) Conforme, o conjunto de dados, trate-se de uma população ou uma amostra, teremos o desvio padrão dado por: População =====> ( ) σ µ = −∑ X N i 2 Amostra ======> ( ) S X X n i = − − ∑ 1 2 Do exemplo 2 , dado acima, temos o desvio padrão dado por S = 6 5, ====> S = 2,55 Exemplo 3: Calcular a variância e o desvio padrão para a distribuição de frequências das ALTURAS dos 29 estudantes de Cálculo das Probabilidades e Estatística I - Turno: Manhã, Turma: 04, Período: 97.1. ALTURAS (cm) No. Est fi P. Médio Xi X i 2 X fi i⋅ X fi i2 ⋅ 150 |---- 157 1 153,5 23562,25 153,5 23562,5 157 |---- 164 4 160,5 25760,25 642 103041,0 164 |---- 171 12 167,5 28056,25 2010 336675,0 171 |---- 178 9 174,5 30450,25 1570,5 274052,25 178 |---- 185 3 181,5 32942,25 544,5 98826,75 Total ou ∑ 29 4920,5 836157,5 Variância ==> S n Xi fi ( Xi fi ) n (n ) , ( , ) , , 2 2 2 1 29 836157 25 4920 5 2 29 28 37239 95 812 45 86= ⋅ ∗ − ∗∑∑ ∗ − = ∗ − ∗ = = 27 Portanto, a variância das alturas será: S , cm2 4586 2= Desvio Padrão ====> S cm cm= = =Variância 45 86 6 772, , 4 - O COEFICIENTE DE VARIAÇÃO É uma quantidade adimensional e serve para comparar dois ou mais conjuntos de dados de unidades diferentes. Mede a "DISPERSÃO RELATIVA" de um conjunto de dados. É expresso, usualmente, em percentagem ( % ). População ====> CV = × σ µ 100 , sendo que µ ≠ 0 Amostra ====> CV S X = × 100 , sendo que X ≠ 0. Exemplo 4: Calcule o coeficiente de variação (dispersão relativa) das ALTURAS dos 29 estudantes da Turma 04 - Turno da Manhã de Calc. Prob. Est I - Período: 97.1 - Tabela 1.4 Da distribuição das alturas, (tabela 1.4), temos: Altura média ===> X cm= 169 67, e o Desvio Padrão ===> S cm= 6 77, 1. Costa Neto, P.L.O. Estatística. Editora Edgar Blucher. 2. Mendenhall, W. Probabilidade e Estatística. Editora Campus, Vol. I e II. Portanto, ====> CV S X cm cm = × = × =100 6 77 169 67 100 3 99 , , , , ou seja CV = 3 99%, 7. REFERÊNCIAS BIBLIOGRÁFICAS
Compartilhar