Baixe o app para aproveitar ainda mais
Prévia do material em texto
Notas de Aulas - Prob. Estatística - 3º ano - Eng.Ambiental - Profa.Olga L.Anglas R.Tarumoto 1 PROBABILIDADE E ESTATÍSTICA (3 ANO - ENGENHARIA AMBIENTAL)! I. ESTATÍSTICA AMBIENTAL Estatística Ambiental" O termo " abrange vários assuntos com distintos níveis de profundidade. Em primeiro lugar, ele pode referir-se à informação quantificada do ambiente físico como, por exemplo, concentração de poluição do ar, de água e do solo, caracterização dos estoques florestais, minerais e da fauna e extensão da biodeversidade do país. Em segundo lugar, pode referir-se a valores monetários como, por exemplo, gastos relacionados com proteção ambiental e diminuição por parte das empresas, governo e domicílios ou gastos necessários para restaurar ecossistemas. Por último, o termo pode ainda referir-se a uma variedade de dados socioeconômicos como, por exemplo, sistemas de transporte poulição-intensivos, uso de energia, comportamento sobre a reciclagem de resíduos sólidos, uso de pesticidas e fertilizantes, e indicadores de saúde. Como as estatísticas ambientais saõ coletadas em fontes dispersas e, consequentemente, utilizam-se de conceitos e métodos diferentes, as classificações ambientais constituim-se em instrumentos básicos para assegurar sua articulação no tempo, no espaço e entre as diversas fontes através do uso de uma linguagem comum.Por isso as classificações se encontram em aberto, estando decididas somente as inclusas nas classificações internacionais. Assim os são gerados em estudos que visam caracterizar e"Dados Ambientais" descrever um processo ou estado do meio ambiente atendendo várias finalidades como monitoração, remediação e pesquisa ambiental. Por tanto a importância da Estatística nos Estudos Ambientais justifica-se pelo uso de ferramentas estatísticas no tratamento de dados ambientais. Notas de Aulas - Prob. Estatística - 3º ano - Eng.Ambiental - Profa.Olga L.Anglas R.Tarumoto 2 II. INTRODUÇÃO E CONCEITOS GERAIS 1. CONSIDERAÇÕES GERAIS. Porque estudar estatística? O conjunto de conceitos e métodos hoje conhecidos como ESTATÍSTICA, exerce um papel crescente na atividade humana, seja ela científica, comercial ou governamental. Decisões nas áreas econômicas, públicas ou privadas, são hoje dependentes do significado e da precisão de indicadores como taxas de emprego, de crescimento econômico, de preços ao consumidor, etc. , a adoção de novas práticas agrícolas ou cultivares dependem, ás vezes, de complexos esquemas de coletas e análise de dados; a avaliacão do sucesso da administração de tratamentos clínicos, como a vacinação, por exemplo, obedecem a critérios estatísticos, ou estudos demográficos como crescimento populacional, migração ou imigração têm a fundamental contribuição dos métodos estatísticos; estudos sócio-economicos ou políticos só são possíveis, frequentemente, por dispor a estatística de métodos que possibilitam estudar populações enormes a partir de pequenas amostras. Pode-se notar a partir desses poucos exemplos, a importância dessa disciplina como ferramenta necessária á compreensão dos fenômenos que se sucedem nas mais diferentes áreas e que faz parte de nosso cotidiano. 2. CONCEITO, DIVISÃO E LIMITAÇÕES Que é estatística? Historicamente, a estatística teve origem na necessidade que tinha o Estado Político de conhecer os seus domínios. Dessa relação nasceu, provávelmente, o nome derivado da palavra latina STATUS. Por uma transferência natural de significado, a palavra Estatística passou a compreender toda sorte de medidas para descrever numericamente situações diversas. Notas de Aulas - Prob. Estatística - 3º ano - Eng.Ambiental - Profa.Olga L.Anglas R.Tarumoto 3 Modernamente, entretanto, a Estatística está relacionada com o processo de descrição e inferência, em particular, com a eficiente sumarização dos dados, com o planejamento e análise de experimentos e levantamentos, com a natureza dos erros de observação e outras causas que provocam variação em um conjunto de dados. Assim podemos pensar na Estatística como a ciência que tem como objetivos fornecer subsídios para o planejamento e a condução de experimentos, bem como para a coleta, a descrição e a análise de dados e para a interpretação de resultados. Como pode ser dividida a estatística? Pelo próprio conceito, nota-se que a estatística pode ser dividida em duas partes ESTATÍSTICA DESCRITIVA OU DEDUTIVA: é a parte da estatística que cuida da apresentação dos dados de observação por meio de uso de tabelas, gráficos e de medidas dentre as quais se destacam as medidas de posição e de dispersão. ESTATÍSTICA ANALÍTICA OU INDUTIVA: é a parte da estatística que fornece métodos que propiciem a realização de inferências sobre populações a partir de amostras delas provenientes, tendo, por base o cálculo de probabilidades. Observação: O próprio termo "indutiva" decorre da.existencia de um processo de "indução", isto é, um processo de raciocínio em que, partindo-se do conhecimento de uma parte, procurase tirar conclusões sobre a realidade, no todo. O oposto ocorre nos processos de "dedução", em que, partindo-se do conhecimento do todo, concluímos exatamente sobre o que deve ocorrer em uma parte. Quais são suas limitações? A estatística, mesmo sendo um importante instrumento auxiliar na pesquisa e na interpretação dos fenômenos, tem suas limitações quanto ao uso. São elas: A estatística não serve para corrigir erros groseiros nem técnicas defeituosas. Como toda informação está contida nos dados, se esses dados são viciados será falsa qualquer conclusão que deles se tire. Notas de Aulas - Prob. Estatística - 3º ano - Eng.Ambiental - Profa.Olga L.Anglas R.Tarumoto 4 A estatistica não substitui o julgamento critico. Ela fornece critérios que auxiliam na tomada de decisões, mas não dispensa a análise crítica do pesquisador. EXEMPLO: Um comprador de certo frigorifico deve comprar um lote de 10.000 frangos de 45 dias, produzidos em certa granja. Sabe?se que a avaliação do custo do lote ,é feita em função do seu peso médio, em kg. , desconhecido. Diante da impossibilidade de pesar cada um dos 10.000 animais (população objeto), o comprador retira uma amostra aleatória de = 50 frangos (veremos mais adiante se esse "tamanho" de amostra é8 suficiente), que apresenta um peso médio de 1,8 kg. . Com base nesse resultado amostral, que inferências pode o comprador fazer sobre o verdadeiro valor do parâmetro populacional? 3. POPULAÇÃO E AMOSTRA. População: é um conjunto de elementos com uma ou mais características em comum. Observação: essa característica em comum deve delimitar inequivocamente quais os elementos que pertencem á população e quais os que não pertencem. Assim, em qualquer estudo estatístico, temos sempre em mente pesquisar uma ou mais características dos elementos de alguma população, portanto, os dados que observaremos, na tentativa de tirar conclusões sobre o fenômeno que nos interessa, serão referentes a elementos dessa população. Amostra: é um subconjunto dessa população. Observação: é um número finito pois todos os seus elementos serão examinados para efeito da realização do estudo estatístico desejado. É intuitivo que, quanto maior for o tamanho da amostra, mais precisas e mais confiáveis deverão ser as induções realizadas sobre a população (é dezir podemos concluir que os resultados mais perfeitos seriam obtidos pelo exame completo de toda a população, ao qual se acostuma denominar censo ou recensamento). Essa conclusão é válida em teória, mas na prática, muitas vezes, não se verifica. Notas de Aulas - Prob. Estatística - 3º ano - Eng.Ambiental - Profa.Olga L.Anglas R.Tarumoto 5 4. VARIÁVEIS. TIPOS DE VARIÁVEIS. Dados Estatísticos: Os dados estatísticos se obtém mediante um processo que envolve a observação ou outra mensuração de itens. Tais itens chaman-se variáveis, porque originam valores que tendem a exibir certo grau de variabilidade quando se fazemmensurações sucessivas. Uma vez dispondo-se dos resultados observados (sejam populacionais ou amostrais) o passo seguinte deverá ser, necessariamente, extrair as informações contidas nesses resultados. No entanto, é preciso antes, de mais nada, que se tenha(m) bem definida(s) qual(is) a(s) característica(s) de interesse que deverá(ão) ser verificadas. Ou seja, não iremos trabalhar estatisticamente com os elementos existentes, mas com alguma(s) característica(s) desses elementos que seja(m) fundamental(is) ao nosso estudo. Observamos, portanto, que iremos sempre trabalhar com os valores de alguma variável de interesse, e não com os elementos originalmente considerados. A escolha das variáveis de interesse dependerá, em cada caso, dos objetivos do estudo estatistico em questão. . De modo geral, dividiremos as variáveis em dois grupos: variáveis qualitativas e variáveis quantitativas. a) Variáveis Qualitativas. São aquelas usadas para descrever qualidades, atributos, categorias, etc. Em geral a menos de especificações, não podem ser comparadas a conjuntos numéricos. As variáveis qualitativas podem ser classificadas em ordinais e nominais. : Quando houver um sentido de ordenação em seusal) Variável Qualitativa ordinal possíveis valores. Exemplo: Conceito obtido pelos alunos em Estatística (ruim, médio, bom, ótimo). : Quando não houver sentido de ordenação ema2) Variável Qualitativa nominal seus valores. Exemplo: sexo (masculino, feminino). Notas de Aulas - Prob. Estatística - 3º ano - Eng.Ambiental - Profa.Olga L.Anglas R.Tarumoto 6 b) Variáveis Quantitativas. São aquelas que descrevem quantidades e, desse modo, podem ser comparadas a conjuntos numéricos. As variáveis quantitativas serão aqui classificadas em discretas e contínuas. : São aquelas usadas para descrever dadosb1) Variável Quantitativa Discreta discretos, isto é, aquelas que assumem apenas determinados valores no campo dos números reais. Exemplos: número de carros que atravessam num pedágio em certo dia, número de crianças que nascem numa cidade, número de pessoas por familia, etc. : São aquelas usadas para descrever dadosb2) Variável Quantitativa Contínua contínuos, isto é, aquelas que podem teoricamente assumir qualquer valor de um subconjunto de números reais. Exemplos: renda familiar, peso, distância, tempo, etc. Pelos exemplos apresentados, podemos perceber que os valores das variáveis discretas são obtidos mediante alguma forma de contagem, ao passo que os valores das variáveis continuas resultam, em geral, de uma medição, sendo frequentemente dados em alguma unidade de medida. Outra diferença entre os dois tipos de variáveis quantitativas está na interpretação de seus valores. Assim, a interpretação de um valor de uma variável discreta é dada exatamente por esse mesmo valor. A interpretação de um valor de uma variável contínua, ao contrário, é a de que se trata de um valor aproximado. Notas de Aulas - Prob. Estatística - 3º ano - Eng.Ambiental - Profa.Olga L.Anglas R.Tarumoto 7 III. TRATAMENTO DOS DADOS OBSERVADOS. (ESTATÍSTICA DESCRITIVA) O significado de um conjunto de dados, muitas vezes, so é comprendido ou visualizado quando esses dados vêm apresentados ou sumarizados numa forma eficiente. A parte da estatística que trata da apresentação e sumarização de dados recebe o nome de estatística descritiva que pode ser esquematizada como segue: Como seu própio nome diz, estatística descritiva é a parte da estatística que cuida da descrição de dados, quer sejam eles amostrais ou populacionais. OBJETIVOS: - Fornecer subsídios para que o usuario possa descrever de modo simples e eficiente seus dados de interesse. - Possibilidade de ''enxugar'' e ''polir'''grandes massas de dados, apresentando-as de forma consistente e resumida simplificando sensivelmente sua interpretação. 1. Após a definição do problema a ser estudado e oCOLETA DE DADOS. estabelecimento do planejamento da pesquisa (forma pela qual os dados serão coletados, cronograma de atividades, custos envolvidos, exame da informações disponíveis, delineamento da amostra, etc. ), o passo seguinte é a coleta de dados, que consiste na busca ou compilação dos dados das varíaveis, componentes do fenômeno a ser estudado. Existem dois tipos de coleta de dados: direta e indireta. : Quando os dados são obtidos na fonte originária. Os valores assim Direta compilados são chamados de dados primários. Exemplos: nascimentos, casamentos e óbitos, registrados no cartório de registro civil; opiniões obtidas em pesquisas de opinião pública; vendas registradas em notas fiscais da empresa, etc. Notas de Aulas - Prob. Estatística - 3º ano - Eng.Ambiental - Profa.Olga L.Anglas R.Tarumoto 8 Indireta: Quando os dados obtidos provém da coleta direta. Os valores assim compilados são chamados de dados secundários. Exemplos: o cálculo do tempo de vida média , obtida pela pesquisa, nas tabelas demográficas publicadas. Quanto ao tempo, a coleta pode ser classificada em : contínua, periódica e ocasional. : Quando é realizada permanentemente (registros).Contínua : Quando é feita em intervalos de tempo (censos).Periódica : quando é efetuada sem época preestabelecida ( pesquisas de opiniãoOcasional pública). 2. Objetivando a eliminação de erros capazes de provocarCRITICA DOS DADOS. futuros enganos de apresentação e analíse, procede-se a uma revisão crítica dos dados, suprimindo os valores extranhos ao levantamento. Existem dois tipos de critica: externa e interna. A critica é dita externa quando visa as causas dos erros que podem se dar por distração do observador, ou pela má interpretação das perguntas de um questionario, e é interna quando diz respeito á verificaçào da exatidão das informações obtidas. Quando trabalhamos com dados numéricos, deparamo-nos sempre com duas situações distintas: os dados representam uma variável discreta ou os dados representam uma variável contínua. Não é surpresa para ninguém que, ao se repetir uma medição com o mesmo instrumento varia vezes, registramos valores distintos. Isto significa que existe sempre uma diferença entre o valor real da medida e o registrado e essa discrepância chamamos de erro. Erros de uma medida.- na determinação de uma medida podem ser cometidos erros que dependem, uns do observador e outros dos instrumentos usados. Podem ser considerados três tipos de erros que podem ser cometidos ao ser efetuada uma medida. Notas de Aulas - Prob. Estatística - 3º ano - Eng.Ambiental - Profa.Olga L.Anglas R.Tarumoto 9 : erros cometidos por falha do observador no manuseio doErros grosseiros instrumento de medida. : erros que dependem do instrumento de medida.Erros sistemáticos : erros que não dependem do observador nem do instrumento deErros acidentais medida. São compensados e de certo modo se anulam para uma grande quantidade de medidas. 3. Após a critica dos dados, convém organizar osAPRESENTAÇÃO DOS DADOS. dados de maneira pratica e racional, para o melhor entendimento do fenômeno que se está estudando. Esta organização denomina-se Série Estatística. Série Estatística.- Conjunto de dados homogêneos expressos por quantidades absolutas ou relativas, discriminados segundo diversas modalidades e ordenados de acordo com as medidas de determinada circunstância de observação ao qual respectivamente correspondem. Os valores numéricos que constituem a série estatística chaman-se têrmos da série. Essa séries podem ser ou não agrupados pelo que são conhecidas por: séries de dados agrupados e séries de dados não-agrupados. Considerando as séries estatísticas como constituídas por um conjunto de valores numéricos resultantes da observação, podem ser classificadas em: 1. Série cronológica, temporal, evolutiva ou histórica: é a série estatística cujos dados estão dispostos em correspôndencia com o tempo, ou seja, variam com o tempo. 2. Série geográfica, territorial ou localização: é a série estatística cujos dados são dispostos emcorrespôndencia com a região georáfica, isto é, variam com o local. 3. Série específica, qualitativa ou categóricas: é a série estatística cujos dados estão dispostos em correspôndencia co a espécie ou qualidade ao qual pertencem. 4. Série de frequências: é a série estatística cujos dados estão agrupados com suas respectivas frequências absolutas. Notas de Aulas - Prob. Estatística - 3º ano - Eng.Ambiental - Profa.Olga L.Anglas R.Tarumoto 10 Um conjunto de dados deve ser resumido e qualificado de acordo com critérios convenientes já que, dificilmente, pode-se tirar conclusões válidas de dados não ordenados. Os dados estatísticos depois de apurados podem ser expostos em tabelas ou gráficos apropriados. Quando descrevemos dados em tabelas e gráficos, temos por objetivo resumir e simplificar sua exposição, induzindo a interpretações mais rápidas, eficientes e seguras. Nesse contexto as tabelas e gráficos têm sido usados para sintetizar a descrição de dados nas mais diversas áreas do conhecimento humano. 3.1 TABELAS Uma tabela ou quadro pode ser definida, de maneira simples, como sendo uma disposição escrita, e em certa ordem, que se obtém a partir de uma coleção de dados numéricos provenientes de uma pesquisa qualquer. Existem normas nacionais para a apresentação de tabelas, ditados pelo Conselho Nacional de Estatística mediante resolução N 886, de 26 de outubro de 1966 sob a denominação de "Normas Técnicas! para a Apresentação Tabular da Estatística Brasileira". Uma tabela compõe-se de elementos esenciais e elementos complementares. Os elementos essenciais são: : é a indicação que precede a tabela contendo a designação do fatoTítulo observado, o local e a época em que foi registrado (o que?, onde?, quando?). : é o conjunto de linhas e colunas onde estão inseridos os dados.Corpo : é a parte superior da tabela que especifica o conteúdo das colunas.Cabeçalho : é a parte da tabela que indica o conteúdo das linhas.Coluna indicadora Os elementos complementares são: : entidade que fornece os dados ou elabora a tabela.Fonte : informações de natureza geral, destinadas a conceituar ou esclarecer oNotas conteúdo das tabelas. : são informações específicas destinadas a esclarecer ou conceituarChamadas dados numa parte da tabela. Estes elementos complementares se situam, de preferência, no rodapé da tabela. Notas de Aulas - Prob. Estatística - 3º ano - Eng.Ambiental - Profa.Olga L.Anglas R.Tarumoto 11 3.2 GRÁFICOS. Através da forma gráfica, o observador obtém com rapidez e facilidade praticamente todas as informações sobre o comportamento dos dados observados. Não há apenas uma maneira de representar graficamente os dados. A escolha do gráfico mais apropriado ficará a critério do analista. Um gráfico é um conjunto de figuras geométricas (pontos, linhas, superfícies ou volumes) que representam a relação entre as variáveis. Assim, através de figuras geométricas, a análise do fenômeno será de compreensão mais rápida. Um gráfico vai depender da natureza dos dados ao qual pertencem e a finalidade para a qual ele é recomendaddo. Estas representações gráficas chaman-se gráficos ou diagramas. Os gráficos, quanto á forma, classificam-se em: a) : por pontos, por linhas e por superficies (g. colunas, g. barras, g.Diagramas porcentagens complementartes, g. setores e histogramas); b) : representação por intermédio de uma carta geográfica;Cartogramas c) : representação por meio de símbolos representativos do fenômeno;Pictogramas d) : representação por meio de corpos sólidos geométricos.Estereogramas Os gráficos, quanto a finalidade, podem ser analitícos, informativos e comparativos. a) os analíticos têm por finalidade analisar o comportamento de um fenômeno. b)os informativos têm por finalidade informar o andamento de um fenômeno; c) os comparativos têm por finalidade confrontar fenômenos, como, por exemplo, o fenômeno produção e consumo. Notas de Aulas - Prob. Estatística - 3º ano - Eng.Ambiental - Profa.Olga L.Anglas R.Tarumoto 12 3.3 ALGUMAS RECOMENDAÇÕES PARA A CONSTRUÇÃO DE TABELAS E GRÁFICOS. Tabelas. A apresentação de dados em tabelas obedecem a certos critérios ou normas: Sequem em baixo algumas das principais recomendações e normas: - Alguns sinais convencionais a serem usados são: - (traço) - quando o dado for zero. ... (três pontos) - quando não se dispoe do dado. x (xis) - quando o dado for omitido. ? (interrogação) - quando há dúvida sobbre a veracidade da informação. - A indicação da data de referência deverá ser como nos seguintes casos: 1892-915 - quando varia o século. 1960-65 - quando varia anos consecutivamente dentro de um século. 1950-1965 - quando se indica uma série de anos não consecutivos. 1960/61 - período de doze meses diferente do ano civil. - Com relação aos dados propiamente ditos: A parte inteira deverá ser separada por pontos em classes de três números da direita para a esquerda, exceto os números tradicionalmente escritos de outra forma. A separação da parte inteira da decimal será feita através de vírgula. Em caso de arrendondamento adiciona-se uma unidade ao último que permanecerá se o primeiro a ser desprezado for 5 0u maior. Conserva-se inalterado caso seja menor que 5. - Para a apresentação da tabela: Excluídos os títulos, as tabelas deverão ser delimitadas, no alto e baixo, por traços horizontais. Recomenda-se não delimitá-las á esquerda e á direita. É facultativo o uso de traços verticais para separação de colunas no corpo da tabela. Quando, por excessiva altura, tiver que ocupar mais que uma página, não será delimitada inferiormente, repetindo-se o cabeçalho na página seguinte. Deve-se usar Notas de Aulas - Prob. Estatística - 3º ano - Eng.Ambiental - Profa.Olga L.Anglas R.Tarumoto 13 nesse caso, no alto do cabeçalho ou dentro da coluna indicadora a palavra continuação ou conclusão, conforme o caso. Se possuir muitas linhas e poucas colunas poderá ser disposta em duas ou mais partes, lado a lado, separando-se as partes por um traço duplo. Sua disposição deverá estar na posição normal de leitura. Caso isso não seja possível, a apresentação será feita de forma que a rotação da página seja não sentido dos ponteiros do relógio. Gráficos. Muito embora a confecção de gráficos dependa muito da habilidade individual, algumas regras gerais são importantes: - Os gráficos, geralmente são construídos num sistema de eixos chamado sistema cartesiano ortogonal. A variável independentemente normalmente é localizado no eixo horizontal, chamado eixo das abcissas, enquanto que a variável dependente é colocada no eixo vertical, chamado eixo das ordenadas. No eixo vertical, o início da escala deverá ser sempre zero, ponto do encontro dos dois eixos. - Iguais intervalos para as medidas originais deverão corresponder iguais intervalos nas escalas. Por exemplo, se ao intervalo 10-15 kg. corresponde 2 cm. na escala, ao intervalo 40-45 kg. deverá corresponder 2cm., ao intervalo 40-50 corresponderá 4cm. e assim por diante. - O gráfico deverá possuir, título, notas, rodapé e legendas, toda informação necessária a sua compreensão, sem auxilio do texto. - Se, no gráfico, for feita alguma comparação, deve-se usar figuras diferentes que deverão estar, senão adjacentes, o mais próximo possível. - Contudo, os elementos simplicidade, clareza e veracidade devem ser considerados quando da elaboração de um gráfico. Notas de Aulas - Prob. Estatística - 3º ano - Eng.Ambiental - Profa.Olga L.Anglas R.Tarumoto 14 4. DISTRIBUIÇÃO DE FREQUÊNCIA Por constituir-se no tipo de tabela mais importante para a Estatística Descritiva, faremos um estudo completo das Distribuições de Frequência. Em uma pesquisa, depois dos dados serem coletados, criticados, apurados e apresentados, tanto na forma tabular quanto na gráfica, passamos a sua descrição, que é o estudo preliminar do comportamento da característica de interesse, o que ajudará na interpretaçãodo fenômeno.Essa descrição dos dados depende tanto do tipo de variável com que estamos trabalhando (característica) como também da quantidade de observações realizadas.Combinando o tipo de variável e a quantidade de observações, temos uma tabela que tem como objetivo resumir as informações provenientes dos dados da pesquisa e a qual chamaremos de Distribuição de Frequências. Elementos para a construção de uma distribuição de frequência: Dados Brutos: É o conjunto dos dados numéricos obtidos após a crítica dos valores colectados. Rol: É o arranjo dos dados brutos em ordem de frequência crescente ou decrescente. Amplitude Total ( )V : Ë a diferença entre o maior e o menor valor observado. Frequência Absoluta ( )03 : É o número de vezes que o elemento aparece na amostra ou população, ou o número de elementos pertenecentes a uma classe. Distribuição de Freqüências: É o arranjo dos valores e suas respectivas freqüências. Número de Classes ( )5 : Não há uma fórmula exata para o cálculo do número de classes. Apresentaremos duas soluções: a) Se =5 ou se 8 Ÿ #& Ê 5 8 #& Ê 5 ¶ 8È b) Fórmula de Sturges : , onde tamanho da amostra.5 ¶ " $ß $# 691Ð8Ñ 8 œ Notas de Aulas - Prob. Estatística - 3º ano - Eng.Ambiental - Profa.Olga L.Anglas R.Tarumoto 15 Observação: O número de classes, como norma geral, não deverá ser inferior a 5 nem superior a 15, pois em ambos os casos a eficiência da sumarização estaria comprometida. Amplitude das Classes ( )2 : h onde: = amplitude total e = número de classes.¶ ß V 5V5 Limite das Classes: Existem diversas maneiras de expressar os limites das classes. Sejam + 6 , 6 + ,Þ= e = , onde M W a) |----| : comprende todos os valores entre e .+ , + , b) |---- : comprende todos os valores entre e , excluindo o .+ , + , , c) ----| : comprende todos os valores entre e , excluindo o .+ , + , + d) ---- : comprende todos os valores entre e , excluindo e .+ , + , + , Pontos Médios das Classes ( )B3w : É a média aritmética entre o limite superior e o limite inferior da classe. Assim, B3 w +, #= , é o ponto médio da classe. Frequência Absoluta Acumulada (F )+- : É a soma das frequências absolutas dos valores inferiores ou iguais ao valor dado. Frequência Relativa ( 0 Ñ3w À 0A frequência relativa de umvalor é dado por, = , ou3w 083 seja, é a porcentagem daquele valor na amostra. Observação: = 1.! 3œ" 8 3 w0 Frequência Relativa Acumulada (F )+-w : É a soma das frequências relativas dos valores inferiores ou iguais ao valor dado. Histograma: É a representação gráfica de uma distribuição de frequências por meio de retangulos justapostos. Polígono de Frequências: É a representação gráfica de uma distribuição de frequências por meio de um polígono. Polígono de Frequências Acumulada ( Ogiva de Galton). Notas de Aulas - Prob. Estatística - 3º ano - Eng.Ambiental - Profa.Olga L.Anglas R.Tarumoto 16 5. ANÁLISES DOS DADOS (MEDIDAS DESCRITIVAS OU ESTATÍSTICAS). Até aqui, vimos a sintetização dos dados sob a forma de tabelas, gráficos e distribuições de frequências. Em muitas situações, entretanto, são necessárias "medidas" que caracterizem mais precissamente um conjunto de dados. Ou seja, vamos aprender o cálculo de medidas que têm como propósito a redução dos dados a um pequeno número de valores denominados "estatísticas", fornecendo toda a informação relevante com referência à população. Estudaremos a descrição paramétrica dos dados no tocante à sua tendência central, sua dispersão, sua forma e seu relacionamento funcional. Em outras palavras, apresentaremos regras para quantificar tais características. 5.1 MEDIDAS DE POSIÇÃO. Medidas de posição ou de têndencia central são aquelas medidas que objetivam representar o ponto de equilibrio ou o centro de uma distribuição de um conjunto de dados. Existem várias medidas de tendência central, cada qual utilizada dentro de um contexto especifico. As mais utilizadas são a média aritmética, a mediana e a moda, embora outras sejam úteis em algumas situações como a média geométrica, média harmônica, etc. 1. MÉDIA ARITMÉTICA ( _ ).B A média aritmética, pela sua facilidade de uso, de cálculo e de comprensão aliada à potencialidade de uso para propósitos de inferência e, ainda, ás suas propriedades matemáticas, é a medida de posição mais conhecida e utilizada. A média aritmética pode ser de dois tipos: a simples e a ponderada. A média aritmética simples é calculada considerando-se que todas as observações devem de participar com o mesmo peso, enquanto que, na ponderada, cada observação participa com seu respectivo peso. Notas de Aulas - Prob. Estatística - 3º ano - Eng.Ambiental - Profa.Olga L.Anglas R.Tarumoto 17 Segundo a forma na qual os dados estão agrupados temos que o cálculo da média aritmética simples é dado por À a) Dado um conjunto de observações , , ..., , portanto, " "Dados sem agrupar.- B B B 8" # 8 valores da variável X. Define-se média aritmética simples ou simplesmente média como: B œ ! 3œ" 8 3B 8 b) Quando os dados estiverem agrupados numa distribuição deDados Agrupados.- frequência usaremos a média aritmética simples dos valores observados ponderados pelas respectivas frequências absolutas. b1) Caso Discreto: B œ ! ! 3œ" 7 3 3 3œ" 7 3 B 0 0 onde: é o número de elementos do conjunto e é o número de classes),! 3œ" 7 30 œ 8 Ð 8 7 são os valores que assume a variável X, e são suas frequências absolutasB 03 3 correspondentes. b2) Caso Contínuo: B œ ! ! 3œ" 7 w 3 3 3œ" 7 3 B 0 0 onde: ( é o número de elementos do conjunto e é o número de classes),! 3œ" 7 30 œ 8ß 8 7 são os pontos médios das classes , e são suas frequências absolutasB 0w3 3 correspondentes. 2. MEDIANA (Me). Dado um conjunto de observações portanto " " valores daB ß B ß ÞÞÞ ß B ß ß 8" # 8 variável X; cujos valores estão ordenados num rol crescente ou decrescente. Define-se mediana como o valor que divide esse rol em duas partes iguais. Notas de Aulas - Prob. Estatística - 3º ano - Eng.Ambiental - Profa.Olga L.Anglas R.Tarumoto 18 a) Se os dados estão dispostos num:Dados Sem Agrupar.- al) Rol Impar: A mediana é igual ao valor numérico correspondente ao elemento 8" # Þ a2) Rol Par: A mediana é igual à média dos valores númericos correspondentes aos elementos e 8 8# # "Þ b) Se os dados estão dispostos numa distribuição de frequências.Dados Agrupados.- bl) Tanto para " " impar como para " " par, o procedimento paraCaso Discreto: 8 8 encontrar o valor da mediana é igual ao critério considerado para os dados sem agrupar. Para identificá-lo, abre-se a coluna da frequência absoluta acumulada ( F ) e por meio+- dessas frequências acumuladas encontra-se o valor ( ) correspondente à mediana.B3 b2) Procedimento:Caso Contínuo: 1. Calcula-se a ordem . Como a variável é contínua, não se preocupe se " " é par ou8# 8 impar. 2. Pela coluna de frequência acumulada ( F ) identifica-se a classe ou intervalo que+- contém a mediana ( classe Me ). 3. Utiliza-se a fórmula: Me œ 6 2Q/ Q/ J 0 Œ 8# +8> Q/ onde: é o limite inferior da classe Me,6 œQ/ é a frequência acumulada da classe anterior á classe Me,J œ+8> é a frequência absoluta simples da clase Me,0 œ Q/ é a amplitude da classe Me,2 œQ/ é o número de elementos do conjunto.8 œ 3. MODA ( Mo). Dado um conjunto de observações portanto " " valores daB ß B ß ÞÞÞ ß B ß 8" # 8 variável X. Define-se moda como o valor que ocorre com maior frequência ou seja é o valor que aparece mais frequentemente. Notas de Aulas - Prob. Estatística - 3º ano - Eng.Ambiental - Profa.Olga L.Anglas R.Tarumoto 19 a) A moda é obtida por simple contagem.Dados Sem Agrupar.- Observação: Quando o conjunto de dados apresentar somente um valor para a moda, dizemos que ela é "unimodal"; se apresentar dois valores para a moda, dizemos que ela é "bimodal"; e se apresentar mais valores "multimodal". A moda étambém muito utilizada em variáveis qualitativas. b) Se os dados estão dispostos numa distribuição de frequências.Dados Agrupados.- b1) A .moda é obtida pela simples observação do elemento queCaso Discreto: apresenta maior frequência absoluta. b2) Para dados agrupados em classes ou intervalos a moda éCaso Contínuo: calculada mediante diversas formas. Consideramos dois processos: Primeiro Processo: Fórmula de Czuber. 1. Identifica-se a classe modal ( classe Mo ) ou seja aquela que possui maior frequência absoluta. 2. Aplica-se a fórmula: Mo œ 6 2Q9 Q9˜˜ ˜ " " # onde: é o limite inferior da classe Mo6 œ ßQ9 ˜ œ 0 0 ß" Q9 +8> ˜ œ 0 0 ß# Q9 :9= com sendo a frequência absoluta simples da classe anterior a classe Mo, e sendo0 0+8> :9= a frequência absoluta simples da classe posterior a classe Mo. é a amplitude da classe Mo,2 œQ9 é o número de elementos do conjunto.8 œ Segundo Processo: Determinação gráfica da moda. Notas de Aulas - Prob. Estatística - 3º ano - Eng.Ambiental - Profa.Olga L.Anglas R.Tarumoto 20 É preciso construir o histograma de frequências da distribuição, identificar a classe modal (aquela com maior altura) e proceder da forma seguinte: a moda pode ser obtida como a projecão do ponto de interseção entre as semiretas que unem convenientemente, no histograma, o retángulo que descreve a classe modal e seus adjacentes. RELAÇÃO ENTRE MÉDIA, MEDIANA E MODA. Quando uma distribuição é simétrica, as três medidas coincidem. Porém, a assimetria torna-as diferentes e essa diferença é tanto maior quanto maior e a assimetria. Assim, em uma distribuição em forma de sino, temos: x Me Mo, no caso da curva simétrica;œ œ Mo Me x, no caso da curva assimétrica positiva; x Me Mo, no caso da curva assimétrica negativa. Notas de Aulas - Prob. Estatística - 3º ano - Eng.Ambiental - Profa.Olga L.Anglas R.Tarumoto 21 5.2 MEDIDAS DE DISPERSÃO. As medidas de dispersão são estatisticas descritivas que visam fornecer o grau de variabilidade das observações, geralmente utilizando como padrão uma medida de tendência central. Assim, duas distribuições poderão estar centradas no mesmo ponto, mas as observações poderão estar muito mais dispersas numa distribuição da que na outra. Dessa forma, enquanto uma medida de tendência central indica a posição de uma distribuição, uma medida de dispersão indicará o formato dessa distribuição. Portanto, nosso interesse será medir o grau de concentração ou dispersão dos dados em torno da média.Tal como as medidas de posição, existem várias medidas de dispersão, sendo as principais as que seguem: 1) AMPLITUDE TOTAL ( ).V É a diferença entre o maior e o menor dos valores da série. Indicaremos: V B B = 7+B 738 A utilização da amplitude total como medida de dispersão é muito limitada, pois, sendo una medida que depende apenas dos valores externos, é instável, não sendo afetada pela dispersão dos valores internos. #ÑDESVIO MÉDIO ( .HQ Ñ Considerando nosso propósito de medir a dispersão ou o grau de concentração dos valores em torno de uma medida de tendência central, nada mais interessante que estudarmos o comportamento dos desvios de cada valor em relação da média. No entanto, lembrando que , para resolver esse problema definiu-se o desvio médio! 3œ" 8 3ÐB BÑ œ ! como sendo a média dos módulos dos desvios (valor absoluto) , ou seja: Notas de Aulas - Prob. Estatística - 3º ano - Eng.Ambiental - Profa.Olga L.Anglas R.Tarumoto 22 a) Dados Sem Agrupar: HQ œ ! 3œ" 8 3lB Bl 8 b) Se os dados estão dispostos numa distribuição de frequências.Dados Agrupados: bl) Caso Discreto. HQ œ ! ! 3œ" 7 3 3 3œ" 7 3 lB Bl0 0 b2) Caso contínuo: HQ œ ! ! 3œ" 7 w 3 3 3œ" 7 3 lB Bl0 0 em ambos casos, ! 3œ" 7 30 œ 8Þ Observação: De maneira similar se for escolhido a mediana. O desvio médio é uma boa medida de dispersão se o objetivo for somente a obtenção de uma estatística que represente a dispersão, ou seja, calculando com objetivo meramente descritivo. 3. Variância Ð5#ÑÞ A variância é a medida de dispersão mais utilizada, desempenhando papel fundamental nos processos de inferência estatistica. Assim, a variância é definido como: Dada uma variável X: 2, , define-se sua variância populacional como aB ß 3 œ "ß ÞÞÞß R3 média dos quadrados dos desvios, ou seja: 5# ÐB Ñ Rœ ! 3œ" R 3 #. Observação: indica a variância e lê-se sigma ao quadrado e é a média da população.5 .# Notas de Aulas - Prob. Estatística - 3º ano - Eng.Ambiental - Profa.Olga L.Anglas R.Tarumoto 23 Seus estimadores assumem as seguintes formas: a) Dados Sem Agrupar: 5^ # # ÐB BÑ 8"œ = œ ! 3œ" 8 3 # b) Se os dados estão dispostos numa distribuição de freqüências.Dados Agrupados: b1) Caso Discreto: 5^ # # ÐB BÑ 0 8"œ = œ ! 3œ" 7 3 3 # b2) Caso Continuo: 5^ # # ÐB BÑ 0 8"œ = œ ! 3œ" 7 w # 3 3 onde: média amostral, freqüência absoluta, pontos médios das classes.B œ 0 œ B œ 3 w3 4. DESVIO PADRÃO ( )5 Define-se desvio padrão de uma variável X: , , 2, ... , , como a raizB 3 œ " R3 quadrada positiva de sua variância: 5 5œÈ # Seus estimadores seguem a mesma idéia: 5^ œ = œ =È # 5. Coeficiente de Variação ( GZ ÑÞ Trata-se de uma medida relativa de dispersão, útil para a comparação em termos relativos do grau de concentração em torno da média de séries distintas. É dado por: GZ œ GZ5B B =100 ou = 100 Notas de Aulas - Prob. Estatística - 3º ano - Eng.Ambiental - Profa.Olga L.Anglas R.Tarumoto 24 Para efeitos práticos, costuma-se considerar que superior a 50% indica altoGZ grau de dispersão e, consequentemente, pequena representatividade da média. Enquanto que para valores inferiores a 50%, a média será tanto mais representativa do fato quanto menor for o valor do seu .GZ 5.2 OUTRAS MEDIDAS: SEPARATRIZES, ASSIMETRIA E CURTOSES Estudaremos agora outras medidas que podem ser de grande interesse para a Análise Descritiva dos Dados. Dentre eles estão as Separatrizes, sobre as quais já fizemos menção anteriormente e, as medidas de Assimetria e Curtose, que nos permitem estudar a forma da distribuição dos dados. MEDIDAS SEPARATRIZES. Conforme vimos anteriormente, separatrizes são parâmetros que podem "partir" conjuntos de dados, segundo o interesse do usuário. Vimos, também, através das ogivas de Galton, como obter boas aproximações gráficas para as separatrizes mais utilizadas: a mediana, os quartis, os decis e os percentis. Veremos agora, com base na expressão já obtida para a mediana, algumas regras para a obtenção algébraica das demais separatrizes. 1. QUARTIS ÐU ÑÞ3 Os quartis dividem um conjunto de dados em quatro partes iguais. Analogamente, o primeiro e o terceiro quartis são obtidos como: U œ 6 2" U U Ð J Ñ 0" " 8 % +8> U" e U œ 6 2$ U U Ð J Ñ 0$ $ $8 % +8> U$ Notas de Aulas - Prob. Estatística - 3º ano - Eng.Ambiental - Profa.Olga L.Anglas R.Tarumoto 25 onde: e são os limites inferiores das classes que contém o quartil e o quartil6 6 UU U "" $ U$ respectivamente; é a frequência acumulada da classe anterior à classe que contém ou J U U à+8> " $ e são as freqüências absolutas simples das classes que contém ou 0 0 U U àU U " $" $ e são as amplitudes das classes que contém ou .2 2 U UU U " $" $ Observação: Observamos que M/ #œ U Þ 2. DECIS ( e PERCENTIS ( ).H Ñ T3 3 Continuando o estudo das medidas separatrizes temos os decis e percentis que dividem o conjunto de dados em 10 e 100 partes iguais respectivamente. De modo análogo podemos definir o i-ésimo decil, =1, 2, ... , 9, como:3 H œ 6 23 H H Ð 8J Ñ 03 3 3 "! +8> H3 e o i-ésimo percentil, i =1, 2, ... , 99, por: T œ 6 23 T T Ð 8J Ñ 03 3 3 "!! +8> T3 MEDIDAS DE ASSIMETRIA. Já foi comentado que, em uma distribuição simétrica, coincidem a média, a mediana e a moda e que os quartis ficam equidistantes da mediana , o que não ocorrenuma distribuição assimétrica. Assim ocorre muitas vezes, que podemos ter interesse em conhecer o grau de assimetria de uma distribuição. Dentre os vários estimadores da assimetria, apresentamos aqui o coeficiente de assimetria de Pearson, dado por, EWÐT Ñ œ BQ9 = Notas de Aulas - Prob. Estatística - 3º ano - Eng.Ambiental - Profa.Olga L.Anglas R.Tarumoto 26 e o coeficiente de assimetria de Yule, dado por, EWÐ] Ñ œ U U #UU U " $ # $ " onde: Se = 0 a distribuição é simétrica,EW Se a distribuição é assimétrica positiva,EW ! Se a distribuição é assimétrica negativa.EW ! MEDIDAS DE CURTOSEÞ Entende-se por curtose o grau de achatamento de uma distribuição. Com relação ao grau de achatamento, podemos ter: Dentre os vários coeficientes de curtose, apresentamos aqui o coeficiente de Keley, dado por, GÐOÑ œ U U#ÐT T Ñ $ " *! "! Notas de Aulas - Prob. Estatística - 3º ano - Eng.Ambiental - Profa.Olga L.Anglas R.Tarumoto 27 onde: Se , diremos que a curva da distribuição é mesocúrtica,GÐOÑ œ !Þ#'$ Se , diremos que a curva da distribuição é platicúrtica (maisGÐOÑ !Þ#'$ achatada) Se , diremos que a curva da distribuição é leptocúrtica (maisGÐOÑ !Þ#'$ afinada). Notas de Aulas - Prob. Estatística - 3º ano - Eng.Ambiental - Profa.Olga L.Anglas R.Tarumoto 28 IV. PROBABILIDADE. CONSIDERAÇÕES GERAIS. O estudo da probabilidade, fundamental em estatística, teve suas origens no século XVI, bem ulterior, portanto, ás da Estatística. Sua origem esta ligada ao estudo dos jogos de azar propostos pelo Cavalheiro de Mére aos matemáticos franceses Fermat e Pascal. No entanto, somente no século XX é que se desenvolveu uma teoria matemática rigorosa baseada em axiomas, definições e teoremas. Esses jogos de azar, que implicam em ações como girar uma roleta, lançar um dado ou uma moeda, retirar uma carta de um baralho, etc. tem duas características: a primeira é de incerteza de ocorrer determinado acontecimento, em determinada tentativa; a segunda é a de regularidade a longo prazo, que permite prever o número de vezes que ocorrerá determinado acontecimento em uma série de tentativas conduzidas de maneira uniforme. Assim, por exemplo, se vamos jogar uma moeda não-viciada uma única vez, é incerto ocorrer a face cara, mas se vamos jogar essa moeda um grande número de vezes, podemos prever que a face cara ocorrerá metade das vezes. CONCEITOS FUNDAMENTAIS. Todas as vezes que estudarmos alguns fenômenos de observação, cumpre-nos distinguir o própio fenômeno e o modelo matemático que melhor o explique. Na formulação do modelo matemático mais adequado deve-se levar em conta que certos pormenores sejam desprezados com o objetivo de simplificar o modelo. É evidente que a representatividade deste dependerá de que os detalhes desprezados sejam ou não importantes para a elucidação do fenômeno considerado. Notas de Aulas - Prob. Estatística - 3º ano - Eng.Ambiental - Profa.Olga L.Anglas R.Tarumoto 29 A comprovação do modelo matemático escolhido não pode ser feita antes que alguns dados de observação sejam obtidos. É a partir da comparação dos resultados previstos pelo modelo e de um determinado número de valores observados, que se irá concluir sobre a adequação do modelo escolhido. Os modelos matemáticos podem ser de dois tipos: determinísticos ou não- determinísticos (probabilísticos ou aleatórios). Modelo Determinístico.- É aquele modelo em que, a partir das condições em que o experimento é realizado, pode-se determinar seu resultado. Modelo Não-Determinístico.- É aquele modelo em que as condições de execução de um experimento não determinam o resultado final, mas sim o comportamento probabilístico do resultado observável. EXPERIMENTOS ALEATÓRIOS ( ).X Praticamente todos os fenômenos que ocorrem na natureza são aleatórios. Por exemplo, possivelmente mais de uma vez temos participado de uma aposta por meio de uma moeda. Nesta decisão na linguagem corrente, dizemos, ganha quem tem mais sorte, na teoria de probabilidades diremos que se determina aleatoriamente ou ao acaso o ganhador. De fato, antes de lançar a moeda não podemos afirmar quem vai ser o ganhador (característica de um experimento aleatório). Sem embargo, se a moeda for honesta (esta perfeitamente equilibrada) ambos tem as mesmas possibilidades de ganhar, em outras palavras não se favorece a nenhum. Este exemplo, nos dá uma ideia de experimento aleatório. Definição.- Chamamos de experimentos aleatórios ( ) aquele que, repetidos emX idênticas condições, produzem resultados diferentes. São características desses experimentos: a) Cada experimento poderá ser repetido sob as mesmas condições indefinidamente; b) Não se conhece um particular valor do experimento "a priori", porém podemos descrever todos os possíveis resultados (as possibilidades) do experimento; Notas de Aulas - Prob. Estatística - 3º ano - Eng.Ambiental - Profa.Olga L.Anglas R.Tarumoto 30 c) Quando o experimento for realizado repetidamente os resultados individuais parecem ocorrer de forma acidental. Contudo, se o experimento for repetido um grande número de vezes uma configuração definida ou regularidade surgirá. É esta caracteristica de fundamental importância para avaliarnos uma probabilidade. EXEMPLOS. ESPAÇO AMOSTRAL ( ).f Definição.- Chamamos espaço amostral ( ) associado a um experimento aleatório ( )f X ao conjunto formado por todos os resultados possíveis desse experimento Observação.- Podemos conceber o espaço amostral como um conjunto universal. Então, podemos falar de subconjuntos e elementos. EXEMPLOS. Algumas observações devem ser feitas em relação aos espaços amostrais aqui apresentados. Espaços Amostrais Discretos.- Se têm um número finito ou infinito numerável de elementos. Espaços amostrais discretos finitos: Se o espaço amostral tem um número finito de elementos. Espaços amostrais discretos infinitos: Quando se pode estabelecer uma correspondência um a um com o conjunto dos números inteiros positivos de modo que possa ser enumerado como 1, 2, 3, ... . Espaços Amostrais Contínuos.- Se têm um número não numerável de elementos, ou seja, cujos elementos são todos os pontos de algum intervalo. Notas de Aulas - Prob. Estatística - 3º ano - Eng.Ambiental - Profa.Olga L.Anglas R.Tarumoto 31 Observações.- 1) A fim de descrever um espaço amostral associado a um experimento, devemos ter uma idéia bastante clara daquilo que estamos mensurando ou observando. Por isso, devemos falar de "um" espaço amostral associado a um experimento, e não de "o" espaço amostral. 2) Observa-se, também, que o resultado de um experimento não é, necessariamente, um número. Pode ser uma letra, um vetor, uma função, etc. EVENTOS.- ( , , , ...)E F G Definição.- Denomina-se evento a todo conjunto particular de resultados de , ou ainda, af todo subconjunto de (relativo a um particular espaço amostral , associado a umf f experimento aleatório ). Denotaremos um evento por qualquer letra maiuscula doX alfabeto. Observações.- 1) Na terminologia dos conjuntos, um evento é um subconjunto de um espaço amostral .f 2) Em particular, e (conjunto vazio) são eventos, é dito o evento certo e o eventof 9 f 9 impossível. 3) Qualquer resultado individual pode também ser tomado como um evento. 4) Todo evento é composto de pontos amostrais. Os eventos que possuim um único ponto amostral ou um único elemento serão chamados eventos elementares. EXEMPLOS. Notas de Aulas - Prob. Estatística - 3º ano - Eng.Ambiental - Profa.Olga L.Anglas R.Tarumoto 32 COMBINAÇÕES DE EVENTOS. Como e os eventos a ele associados são conjuntos, as mesmas operaçõesf realizadas com conjuntos são válidas também para os eventos. Assim, se e sãoE F eventos de , pode-se dizer que:f a) União de dois eventos. Sejam e dois eventos; então será também um evento que ocorrerá se,E F E F- e somente se, ouou ambos ocorrem.E F b) Interseccão de dois eventos. Sejam e dois eventos; então será também um evento que ocorrerá se,E F E F+ e somente se, e ocorrerem simultaneamente. Em particular, dois eventos e sãoE F E F denominados mutuamente exclusivos, se eles não puderem ocorrer simultaneamente, isto é, = .E F g+ c) Complementar de um evento. Seja A um evento, então será também um evento que ocorrerá se, e somenteEG se, não ocorre.E EXEMPLOS. d) Se , , ... , for qualquer coleção finita de eventos, então será o eventoE E E E8 3 œ " " # 8 3- que ocorrerá se, e somente se, ao menos um dois eventos ocorrerE Þ3 e) Se , , ... , for qualquer coleção finita de eventos, então será o eventoE E E E8 3 œ " " # 8 3+ que ocorrerá se, e somente se, todos os eventos ocorrer.E3 f) Se , , ... , ... for qualquer coleção infinita (numerável) de eventos, então E E E E_ 3 œ " " # 8 3- será o evento que ocorrerá se, e somente se, ao menos um dois eventos ocorrer.E3 g) Se , , ... , , ... for qualquer coleção infinita (numerável) de eventos, então E E E _ 3 œ " " # 8 + E E3 3 será o evento que ocorrerá se, e somente se, todos os eventos ocorrerem. Notas de Aulas - Prob. Estatística - 3º ano - Eng.Ambiental - Profa.Olga L.Anglas R.Tarumoto 33 CONCEITOS DE PROBABILIDADE. Como a teoria das probabilidades esta, historicamente, ligada aos jogos de azar, esta associação gerou inicialmente um conceito chamado clássico ou probabilidade "A Priori" devido a Laplace. O conceito de frequência relativa como estimativa de probabilidade ou probabilidade "A Posteriori" surgiu posteriormente através de Richard Von Mises. Já no século XX, como a conceituação até então existente não era apropriada a um tratamento matemático mais rigoroso, KoImogoroff conceituou probabilidade através de axiomas rigorosos, tendo por base a teoria da medida. 1. Se um evento pode ocorrer de " " maneirasConceito Clássico ou "A Priori".- 2 diferentes, em um total de " " maneiras possíveis (todas igualmente prováveis), então a8 probabilidade do evento é 2Î8Þ EXEMPLOS. 2. Se após " " repetições de um experimentoConceito de Frequência ou "A Posteriori".- 8 ( suficientemente grande), se observan " " ocorrências de determinado evento, então a8 2 probabilidade do evento é . Essa probabilidade é chamada também de probabilidade2Î8 empírica. EXEMPLOS. Tanto o conceito clássico, como o conceito de frequência, presenta sérias dificultades: o primeiro, porque a expressão "igualmente provável" é assaz vaga; e o segundo, porque é igualmente vaga a expressão "suficientemnte grande". Dificultades tais levam aos matemáticos, a procurar uma definição axiomática de probabilidade. 3. Conceito Moderno ou Axiomático. Definição.- Seja um experimento aleatório. Seja um espaço amostral associado a .X f X A cada evento associaremos um número real representado por ( ) e denominadoE T E probabilidade do evento , que satisfaça as seguintes condições ou axiomas:E Notas de Aulas - Prob. Estatística - 3º ano - Eng.Ambiental - Profa.Olga L.Anglas R.Tarumoto 34 1) 0 ( ) 1.Ÿ T E Ÿ 2) ( ) 1.T œf 3) Se e forem eventos mutuamente exclusivos, ( ) = ( ) + ( ).E F T E F T E T F- 4) Se , , ...,A , ... forem, dois a dois, eventos mutuamente exclusivos, então:E E" # 8 ( ) ( ) + ( ) + ... + ( ) + ...T E œ T E T E T E_ 3 œ " - 3 " # 8 observe-se que da condição 3, decorre imediatamente que, para qualquer finito,8 ( ) )T E œ T E8 3 œ " + !3 3 3œ" 8 Pelo que se pode notar, o conceito axiomático não fornece formas e sem condições para o cálculo de probabilidade, ou seja, qualquer processo de cálculo de probabilidade é válido desde que satisfaça os axiomas. Fácilmente se comprova que os conceitos "a priori" e "a posteriori" se enquadram dentro desse conceito. Apresentamos, agora, alguns teoremas que vêm como consequências desses axiomas: Principais Teoremas. 1) Se é o conjunto vazio, então ( ) = 0.9 9T Observação.- A reciproca do teorema não é verdadeira. Isto é, se ( ) = 0, não podemos,T E em geral, concluir que , porque existem situações nas quais atribuímosE œ g probabilidade zero a um evento que pode ocorrer. 2) Se é o complemento de A, então ( ) 1 ( ).E T E œ T EG G Observação.- Este resultado é útil porque sempre que desejamos avaliar ( ), poderemosT E calcular ( ) e, depois, obtermos o resultado desejado por substração. As vezes resultaT EG mais fácil calcular ( ) do que ( ).T E T EG 3) Se , então ( ) ( ).E § F T E Ÿ T F 4) Teorema da Soma: Se e forem dois eventos quaisquer, então:E F ( ) ( ) + ( ) ( ).T E F œ T E T F T E F- + Notas de Aulas - Prob. Estatística - 3º ano - Eng.Ambiental - Profa.Olga L.Anglas R.Tarumoto 35 5) Se , e forem três eventos quaisquer, então:E F G T E F G œ T E T F T G T E F T E G T F G( ) ( ) + ( ) + ( ) ( ) ( ) ( ) +- - + + + + ( )T E F G+ + Note-se que, apesar de termos postulado a existência do número ( ) e de váriasT E propriedades (teoremas) que esse número possui, nada dissemos quanto a maneira que poderemos calcular ( ). Para esse cálculo, devemos fazer certas suposições adicionaisT E que conduzem a um método de avaliação dessa probabilidade, porém, se essas suposições não forem fundamentadas, deveremos recorrer a experimentação a fim de encontrar T E T E( ). A frequência relativa será de grande valia para aproximar ( ). Note-se que não estamos afirmando que é a mesma coisa que ( ). Contudo, mesmo que a0 T EE aproximação for muita grosseira, em nada abalará a lógica do modelo estabelecido acima. ESPAÇOS AMOSTRAIS FINITOS. Seja um espaço amostral finito = , , ..., . A fim de caracterizar ( )f f Ö+ + + × T E" # 8 para este modelo, devemos inicialmente considerar o evento formado por um resultado simples ou elementar, = . A cada evento simples associaremos um númeroE Ö+ × Ö+ ×3 3 : +3 3, denominado probabilidade de { } satisfazendo as seguintes condições: a) 0, 1,2,...,: 3 œ 83 b) : : ÞÞÞ : œ "Þ" # 8 A probabilidade ( ) de cada evento composto (mais de um evento) é entãoT E definida como a soma das probabilidades dos pontos amostrais de .E EXEMPLOS. ESPAÇOS AMOSTRAIS FINITOS EQUIPROVÁVEIS. Quando nós associamos a cada ponto amostral a mesma probabilidade, o espaço amostral chama-se equiprovável ou uniforme. Em particular, se contém " " pontos,f 8 então, a probabilidade de cada ponto será 1/8Þ Notas de Aulas - Prob. Estatística - 3º ano - Eng.Ambiental - Profa.Olga L.Anglas R.Tarumoto 36 Por outro lado, se um evento contém " " pontos amostrais, então suaE < probabilidade é, ( ) = .T E <Î8 Este método de avaliar ( ) é frequentemente enunciado como:T E ( )T E œ NN ! ! de elementos de de elementos de E f ou ( )T E œ N N ! ! de vezes em que o evento pode ocorrer de vezes em que ocorre E f Observação.- Salientamos que a fórmula acima para ( ) pode ser usada somente paraT E um espaço equiprovável, não pode ser usada de um modo geral. Nota.- A expressão "aleatoriamente" será usada somente para espaços equiprováveis; formalmente, a frase "escolha aleatoriamente um ponto de um conjunto " significa quef f f é um espaço equiprovável, isto é, que cada ponto amostral de tem a mesma probabilidade. EXEMPLOS. PROBABILIDADE CONDICIONAL. Seja um espaço amostral e consideremos dois eventos e . Com o símbolof E F T ElF E F( ) indicamos a probabilidade do evento , dado que o evento ocorreu, isto é, T ElF E F( ) é a probabilidade condicional do evento , uma vez que tenha ocorrido.Quando calculamos ( ) tudo se passa como se fosse o novo espaçoT E lF F amostral "reduzido" dentro do qual, queremos calcular a probabilidade do evento .E EXEMPLOS. Outra maneira de ser calculada as probabilidade condicional ( ) éT ElF considerando o diagrama de Venn, ou seja: (Gráfico) ( )T ElF œ œ œT E F E F E FT F F F( ) NCF ( ) / NTC NCF ( )( ) NCF ( ) / NTC NTC ( ) Notas de Aulas - Prob. Estatística - 3º ano - Eng.Ambiental- Profa.Olga L.Anglas R.Tarumoto 37 Para definirmos formalmente ( ), vamos recorrer novamente ao conceito deT ElF frequência relativa. Se um experimento aleatório for repetido "n" vezes, sejam e o8 ß 8 8 E F EF número de vezes que ocorrem os eventos , e , respectivamente. Qual é oE F E F significado de ... é a frequência relativa de naqueles resultados que 8 8 E FEF F ? ocorreu; isto é, a frequência relativa de condicionada a ocorrencia de . Assim,E F podemos escrever: 8 8 8 8 0 8 8 0EF F F EF F EFœ œ onde e representam as frequências relativas da ocorrência de e 0 0 E F FEF F respectivamente. Quando é grande, é próxima de ( ) e é próxima de8 0 T E F 0EF F T F( ). Isto sugere a seguinte definição: DEFINIÇÃO.- Dados dois eventos, A e B, denotaremos ( ) a probabilidadeT ElF condicionada do evento , quando tiver ocorrido, por:E F ( ) ,T ElF œ T E FT F( )( ) onde ( ) 0.T F Pode-se constatar que ( ) , assim definida, satisfaz os postulados deT E lF probabilidade já mencionados: 1) 0 ( ) 1,Ÿ T E lF Ÿ 2) ( B) 1,T l œf 3) ( ) ( ) ( ) se .T E E lF œ T E lF T E lF ß E E œ" # " # " # 9 Em resumo, temos dois modos de calcular ( ):T E lF 1 Considerando que a probabilidade do evento será calculada em relação ao espaço! E amostral "reduzido" .F 2 Empregando a definição acima, onde ( ) e ( ) são calculados em relaçào ao! T E F T F espaço amostral original .f EXEMPLOS. Notas de Aulas - Prob. Estatística - 3º ano - Eng.Ambiental - Profa.Olga L.Anglas R.Tarumoto 38 TEOREMA DO PRODUTO. Uma consequência importante da definição formal de probabilidade condicional é a seguinte: ( ) ( ) ( ) ( )T E lF œ Ê T E F œ T F T E lFT EFT F( )( ) ou ( ) ( ) ( )T F lEÑ œ Ê TÐE F œ T E T F lET EFT E( )( ) isto é, a probabilidade de ocorrência simultânea de dois eventos ( ) é o produto daT E F probabilidade de um deles pela probabilidade condicional do outro, dado o primeiro. EXEMPLOS. Este teorema pode ser generalizado para mais de dois eventos, da seguinte maneira: T E E ÞÞÞ E Ñ œ( " # 8 œ T E ÑT E lE ÑT E lE E Ñ ÞÞÞ T lE E ÞÞÞ E Ñ( ( ( (A" # " $ " # 8 " # 8" EXEMPLOS. PARTIÇÕES. DEFINIÇÃO.- Dizemos que os eventos formam uma partição de umE ß E ß ÞÞÞ ß E" # 8 espaço amostral , quando: (Gráfico) f a) ,E E œ ß 3 Á 43 4 9 b) , E œ8 3 œ " 3 f c) ( para todo .T E Ñ !ß 33 Notas de Aulas - Prob. Estatística - 3º ano - Eng.Ambiental - Profa.Olga L.Anglas R.Tarumoto 39 Observação.- Quando o experimento é realizado um, e somente um, dos eventos X E3 ocorre. Consideremos um evento qualquer referente a , e umaF E ß E ß ÞÞÞ ß Ef " # 8 partição de . Podemos escrever:f F œ Ff (F œ E E ÞÞÞ E Ñ F" # 8 ( ) ( ) ... ( )F œ E F E F E F" # 8 onde os são também mutuamente exclusivos, ou seja, são dois a dois mutuamenteE F3 exclusivos. Observação.- Naturalmente, alguns dos conjuntos poderão ser vazios, mais issoE F3 não inválida essa decomposição de . O ponto importante é que todos os eventos E E F3 são dois a dois mutuamente exclusivos. EXEMPLOS. Aplicando a propriedade da adição de eventos mutuamente exclusivos, temos que: ( ) ( ) ( ) ... ( )T F œ T E F T E F T E F" # 8 Assim pelo Teorema da Multiplicação cada termo pode ser expresso na forma T E ÑT F lE Ñ( ( e, daí, obtemos o que se denomina:3 3 TEOREMA DA PROBABILIDADE TOTAL. ( ) ( ( ( ( ( (T F œ T E ÑT F lE Ñ T E ÑT F lE Ñ ÞÞÞ T E ÑT F lE Ñ" " # # 8 8 Observação.- Este resultado é útil, porque frequentemnete, quando ( ) é pedida, podeT F ser difícil; calculá-la diretamente. No entanto, com a informaçào adicional de que E T F lE ÑÞ3 3tenha ocorrido, seremos capazes de calcular ( EXEMPLOS. Notas de Aulas - Prob. Estatística - 3º ano - Eng.Ambiental - Profa.Olga L.Anglas R.Tarumoto 40 TEOREMA DE BAYES. Por outro lado, a probabilidade condicional de dado é definida como:E F3 (A ) ,T lF œ3 T E FT F( ) ( )3 para qualquer 3Þ Nesta equação, usamos o Teorema da Probabilidade Total para substituir ( ) eT F o Teorema do Produto para substituir ( ). Obtendo assim o seguinte resultado:T E F3 Suponha ser uma partição de e , um evento qualquer. EntãoE ß E ß ÞÞÞ ß E F" # 8 f para qualquer 3à ( )T E lF œ3 T E ÑT F lE ÑT E ÑT F lE ÑT E Ñ T F lE ÑÞÞÞT E T F lE Ñ( ( ( ( ( ( ( ) (3 3" " # # 8 8 Este resultado é muito importante, pois, como vimos, relaciona probabilidades "a priori" T E Ñ T F lE E( com probabilidades "a posteriori" ( ), probabilidades de depois que3 3 3 ocorrer FÞ EXEMPLOS. EVENTOS INDEPENDENTES. Dados dois eventos e de um espaço amostral , diremos que independe deE F Ef F T E lF œ T E E F F se: ( ) ( ), isto é, independe de se a ocorrência de não afeta a probabilidade de EÞ Observamos que se A independe de ( ( ) 0 ) então independe de pois:F T E F E ( A) ( )T F l œ œ œ œ T FT EF T F T ET E T E T ET F T E lF( ) ( ) ( )( ) ( ) ( )( ) ( ) Em resumo, se independe de , então independe de e além disso:E F F E ( ) ( ) ) ( ) ( ).T E F œ T E TÐF lE œ T E T F Notas de Aulas - Prob. Estatística - 3º ano - Eng.Ambiental - Profa.Olga L.Anglas R.Tarumoto 41 Isto sugere a seguinte definição: DEFINIÇÃO.- e serão eventos independentes se, e somente se,E F T E F œ T E T F( ) ( ). ( ). Caso contrário eles são chamados de eventos dependentes. Esta definição pode ser estendida para mais de dois eventos como segue: DEFINIÇÃO.- Diremos que os três eventos , e são mutuamente independentes se,E F G e somente se, todas as condições seguintes forem válidas: ( ) ( ) ( )T E F œ T E T F ( ) ( ) ( )T E G œ T E T G ( ) ( ) ( )T F G œ T F T G ( ) ( ) ( ) ( )T E F G œ T E T F T G Finalmente, esta definição pode ser extendida para eventos.8 EXEMPLOS. Notas de Aulas - Prob. Estatística - 3º ano - Eng.Ambiental - Profa.Olga L.Anglas R.Tarumoto 42 V. VARIÁVEIS ALEATÓRIAS. CONSIDERAÇÕES GERAIS. Ao descrever o espaço amostral de um experimento observamos que é formado por todos os resultados possíveis do experimento e cujos valores não são necessariamente numéricos. Por exemplo, a face de uma moeda poderá ser cara ou coroa, ao se observar um conjunto de animais, pode-se classificá-los como sendo machos ou fêmeas, e assim por diante. Sobre este espaço podemos definir a nossa idéia de variáveis aleatórias. Ou seja, em muitas situações experimentais estaremos interessados na mensuração de alguma coisa e no seu registro como um número. Dessa forma, poderemos atribuir um número a cada resultado (não-numérico) do experimento. Por exemplo, poderemos atribuir o valor zero se o resultado da moeda for cara ou se o animal for macho e o valor um se o resultado da moeda for coroa ou se o animal for fêmea respectivamente. Definição.- Seja o espaço amostral associado com algum experimento . A variávelf X aleatória (v.a) é uma função que distribui um número real ( ) a cada elemento .\ \ = = − f GRÁFICO Obs.- - Apesar de embora seja chamada variável aleatória, e, na realidade, uma função\ cujo domínio é o espaço amostral e cujo contradomínio é o subconjunto da retaf ‘\ real; = { /. existe um tal que ( ) = }, que na realidade são todos os‘ ‘ fX < − = − \ = < valores possíveis de .\ - Nem toda função de na reta real será admitida como variável aleatória. Por exemplo,f uma função que distribui mais que um número real a algum elemento de e inaceitável.f Somente funções que distribuem exatamente um número real a cada elemento de sãof satisfatórios, em contrapartida, o mesmo número real pode ser distribuído por muitos elementos de .f - Em alguns casos, o espaço amostral já é numérico. Simplesmente tomamos ( ) = a\ = = função identidade. EXEMPLOS. Notas de Aulas - Prob. Estatística - 3º ano - Eng.Ambiental - Profa.Olga L.Anglas R.Tarumoto 43 Obs.- A variável aleatória assim definida, como se nota, apenasquantifica o resultado ,= possivelmente não-numérico. Da mesma forma que os espaços amostrais básicos, os espaços amostrais das variáveis aleatórias poderão ser enumeráveis e não enumeráveis ou contínuos. Definição.- Se uma v.a. tem como espaço amostra um conjunto finito ou infinito\ ‘\ enumerável, então a v.a. é denominada v.a. discreta. Se for um espaço amostral\ ‘\ não enumerável ou contínuo, será denominada v.a. contínua.\ EXEMPLOS. De uma maneira geral, os valores das v.a. discretas são obtidos através de um processo de enumeração ou contagem, enquanto que os valores das v.a. contínuas são obtidas por processos de medição. Definição.- Seja um experimento aleatório e seu espaço amostral . Seja uma v.a.X f \ definida em e seja seu contradomínio. Seja um evento definido em relação a ,f ‘ ‘\ \F i é., . Então o evento será definido assim: = { /. ( ) }. Ou seja,Þ F § E E = − \ = − F‘ f\ E \Ð= − F será constituído por todos os resultados em , para os quais ) . Neste caso,f diremos que e são EVENTOS EQUIVALENTES.E F GRÁFICO. Definição.- Se e são eventos equivalentes, então definimos aE § F §f ‘\ probabilidade do evento , ( ) como sendo igual a ( ). Ou seja,F T F T E T \ = − F œ T F œ T E F[ ( ) ] ( ) ( ). Portanto, para encontrar a probabilidade de um evento em , primeiro encontramos o evento equivalente em , cuja probabilidade é‘ f\ E conhecida, e esta como a probabilidade do evento , assim definimos ( ).F T F EXEMPLO. Uma vez que as probabilidades dos vários resultados no contradomínio ‘\ tenham sido determinados, ignoraremos freqüentemente o espaço amostral original ,f que deu origem a essas probabilidades, pois o fato de que essas probabilidades sejam determinadas por uma função de probabilidade definida sobre o espaço amostral original f; não nos interessa, quando estamos apenas interessados em estudar os valores da v.a .\ Notas de Aulas - Prob. Estatística - 3º ano - Eng.Ambiental - Profa.Olga L.Anglas R.Tarumoto 44 1 - VARIÁVEIS ALEATÓRIAS DISCRETAS. Definição.- Seja uma v.a. Se o número de valores possíveis de (i.é., , o\ \ ‘\ contradomínio) for finito ou infinito numerável, denominaremos como sendo uma v.a.\ discreta. Isto é, os valores possíveis de , podem ser postos em lista como , ..., .\ B B ß B" # 8 No caso finito, a lista acaba, e no caso infinito numerável, a lista continua indefinidamente. Definição.- Seja uma v.a. discreta. Portanto, , o contradomínio de , será formado\ \‘\ no máximo por um número infinito numerável de valores , , .... . A cada possívelB B" # resultado associaremos um número ( ) = ( = ), denominado probabilidade deB : B T \ B3 3 3 B : B 33 3. Os números ( ), =1, 2, ... devem satisfazer as seguintes condições: a) ( ) 0 , para todo ; e: B 33 b) ( )! 3œ" _ 3: B œ " A função , definida acima, é denominada "Função de Probabilidade" (fp) - ou: função de probabilidade no ponto, ou função de quantia, ou lei de probabilidade, etc - da v.a . A coleção de pares ( , ( )), = 1, 2, ..., é algumas vezes denominada\ B : B 33 3 "distribuição de probabilidade" de .\ Definição.- Seja um evento associado a v.a , isto é, . Suponha-se,F \ F § ‘\ especificamente, que { , , ...}. Daí,F œ B B3" 3# T F œ T = \ = − F( ) [ /. ( ) ] (porque são eventos equivalentes) [ /. ( ) , 1, 2, ...] ( )œ T = \ = œ B 4 œ œ : B34 34 4œ" _! ou seja, a probabilidade de um evento é igual a soma das probabilidades dos resultadosF individuais associados com .F Notas de Aulas - Prob. Estatística - 3º ano - Eng.Ambiental - Profa.Olga L.Anglas R.Tarumoto 45 Existem três formas distintas e equivalentes de se representar uma função de probabilidade. A primeira consiste em relacionar os valores da variável e os respectivos valores da função, chamada "representação tabular", a segunda é a "representação gráfica", e a última, chamada "representação analítica", estabelece uma expressão geral para representar o valor da função num ponto genérico da variável independente. EXEMPLOS. 2 -VARIÁVEIS ALEATÓRIAS CONTÍNUAS. Definição.- Seja uma v.a. Se o número de valores possíveis de (isto é, o\ \ contradomínio ) for não enumerável ou continuo (ou um intervalo ou coleção de‘\ intervalos), denominaremos de v.a contínua.\ Definição.- Diz-se que é uma v.a. contínua, se existir uma função , denominada\ 0 "Função Densidade de Probabilidade" (fdp) da v.a. que satisfaça as seguintes\ condições: a) ( ) 0, para todo ;0 B B b) ( ) 1'__ 0 B .B œ c) Para todo , com , teremos: ( ) .+ , _ + , _ T + Ÿ \ Ÿ , œ 0ÐBÑ.B'+, Obs.- Em outras palavras, denomina-se fdp a toda função ( ) que não assuma valores0 B negativos, ou ainda, cujo gráfico esteja sobre ou acima do eixo das abscissas e cuja área compreendida entre a função e o eixo das abscissas no intervalo seja igual a um.‘\ GRÁFICO - Como toda a área vale um, a probabilidade ( ) está definida como a áreaT + Ÿ \ Ÿ , acotada pelo gráfico de , as retas = , = e o eixo das abscissas.0 B + B , GRÁFICO Notas de Aulas - Prob. Estatística - 3º ano - Eng.Ambiental - Profa.Olga L.Anglas R.Tarumoto 46 -Note-se que ( ) não é probabilidade. Somente quando a função for integrada entre dois0 B limites, ela produzirá uma probabilidade, que será a área sob a curva da função entre B œ + B œ , + , e ; . - A definição também nos mostra que a probabilidade de qualquer valor específico de ,\ por exemplo x , teremos ( = ) = 0, pois,! !T \ B ( = ) (x)T \ B œ 0 .B œ !! B B' ! ! Observação: Sendo assim, as probabilidades abaixo serão todas iguais, se for v.a.\ contínua: ( ), ( ), ( ), ( ).T + Ÿ \ Ÿ , T + Ÿ \ , T + \ Ÿ , T + \ , EXEMPLOS. 3 - FUNÇÃO DISTRIBUIÇÃO ACUMULADA. Definição.- Seja uma v.a discreta ou contínua (ou seja assumindo valores na reta real).\ Define-se a função como a "Função Distribuição Acumulada" (FDA) da v.a comoJ \ J B T \ Ÿ B B − T \ Ÿ B\ \( ) = ( ), que associa a cada ponto a probabilidade ( ).‘ Teorema.- Consideremos: a) Se for uma v.a. discreta com fp ( ), então:\ : B ( ) = ( ) = ( = )J B T \ Ÿ B T \ >\ >ŸB ! b) Se for uma v.a contínua com fdp ( ), então:\ 0 B ( ) = ( ) = ( ) , onde é uma variável aparente.J B T \ Ÿ B 0 > .> >\ _ B' EXEMPLOS. Obs.- Os gráficos apresentados para as FDA são em cada caso, bastante típicos, no sentido seguinte: Notas de Aulas - Prob. Estatística - 3º ano - Eng.Ambiental - Profa.Olga L.Anglas R.Tarumoto 47 - Se for uma v.a discreta, corn um número finito de valores possíveis, o gráfico da\ FDA será constituído por segmentos de retas horizontais (nesse caso, a FDA se denomina função em degraus). A função é contínua, exceto nos valores possíveis de : , , ...J \ B B" # , , .... . No valor o gráfico apresenta um "salto" de magnitude ( ) = ( = ).B B : B T \ B8 3 3 3 - Se for uma v.a contínua, a FDA será uma função contínua para todo .\ J B - A FDA é definida para todos os valores de , o que é urn motivo importante paraJ B considerá-la. Propriedades.- Consideremos as seguintes propriedades: 1) Se então ( ) ( ), isto é, a função ( ) é monótona não-decrescente.B B J B J B J B" # " # \ Em particular se é contínua, então ( ) é crescente para todo .\ J B B − ‘\ 2) A FDA ( ) é sempre contínua a direita.J B\ 3) Se é uma v.a assumindo valores , então:\ B − ‘\ lim ( ) e lim ( ) 1 - +B Ä _ J B œ ! J B œ B Ä _ \ \ 4) Se é uma v.a. contínua, com FDA ( ), então sua fdp ( ) será dado por:\ J B 0 B\ 0 B œ J B œ J B B J( ) '( ) ( ), para todo no qual a seja derivável...B 5) Se e uma v.a discreta, com FDA ( ), então: ( = ) (x ) (x ) .\ J B T \ B œ J J\ 3 3 3" Assim, a descrição probabilística de uma variável aleatória a feita pela sua: - função distribuição acumulada, pois determina univocamente a função de probabilidade ou a função densidade de probabilidade; - função de probabilidade, se é discreta;\ - função densidade de probabilidade, se é contínua.\ Notas de Aulas - Prob. Estatística - 3º ano - Eng.Ambiental- Profa.Olga L.Anglas R.Tarumoto 48 As funções de probabilidade ou de densidade consistem, portanto, nos modelos de descrição probabilística ou, como é mais comumente denominado, definem a distribuição de probabilidade da v.a. .\ Os termos "função de probabilidade" ou "distribuição de probabilidade discreta" e "função densidade de probabilidade" ou "distribuição de probabilidade contínua" serão considerados como sinônimos. EXEMPLOS. 4 - FUNÇÕES DE VARIÁVEIS ALEATÓRIAS. Eventos Equivalentes. Seja um experimento aleatório e seu espaço amostral . Seja uma v.aX f \ definida em . Suponha-se que = ( ) seja uma função real de . então = ( ) éf C L B B ] L B uma v.a, porque para todo , um valor de fica determinado, a saber = ( ( ) ).= − ] C L \ =f GRÁFICO. Onde é o contradomínio da v.a. , o conjunto de todos os valores possíveis da‘\ \ função e é o contradomínio da v.a , o conjunto de todos os valores possíveis de\ ]‘] ] . Definição 1.- Seja um evento (subconjunto) associado ao contradomínio , de .G ]‘] Seja definido assim: = { /. ( ) }. Ou seja, é o conjunto deF § F B − L B − G F‘ ‘\ \ todos os valores de , tais que ( ) . Se e forem relacionados desse modo, os\ L B − G F G denominaremos eventos equivalentes. Definição 2.- Seja uma v.a definida no espaço amostral . Seja o contradomínio de\ f ‘\ \ L ] L B. Seja uma função real e considere-se a v.a. = ( ) com contradomínio . Para‘] qualquer evento , definiremos ( ) como: ( ) = [{ /. ( ) }].G § T G T G T B − L B − G‘ ‘] \ Ou seja, a probabilidade de um evento associado ao contradomínio de é definida como] a probabilidade do evento equivalente (em termos de ).\ Notas de Aulas - Prob. Estatística - 3º ano - Eng.Ambiental - Profa.Olga L.Anglas R.Tarumoto 49 4.1 - VARIÁVEIS ALEATÓRIAS DISCRETAS. Caso 1.- é uma v.a. discreta. Se for uma v.a. discreta e = ( ), nesse caso segue-\ \ ] L \ se imediatamente que será também uma v.a discreta.] Procedimento: Se , , ..., , ... forem os valores possíveis de , ( ) = ( = ), eB B B \ : B T \ B" # 8 3 3 L \ C B( ) for uma função tal que, a cada valor corresponda exatamente um valor , então a distribuição de probabilidade de será obtido do seguinte modo:] valores possíveis de : = ( ), = 1, 2, ..., , ...] C L B 3 83 3 probablidades de : ( ) = ( = ) = ( ).] : C T ] C : B3 3 3 EXEMPLOS. Obs.- Muitas vezes a função não possui a característica acima, e poderá acontecer queL vários valores de levem ao mesmo valor de , nesse caso apresentamos o seguinte\ ] procedimento. Procedimento: Sejam , , ..., , ... os valores de que tenham a propriedadeB B B \3" 3# 35 L B œ C 4( ) para todo . Então:34 3 ( ) ) ( )+ ( )+ ....: C œ TÐ] œ C œ : B : B3 3 3" 3# isto é, para calcular a probabilidade do evento { = }, acha-se o evento equivalente em] C3 termos de (no contradomínio ) e em seguida adicionam-se todas as probabilidades\ ‘\ correspondentes. EXEMPLOS. Caso 2.- é uma v.a contínua. Pode acontecer que seja uma v.a contínua enquanto \ \ ] seja discreta. Procedimento: A distribuição de probabilidade de será dado por: ( ) = ,] : C 0ÐBÑ.B3 E' onde é o evento em , que é equivalente ao evento ( = ) em e é a fdp daE ] C 0ÐBÑ‘ ‘\ 3 ] v.a .\ EXEMPLOS. Notas de Aulas - Prob. Estatística - 3º ano - Eng.Ambiental - Profa.Olga L.Anglas R.Tarumoto 50 4.2 - VARIÁVEIS ALEATÓRIAS CONTÍNUAS. O caso mais importante (e mais freqüente) é quando for uma v.a. continua com\ fdp e for uma função contínua. Conseqüentemente = ( ) será uma v.a0ÐBÑ L ] L \ contínua e nosso interesse será encontrar sua fdp, que denotaremos por .1 Procedimento: a) Obter , a FDA de , na qual ( ) = ( ), achando-se o evento (noK ] K ] T ] Ÿ C E contradomínio de ) o qual é equivalente ao evento { } (no contradomínio de ).\ ] Ÿ C ] b) Derivar ( ) em relação a , a fim de obter a fdp ( ).K C C 1 C c) Determinar aqueles valores de no contradomínio de , para os quais ( ) 0.C ] 1 C EXEMPLOS. As formas consideradas acima, levam em consideração que as funções são estritamente monótonas, crescente ou decrescente, e por isso podemos apenas encontrar sua função inversa, ou seja = ( ) = ( ), onde é denominada funçãoC L B Ê B L C L" " inversa de . Portanto, se for estritamente crescente { ( ) } será equivalente aL L L B Ÿ C { ( )}, enquanto se for estritamente decrescente, { ( ) } será\ Ÿ L C L L B Ÿ C" equivalente a { H ( )}. Este processo pode ser generalizado como segue.\ C" Teorema.- Seja uma v.a contínua com fdp , onde ( ) 0, para .\ 0 0 B + B , Suponha-se que = ( ) seja uma função de estritamente monótona (crescente ouC L B B decrescente). Admita-se que essa função seja derivável para todo . Então a v.a ,B ] definida como ( ) possui a fdp ( ) dada por: ( ) = ( )| |, onde é expresso] œ L \ 1 C 1 C 0 B B.B.C em termos de . Se for crescente, então será não-nula para aqueles valores de queC L 1 C satisfaçam ( ) ( ). Se for decrescente, então será não-nula para aquelesL + C L , L 1 valores de que satisfaçam ( ) ( ).C L , C L + No entanto, se = ( ) não for uma função monótona de , não poderemosC L B B aplicar diretamente o processo acima. Em vez disso, temos que voltar ao processo geral. EXEMPLOS. Notas de Aulas - Prob. Estatística - 3º ano - Eng.Ambiental - Profa.Olga L.Anglas R.Tarumoto 51 VI - MODELOS DE DISTRIBUIÇÕES. 1 - INTRODUÇÃO. Até agora, estudamos as variáveis aleatórias e sua descrição probabilistica por medio de sua distribuição de probabilidade. Notamos que algumas variáveis aleatórias aparecem com bastante frequência adaptando-se muito bem a situações práticas. Dessa forma um estudo mais aprofundado nessas situações nos facilita muito a construção de sua distribuição de probabilidade já seja através de sua função de probabilidade ou de sua função densidade de probabilidade, conforme a variável aleatória seja discreta ou contínua, bem como a determinação dos seus principais parâmetros. Assim, para um dado problema, primeiro tentamos verificar se ele satisfaz ás condições dos modelos conhecidos, pois isso irá facilitar muito o nosso trabalho. Dentro dos modelos de distribuições de variáveis aleatórias discretas temos: Distribuição Uniforme Discreta, Distribuição de Bernoulli, Distribuição Binomial, Distribuição Geométrica, Distribuição Binomial Negativa, Distribuição Poisson, Distribuição Hipergeométrica, Distribuição Multinomial, etc. e dentro dos modelos de distribuiçòes de variáveis aleatórias contínuas temos: Distribuição Uniforme Contínua, Distribuição Exponencial, Distribuição Normal, Distribuição Gama, Distribuição Qui- Quadradado, Distribuição Beta, Distribuição T-Student, Distribuição F-Sneedor, etc, entre muitas outras. 2 - DISTRIBUIÇÕES DISCRETAS. DISTRIBUIÇÃO UNIFORME DISCRETA. A distribuição uniforme discreta representa situações em que todos os possíveis valores da váriavel são equiprováveis. Definição.- Uma variável aleatória segue a distribuição uniforme discreta, com valores B ß B ß ÞÞÞ ß B" # 8 , se tem função de probabilidade dado por: Notas de Aulas - Prob. Estatística - 3º ano - Eng.Ambiental - Profa.Olga L.Anglas R.Tarumoto 52 :ÐB Ñ œ ß 3 œ "ß #ß ÞÞÞ ß 83 " 8 Definição.- A esperança e variança de uma v.a com distribuição uniforme discreta é\ dada por: ( ) e ( )I \ œ Z \ œ Þ8"# "#Ð8"Ñ Ð8"Ñ DISTRIBUIÇÃO DE BERNOULLI. Em muitas situações práticas a variável de interesse assume somente dois valores. Por exemplo, a peça é classificada como boa ou defeituosa; o entrevistado concorda ou não com a afirmação feita; a vacina imunizou ou não a criança. Estas situações têm alternativas dicotômicas, que genericamente podem ser representadas por respostas do tipo sucesso- fracasso. A atribuição de qual das respostas será referida como sucesso é feita de modo arbitrário, mas deve ser definida claramente para evitar ambiguedades. Esses experimentos recebem o nome de ensaios de Bernoulli ( ou provas de Bernoulli). Assim para
Compartilhar