Baixe o app para aproveitar ainda mais
Prévia do material em texto
Probabilidade E Estatística Elaborado por Paul CHEGE Traduzido para Português por Paulo Diniz African Virtual university Université Virtuelle Africaine Universidade Virtual Africana _Universidade Virtual Africana Nota Este document é publicado sob as condições da Creative Commons http://en.wikipedia.org/wiki/Creative_Commons Atribuição http://creativecommons.org/licenses/by/2.5/ Licenca (abreviada “cc-by”), Versão 2.5. Por CC São reservados alguns direitos _Universidade Virtual Africana Índice I. Probabilidade e Estatística............................................................................... 3 II. Conhecimentos prévios (Pre-requisitos) ........................................................ 3 III. Tempo............................................................................................................... 3 IV. Materiais............................................................................................................ 3 V. Justificativa/Filosofia do módulo............................................................3 VI. Conteúdos......................................................................................................... .4 6.1 Visão geral......................................................................................................... .4 6.2 Plano/Esboço..................................................................................................... .5 6.3 Diagrama de organização dos conteúdos....…………………………………. 6 VII. Objectivos do módulo……………………………………………………….. 7 VIII. Actividades específicas de aprendizagem………………………………….... 7 IX. Actividades de ensino e aprendizagem..............................................................9 X. Lista de conceitos chaves (Glossário).............................................................. 12 XI. Lista de materiais de leitura obrigatória ........................................................ .18 XII. Lista de recursos……………………………….…………………………… 19 XIII. Lista de Links (Sítios da Internet) úteis…………………………………….. 20 XIV. Actividades de aprendizagem............................................................................21 XV. Síntese do modulo………………………………………………………….. 112 XVI. Avaliação sumativa........................................................................................... 113 XVII. Referencias…………………………………………………………………… 121 XVIII. Registos de estudantes....................................................................................... 122 XIX. Principal Autor do módulo................................................................................ 123 _Univeridade Virtual Africana I. Probabilidade e Estatística Por Paul Chege II. Conhecimentos prévios (Pre-requisitos) Para frequentarem este modulo, os estudantes precisam ter conhecimentos sobre Probabilidade e Estatística do Ensino Secundário III. Tempo O tempo total para este modulo é de 120 horas de estudo. IV. Material Os estudantes deverão ter acesso aos textos nucleares de leitura que estão especificados em diante. Também precisarão de usar o computador para terem acesso total aos textos nucleares de leitura. Adicionalmente, os estudantes deverão estar aptos para instalar e usar o Sofware wx Maxima para exercitarem conceitos algébricos V. Importância do Módulo/Filosofia do Módulo Probabilidade e Estatística, para além de ser uma área chave para o ensino de matérias do ensino secundário, constitui uma base muito importante para o ensino da Matemática do nível superior. A Estatística é uma área fundamental da Matemática com aplicação em muitas outras disciplinas e é útil em análise de processos em produção industrial. O estudo da Estatística providencia especialistas (Estatísticos) capazes de recolher e analisar dados referentes a uma determinada população e fazer as respectivas inferências sobre certas características desta. Os Estatísticos providenciam aos governos e organizações instrumentos concretos que podem ajudar aos gestores na tomada de decisão perante uma determinada situação. Por exemplo, com base na Probabilidade e Estatística, pode-se analisar a taxa de expanção de doenças, as alterações da densidade populacional, pode-se fazer a previsão meteorológica, etc. O estudo da da teoria de Probabilidade ajuda na tomada de decisão dos agentes governamentais e das organizações, usando como base a teoria de chances. Por exemplo, pode-se predizer a quantidade de crianças de sexo masculino e de sexo feminino nascidas dentro de um determinado período e também projectar a quantidade de chuva que uma determinada região pode esperar, com base em alguns dados históricos sobre as regularidades/padrões de chuva dessa região. A teoria de Probabilidade também tem sido extensivamente usada na determinação de qualidade (alta, média e baixa) de produtos industriais, por exemplo, para prever o número de peças defeituosas num processo de produção industrial. _African Virtual University VI. Conteúdos 6.1 Visão geral Este módulo é composto por três unidades: Unidade 1: Estatística Descritiva e Distribuição de Probabilidades A Estatística descritiva é uma unidade que é desenvolvida ou como uma extensão da matemática do nível secundário ou como uma introdução para estudantes que se iniciam no estudo da Estatística. Introduzem-se nesta unidade as medidades de tendência central e de dispersão e também o conceito de probabilidade e o seu tratamento teórico. Unit 2: Variáveis aleatórias e Distribuições Esta unidade exige como pre-requisito a unidade 1. É desenvolvida a desde o conceito de Momento e função geradora de Momento, desiguladades de Markov e de Chebychev, algumas distribuições univariadas, distribuições bivariadas de probabilidade e probabilidades condicionais. Esta unidade dá algum subsídio para a análise de coeficientes de correlacão e para funções de distribuição de variáveis aleatórias, tais como a distribuição qui-quadrado, distribuição T e a distribuição F Unit 3: Teoria de Probabilidade Esta unidade é desenvolvida a partir da unidade 2. Nesta unidade faz-se a análise de Probabilidade usando funções de indicadores. Introduz-se a desigualdade de Bonferoni, funções geradoras, função característica e independência estatística de amostras aleatórias. Desenvolve o conceito de função para diferentes variáveis aleatórias e termina com o tratamento dos teoremas de convergência e de limite central. _African Virtual University 6.2 Plano: Programa Unidade 1 ( 40 horas): Estatística Descritiva e Distribuição de Probabilidades Nível 1. Prioridade A. Sem pre-requisitos. Distribuição de frequências relativas, distribuição de frequências acumuladas, curvas de frequências, média moda e mediana. Quartís e percentís, desvio padrão, distribuições simétricas e assimétricas. Probabilidade, espaço amostral, evento, definição de probabilidade, propriedades da probabilidade, variáveis aleatórias, distribuição de probabilidades, valor esperado (média) de uma variável aleatória, algumas distribuições particulares: distribuição de Bernoulli, distribuição Binomial, de poisson, Geométrica, Hipergeométrica, Uniforme, Exponencial e distribuição Normal. Distribuição de frequências bivariadas, tabelas de probabilidades conjuntas e probabilidades marginais Unidade 2 ( 40 horas): Variáveis Aleatórias e Distribuições de Testes Nível 2. Prioridade B. O pre-requisito é a Estatística 1 Momentos e funções geradoras de Momentos, desigualdades de Markov e de Chebychev, distribuições univariadas especiais. Distribuição de probabilidades bivariadas, distribuições de probabilidades conjuntas, condicionais e marginais. Independência, regressãoe correlação de dados bivariadas, cálculo de coeficientes de regressão e de correção, função distribuição de variáveis aleatórias, distribuição normal bivariada. Distribuições derivadas, tais como qui-quadrado, T e F. Unidade 3 ( 40 horas): Teoria de Probabilidade Nível 3. Prioridade C. O pre-requisito é Estatística 2. Probabilidade: Uso de funções indicadoras. Desigualdade de Bonferoni de vectores aleatórios. Funções geradoras. Função característica. Independência estatística de amostras aleatórias. Distribuição multinomial. Função de várias variáveis aleatórias. Independência de X e de S2 em amostras normais, estatísticas de ordem, convergência e teorema de limite. Exercícios práticos. 6.3. Diagrama de organização dos conteúdos _African Virtual University_African Virtual University VII. Objectivos No fim deste modulo, os estudantes deverão ser capazes de calcular as medidas de tendência central e de dispersão em estatística e resolver tarefas de probabilidade baseadas nas leis probabilisticas e fazer testes de hipóteses usando a teoria de probabilidades VIII. Objectivos específicos de aprendizagem (Objectivos instrucionais) Unidade 1: Estatística Descritiva e Distribuição de Probabilidades ( 40 Horas) No fim desta unidade, os estudantes deverão ser capazes de: Desenhar várias curvas de frequência; Calcular a média, moda, mediana, quartís, decís, percentís e desvio padrão de dados agrupados ou não; Definir e enunciar as propriedades da Probabilidade; Ilustrar as variáveis aleatórias, distribuição de probabilidades e valor esperado de uma variável aleatória; Ilustrar as distribuições de Bernoulli, Binomial, Poisson, Geométrica, Hipergeométrica, Uniforme, Exponencial e Normal; Unidade 2: Variáveis Aleatórias e Distribuição de Testes ( 40 Horas) No fim desta unidade, os estudantes deverão ser capazes de: Ilustrar Momentos e funções geradoras de Momentos; Analisar as desigualdades de Markov e de Chebychev; Examinar algumas distribuições univariadas de probabilidade, distribuições bivariadas de probabilidades, probabilidades conjuntas, marginais e condicionais; Mostrar a independência de variáveis, correlação e regressão; Calcular os coeficientes de correlação e regressão para dados bivariados; Mostrar a função distribuição de varíáveis aleatórias; Examinar a distribuição normal bivariada; Ilustrar as distribuições derivadas, tais como a qui-quadrado, a T e a distribuição F. _African Virtual University Unidade 3: Teoria de Probabilidade ( 40 Horas) No fim desta unidade, os estudantes deverão ser capazes de: • Usar as funções de indicadores em Probabilidades; • Mostrar a desigualdade de Bonferoni; • Ilustrar funções geradora e característica; • Examinar a independência estatistica de amostras aleatórias e a distribuição multinomial; • Avaliar funções de várias amostras aleatórias; • Illustrar a independência de X e S2 em amostras normais de estatísticas de ordem; • Mostrar a distribuição normal multivariada; • Illustrar os teoremas de convergência e de limite; • Resolver exercícios práticos. _African Virtual University IX. Actividades de Ensino e de Aprendizagem 9.1 Pre-Avaliação A Matemática Básica é um pre-requisito para a Probabilidade e Estatística. Tarefas 1. Se jogarmos um dado, a probabilidade de se obter um número maior que 4 é: 2. Uma carta é extraida aleatoriamente de um baralho de 52 cartas. A probabilidade de ser Rainha é: 3. São dados 100 números, dos quais 20 são 4s, 40 são 5s, 30 são 6s e os restantes são 7s. Encontre a média aritmética desses números. _0African Virtual University 4) Calcule a média dos seguintes dados. 5) Encontre a moda dos seguintes dados: 5, 3, 6, 5, 4, 5, 2, 8, 6, 5, 4, 8, 3, 4, 5, 4, 8, 2, 5 e 4. A. 4 B. 5 C. 6 D. 8 6) O valor da probabilidade pode variar: A. de 0 a 1 B. de -1 a +1 C. de 1 a 100 1 D. de 0 a 2 7) Encontre a mediana dos seguintes dados: 8, 7, 11, 5, 6, 4, 3, 12, 10, 8, 2, 5, 1, 6, 4. A. 12 B. 5 C. 8 D. 6 8) Encontre a amplitude total dos seguintes valores: 7, 4, 10, 9, 15, 12, 7, 9. A. 9 B. 11 C. 7 D. 8.88 __African Virtual University 9) Se jogarmos duas moedas e verificarmos as faces voltadas para cima, o espaço amostral será: A. C, K e CK B. CC, CK, KC, KK C. CC, CK, KK D. C, K 10) Se uma letra for escolhida aleatoriamente da palavra “Mississippi”, encontre a probabilidade De que seja um “i” Chave de respostas 1. B 2. A 3. D 4. C 5. B 6. A 7. D 8. B 9. B 10. D Comentários Pedagógicos para estudantes Esta pré-avaliação destina-se a dar aos estudantes uma visão sobre o que devem lembrar sobre Probabilidade e Estatística. Uma pontuação inferior a 50% nesta pre-Avaliação indica que o estudante precisa de rever os conteúdos de Probabilidade e Estatística do nível secundário. A pré-avaliação abrange os conceitos básicos com os quais os estudantes precisam de se familiarizar antes de avançar com este módulo. Faça a revisão da Probabilidade e Estatística do ensino secundário para dominar o básico se tem problemas com esta pré-avaliação. __African Virtual University X. Conceitos Chaves ( Glossário) Eventos mutuamente exclusivos: Dois eventos dizem-se mutuamente exclusivos se não podem ocorrer ao mesmo tempo. Variância de um conjunto de dados é definida como a raiz quadrada do desvio padrão, isto é, Var = S2. Experimento aleatório: é o processo de observação ou de acção cujos resultados, embora possam ser descritos no seu conjunto, não são determináveis à prior, antes da realização da experiência. Ex: tirar aleatoriamente uma carta de um baralho ou lançar um dado e verificar o número obtido. Espaço amostral: é o conjunto de todos resultados possíveis de um experimento. Ex., se lançarmos uma moeda e verificarmos a face de cima esperamos dois resultados possíveis (cara ou coroa). Portanto, o espaço amostral é (C; K). Variável aleatória: é uma função que assume valores reais para todos resultados possíveis de um experimento aleatório. Amostra aleatória: aquela que é construida por métodos envolvendo uma componente imprevisível. Distribuição de Bernoulli: é uma distribuição de probabilidade discreta, que assume o valor 1 com probabilidade p de sucesso e valor 0, com probabilidade de fracasso q = 1- p. Distribuição Binomial: é uma distribuição de probabilidade discreta, que dá conta do número de sucessos em n experimentos aleatórios independentes, cada um com apenas dois resultados possíveis (um correspondendo ao sucesso e outro, ao fracasso). A probabilidade de sucesso p, é sempre a mesma para cada experimento. Distribuição Hipegeomátrica: é uma distribuição de probabilidade discreta que descreve o número de sucessos em uma amostra de tamanho n, retirada de uma população finita de tamanho N, sem reposição. Distribuição de Poisson: é uma distribuição de probabilidade discreta, que expressa a probabilidade de vários eventos que ocorrem em um determinado período de tempo, se esses eventos ocorrerem com uma taxa média conhecida, e independentemente do intervalo de tempo. Correlação: é uma medida de associação entre duas variáveis. Regressão: é uma medida usada para examinar a relação entre uma variável dependente e uma independente. Teste qui-quadrado: é um teste de hipótese estatística em que a estatística de teste tem uma distribuição qui-quadrado quando a hipótese nula é verdadeira, ou qualquer teste em que a distribuição de probabilidades da estatística de teste (assumindo que a hipótese nula é verdadeira) podeser aproximada a uma distribuição qui-quadrado, tanto quanto melhor, fazendo o tamanho da amostra suficientemente grande. Distribuição Normal multivariada: é uma distribuição de probabilidade específica, que pode ser considerada uma generalização da distribuição normal univariada, para dimensões mais grandes. teste-t é qualquer teste de hipótese estatística para dois grupos, em que a estatística de teste tem uma distribuição t de Student se a hipótese nula é verdadeira. __African Virtual University Termos estatísticos 1. Dados brutos: são dados não organizado numericamente. 2. Rol: é um arranjo dos dados numéricos em ordem crescente de magnitude. 3. Amplitude total: é a diferença entre o maior e o menor valor dos dados. 4. Intervalos de classes: Em uma série de dados agrupados por exemplo, 21-30, 31-40 etc, o intervalo 21-30 é chamado de intervalo de classe. 5. Limites da Classe: Em um intervalo de classe, por exemplo, 21-30, 21 e 30 são chamados de limites de classe. 6. Limites inferior de classe (Lic): No intervalo da classe 21-30, o limite inferior da classe é 21 7. Limite superior de classe (Lsc): no intervalo da classe 21-30, o limite superior da classe é 30 8. Fronteiras dos Limites inferior e superior da classe: No intervalo da classe 21-30, a fronteira do limite inferior de classe é de 20,5 e a do limite superior é 30.5. Essas fronteiras garantem, teoricamente, todos valores do intervalo de 21-30 estão incluidos no intervalo de 20,5-30,5. 9. Amplitude de classe: É a diferença entre o limite superior e o inferior. Exemplo, para o intervalo de 21-30, a amplitude é 9 e para o intervalo 20,5-30,5 a amplitude é 10. 10. Marca de classe ou ponto médio: é a média aritmética dos limites da classe. Para o intervalo de 21-30, o ponto médio é 11. Distribuição de frequências: Um grande número de dados brutos, pode ser representado na forma tabular, com as suas respectivas frequências. Por exemplo: Esta representação dos dados chama-se distribuição de frequências ou tabela de frequências 12. Frequências acumuladas: A frequência acumulada até um certo valor ou dado, é a soma as frequências individuais precedentes incluindo a do próprio valor ou dado. Por exemplo: 13. Distribuição de frequências relativas. Na tabela seguinte, A soma das frequências é A freqência relativa da classe 25-29 é calculada dividindo a frequência desta classe pela soma das frequências. Exemplo: A frequência relativa do intervalo de 25-29 é dada por __African Virtual University 14. Curva de frequências acumuladas (Ogiva). Dada a tabela de frequências abaixo, Podemos construir o gráfico das frequências acumuladas versus fronteiras dos limites superiores das classes. Nota: No gráfico de frequências acumuladas, o primeiro ponto marcado é (24,5; 4). Se começássemos o gráfico neste ponto, este ficaria pendurado no eixo-0y. Para evitar isso, criamos outro ponto (19,5, 0) como ponto de partida. 19,5 é a fronteira do limite superior da classe (projectada) anterior. __African Virtual University Formas de curvas de frequência __African Virtual University XI. Lista de material de leitura obrigatória Leitura 1: Wolfram MathWorld Acedido em 06.05.07) Referência completa :http://mathworld.wolfram.com/Probabilty Resumo: Esta referência fornece o material de leitura muito necessário em Probabilidade e Estatística. A referência tem uma série de ilustrações que capacitam o estudante através de diferentes metodologias de abordagem. Wolfram MathWorld é uma enciclopédia matemática online especializada. Justificação/Filosofia: Ele fornece as referências mais detalhadas para qualquer tópico matemático. Os estudantes devem começar por utilizar o mecanismo de Leitura 2: Wikipedia (visitado em 06.05.07) Referência Completa : http://en.wikipedia.org/wiki/statistics Resumo: Wikipédia é uma enciclopédia on-line. É escrita pelos próprios leitores. Está sempre renovada, já que novas entradas são continuamente revistas. Além disso, tem-se revelado extremamente precisa. Os assuntos matemáticos que dão entrada são muito detalhados. Justificação/Filosofia: A Wikipédia dá definições, explicações e exemplos que os estudantes não podem acessar facilmente em outros recursos. Pelo facto de a W Leitura 3: ikipedia ser atualizada com freqüência dá-se ao estudante a possibilidade de MacTutor History of Mathematics (Acedido em 03.05.07) Referência complete: http://www-history.mcs.standrews.ac.uk/Indexe s Resumo: O Arquivo MacTutor é a história mais abrangente da matemática na internet. Os recursos são organizados tendo em conta os temas históricos. Justificação/Filosofia: Os estudantes devem pesquisar o arquivo MacTutor por palavras-chave nos tópicos estão a estudar (ou pelo nome do módulo em si). É importante ter uma visão geral de onde a matemática que está a ser estudada se encaixa na história da matemática. Quando o estudante termina o curso e vai ensinar a matemática do ensino secudário, terá de traser o assunto para seus alunos. Em particular, o papel das mulheres na história da matemática deve ser bem estudado para ajudar os alunos a compreenderem que dificuldades as mulheres têm enfrentado ainda que estejam a traser uma contribuição importante. Do mesmo modo, o papel do continente Africano deve ser estudado para compartilhar com os alunos nas escolas, nomeadamente os primeiros dispositivos de contagem (por exemplo, o osso Ishango) e também o papel da matemática egípcia deve ser bem estudado. __African Virtual University XII. Lista de recursos obrigatórios Recurso 1: Maxima. Referência Completa: Uma cópia do Maxima em disco faz parte do material para este curso Os estudantes do ensino à distância são ocasionalmente confrontados com dificuldades no ensino da matemática devido a falta de recursos que os possam guiar. A falta de aulas presenciais orientadas por um docente pode levar os estudantes a uma estagnação total, se não estiverem devidamente equipados de recursos que os ajudem a resolver seus problemas de aprendizagem da matemática. Este impedimento pode ser resolvido através de uso de recurso acompanhante: Maxima. Justificação/Filosofia: Maxima é um software do grupo das fontes abertas que pode permitir os estudantes a resolver equações lineares e quadráticas, sistemas de equações, integração e diferenciação, executar manipulações algébricas: factorização, simplificação, etc. Iste recurso é obrigatório para estudantes do ensino à distância porque possibilita uma aprendizagem rápida usando as habilidades em TIC’s já adquiridas. Recurso 2: Graph Referência Completa: Uma cópia de Graph, também acompanha este curso É relativamente difícil desenhar gráficos de funções, especialmente funções complicadas com funções em três dimensões. Os estudantes à distância, inevitavelmente encontrarão situações em que precisarão de algum recurso para desenhar gráficos em matemática. Este curso é acompanhado de um software chamado Graph para ajudar os estudantes no desenho de gráficos. Contudo, os estudantes precisam de estar familiarizados com este software para o poderem usar facilmente. Justificação/Filosofia: Graph é um software, dinâmico, do tipo fonte aberta, que os estudantes podem ter acesso através do disco que lhes é disponizado. Este ajuda aos estudantes de matemática a desenhar gráficos que de outro modo seriam bastante difíceis. É fácil usar este software, desde que os estudantes invistam algum tempo para aprenderem como funciona. Os estudantes sairão em vantagem porquepoderão usar este recurso em outras disciplinas durante e mesmo depois do curso. Notarão que é muito útil quando forem ensinar a matemática no ensino secundário. _0African Virtual University XIII. Lista de Links úteis Link 1 Títlo : Wikipedia URL:http://en.wikipedia.org/wiki/Statistics Descrição: Wikipedia é dicionário de todos matemáticos. É um recurso-aberto que freqüentemente é atualizado. A maioria dos estudantes, de quando em vez, encontrará problemas de referências para materiais de consulta. A maioria dos livros disponíveis só cobre partes ou seções dos conteúdos de Probabilidade e Estatística. Esta escassez de materiais pode ser superada com o uso de Wikipedia. É fácil aceder por pesquisa no “Google”. Justificação/Filosofia: A disponibilidade de Wikipedia resolve problemas cruciais de falta de materiais de aprendizagem em várias áreas de matemática. Estudantes deveriam ter experiência, em primeira mão, de Wekipedia para os ajudar nas suas aprendizagens. É um recurso grátis muito útil que não só resolve os problemas de estudante de materiais de referência mas também dirige os estudantes para outro websites relativamente úteis, bastando clicar nos ícones indicados. A sua utilidade é de reconhecida importância. Link 2: Título: Mathsguru URL: http://en.wikipedia.org/wiki/Probability Descrição: Mathsguru é um website que ajuda os estudantes a compreender várias da Teoria de Números. É fácil acerder através de pesquisa no Google e disponibiliza informações detalhadas sobre várias questões de Probabilidade. Oferece explicações e exemplificações que facilmente os estudantes podem entender. Justificação/Filosofia: Mathsguru oferece vias alternativas para estudantes acederem a outros tópicos correlacionados, sugestões e soluções, podendo constituir uma grande ajuda para os que encontram frustrações em obter livros que ajudem na aprendizagem de Probabilidade. Oferece abordagens bastante úteis, tendo em consideração as várias áreas do módulo de Probabilidade. Link 3. Título: Mathworld Wolfram URL: http://mathworld.wolfram.com/Probability Descrição: Mathworld Wolfram é um website cheio de soluções para problemas de Probabilidade. Os estudantes podem aceder a este recurso através de pesquisa no Google. Wolfram também orienta os estudantes para outros websites úteis para aprimorar as suas compreensões sobre os mesmos tópicos. Mathworld Wolfram é um site que também providencia alguns subsídios sobre a Teoria de Números, desafios e algumas orientações metodológicas. Ajuda também na Modelagem Matemática e é fortemente recomendado para estudantes interessados em aprender a Teoria de Números e outras áreas da Matemática. Ajuda a fazer ligação para outros websites fornendo uma vasta gama de informações necessárias para estudantes compreenderem os conteúdos de Probabilidade e Estatística. __African Virtual University XIV. Actividades de Aprendizagem Unidade 1 40 Horas Estatística Descritiva e Distribuição de Probabilidades Uma fazendeira desenvolveu as seguintes actividades na sua fazenda: 1. Ela planta 80 mudas no primeiro dia de Março. No primeiro dia de Dezembro mede as alturas das plantas. 2. Ela pesa todas as vacas da fazenda e regista os pesos no seu diário. 3. Faz o registo da produção de ovos da secção de avícula. 4. Faz o registo do tempo levado até entregar o leite à fábrica de processamento. Os resultados dos registos estão indicados a seguir: 1. Alturas das plantas em cm 2. Pesos de vacas em kg __African Virtual University 3. Número de Ovos 4. Tempo gasto até que o leite chegue ao processamento CASO 1: Uma empresa local que lida com serviços de extensão agrícola visita a fazendeira. Ela orgulhosamente produziu seus registos. O gestor agrícola ficou muito impressionado com registos mas percebe claramente que a fazendeira precisa de algumas habilidades em gestão de dados para permitir que ela tome boas decisões com base nos dados provenientes da sua fazenda. O gestor agrícola projeta um curso sobre processamento de dados para todos os farmeiros rurais. Durante a fase de planeamento do curso, são definidos os seguintes conceitos: a) Dados: São resultados de uma observação. Por exemplo, alturas de mudas b) Freqüência: taxa de ocorrência de um dado. Por exemplo, número de vacas pesadas. c) Média: O valor médio de um conjunto de dados d) Moda: Dado que ocorre com maior frequência. e) A mediana: Postos os dados em ordem crescente, a mediana é o elemento da posição Aula 1: Introdução à Estatística A Estatística Descritiva é utilizada para designar qualquer das várias técnicas utilizadas para sumarizar um conjunto de dados. Tais técnicas são geralmente classificadas em: 1. Descrição gráfica, em que usamos gráficos para sumarizar os dados. 2. Descrição Tabular, em que se usam tabelas para sumarizar os dados. 3. Descrição Paramétrica, em que se estimam os valores de determinados parâmetros que assumimos que completam a descrição do conjunto de dados. Em geral, os dados estatísticos podem ser descritos como uma lista de indivíduos ou unidades e os dados associados a cada um deles. 1. Pretende-se neste momento alcançar dois objectivos: Pretende-se mostrar estatisticamente o quanto certas medidas são parecidas. Em manuais de Estatística esta questão é respondida com base nas medidas de tendência central. __African Virtual University Quando estamos resumindo uma certa quantidade de dados, como o comprimento, o peso ou a idade, é comum responder-se à primeira questão com o cálculo da média aritmética, a mediana, ou a moda. Às vezes, pode-se calcular os quartís, decís ou percentís. As medidas mais comuns de variabilidade para dados quantitativos são a variância; a sua raiz quadrada, o desvio-padrão, a amplitude total; o intervalo interquartil, e o desvio absoluto. Aulas para os farmeiros Aos farmeiros é lhes ensinado como calcular: a) A Média A Média de um conjunto de dados é a soma de todos valores dividida pelo número total de dados. Exemplo: Calcule a média dos seguintes conjuntos de dados __African Virtual University Aula 2 Média de dados discretos Exemplo: Encontre a media dos seguintes dados __African Virtual University __African Virtual University FAÇA O SEGUINTE Calcule a media de: Respostas __African Virtual University Aula 3 Moda Exemplo 1) Encontre a moda dos seguintes dados: 1,3,4,4,5,6,1,3,3,2,2,3,3,5 Solução: A moda deste conjunto é o element que aparece mais vezes. Concretamente é o 3, com frequência igual a 5. 2) Encontre a moda dos seguintes dados: 22, 24, 25,22, 27, 22, 25, 30, 25, 31 Solução: 2. 2 e 25 ocorrem três vezes cada um. Portanto, as modas são 22 e 25. Neste caso, o conjunto de dados diz-se bimodal 3) Encontre a moda dos seguintes dados: Olhando para a distribuição de frequências, na tabela, conclui-se que a moda do conjunto de dados é X = 3, com frequência 16. 4) Encontre a classe modal dos seguintes dados: Neste caso, a classe modal é 70 – 74, porque apresenta a frequência mais alta 15. __African Virtual University FAÇA O SEGUINTE: Determine a moda ou a classe modal dos seguintes dados: Respostas __African Virtual University Aula 4 Mediana A mediana é o valor que se encontra no centro da distribuição de dados, quando estes estão dispostos na ordem crescente ou decrescente. Por exemplo, no conjunto 1; 2; 3; 4; 5, amediana é 3 porque aparece no centro. Isto é, o 3 divide o conjunto em duas partes iguais. Nos dados 1; 2; 2; 3; 4; 5; 6; 7; 7; 8, temos 10 elementos e não existe um único no centro. Ou seja, existem dois valores que formam o centro e, neste caso, a mediana é determinada calculando a média aritmética destes dois valores. Exemplo: Cálculo de mediana para dados agrupados em classes Exemplo: Encontre a mediana dos seguintes dados em classes _0African Virtual University Definição: Limite superior e limite inferior de uma classe. Limite inferior de classe (Li) ou a fronteira inferior de classe e Limite superior de classe (Ls) ou a fronteira superior de classe. Exemplo, para o intervalo 20 – 24 a fronteira inferior é 19.5 e a superior é 24.5 e para o intervalo 35 – 39 as fronteiras inferior e superior são respectivamente 34.5 e 39.5. Observa a tabela seguinte: Para determinar a mediana destes dados segue os seguintes passos: 1. Identificar a classe que contém a mediana. Neste caso, a mediana ocorre no intervalo 30 – 34, onde se encontra o dado da posição 20.5. 2. Encontrar as fronteiras desta classe. Neste caso, são Li = 29.5 e s = 34.5. 3. Determinar as frequências acumuladas. 4. Determinar a amplitude desta classe. Faz-se Ls – Li = 34.5 – 29.5 = 5 5. Calcular a mediana fazendo: Amplitude total de um conjunto de dados A amplitude total de um conjunto de dados determina-se fazendo a diferença entre o valor máximo e o mínimo do conjunto. Exemplo: Para o conjunto 23,26,34, 47,63, a amplitude é 63 – 23 = 40 e para o conjunto 121, 65, 78, 203, 298, 174, a amplitude é 298 – 65= 233. __African Virtual University Aula 5: Medidas de posição ou de Localização e de dispersão 1) Quartís Dados ordenados Segundo a sua magnitude, podem ser divididos em 4 partes iguais. As posições extremas destas divisões são os quartís. Assim, o primeiro quatil (Q1), deixa 25% de elementos à esquerda. O segundo quatil (Q2), deixa 50% de elementos à esquerda. Portanto, o segundo quartil coincide com a mediana. O terceiro quartil, deixa 75% de elementos à esquerda. 2) Semi-amplitude interquartil A semi-amplitude interquartil é definida como 3) Decís Quando os dados estão ordenados, podem ser subdivididos em 10 partes iguais, contendo, cada uma, 10% do total de elementos. Cada parte corresponde a um decil e se denotam por D1, D2, D3, ..., D8 e D9 4) Percentís Os percentís dividem o conjunto de dados em 100 partes iguais. Assim, podemos identificar 99 percentís, P1, P2, P3, ...., P98 e P99 5) Desvio médio absoluto O desvio médio absoluto de um conjunto de N dados, X1, X2, X3, ..., XN, é definido como a média dos desvios absolutos dos valores Xj em relação à média, isto é, __African Virtual University Exemple Encontre o desvio médio absolute dos seguintes dados 3, 4, 6, 8, 9. Solução A média aritmética dos valores dados é E, portanto, o desvio médio absoluto é Dada uma tabela de frequências O desvio médio absoluto é determinado usando a fórmula __African Virtual University 5) Desvio Padrão O desvio padrão de um conjunto de N dados X1, X2, ...., XN, é definido como a média dos desvios quadráticos, ou seja, Para uma tabela de frequências, O dessvio padrão calcula-se fazendo 6) Variância A variância de um conjunto de dados é definida como o quadrado do desvio padrão. Geralmente usa-se o S2 para denotar a variância calculada com base numa amostra de uma população e para denotar a variância populacional. De mesmo modo podemos considerar os respectivos desvios padrão. __African Virtual University Exemplos Encontre a media e a amplitude dos seguintes dados: 5,5,4,4,4,2,2,2 Solução E a amplitude é A = 5 – 2 = 3 Mediana Exemplo Dadas 13 observações 1,1,2,3,4,4,5,6,8,10,14,15,17, identifique a media Neste caso, há que identificar a posição da media. Como o número total de dados é ímpar, existe um só elemento no centro. Este elemento encontra-se na posição 2 1N 2 113 = 7. Daí que basta identificar o elemento que está na posição 7, nos dados ordenados. Concretamente, a mediana é 5. Mas quando o N é par, a mediana é calculada com base na média aritmética dos dois valores da posição central. Exemplo: No conjunto 1,1,2,2,3,4,4,5,6,8,10,14,15,17, o N = 14 e a mediana é calculada fazendo a média aritmética dos números das posições 2 N = 7 e 2 N +1 = 8. Estes números são 4 e 5. Portanto a mediana é 2 54 = 4.5 __African Virtual University FAÇA ISSO Encontre a mediana dos seguintes dados: A Variância é a média dos desvios quadráticos Onde N é o número de observações e a diferença X - X é o desvio em relação à média. S2 é a variância e a sua raíz é o desvo padrão. __African Virtual University Exemplo Dado o conjunto 2,4,5,8,11. Determine a variância e o desvio padrão. Na tabela seguinte estão apresentados os cálculos até a soma dos desvios quadráticos Portanto, a variância S2 = 5 50 = 10 e o desvio padrão S = 10 FAÇA ISSO 1) Calcule a amplitude dos seguintes dados: 1,1,1,2,2,3,3,3,4,5 10) Calcule a variância e o desvio padrão dos seguintes dados: 1,2,3,4,5 Assimetria Dada uma distribuição, podemos determinar um coeficiente que mede o quanto a distribuição é assimétrica. Podemos considerar dois tipos de assimetria: Positiva ou assimetria à direita e negativa ou assimetria à esquerda. Numa distribuição simétrica, a média é igual a moda e a mediana. Na distribuição assimétrica positiva ou à direita, a média é maior do que a moda e a mediana. Na distribuição assimétrica negativa ou à esquerda, a média é menor do que a moda e a mediana. Pode-se ver a seguir alguns exemplos: __African Virtual University Primeiro coeficiente de Assimetria de Pearson Este coeficiente é definido como: Segundo coeficiente de Assimetria de Pearson Este coeficiente é definido como: O coeficiente de Assimetria determinado a partir dos quartís. Coeficiente de Assimetria determinado a partir dos percentís. __African Virtual University Exemplo: Encontre o percentil de ordem 25, para os seguintes dados: 1, 2, 3, 4, 5, 6, 7, 9 Solução: Como o N = 8, faz N.(0,25) = 8.(0,25) = 2. O elemento da posição 2 é o 2 e o da posição 3 é o 3. O percentil pedido está entre 2 e 3. Como a diferença entre estes dois valores é 1, para encontrar o tal percentil faz (0,25).1 + 2 = 2,25 Encontre o percentil de ordem 50 dos dados do exercício anterior Solução: 8.(0,50) = 4. O tal percentil entre o quarto e o quinto elemento, 4 e 5, respectivamente. Como a diferença entre estes valor é 1, faz (0,50).1 + 4 = 4,5 que é o percentil de ordem 50 __African Virtual University FAÇA ISSO Encontre os percentís de ord m 25, 50 e 90 dos seguintes dados: e 46,21,89,42,35,36,67,53,42,75,42,75,47,85,40,73,48,32,41,20,75,48,48,32,52,61 49,50,69,59,30,40,31,25,43,52,62,50 Respostas a) 36 b) 48 c) 73 Curtose O coeficiente de curtose mede o grau de achatamento de uma distribuição quando se compara a uma distribuição normal. Exemplos: _0African Virtual University FAÇA ISSO Encontre a moda dos seguintes dados: 1) 1,3,4,4,2,3,5,1,3,3,5,4,2,2,2,3,3,4,4,5 2) Número de casamentos em cada 1000 pessoas na população Africanapara os anos de 1965 a 1975 __African Virtual University 3) Número de mortes em cada 1000 pessoas ano a ano de 1960 e de 1965 – 1975 1960 9.5 1965 9.4 1966 9.5 1967 9.4 1968 9.7 1969 9.5 1970 9.5 1971 9.3 1972 9.4 1973 9.3 1974 9.1 1975 8.8 Soluções 1. 3 2. 10.6 3. 9.5 __African Virtual University Probabilidade Conceitos importantes para o cálculo das probabilidades Para começarmos com o cálculo das probabilidades é importante que definamos três conceitos básicos: 1. Experimento ou fenómeno aleatório 2. Espaço amostral (conjunto fundamental ou espaço de resultados ou espaço de acontecimentos) 3. Evento ou acontecimento I) Experimento Aleatório Chama‐se Experimento Aleatório ao processo de observações ou de acção cujos resultados, embora podendo ser descritos no seu conjunto, não são determináveis à priori, antes da realização da experiência. Um experimento Aleatório tem as seguintes características: ‐ A possibilidade de repetição do experimento em condições similares; ‐ Não se poder dizer à partida qual o resultado do experimento a se realizar, mas poder descrever‐ se o conjunto de todos resultados possíveis; ‐ A existência de regularidades quando o experimento é repetido muitas vezes. Ex: Consideremos os seguintes experimentos E1: largar uma pedra de certa altura e verificar o que vai acontecer Para este experimento, uma questão é certa! A pedra vai cair E2: Lançar uma moeda, ao ar, e verificar a face voltada para cima quando a moeda já estiver no chão Aquí, porque a moeda (honesta ou não viciada) tem duas faces, não sabemos à prior qual estará voltada para cima! Existem duas possibilidades. Portanto, E1 é um experimento não aleatório enquanto que E2 é um experimento aleatório Outros experimentos aleatório que podemos considerar, são por exemplo: E3: Lançar duas moedas, ao ar, e verificar as faces de cima. Neste experimento, os resultados possíveis são: (C,C); (C,K); (K,C) e (K,K) em que C é a face coroa e K é a face cara. E4: Lançar um dado (de 6 faces) e verificar a face voltada para cima Para este experimento os resultados esperados são 1 ; 2 ; 3; 4; 5; 6 II) Espaço Amostral ou Espaço de Resultados ou Espaço de acontecimentos ou Conjunto Fundamental (S) ‐ É o conjunto de todos resultados possíveis de um certo experimento Ex: Para o experimento anterior (E2), o espaço amostral é S = (K , C) Para o experimento E3 o conjunto fundamental é S = (C,C); (C,K); (K,C); (K,K) Para o E4 o espaço de resultados é S = 1 ; 2 ; 3; 4; 5; 6 III) Evento ou acontecimento Chama‐se Evento à qualquer subconjunto de S Ex: Consideremos para o experimento E3 o acontecimento A: Saida da face cara pelo menos uma __African Virtual University Definições ou Conceitos de Probabilidade Vamos destacar, aqui, três definições ou conceitos de probabilidades: I. Conceito Clássico de Probabilidade (Teoria Clássica de Laplace) ‐ Se a uma experiência aleatória se podem associar N resultados possíveis, mutuamente exclusivos e igualmente prováveis, e se n(X) desses resultados tiverem o atributo X, então a probabilidade de X é a fracção N Xn )( ; Isto é P(X) = N Xn )( onde n(X) é o nº de resultados favoráveis a X e N é o nº de resultados possíveis para o experimento Ex: No experimento que consiste em lançar duas moedas e verificar a face de cima, o espaço amostral (S) tem 4 elementos ( resultados possíveis). Então N = 4. E os casos favoráveis ao evento A são 3. Portanto n(A) = 3. Então P(A) = N An )( = 4 3 II. Conceito frequencista de Probabilidade ou abordagem empírica ‐ Se em N realizações de uma experiência, o acontecimento A se verificou n vezes, diz‐se que a frequência relativa de A nas N realizações é f(A) = N n P(A) = limf(A) N n (quando N ∞) Para o caso do exemplo anterior, o número de realizações do experimento é N = 4 e a frequência relativa de A é é f(A) = N n = 4 3 . Portanto a probabilidade de A é P(A) N n = 4 3 Portanto, aqui, a probabilidade aproxima‐se à frequência relativa do evento. III. Conceito subjectivo ou personalista de probabilidade ‐ Utilizando este conceito, a probabilidade de um acontecimento é dada pelo grau de credibilidade ou de confiança que cada pessoa dá à realização de um acontecimento. Baseia‐se na informação quantitativa (ex: frequência de ocorrência de um acontecimento) e/ou qualitativa (ex: informação sobre experiência passada em situações semelhantes) que o decisor possui sobre o acontecimento em causa. Diferentes decisores podem atribuir diferenmtes probabilidades ao mesmo acontecimento decorrentes da experiência, atitudes, valores, etc, que possuem. Exemplo: O João diz ao Manuel: Manuel, se tu passares da rua ao lado daquela casa a probabilidade de seres corrido por um cão‐guarda (dessa casa) é de 90%. Mas O Paulo diz ao Manuel: Manuel, se tu passares da rua ao lado daquela casa a probabilidade de seres corrido por um cão‐guarda (dessa casa) é de 50%. Aqui, o João e o Paulo dão a mesma informação ao Manuel mas podes ver que eles atribuem probabilidades diferentes ao evento “ ser corrido...” Pode ser que de 10 vezes que o João passou daquela rua foi corrido 9 vezes e que o Paulo teve uma sorte diferente e foi corrido apenas 5 vezes! Portanto, cada um está usando as suas experiências passadas para definir a probabilidade de alguém ser corrido ao passar daquela rua. Então as probabilidades por eles atribuídas ao evento acima são subjectivas. __African Virtual University Regras de Contagem 1) Factorial Definição: Factorial 4 ! = 4 x 3 x 2 x 1 and 7! = 7 x 6 x 5 x 4 x 3 x 2 x 1 2) Permutação __African Virtual University__African Virtual University FAÇA ISSO Resolva as seguintes tarefas: . __African Virtual University Exemplo: Axiomas da teoria de probabilidades ‐ Da necessidade de sistematização dos conceitos empregues na teoria das probabilidades e da construção de um corpo teórico coerente surgem os três axiomas em que se baseiam todos os desenvolvimentos posteriores do campo das probabilidades. Assim consideramos que P( ) é uma função que associa a todo o acontecimento A definido em S um nº compreendido no intervalo ; e que satisfaz os seguintes axiomas: I. P(A) , A S (onde S é o espaço amostral) II. P(S) = 1, ( S é um acontecimento certo) III. Sendo A e B acontecimentos mutuamente exclusivos definidos em S, ou seja A B , tem‐se que P(AB) = P(A) P(B) Em geral, se A1, A2, A3, ..., An são acontecimentos mutuamente exclusivos definidos em S, então P(A1 A2 A3 ... An ) = P(A1) P(A2) P(A3) ... P( An ) = i=1 n P(Ai) Exemplo: Se lançarmos um dado, qual a probabilidade de obtermos 3 pontos ou 5 pontos? Solução: P(3) = 6 1 ; P(5) = 6 1 e, portanto, P(3 ou 5) = 6 1 + 6 1 = 6 2 = 3 1 PROBABILIDADE DA MULTIPLICAÇÃO Em probabilidades, há uma regra análoga ao princípio fundamental da contagem (estudado na análise combinatória), denominada regra do produto ou regra de multiplicação de probabilidades. Enunciado: Se um acontecimento é composto por vários eventos sucessivos e independentes, de tal modo que: O 1º evento é A e a sua probabilidade é P(A) O 2º evento é B e a sua probabilidade é P(B) O 3º evento é C e a sua probabilidade é P(C) . . . . . . . . . O K‐ésimo evento é K e a sua probabilidade é P(K), Então a probabilidadede que os eventos A, B, C, ..., K, ocorram nessa ordem é P(A B C ... K) = P(A).P(B).P(C).....P(K) Dois acontecimentos A e B, por exemplo, são independentes se e somente se a probabilidade de A ocorrer após B ter ocorrido é igual a probabilidade de A. Isto é, P(A após B) = P(A) ou P(B após A) = P(B) NOTA: Axiomas são proposições aceites sem demonstração d) Alguns teoremas importantes Os teoremas sempre precisam de ser demonstrados! Teorema 1. Dado um acontecimento A com probabilidade P(A), a probabilidade do seu complementar (acontecimento contrário) obtém‐se subtraíndo à unidade, a probabilidade de A; isto é P( A ) = P(A ) = 1 – P(A) c Temos (B A) (B – A) = . Então os acontecimentos (B A) e (B – A) são mutuamente exclusivos __African Virtual University Teorema 2. Aprobabilidade do acontecimento impossível; isto é P( ) = 0 Teorema 3. Dados dois acontecimentos A e B quaisquer, a probabilidade do acontecimento diferença B – A é P(B ‐ A) = P(B) – P(A B) Demonstração: FIGURA: Da figura podes ver que (B A) (B – A) = . Então os acontecimentos (B A) e (B – A) são mutuamente exclusivos Mas (B A) (B – A) = B Então P(B) = P(B A) (B – A)] = P (B A) P(B – A) P(B – A) = P(B) ‐ P (B A) c.q.d Teorema 4. ‐ A probabilidade da união de dois acontecimentos quaisquer (não necessariamente mutuamente exclusivos), A e B é P(A B) = P(A) P(B) ‐ P (B A) Consideremos alguns exemplos: a) De um baralho de 52 cartas é escolhida aleatoriamente uma carta. Qual a probabilidade de ser um 10 ou coração. Solução: A probabilidade de ser um 10 é P(10) = 52 4 ; a probabilidade de ser coração é P(coração) = 52 13 e a probabilidade de ser 10 e coração P(10 e coração) = 52 1 . Portanto, a probabilidade pedida é P(A B) = P(A) P(B) ‐ P (B A) = P(10) + P(coração) – P(10 e coração) = P(10) + P(coração) – P(10 e coração) = 52 4 + 52 13 ‐ 52 1 = 52 16 b) No lançamento de um dado, encontre a probabilidade de que se tenha obtido o número 4 sabendo que sabendo que o número obtido no lançamento foi par. Solução: Trata‐se, aquí, de uma probabilidade condicional. Para dois eventos A e B, em geral, a probabilidade de ocorrência simultânea é dada por P(A B) = P(A/B).P(B) e, portanto, P(A/B) = P(B) B) (A Sendo A: Saida do número 4 no lançamento de um dado e B: Saida de um número par no lançamento de um dado então P(A B) = 6 1 e P(B) = 6 3 . Portanto, P(A/B) = P(B) B) (A = 6 3 6 1 = = 3 1 c) Uma caixa contém 3 bolas cor de laranja, 3 cor amarela e 2 cor branca. Três bolas são seleccionadas aleatoriamente sem reposição. Achar a probabilidade de sairem duas amarelas e uma branca. Sejam, A1: Saida de bola amarela na primeira extracção. Então, P(A1) = 8 3 A2: Saida de bola amarela na segunda extracção após ter saido amarela na primeira. Então, P(A2) = 7 2 B3: Saida de bola branca na terceira extracção após terem saido amarelas nas duas extracções anteriores. Então, P(A2) = 6 2 Então, a probabildade de sairem duas amarelas e uma branca será: 8 3 x 7 2 x 6 2 = 28 1 EXERCÍCIOS 1. De quantas maneiras diferentes 7 pessoas podem estar dispostas numa fila? 2. De quantas maneiras diferentes 3 canetas podem ser escolhidas de 12 canetas? 3. Se de um baralho de 52 cartas escolhermos 3, qual a probabilidade de todas serem ouro? RESPOSTAS 1. (5040) 2. (220) 3. (0,013) LEIA An Introduction to Probability and Rondam Processes by Kenneth B & Gian-Carlo, páginas 1. 1. 20-1.22 * Capítulo 1 de exercícios: Sets, Events & Probability pg 1.23-1.28 Números 1-12 & 14-20 2. 2.1-2.33 * Capítulo 2 de exercícios: Finite Processes pag. 2.33 Números 1, 2, 3, 13-20 3. Itroduction to Probability , by Charles M Grinstead páginas 139-141 Variáveis Aleatórias Variáveis Aleatórias (v. a) Definição: Uma variável aleatória é uma função que associa a cada resultado possível de um experimento aleatório um número real. (Harry Frank & Steve C Althoen, CUP, 1994, pág. 155). Uma variável Aleatória é uma variável no sentido de que ela pode ser usada como um substituto de um número nas equações ou inequações. Sua aleatoriedade é completamente descrita pela sua função de distribuição acumulada que pode ser usada para determinar a probabilidade que ela toma para certos valores particulares. Formalmente, uma variável aleatória é uma função mensurável de um espaço de probabilidades ao conjunto de números reais. Por exemplo, uma variável aleatória pode ser usada para descrever o processo de lançamento de um dado perfeito e os possíveis resultados {1, 2, 3, 4, 5, 6}. A representação mais óbvia é tomar estes conjunto como espaço amostral, a medida de probabilidade como sendo uma medida uniforme, e a função sendo a função identidade. Variável Aleatória Alguns consideram variável aleatória um nome inapropriado, uma vez que variável aleatória não é variável mas sim uma função que transforma resultados (de um experimento) em números reais. Seja A uma -álgebra e o espaço amostral de resultados relevantes ao experimento a ser levado a cabo. No exemplo de lançamento do dado, o espaço de resultados é = {1, 2, 3, 4, 5, 6}, e A seria a potência do conjunto. Neste caso, uma variável aleatória apropriada seria a função identide X() = , tal que se o resultado é um “1” então a variável aleatória é tabém 1. Um exemplo igualmente simples mas menos trivial é o exemplo no qual poderíamos lançar uma moeda: um espaço amostral adequado de resultados possíveis é = {H, T} (para cara ou coroa), e A igual ainda à potência de . Uma entre muitas variávis aleatórias possíveis definidas neste espaço é: X() = Tse Hse ,1 ,0 Matematicamente, uma variável aleatória é definida como uma função mensurável de um espaço amostral para algum espaço mensurável Convergência de Variáveis Aleatórias Na teoria de probabilidade, existem várias noções de convergência para variáveis aleatórias. Elas são listadas abaixo em ordem da sua força, isto é, qualquer noção de convergência subsequente na lista implica convergência de acordo com todas as noções de convergência precedentes. Convergência em distribuição: Como o nome diz, uma sequência de variáveis aleatórias X1, X2, ... converge para a variável aleatória X em distribuição se as suas respectivas funções de distribuição acumuladas F1, F2, ... convergem para a função de distrbuição acumulada F, de X, sempre que F é contínua. Convergência Fraca: A sequência de variáveis aleatórias X1, X2, ... é dita convergir fracamente para uma variávela aleatória X se )|(|lim XXP nn = 0 para cada > 0. A Convergência Fraca é também chamada deconvergência em probabilidade. Convergência Forte: A sequência de variáveis aleatórias X1, X2, ... é dita convergir fortemente para uma variávela aleatória X se )(|lim XXP nn = 1 A convergência Forte é também conhecida como convergência quase certa. Intuitivamente, convergência forte é uma versão mais forte da convergência fraca, e em ambos casos as variáveis aleatórias X1, X2, ... mostram uma correlação crescente com X. Todavia, no caso da convergência em distriubuição, os valores realizados das variáveis aleatórias não precisam de convergir, e qual qualquer possível correlação entre eles é imaterial. Lei dos Grandes Números Se uma moeda perfeita é atirada para cima, sabemos que aproximadamente metade de vezes terá cara virada para cima, e outra metade terá coroa viradapara cima. Também parece que quanto mais lançarmos a moeda, mais provável é que a razão de cara:coroa aproximará a 1:1. A probabilidade moderna permite-nos chegar formalmente ao mesmo resultado, apelidada de Lei de Grandes Números. Este resultado é notável porque em parte alguma foi assumido durante a construção da teoria e é completamente um ramo da teoria. Ligando teoricamente-deduzidas as probabilidades à sua frequência real de ocorrência no mundo real, este resultado é considerado como um pilar na história da teoria estatística. A Lei forte de grandes números (SLLN – strong law of large numbers) afirma que se um evento de probabilidade p é observado repetidamente durante experimentos independentes, a razão entre a fraquência observada do tal evento e o número total de repetições converge fortemente para p em probabilidade. Em outras palavras, se X1, X2, ... são variáveis aleatórias independentes de Bernoulli tomando valores 1 com probabilidade p e 0 com probabilidade 1 – p, então a sequência de números aleatórios n X n converge para p quase certamente, isto é, 11lim p n n i iX n P Teorema Central do Limite O teorema central do limite é a razão de ocorrência omnipresente da distribuição normal, para a qual é um dos teoremas mais celebrados em probabilidade e estatística. O teorema afirma que a média de muitas variáveis aleatórias independentes e identicamente distribuidas tende para uma distribuição normal independentemente da qual distribuição original as variáveis aleatórias seguem. Formalmente, seja X1, X2, ... variáveis aleatórias independentes com médias 1, 2, ..., e variâncias .. Então, a sequência das variâveis aleatórias Zn = n i i n i iiX 1 2 1 )( converge em distribuição para uma variável aleatória normal padrão. Funções de Variáveis Aleatórias Se temos uma variável aleatória X em e uma função mensurável f: R R, então Y = f(X) será também uma variável aleatória em , uma vez que a composição de uma função mensurável é uma função mensurável. O memso procedimento que nos permitiu sair do espaço de probabilidade (, P) para (R, dFX) pode ser usado para obter a distribuião de Y. A função acumulada de probabilidade de Y é FY(y) = P(f(X) y). Exemplo Seja X tomando valores reais, uma variável aleatória contínua e seja Y = X2. Então FY(y) = P(X2 y). Se y < 0, então P(X2, y) = 0, assim FY(y) = 0 se y < 0 Se y 0, então P(X2 y) = P(|X| y) = P ),( yXy Assim, FY(y) = FX( y) – F (-X y) se y 0 Distribuições de Probabilidade Certas variáveis aleatórias ocorrem muitas vezes na teoria de probabilidade devido a muitos processos naturais e físicos. Suas distribuições portanto, ganharam importância especial na teoria de probabilidade. Algumas distribuições discretas fundamentais são a uniforme, a de Bernoulli, a binomial, a binomial negativa, de Poisson e a geométrica. Distribuições contínuas importantes incluem a uniforme contínua, a normal, exponencial, gamma e a distribuição beta. Funções de Distribuição Uma variável aleatória X: R definida no espaço de probabilidade (, A, P) é dada, podemos colocar as questões do tipo “Quão provável é que o valor de X seja maior que 2?”. Esta questão é a mesma que a probabilidade do evento {s : X(s) > 2} que muitas vezes é escrito como P(X > 2), de forma mais breve. Registando todas estas probabilidades para valores reais de X resulta a distribuição de probabilidade de X. A distribuição de probabilidade “esquece” do espaço particular de probabilidade usado para definir X e somente regista as probabilidades dos diferentes valores de X. Tal distribuição de probabilidade pode sempre ser capturada pela sua função acumulada de probabilidade FX(x) = P(X x) e algumas vezes também se usa uma função de densidade de probabilidade. Em termos de teoria de medidas, usamos a variável aleatória X para “puxar-a-diante” a medida P em a uma medida dF em R. O espaço de probabilidade subjacente é um dispositivo técnico usado para garantir a existência de variáveis aleatórias, e algumas vezes para construí-las. Na prática, se dispõe juntamente do espaço e somente se atribui a uma medida em R que associa medida 1 a toda recta real, isto é, trabalhamos com distribuições de probabilidade em vez de variáveis aleatórias. Teoria de Probabilidade discreta A teoria de probabilidade discreta lida com eventos que ocorrem em espaços amostrais enumeráveis. Exemplos: Lançamento de um dado, experimentos com baralhos de cartas, e uma caminhada aleatória. Definição clássica: Inicialmente a probabilidade de um evento a ocorrer foi definida como um número de casos favoráveis ao evento, sobre o número total de resultados possíveis. Por exemplo, se o evento é “ocorrência de um número par quando o dado é lançado”, a probabilidade é dada por 2 1 6 3 uma vez que 3 faces das 6 têm números pares. Definição moderna: a definição moderna começa com um conjunto chamado de espaço amostral que relaciona ao conjunto de todos resultados possíveis no sentido clássico, denotado por = {x1, x2, ... }. E depois é assumido que para cada elemento x , um número intrínseco de “probabilidade” f(x) é associado, que satisfaz as seguintes propriedades: 1. f(x) [0, 1] para todo x 1)( x xf Um evento é definido como qualquer subconjunto E do espaço amostral . A probabilidade do evento P(E) = Ex xf )( Assim, a probabilidade de todo espaço amostral é 1, e a probabilidade do evento nulo é 0. A função f(x) que transforma um ponto no espaço amostral ao valor da “probabilidade” é chamada uma função de massa de probabilidade abreviada como fmp (= pmf-probability mass function). A definição moderna não tenta responder como as funções de massa de probabilidade são obtidas, em vez disso constrói uma teoria que assume sua existência. Teoria de Probabilidade Contínua A teoria de probabilidade contínua lida com eventos que ocorrem num espaço amostral contínuo. Se o espaço amostral é um conjunto de números reais, então uma função chamada de função acumulada de probabilidade ou fadF (=cdfF – cumulative distribution function) é assumida a axistir, que resulta em P(X x) = F(x) fadF deve satisfazer as seguintes propriedades: 1. F é uma função monótona não decrescente e contínua à direita 2. 0)( lim xFx 3. 1)( lim xFx Se F é diferenciável, então a variável aleatória é dita ter uma função de desnsidade de probabilidade ou fdp ou simplesmente densidade f(x) = dx xdF )( Para um conjunto E R, a probabilidade da variável aleatória em E é definida como P(X E) = Ex xdF )( No caso da densidade existir, então a função anterior pode ser escrita como P(X E) = Ex dxxf )( Enquanto que a fdp existe somente para variáveis aleatórias contínuas, a fad existe para todas variávis aleatórias (incluíndo para variáveis aleatórias discretas) que tomam valores em R. Estes conceitos podem ser genaralizados para casos de espaços multidimensionais ou seja em Rn. Função de Densidade de Probabilidade Distribuição discreta Se X é uma variável que pode assumir um conjunto discreto de valores X1, X2, X3, ..., Xk com respeito a probabilidades p1, p2, p3, ...., pk, onde p1 + p2 + p3 + ....... + pk = 1 dizemos que uma distribuição discreta de probabilidade para X foi definida. A função p(X), com os valores respectivos p1, p2, p3, ..., pk para X = X1, X2, X3, ..., Xk é chamda de função de probabilidade, ou função de frequência, de X. Porque X pode assumir certos valores com probabilidades dadas, esta função é muitas vezes chamada uma variávelaleatória discreta. Uma variável aleatória é também conhecida como uma variável de chance ou variável estocástica. {Murray R, 2006, pág. 130). Distribuição Contínua Supõe que X é uma variável aleatória contínua. Uma variável aleatória contínua X é especificada pela sua funçao de densidade de probabilidade que é escrita f(x) quando f(x) 0 em todo intervalo de valores para os quais x é válido. Esta função de densidade de probabilidade pode ser representada por uma curva, e as probabilidades são dadas pela área por baixo da curva. A área total por baixo da curva é igual a 1. A área por baixo da curva entre as rectas x = a e x = b (sombreada) corresponde a probabilidade de X entre a e b, que pode ser denotada por P(a < X < b). P(X) é chamada uma função de densidade de probabilidade e a variável X é muitas vezes chamada de uma variável aleatória contínua. Uma vez que a área total por baixo da curva é igual a 1, segue a probabilidade do espaço entre a e b é dada por P(a X b) = b a dxxf )( que é a área sombreada. Nota: ao calcular a área entre a e b, não distinguimos as desigualdades ( e ) e (< e >). Assumimos que as rectas em a e b não têm grossura e a sua área é igual a zero. Exemplos resolvidos: 1) Uma variável aleatória X está distribuida com a função densidade de probabilidade f definida por f(x) = kx(16 – x2), para 0 < x < 4 Avalie a). O valor da consatante k b). A probabilidade do espaço P(1 < X < 2) c). A probabilidade P(X 3) Solução Para qualquer função f(x) tal que f(x) 0, para a X b, e = 1 b a dxxf )( pode ser tomada como a função de densidade de probabilidade (f. d. p) de uma variável aleatória contínua no intervalo a X b. Procedimento Passo 1: Em geral, se X é uma variável aleatória contínua (v. a. c.) com f. d. p. f(x) válida no intervalo a X b, então Xa dxxf || 1)( , isto é b a dxxf )( = 1 Passo 2: a) Para determinar k, usamos o facto de que f(x) = kx(16 – x2), para 0 X 4, então 1)16( 4 0 2 dxxkx k 1)16( 4 0 3 dxxx k = 64 1 Passo 3 b). Determinar P(1 < X < 2) Solução P(1 < X < 2) = 2 1 )( dxxf = 64 1 2 1 3 )16( dxxx = 256 81 Passo 4 c). Determinar P(X 3) P(X 3) = 64 1 4 3 3 )16( dxxx = 256 49 Exemplo 2 2). X é a variável aleatória contínua ‘a massa de uma substância, em kg, por minuto num processo de produção industrial’, onde f(x) = casosoutrosem Xxx 0 )30()6( 12 1 Determinar a proabilidade de que a massa seja mais que 2 kg. Solução X pode tomar valores somente de 0 a 3. Esboçamos o gráfico de f, e sombreamos a área requerida. P(X > 2) = 3 2 )6( 12 1 dxxx = 3 2 2 )6( 12 1 dxxx = 3 2 3 2 3 3 12 1 xx = 0,722 (3 casas decimais) A probabilidaade de que a massa seja mais do que 2 kg é de 0,722 Exemplo resolvido 3). Uma variável aleatória contínua tem fdp f(x) onde f(x) = kx2, 0 X 6 a). Determinar o valor de k b). Determinar P(2 X 4). Solução a) Uma vez que X é uma variável aleatória, a probabilidade total é igual 1, isto é, || 1)( a dxxf = 1 6 0 2dxkx 1 3 6 0 3 kx 1 3 216 k k = 216 3 Portanto, f(x) = 22 72 1 216 3 xx , 0 X 6 b) P(2 X 4) = 4 2 2 72 1 dxx = 4 2 3 216 1 x = 0,259 Portanto, a probabilidade P(2 X 4) = 0,259 Exemplo resolvido 4). Uma variável aleatória contínua (v. a c) tem a função de densidade de probabilidade f. d. p. f(x), onde f(x) = casosoutrosem Xxk Xk 0 )52()32( 20 a) Determinar o valor de k b) Esboçar y = f(x) c) Determinar P(X 1) d) Determinar P(X > 2,5) Solução a) Uma vez que X é uma variável aleatória, então Xa dxxf || 1)( Portanto, 2 0 5 2 1)32( dxxkkdx = 1 52220 3xxkkx 2k + 19k = 1 k = 21 1 b) Assim a f. d. p de X é f(x) = casosoutrosem Xx X 0 )52()32( 21 1 20 21 1 Esboço do gráfico de f: c) P(X 1) = área por baixo do gráfico entre zero e 1 = C L = 1 21 1 = 21 1 = 0,048 d) Determinar P(X > 2,5) = área do rectângulo + área do trapézio = ( 21 1 2) + ( 21 1 {0,5}{ 21 1 + 21 2 }) = 131,0 84 11 RESOLVE 1). A variável aleatória contínua X tem a f. d. p f(x) onde f(x) = k, 0 X 3. a) Esboce y = f(x) b) Determine o valor da constante k c) Determine P(0,5 X 1) 2) A variável aleatória contínua X tem a f. d. p f(x) onde f(x) = kx2, 1 X 4 a) Determine o valor da constante b) Determine P(X 2) c) Determine P(2,5 X 3,5) 3) A variável aleatória contínua X tem a f. d. p f(x) onde f(x) = casosoutrosem Xxk Xk 0 )32()12( 20 Determine o valor da constante k a) Esboce y = f(x) b) Determine P((X 2) c) Determine P(1 X 2,2) Reflexão: Os professores podem encontrar o software de produção de gráficos úteis no ensino da estatística. Um exemplo do software da Fonte Aberta é o Graph. Veja na página http://www.padowan.dk/graph/ Se tem acesso ao computador, faça o download graph e explore as suas ferramentas estatísticas A seguir está um exemplo de diferentes curvas que podem ser desenhadas com o recurso a Graph. Esperança Definição Se X é uma variável aleatória contínua com a função de densidade de probabilidade (f. d. p) f(x), então a esperança de X é E(X) onde E(X) = Xa dxxXf || )( NB: E(X) é muitas vezes denotada por e referida como a média de X Exemplo 1) Se X é uma variável aleatória contínua com f. d. p f(x) = 2 16 1 x , 0 X 3, determine E(X). Solução E(X) = Xa dxxXf || )( 3 0 2}{ 16 1 dxXX = 64 81 416 1 3 0 4 x = 1,265 2) Se a variável aleatória contínua X tem f. d. p. f(x) = 5 2 (3 + x)(x – 1), 1 X 3, determine E(X). E(X) = Xa dxxXf || )( 3 0 )1)(3}({ 16 1 dxxxX = 60 608 2 3 3 2 45 2 3 1 234 xxx = 10,13 Generalização Se f(x) é uma função qualquer da variável aleatória contínua X tendo a f. d. p. f(x), então E[g(X)] = Xa dxxfxg || )()( e em particular E(X2) = Xa dxxfX || 2 )( A seguinte conclusão é consistente 1. E(a) = a 2. E(aX) = aE(X) 3. E(aX + b) = aE(X) + b 4. E[f1(X) + f2(X)] = E[f1(X)] + E[f2(X)] Exemplo 1) Uma variável aleatória contínua X tem f. d. p. f(x) onde f(x) = x 2 1 , 0 X 3 Determine a) E(X) b) E(X2) c) E(2X + 3) Solução a) E(X) = = Xa dxxXf || )( 3 0 2 2 1 dxx = 3 0 3 32 1 x = 4,5 b) E(X2) = = Xa dxxfX || 2 )( 3 0 3 2 1 dxx = 3 0 4 42 1 x = 8 81 = 10,125 c) E(2X + 3) = E(2X) + 3 = 2E(X) + 3 = 2(4,5) + 3 = 12 (a partir de a) acima) RESOLVE 1) A variável aleatória contínua X tem a f. d. p. f(x), onde f(x) = casosoutrosem Xxk xk Xkx 0 )53()4( 31 10 a) Determine k b) Calcule E(X) 2) A variável aleatória contínua X tem a f. d. p f(x) onde f(x) = )3( 101 x , 0 X 5 Determine a) E(X) b) E(2X + 3) c) E(X2) d) E(X2 + 2X – 1) Distribuição de Bernoulli Na teoria de probabilidade e estatística, a distribuição de Bernoulli, assim chamada em homenagem ao cientísta Suiço Jacob Bernoulli, é uma distribuição discreta de probabilidade, que toma o valor 1 com a probabilidade de sucesso p e valor 0 com a probabilidade de fracasso q = 1 – p. Assim se X é uma variável aleatória com esta distribuição, temos P(X = 1) = 1 – P(X = 0) = p. A função f de massa de probabilidade desta distribuição é: f(k; p) = casosoutrosem ksep ksep 0 01 1 O valor esperado de uma variável aleatória de Bernoulli X é E(X) = p, e sua variância Var(X) = p(1 – p). A curtose tende para o infinito para os valores altos e baixos de p, mas para p = 2 1 a distribuição de Bernoulli tem a curtose mais baixa do que qualquer outra distribuição, nomeadamente -2. A distribuição de Bernoulli faz parte da família da distribuição exponencial. Distribuição Binomial Na teoria de probabilidade e estatística, a distribuição binomial é uma distribuição discreta de probabilidade do número de sucessos numa seuqência de n experimentos independentes do tipo sim/não cada um dos quais resulta em sucesso com probabilidade p. Um tal experimento de sucesso /fracasso é também chamado de experimento de Bernoulli ou ensaio de Bernoulli. De facto, quando n = 1, a distribuição binomial é uma distribuição de Bernoulli. A distribuição binomial é a base para o teste popular binomial da significância estatística. Exemplos Um exemplo elementar é o seguinte: lançar um dado para cima dez vezes e contar o número de 1s como resultado. Então este número aleatório segue uma distribuição binomial com n = 10 e p = 6 1 Por exemplo, assume que 5% da população tem olhos verdes. E você retira 500 pessoas aleatoriamente. O número de pessoas de olhos verdes você retira é uma variável aleatória X que segue uma distribuição binomial com n = 500 e p = 0,05 (quando a retirada de pessoas é com reposição). Exemplos 1). Uma moeda é lançada para cima 3 vezes. Determine a probabilidade de obter 2 caras e uma coroa em qualquer ordem dada. Fórmula Podemos usar a fórmula xnxnx ppC 1 Onde n = ao número total de lançamentos x = número de sucessos (1, 2, ...) p = probabilidade de sucessos 1º determina o número de possbilidades em que um sucesso pode ocorrer nxC 2º é a probabilidade de obter x sucessos xp 3º é a probabilidade de obter n – x fracassos. xnp 1 Solução Lançar 3 vezes significa n = 3 Duas caras significa x = 2 P(Cara) = 2 1 ; P(Coroa) = 2 1 P(2 caras) = 232 3 2 2 11 2 1 C = 3 4 1 2 1 = 8 3 RESOLVE 1) Determine a probabilidade de obter exactamente um 5 quando um dado é lançado 3 vezes. 2) Determine a probailidade de obter 3 caras quando 8 moedas são lançadas para cima. 3) Uma urna contém 4 bolas vermelhas e 2 bolas verdes. Uma bola é extraída da urna e reposta na urna 4 vezes. Qual a probabilidade de obter exactamente 3 bolas vermelhas e 1 bola verde? Resposta 1) P(um 5) = 72 25 6 5 6 1 213 1 C = 0,347, isto é n = 3, x = 1 e p = 6 1 2) P(3 caras) = 32 7 2 1 2 1 538 3 C = 0,218, isto é n = 8, x = 3, p = 2 1 3) P(3 bolas vermelhas) = 81 32 3 1 3 2 134 3 C = 0,395 isto é n = 4, x = 3, p = 3 2 LEIA 1. Lectures on Statistics, By Robert B. Ash, , page 1-4 Processes By is aleatórias (Random Variables) pág 3.64-3.82 Probability By Charles M. Grinstead 8 ki/Bernoulli_distribution • Exercícios Nos.1, 2 e 3 na pág 4. 2. An Introduction to Probability & Random Kenneth B & Gian-Carlo R, pág. 3.1-3.63 • Exercício Capítulo 3: Variáve Nrs. 1-7, 11-17, 20-24, 34-36 3. An Introduction to Pág. 96-107, & 184 • Exercícios nas pág. 113-11 Nrs. 1,2,3,4,5,8,9,10,19,20 Ref: http://en.wikipedia.org/wiki/measurable_space Ref: http://en.wikipedia.org/wiki/Probability_theory Ref: http://en.wikipedia.org/wi tempo fixo se tais eventos ocorrem com uma taxa média conhecida, e são independentes do tempo a adas telefónicas por hora s vermelhos no sangue numa certa área. A probabilidade de X sucessos é: Distribuição de Poisson Na teoria de probabildade e estatística, a distribuição de Poisson é uma distribuição discreta de probabilidade que exprime a probabilidade de um número de eventos ocorrendo em um período de partir do último evento. A distribuição foi descoberta por Siméon-Denis Poisson (1781-1840). A distribuição de Poisson algumas vezes é chamada uma distribuição Poissonian, análogo ao termo Gaussiano para a distribuição de Gauss ou distribuição normal. A distribuição de Poisson é usada quando a variável ocorre num período de tempo, volume, área, etc. ... e pode ser usada para chegadas de aviões em aeroportos, o número de cham num estação, o número de glóbulo !X e x onde e é uma consatante matemática = 2,7183 é a média ou valor esperado das variáveis. 500 páginas manuscritas, determine idade de uma página dada tenha exactamente 4 erros. Determinar a média de erros = Exemplo Se ocorrem 100 erros tipográficos distribuidos aleatoriamente em a probabil Solução 5500 1100 = 0,2 Em outras palavras, existe uma média de 0,2 erros por cada página. Neste caso x = 4, assim a probabilidade de escolher uma página com exactamente 4 erros é !X e x = !4 2,07183,2 42,0 = 0,00168 Cerca de 0,2% Trabalho em grupo 1. Estude o cálculo da probabilidade e resolve a quesão que se segue Exemplo Resolvido Uma linha telefónica gratis recebe uma média de 4 chamadas por hora para qualquer hora dada. etermine a probabilidade de que ela receba exctamente 5 chamadas. D !X e x = !5 2,07183,2 53 = 0,1001 RESOLVE Que é 10% Uma Companhia de Marketing de telefone obtém uma média de 5 encomendas em cada 1000 chamadas. Se a companhia liga para 500 pessoas, determinar a probabilidade de obter 2 encomendas o ue é 26% LEIA Soluçã 0,26 Q 1. An Introduction to Probability & Random Processes By tas dos problemas 1,2,3 na pág 15. ef: http://en.wikipedia.org/wiki/Normal_distribution Kenneth B & Gian-Carlo R, pág. 187-192 2. Robert B. Ash, Lectures on Statistics, pág. 1 e respos R distribuição geométrica é uma das duas distribuições nsaios de Bernoulli necessárias para obter um amos “a” distribuição geométrica por uma meras questão de convecção p1, então a probabilidade de que k ssários para obter um sucesso é .p0 para k = 1, 2, 3, ... s em cada ensaio é p0, então a probabilidade de que primeiro sucesso é 0 para k = 0, 1, 2, 3, ... Em cada um dos casos, a sequência de probabilidades é uma sequência geométrica. Distribuição Geométrica Na teoria de probabilidade e estatística, a discretas: a distribuição de probabilidade do número X de e sucesso, realizadas no conjunto {1, 2, 3, ...} ou a distribuição de probabilidade do número Y = X – 1 de fracassos antes do primeiro sucesso, sobre o conjunto {0, 1, 2, 3, ... } Uma destas distribuições cham e conveniência. Se a probabilidade do sucesso em cada um dos experimentos é experimentos sejam nece P(Y = k) = (1 – p0)k Equivalentemente, se a probabilidade de sucesso haja k fracassos antes do P(Y = k) = (1 – p0)k.p
Compartilhar