Baixe o app para aproveitar ainda mais
Prévia do material em texto
PROBABILIDADE E ESTATÍSTICA (CEL0272/1915189) 9007 Aula 1: Introdução a Estatística O desenvolvimento da estatística moderna está relacionado a três fenômenos isolados: as necessidades dos governos coletarem dados sobre os seus cidadãos, o desenvolvimento da teoria da probabilidade e o advento da informática. Pacotes estatísticos como: SAS, Eviews, R-Project. Etc. História da Estatística, saiba mais em: https://pt.wikipedia.org/wiki/Hist%C3%B3ria_da_estat%C3%ADstica Estatística é a ciência que estuda método de coleta, organização, descrição, analise e interpretação de dados, para a obtenção de conclusões válidas e tomadas de decisões. Estatística Descritiva: Coleta, a organização e a descrição de dados. Conjunto de técnicas destinadas a descrever e resumir os dados, a fim de que possamos tirar conclusões a respeito da característica de interesse; Estatística Inferencial: Análise e a interpretação dos dados. Estudo de técnicas que possibilitam a extrapolação, a um grande conjunto de dados, das informações e conclusões obtidas a partir da amostra; Estatística das Probabilidades: Estudo do risco e do acaso de eventos futuros e determina se é provável ou não seu acontecimento. Teoria matemática utilizada para se estudar a incerteza oriunda de fenômenos de caráter aleatório. População: é o conjunto total de elementos que tem determinada característica que se deseja estudar. Ao conjunto ou grupo de indivíduos que possuem pelo menos uma característica em comum, denominamos de população estatística ou de universo estatístico. Amostra: é uma parte da população de interesse a que se tem acesso para se desenvolver o estudo estatístico. Uma Amostra é subconjunto finito não vazio de uma população estatística. Para obtermos previsões válidas sobre um determinado problema quase nunca utilizamos todos os elementos da população, trabalhamos apenas com amostras desta população. Exemplo – Previsão baseada em amostra: Antes de uma eleição, os institutos de pesquisa entrevistaram 2000 pessoas e, com base em suas respostas, conseguem prever o resultado da eleição. Parâmetro: é uma medida numérica que descreve alguma característica de uma população. Estatística: é uma medida numérica que descreve alguma característica de uma amostra. Conceito de variável: Para cada experimento ou informação obtemos um número de resultados possíveis, por exemplo: Se o experimento refere-se a uma categoria como "gênero de uma pessoa" são dois os resultados possíveis: masculino ou feminino. Se o experimento refere-se a uma categoria como "estatura de uma pessoa" temos vários resultados possíveis dentro de um intervalo de números. Variáveis Qualitativas: são as variáveis cujas respostas são expressas por um atributo. Podemos distinguir dois tipos de variáveis qualitativas: nominal e ordinal. Variáveis qualitativas nominais: definem-se como aquelas em que as respostas são expressas por um atributo (nome) e esse atributo não pode ser ordenado. Por exemplo: tipo sanguíneo, religião, estado civil, etc. Variáveis qualitativas ordinais: têm suas respostas expressas por um atributo (nome) e esse atributo pode ser ordenado. Por exemplo: grau de instrução, classe social, etc. Variáveis Quantitativas: são aquelas cujas respostas da variável são expressas por números (quantidades). Podemos distinguir dois tipos de variáveis quantitativas: quantitativa contínua e discreta. Variáveis quantitativas discretas: são aquelas que só podem assumir valores inteiros. Por exemplo: número de filhos por casal, número de livros em uma biblioteca, número de carros vendidos, etc. Variáveis quantitativas contínuas: são aquelas que podem assumir, teoricamente, infinitos valores entre dois limites (num intervalo), ou seja, podem assumir valores não inteiros. Por exemplo: altura (em metros) de alunos de uma determinada faixa etária, peso (em kg), salário, etc. Códigos Numéricos: Muitas vezes, na utilização de programas computacionais, associamos códigos numéricos a uma variável qualitativa. Por exemplo, para a variável gênero podemos associar ao sexo feminino o valor 1 e ao masculino 2. Apesar da variável ser representada por valores numéricos, isso não a torna uma variável quantitativa. Organizando e Contando Dados Os dados coletados da observação de um fenômeno coletivo, sem manipulação ou ordenação, são chamados de dados brutos. Exemplo: As notas de matemática de um grupo de alunos ao final da primeira avaliação são: 2,1; 7,1; 4,3; 3,3; 4,7; 6,9; 6,1; 7,1 e 8,3; 6,9. A série numérica exposta poderia ser de melhor forma apresentada se estabelecêssemos uma ordenação para as notas. Esta etapa consiste na elaboração de um Rol ou conjunto ordenado de dados. Um tipo de Rol para esta série de notas poderia ser colocá-las em ordem crescente na forma: {2,1; 3,3; 4,3; 4,7; 6,1; 6,9; 6,9; 7,1; 7,1; 8,3} Dados brutos: dados coletados sem manipulação ou ordenação. Rol: Conjunto de dados Ordenados, sequência ordenada (crescente ou decrescente) dos dados brutos. Atenção: A notação sigma, ∑, que é muito comum em Estatística, designa soma de números. Aula 2: Apresentação e Organização de Dados Distribuição de Frequências É uma tabela que viabiliza a extração rápida de uma grande quantidade de informações sobre um problema aplicado. Esta tabela lista as respostas dos dados, juntamente com suas frequências correspondentes. Uma tabela contém, basicamente, 3 colunas: Tabela 1: distribuição de frequências. Frequência: número de vezes que cada resposta aparece no conjunto de dados. Fr(%): é o quociente da frequência absoluta pelo número de elementos em estudo vezes 100. Exemplo: Os dados abaixo são referentes às idades de funcionários do setor administrativo de uma empresa: 24 19 21 25 18 28 24 25 28 22 25 a) Classifique e indique a variável em estudo. R: A variável em estudo é idade dos funcionários do setor administrativo de uma empresa. A classificação é quantitativa discreta. b) Organize os dados numa distribuição de frequências. R: 18 19 21 22 22 24 24 25 25 25 28 28 Tabela 2: distribuição das idades dos funcionários de uma empresa. c) Qual o percentual de funcionários com pelo menos 25 anos? R: Podemos encontrar o percentual de funcionários com pelo menos 25 anos de duas maneiras: 1ª maneira: dividindo a quantidade de funcionários com pelo menos 25 anos pelo número total de funcionários: 2ª maneira: Somando os valores da coluna F.R(%), que correspondem aos funcionários com pelo menos 25 anos. %67,41%67,16%25 d) Qual o percentual de funcionários com até 23 anos? R: Neste item, utilizamos o mesmo raciocínio do anterior ou 8,33% + 8,33% + 8,33% + 16,67% = 41,66% Observação: No cálculo de medidas separatrizes (quartis, decis e percentis) e na construção de um gráfico denominado ogiva precisamos da frequência acumulada. Então, vamos aprender como se calcula. Frequência acumulada (fa): é a soma de cada frequência com as que lhe são anteriores na distribuição. Frequência relativa acumulada (fra): é o quociente da frequência acumulada pelo número total de dados. Esta frequência também pode ser expressa em porcentagem. O valor (fra x100) é definido como fra (%). %67,41100 12 5 Acrescentando as frequências acumuladas na Tabela 1, obtemos: Tabela 3: distribuição das frequências acumuladas da variável idade. Como vimos anteriormente, um rol para estas informações pode ser descrito por uma série numérica ordenada de forma crescente do tipo: {10, 11, 11, 11, 12, 12, 12, 12, 13, 13, 13, 13, 13, 14, 14, 14, 14, 14, 14, 14, 15, 15, 16, 17} Pelo rol observamos que as vendas de 11, 12, 13, 14, 15 aparelhos ocorreram em 3, 4, 5, 7 e 2 dias no mês, respectivamente, e, as vendas de 10, 16 e 17 aparelhos ocorreram em apenas um dia no mês. Observe neste exemplo que a variável em questão,vendas diárias, pode ser obtida e estudada mais facilmente se dispusermos seus valores ordenados em uma coluna e colocarmos, ao lado de cada valor, os totais de dias no mês em que as respectivas vendas ocorreram. Vamos então começar a inserir colunas nesta tabela com alguns tipos de frequências de dados que definiremos a seguir: Frequências Simples ou Absoluta: Denotada por fi, representa o número de repetições com que o dado i aparece no rol. Observe no rol do exemplo trabalhado: O primeiro dado (i = 1) aparece com frequência simples f1=1; O segundo dado (i = 2) aparece com frequência simples f2= 3; E assim por diante. Acrescentando, portanto, a coluna das frequências fi no exemplo trabalhado, podemos então estabelecer uma tabela mais elaborada como pode ser vista na figura ao lado: Para analisarmos ainda de forma mais fácil os dados da nossa tabela podemos inserir mais duas outras colunas, uma com os dados relativos ao tamanho da amostra e outra com esses mesmos dados só que expressos em suas formas percentuais. Para tal, considere as definições a seguir: Frequências Relativas (fri): Denotadas por fri, são obtidas pelas razões entre as frequências simples e o tamanho da amostra. No exemplo trabalhado as frequências relativas são dadas aproximadamente por: fr1 = 1/24 0,04; fr2 = 3/24 0, 13; fr3 = 4/24 0, 17; fr4= 5/24 0, 20; fr5= 7/24 0, 30 ; fr6 = 2/24 0, 08; fr7 = 1/24 0, 04 e fr8 = 1/24 0, 04 Frequências Relativas Percentuais: Denotadas por fri%, são as frequências relativas simples escritas em suas formas percentuais. Podem ser obtidas pela equação: Olhando tabela podemos, por exemplo, responder facilmente às questões: a. No mês, qual o percentual de vendas diárias de 12 aparelhos? A melhor opção é a leitura pura e simples na coluna da frequência relativa percentual do dado três, fr3 % = 17 %, isto é, em 17% dos dias no mês foram vendidos 12 aparelhos. b. Em quantos dias no mês foram vendidos 15 aparelhos? Basta analisar o valor da frequência simples do dado seis, f6 = 2 dias. c. Qual o dado que aparece mais frequentemente na tabela? Basta olhar o dado com a maior frequência simples (i = 5), isto é, 14 aparelhos. Para respondermos ainda a outros tipos de questionamentos podemos inserir mais três novas colunas na distribuição de frequências: a primeira com as frequências acumuladas simples, a segunda com as frequências acumuladas relativas e a terceira com as frequências acumuladas relativas percentuais, conforme as definições a seguir: Frequências Acumuladas Simples: Denotadas por Fi, são obtidas pelas somas de todas as frequências simples até o elemento analisado. O cálculo de Fi é dado pela equação. No exemplo analisado as frequências acumuladas são obtidas por: Frequências Relativas Acumuladas: Denotadas por Fri, são as razões entre as frequências acumuladas Fi e o tamanho da amostra. As frequências relativas acumuladas na forma de porcentagens são obtidas pela equação a seguir: Acrescentando a tabela do exemplo às novas colunas, obtemos finalmente uma tabela Distribuição de Frequências completa como mostraremos a seguir: Com o conhecimento dos vários tipos de frequências, podemos extrair com facilidades vários tipos de informações da distribuição de frequências, como por exemplo: a. As vendas diárias de no máximo 14 aparelhos ocorreram em 20 dias no mês. Na tabela, a opção de leitura é a do dado 5 na coluna das frequências acumuladas simples, F5 = 20. b. O percentual de vendas diárias de pelo menos 13 aparelhos é de 66%. Na tabela, os dados considerados irão de i = 4 até i = 8, assim nas colunas das frequências acumuladas percentuais basta calcularmos: F8 % - F3% = 100 – 34 = 66 % dos dias. c. O percentual de vendas diárias de 10 aparelhos é de 4%. Na tabela, a opção de leitura é do dado 1 na coluna das frequências percentuais, relativas fr1 = 4. Utilizando Gráficos: O objetivo da utilização de gráficos em análise de dados é o de facilitar a compreensão do fenômeno estatístico por meio do efeito visual imediato que os gráficos proporcionam. A visualização gráfica para uma distribuição de frequências é sempre bastante esclarecedora quanto desejamos extrair informações de um problema aplicado. Tipos de gráficos: Diagramas de área (colunas, barras e setores). Gráfico para representar distribuições de frequências agrupadas em classes: histograma, polígono de frequências e ogiva. Diagramas de área: Os gráficos em colunas, barras e setores são bastante utilizados quando estamos trabalhando com variáveis qualitativas. As colunas (ou barras) comparam rapidamente o tamanho das categorias por meio das frequências ou frequências relativas (%). Exemplo 3: a tabela abaixo apresenta o número de turistas que chegaram ao Brasil em 2010, segundo vias de acesso. Tabela 4: distribuição de frequências do número de turistas que chegaram ao Brasil, segundo vias de acesso. Algumas representações gráficas para este conjunto de dados estão apresentadas a seguir. Diagrama Representativo para uma Distribuição de Frequência sem Intervalos de Classes: É um tipo de gráfico estatístico que para elaborá-lo, dispomos na linha horizontal os valores assumidos pela variável do problema e a seguir levantamos sobre cada valor da variável um segmento de reta vertical com medida correspondente ao valor da sua frequência simples. Figura 1.1: Gráfico em colunas para a variável vias de acesso. Gráfico de Colunas: É uma boa forma de visualizar a distribuição de frequências, apresenta as frequências sob a forma de barras verticais levantadas sobre os dados que aparecem organizados na linha horizontal. Observe o gráfico de colunas que representa a tabela 1 do exemplo trabalhado. Figura 1.2: gráfico em barras para a variável vias de acesso. Diagrama ou gráfico de barras: Apresenta as frequências simples ou relativas sob a forma de barras horizontais, separadas entre si. O gráfico de barras a seguir representa a frequência simples das vendas diárias do aparelho elétrico exposto na tabela 01. Figura 1.3: gráfico em setores para a variável vias de acesso. Gráfico ou Diagrama de Setores: Representa as frequências simples ou relativas sob a forma de setores de um círculo, aponta de forma muito clara os dados mais representativos da distribuição de frequências. O gráfico de setores a seguir representa as frequências simples da tabela 1, a legenda mostra as cores dos setores associados a cada uma das frequências simples da variável venda diária. Nota-se neste gráfico que o setor circular de maior área está associado a 14 aparelhos que é o dado com a maior frequência simples (dado 5: na cor azul), seguido por 13 aparelhos (dado 4: na cor roxa). Os setores de menor área estão associados a 10, 16, 17 aparelhos que são os dados com menores frequências simples (dado 1: na cor Hortência, dado 7: na cor azul celeste e dado 8: na cor rosa). Para esta aula sugiro as seguintes tarefas: Resolução dos exercícios 1, 2, 3 e 7 do Capítulo 1 do livro: Estatística Aplicada a Gestão Empresarial. Resolução dos exercícios 7, 8, 9, 14 do Capítulo 2 do livro: Estatística Aplicada a Gestão Empresarial. Atividade 2 O departamento de atendimento ao consumidor de uma concessionária de veículos recebe, via telefone, as reclamações dos clientes. O número de chamadas dos últimos 30 dias foram anotados e os resultados foram: 5 4 4 5 6 8 4 4 5 6 4 3 6 7 4 5 4 5 7 8 8 5 7 5 4 5 7 6 3 4 a) Indique e classifique a variável em estudo. R: Variável em estudo: número de reclamações, via telefone. Classificação: variável quantitativa discreta.b) Organize os dados numa distribuição de frequências. R: Tabela 1: distribuição do número de reclamações recebidos por uma concessionária. c) Qual o percentual de dias com pelo menos 5 reclamações. R: Temos que, dos 30 dias analisados, 19 deles tiveram pelo menos 5 reclamações, ou seja: %33,6310030/19 Aula 3: Apresentação e Organização de Dados Agrupados em Classes Quando estamos trabalhando com um conjunto de dados que apresenta um grande número de valores diferentes, é conveniente construir classes ou faixas de valores e contar o número de ocorrências em cada faixa. Com uma tabela ordenada fica fácil visualizarmos, Podemos então calcular com facilidade a Amplitude Amostral, denotada por AA, que é a diferença entre o maior valor e o menor valor da variável do problema. AA = x máximo – x mínimo Ex.: AA = 173 -150 = 23 Para determinar o Número de Intervalos de Classes (i) que devemos utilizar no problema adotaremos a “Regra de Sturges” que nos dá uma estimativa do número de classes em termos do tamanho da amostra (n). log n é o logaritmo na base 10 de n. Assim, o número de classes que devemos adotar em nosso problema será de: Arredonda-se sempre o valor de i para o número inteiro mais próximo, pois o número de classes deve ser sempre inteiro. Decidido o número de intervalos de classes, devemos então determinar a Amplitude (h) desses intervalos, que é obtida pelo resultado da divisão entre a amplitude amostral (AA) e o número de classes (i): Assim, a amplitude do intervalo de classe do nosso problema é dada por: Por fim, o nosso problema deve ter seus dados agrupados em 6 classes distintas de intervalos com amplitudes iguais a 4. Vamos então mostrar como devemos montar as classes para tabular os dados Devemos construir as classes começando do menor valor que a variável assume na amostra. A partir daí, devemos ir somando a amplitude de classe de modo que o limite superior de uma classe anterior seja o limite inferior da nova classe. A convenção adotada para a representação de uma classe é a seguinte: |-: Limite inferior incluído na classe e superior não. |-|: limite inferior e superior incluídos na classe. No nosso exemplo, a classe i = 1 terá como limite inferior 150 cm e limite superior 154 cm; a classe i = 2 terá como limite inferior 154 cm e superior 158 cm e assim por diante. Com objetivo de extrair vários tipos de informações da distribuição de frequências poderemos acrescentar a nossa tabela outros tipos de frequências. São elas: De modo geral, a quantidade de classes não deve ser inferior a 5 e nem superior a 25. Exemplo cálculo: 312 6 1870 6 7502620 3,640log3,31 k Rh k Portanto, construiremos 6 classes de amplitude 312 cada uma. Tabela 1: distribuição dos salários dos funcionários de uma empresa. Acrescentando as frequências acumuladas na Tabela 1, temos: Tabela 2: distribuição das frequências acumuladas da variável Salário. Os gráficos apresentados a seguir são bastante utilizados quando queremos representar um conjunto de dados cujo os mesmos foram agrupados em classes. Um histograma é semelhante ao diagrama em barras, porém não há espaços entre as barras. Os intervalos de classes são colocados no eixo horizontal enquanto as frequências são colocadas no eixo vertical. As frequências podem ser absolutas ou relativas. Figura 1.1: histograma para a variável salário (R$) dos funcionários de uma empresa. O polígono de frequências é um gráfico de linha de uma distribuição de frequências. No eixo horizontal, são colocados os pontos médios de cada intervalo de classe e no eixo vertical são colocadas as frequências absolutas ou relativas (como no histograma). O histograma e o polígono de frequências são gráficos alternativos e contêm a mesma informação. Fica a critério de quem está conduzindo o estudo a escolha de qual deles utilizar. Figura 1.2: polígono de frequências para a variável salário (R$) dos funcionários de uma empresa. Outro gráfico que podemos construir para dados agrupados em classes é a Ogiva. Para construí-lo, devemos usar o limite superior de cada intervalo no eixo horizontal e a frequência acumulada no eixo vertical. A frequência acumulada relacionada com o limite inferior da primeira classe é sempre zero. Figura 1.3: ogiva para a variável salário (R$) dos funcionários de uma empresa. Atividade 2 Uma amostra de 64 funcionários de uma empresa localizada na capital paulista forneceu os seguintes valores referentes ao número de horas extras de trabalho nos meses de novembro e dezembro de determinado ano. Use uma amplitude de classe de tamanho 5 e o limite inferior da 1ª classe como 10 e, monte a tabela de distribuição de frequências. Tabela 1: distribuição do número de horas extras dos funcionários de uma empresa. Para calcular a frequência relativa em % basta pegar cada uma das frequências e dividir pelo total e multiplicar por 100. Ex: 6/64 * 100 = 9,38% Aula 4: Medidas de Posição Medidas Estatísticas Medidas de Posição ou de Tendência Central: Têm o objetivo de apresentar um ponto central em torno do qual os dados se distribuem. As mais conhecidas são: a média, a mediana e a moda. Medidas de Dispersão: Servem para indicar o quanto os dados se apresentam dispersos em torno da região central. Medidas de Tendência Central A Média Aritmética ou Média: é a medida de posição central da Estatística que encontra o ponto médio de um conjunto de dados. Características: O cálculo da média envolve todos os elementos do conjunto de dados; A média é influenciada por dados com valores muito pequenos ou muito grandes; A média aritmética é única. É obtida pela soma de todos os valores numéricos do conjunto de dados, dividido pela quantidade de dados. A média aritmética de um conjunto de dados apresentados numa distribuição de frequências é calculada da seguinte maneira: em que: xi: são os valores que a variável assume; fi: é a frequência referente a cada valor; n soma i=1 fi: é a soma dos valores das frequências. A Moda: é a medida de posição da Estatística que encontra o dado que aparece mais frequentemente em uma série de valores. Características: Pode não ser única. Exemplo: A série de dados: 2; 3; 4; 6; 4; 8; 6, possui duas modas Mo= 4 e Mo= 6. Este tipo de série é chamado de série (bimodal); Pode não existir. Exemplo: A série de dados: 2; 3; 4; 6; 8, não possui valor repetido, logo não possui moda. Este tipo de série de dados é chamado de série (amodal), ou mais de duas modas (multimodal); Por ser o valor mais frequente da série, é caracterizada como valor mais típico do conjunto de dados. A Mediana: é uma medida de posição central da Estatística que busca dividir um conjunto de dados em dois grupos que contenham o mesmo número de elementos, dita mais robusta que a média. Características: Para qualquer conjunto de dados haverá sempre uma única mediana; A mediana não é influenciada para dados valores muito pequenos ou muito grandes. A mediana é encontrada ordenando os dados do menor para o maior valor e, em seguida, identificando o valor central desses dados ordenados. É uma medida que divide o conjunto de dados em duas partes, deixando a mesma quantidade de valores abaixo dela e acima. Se o número de elementos do conjunto de dados for ímpar, então a mediana será exatamente o valor central, ou seja: Se o número de elementos do conjunto de dados for par, então a mediana será exatamente a média dos dois valores centrais, isto é: Exercício Para a série de dados: 5; 13; 10; 2; 4; 7; 6. Qual é o valor da mediana? R: Ordenando a série na forma crescente obtemos 2; 4; 5; 6; 7; 10; 13 A mediana é dada por Md = 6 Observe quetrês termos da série estão situados à esquerda de 6 e os outros três termos a direita. Isto é, a mediana dividiu a série de dados em partes iguais. Medidas de posição para dados agrupados em classes: Quando o conjunto de dados for apresentado sob a forma agrupada, perdemos a informação dos valores das observações. Nesse caso, vamos supor que todos os valores dentro de uma classe tenham seus valores iguais ao ponto médio dessa classe. No cálculo da moda para dados agrupados, devemos primeiramente identificar a classe modal, ou seja, a classe que apresenta a maior frequência. Após a identificação da classe modal, utilizaremos a seguinte fórmula para calcular a moda bruta: Mo = l + L / 2 Atividade Um treinador mediu a circunferência abdominal de 10 homens que se apresentaram para uma aula na academia de ginástica. Os valores em centímetros são: 88 83 79 76 78 70 80 82 86 105 a) A variável em estudo é a circunferência abdominal de 10 homens. Classificação: variável quantitativa contínua. b) Média: x= 70+76+78+79+80+82+83+86+88+105 / 10 = 82,7 cm Mediana: para encontrar a mediana, os dados devem estar ordenados: 88 83 79 76 78 70 80 82 86 105 Ordenados: 70 76 78 79 80 82 83 86 88 105 Como n = 10 é um número par, encontraremos a mediana por meio da seguinte fórmula: Moda: não há moda neste conjunto de dados. Não há repetição, todas as frequências são iguais Aula 5: Medidas de Posição Relativa e Medidas de Dispersão Média Geométrica e Aplicações: A média geométrica é a raiz enésima dos produtos dos valores encontrados em um conjunto numérico. Para o conjunto X = {x1, x2,., xn}, onde cada xi é um número real não negativo, a média geométrica (MG) será calculada pela fórmula: Seja o conjunto X = {3, 5, 7, 16}. Então a média geométrica dos valores de X é igual a: Como a média geométrica é sempre menor ou igual que a média aritmética, muitos a utilizam como uma forma de medida mais conservadora de análise central para um conjunto de dados. Para certos tipos de problema ela será a única medida que refletirá a resposta correta. Sua grande aplicabilidade está em estimar a média de razões de crescimentos de dados em problemas dos tipos populacionais e financeiros. Medidas Separatrizes: Fornecem uma ideia sobre a distribuição dos dados ordenados. Apresentam a vantagem de não serem afetadas por valores extremos. As medidas de ordenamento são: Quartis; Decis; Percentis. Todas essas medidas são destinadas a indicar a posição que um determinado dado ocupa em relação à amostra como um todo. Já sabemos que a MEDIANA divide um conjunto de dados em duas partes iguais. Os QUARTIS: são os valores que dividem a série de dados em quatro partes iguais sendo que após a ordenação dos dados: O primeiro quartil (Q1) é o valor que deixa a quarta parte ou 25% das observações dos dados abaixo dele. O segundo quartil (Q2) coincide com a mediana (Md) do conjunto. O terceiro quartil (Q3) é o valor que deixa três quartos 93/40 ou 75% das observações dos dados abaixo dele. Para determinarmos os quartis para um conjunto com n dados devemos adotar os seguintes passos: Caso 1: Dados não Agrupados: O quartil Q1 será o valor da variável que ocupar a posição (n/a); Q2 o valor da variável que ocupar a posição (2n/4) e o Q3 o valor da variável que ocupa a posição (3n/4). Para a determinação dos quartis devemos adotar a seguinte convenção: Se a divisão indicada no item for um número fracionário, arredonde-o para cima e o valor do quartil será a variável encontrado nesta posição. Se a divisão for um número inteiro, o quartil será a média aritmética da variável que ocupar a posição encontrada com o valor da variável que ocupar a posição seguinte. Caso 2: Dados Agrupados: A forma prática de calcular os QUARTIS para uma distribuição de frequências com dados agrupados é estabelecida adotando procedimentos muito semelhantes ao do cálculo da mediana. No caso de determinação do QUARTIL Q1, basta: a) Acrescentar a distribuição uma coluna com as frequências acumuladas; b) Calcular f/4; c) Encontrar a classe que corresponde à classe associada à frequência acumulada imediatamente superior à f/4; d) Aplicar a fórmula a seguir, onde l*, f* e h* são respectivamente, o limite inferior, a frequência simples e a amplitude da classe encontrada em (b). F(ant) é a frequência acumulada da classe anterior à encontrada em (b). O QUARTIL Q2 é a MEDIANA do conjunto de dados. O cálculo do QUARTIL Q3 é calculado de forma semelhante a do quartil Q1 e poderá ser obtido pela fórmula: Os PERCENTIS: Para determinarmos os percentis para um conjunto com n dados devemos adotar os seguintes passos: Caso 1: Dados não Agrupados: O percentil Pk será o valor da variável que ocupar a posição (k.n)/100; Adotar a seguinte convenção: Se a divisão indicada no item for um número fracionário, arredonde-o para cima e o valor do percentil será a variável encontrado nesta posição. Se a divisão for um número inteiro, o percentil será a média aritmética da variável que ocupar a posição encontrada com a variável que ocupar a posição seguinte. Caso 2: Dados Agrupados: De forma semelhante aos quartis, os PERCENTIS podem ser calculados para dados agrupados em classes, pela fórmula. Onde k é a ordem do percentil que se deseja encontrar. Assim no exemplo das estaturas dos 40 alunos da distribuição a seguir Medidas de Dispersão: As medidas de dispersão indicam o grau de variabilidade das observações. Essas medidas possibilitam que façamos distinção entre conjuntos de observações quanto à sua homogeneidade. Quanto menor as medidas de dispersão, mais homogêneo é o conjunto de dados. As medidas de dispersão são: Amplitude Total; Amplitude interquartil; Desvio-Padrão; Variância; Coeficiente de Variação. - Amplitude Interquartil: Mede a dispersão nos dados que estão entre as 50% observações centrais. Sendo assim, não é influenciada pelos valores extremos da amostra de dados. Amplitude Interquartil = Quartil 3 – Quartil 1. Para a série ordenada de tempos gastos no exemplo já visto. Série ordenada de tempos gastos. Exemplo: Amplitude Interquartil = 44 – 35 = 9 minutos. - Variância: Denotada por (s2), é a medida de dispersão que mede a variação média dos dados de uma amostra em relação a sua média aritmética. Pode ser calculada pela fórmula. Em que: Xi é o valor de cada observação; X é a média aritmética das observações e n o tamanho da amostra (número de dados). - Desvio Padrão: Denotado por s, é uma medida conhecida pela sua utilidade e aplicação prática. É calculada extraindo-se a raiz quadrada da variância (s2). - Coeficiente de Variação: Denotado por (CV), é uma medida de dispersão relativa, elimina o efeito da magnitude dos dados, exprime na forma percentual a dispersão dos dados em relação à média. É dado pela fórmula a seguir. Em que: s é o desvio padrão e é a média aritmética da amostra. Os DECIS: A definição dos decis obedece ao mesmo princípio dos quartis, com a modificação da porcentagem de valores que ficam aquém e além do decil que se pretende calcular. A fórmula básica será: k .E fi /10 onde k é o número de ordem do decil a ser calculado. Indicamos os decis: D1, D2, ... , D9. Deste modo precisamos de 9 decis para dividirmos uma série em 10 partes iguais. De especial interesse é o quinto decil, que divide o conjunto em duas partes iguais. Assim sendo o quinto decil é igual ao segundo quartil, que por sua vez é igual à mediana. Para D5 temos: 5.E fi / 10 = E fi / 2 Exemplo: Calcule o 3º decil da tabela anterior com classes. k= 3 onde 3 .E fi / 10 = 3x40/10 = 12. Este resultado corresponde a 2ª classe. D3 = 54 + [ (12 -4) x 4] / 9 = 54 + 3,55 = 57,55 OBS: O que acontecerá com o desvio padrão se multiplicarmos uma constante k a todos os elementos da série? Será multiplicado pelo valor de k unidades. - Com relação ao conceito de Medida de Dispersão, é SOMENTE correto afirmar que: Utilizadas para avaliar o grau de variabilidade ou dispersão dos valores em torno de um valor central; geralmente as médias; A medida de dispersão reflete o quanto de erros ocorre na média como medida de descrição do fenômeno. - Curtose é o grau de achatamento de uma distribuição com relação a uma distribuição padrão, dita normal. Esta curva normal é uma curva correspondente a uma distribuição teórica de probabilidade. Podemos dizer que a medida de curtose ou excesso indica até que ponto a curva de frequências de uma distribuição se apresenta mais afilada ou mais achatada do que uma curva padrão, denominada curva normal. De acordo com o grau de curtose e os três tipos de curvas de frequência, podemos dizer que: Curva Platicurtica tem coeficiente de curtose de c > 0,263 Revisão - Aula 1 a 5 Exercícios Em um determinado mês foi computado o número de faltas ao trabalho, por motivos de saúde, que cada funcionário de uma determinada empresa teve. Os dados estão a seguir: 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 3 3 5 6 - A variável em estudo é o número de faltas ao trabalho por motivo de saúde. R: Classificação: Variável quantitativa discreta. - Organização dos dados numa distribuição de frequência. R: Tabela 1: Distribuição do número de faltas dos funcionários. Frequência: número de vezes que cada resposta aparece no conjunto de dados. F.R(%): é o quociente da frequência absoluta pelo número de elementos em estudo vezes 100. Ex.: 31/63*100 = 49,21 - Encontre as medidas de posição. R: Média: A média aritmética de um conjunto de dados apresentados numa distribuição de frequências é calculada da seguinte maneira: em que: xi: são os valores que a variável assume; fi: é a frequência referente a cada valor. xi * fi = 31 * 0 = 0 Moda: Mo = 0 falta, pois a maior frequência que é 31 o valor é 0 Mediana: Roteiro: 1ºPasso: identificaremos a frequência acumulada imediatamente superior à metade do somatório das frequências simples: A frequência acumulada imediatamente superior a 31,5 é ݂ ൌ 51. 2º Passo: o valor da mediana é o valor da variável associado à ݂ ൌ 51, ou seja, Md = 1 falta - Encontrar ܳ3 (Terceiro quartil). R: Posição do terceiro quartil (Q3): ଷൈସ ൌ ଷൈଷ ସ ൌ 47,25. Como a divisão resultou em um valor fracionário, vamos arredondar para 48. Portanto, o terceiro quartil é o valor que está na quadragésima oitava posição: ܳଷ ൌ 1 ݂݈ܽݐܽ. Então, pelo menos 25% das observações são maiores ou iguais a 1 falta. Aula 6: Análise Combinatória - Revisão A análise combinatória é a parte da Matemática que desenvolve técnicas e métodos de contagem. Visa desenvolver métodos que permitam contar, de uma forma indireta, o número de elementos de um conjunto, estando esses elementos agrupados sob certas condições. Diagrama de Árvore Consideremos o seguinte problema: Uma lanchonete oferece a seus clientes apenas dois tipos de sanduíches: hot dog e hambúrger. Como sobremesa, há três opções: sorvete, torta ou salada de frutas. Pergunta-se: quantas são as possibilidades de uma pessoa fazer uma refeição incluindo um sanduíche e uma sobremesa? A determinação de tais possibilidades pode ser simplificada através de um diagrama, em que, na 1ª coluna, representaremos as possibilidades de escolha do sanduíche e, na 2ª coluna, as possibilidades de escolha da sobremesa. Este esquema é conhecido como diagrama de árvore. Fazendo a leitura de todas as “ramificações” da árvore, obtemos as possíveis refeições. Notemos que fazer uma refeição completa representa uma ação constituída de duas etapas sucessivas: 1) Escolha do tipo de sanduíche: há duas possibilidades. 2) Escolha da sobremesa: para cada uma das possibilidades anteriores, há três maneiras de escolher a sobremesa. Assim, a realização da ação (duas etapas sucessivas) pode ser feita assim: 2 x 3 = 6 maneiras distintas de se escolher uma refeição. Princípio Fundamental da Contagem – PFC Exemplo 1: No Brasil as placas dos veículos possuem 3 letras e 4 algarismos. Qual o número máximo de veículos que poderá ser licenciado? Imaginemos a seguinte situação: Placa ACD – 2172. Como o alfabeto possui 26 letras e nosso sistema numérico possui 10 algarismos (de 0 a 9), podemos concluir que: para a 1ª posição, temos 26 alternativas, e como pode haver repetição, para a 2ª, e 3ª também teremos 26 alternativas. Com relação aos algarismos, concluímos facilmente que temos 10 alternativas para cada um dos 4 lugares. Podemos então afirmar que o número total de veículos que podem ser licenciados será igual a: 26 . 26 . 26 . 10 . 10 . 10 . 10 = 175.760.000. Exemplo 2: No Brasil, antes da alteração do sistema de emplacamento de automóveis, as placas dos veículos eram confeccionadas usando-se 2 letras do alfabeto e 4 algarismos. Qual o número máximo de veículos que podia ser licenciado nesse sistema? Imaginemos a seguinte situação: Placa AC – 2172. Podemos então afirmar que o número total de veículos que podem ser licenciados será igual a: 26 . 26 . 10 . 10 . 10 . 10 = 6.760.000. Percebe-se que a inclusão de apenas uma letra faz com que sejam licenciados, aproximadamente, mais 170.000.000 de veículos. Fatorial De Um Número Natural: Para resolver problemas de Análise Combinatória precisamos utilizar uma ferramenta matemática chamada Fatorial. Seja n um número inteiro não negativo. Definimos o fatorial de n (indicado pelo símbolo n!) como sendo: n! = n . (n-1) . (n-2) . ... . 4 . 3 . 2 . 1 para n ≥ 2. Se n = 1, então 1! = 1. Se n = 0, então 0! = 1. (o fatorial de zero é sempre 1). Resumindo: n! = n . (n-1)! | n E N e n ≥ 2. Exemplos: a) 6! = 6 . 5! = 6 . 5 . 4 . 3 . 2 . 1 = 720 -- b) 4! = 4 . 3! = 4 . 3 . 2 . 1 = 24 -- c) 7! = 7 . 6! = 7 . 6 . 5 . 4 . 3 . 2 . 1 = 5040 -- d) 10! = 10 . 9 . 8 . 7 . 6 . 5 . 4 . 3 . 2 . 1 = 3.628.800 -- e) 3! = 3 . 2 . 1 = 6 – Perceba que 7! = 7 . 6 . 5 . 4! ou 6! = 6 . 5 . 4 . 3!, e assim sucessivamente. Arranjo simples: Dado um conjunto com n elementos distintos, chama-se arranjo dos n elementos, tomados k a k, a qualquer sequência ordenada de k elementos distintos escolhidos entre os n existentes. Temos um Arranjo quando os agrupamentos conseguidos ficam diferentes ao se inverter a posição dos seus elementos. Perceba que para formar centenas com algarismos distintos, utilizando apenas os algarismos (1; 3; 5; 7; 9) teremos as seguintes centenas: 135; 137; 139; 153, 157, e assim sucessivamente. Se invertermos a posição dos elementos de qualquer uma destas centenas conseguiremos outra centena diferente: 135 e 351. Temos então um ARRANJO de cinco elementos tomados de três a três. Exemplo 1: Dado o conjunto A = (1, 2, 3, 4), vamos escrever todos os arranjos desses quatro elementos tomados dois a dois. (1, 2); (1, 3); (1, 4); (2, 1); (2, 3); (2, 4); (3, 1); (3, 2); (3, 4); (4, 1); (4, 2); (4, 3). Notamos que (2, 3) ≠ (3, 2), isto é, a troca na ordem dos elementos de um possível agrupamento diferente. Exemplo 2: Um cofre possui um disco marcado com os dígitos 0, 1, 2, ..., 9. O segredo do cofre é marcado por uma sequência de 3 dígitos distintos. Se uma pessoa tentar abrir o cofre, quantas tentativas deverá fazer (no máximo) para conseguir abri-lo? As sequências serão do tipo xyz. Para a primeira posição teremos 10 alternativas, para a segunda, 9 e para a terceira 8 (lembrando que são dígitos distintos, ou seja, diferentes). Aplicando a formula de arranjos pelo PFC, chegamosao mesmo resultado: 10.9.8 = 720. Observe que 720 = A10,3 Cálculo de números Arranjados: Seja o conjunto de n elementos distintos. Vamos encontrar uma expressão para o número de arranjos dos n elementos tomados k a k: (An,k). A formula do arranjo é: Permutação simples: Permutação simples de n elementos distintos são os agrupamentos formados com todos os n elementos e que diferem uns dos outros pela ordem de seus elementos. De outro modo, podemos entender permutação simples como um caso especial de arranjo, onde n = k, ou seja: Exemplo 1: Escrever todos os anagramas da palavra SOL. Um anagrama da palavra SOL é qualquer permutação das letras S, O, L de modo que se forme uma palavra com ou sem sentido. Assim, temos: SOL, SLO, OSL, OLS, LOS, LSO. Exemplo 2: De quantas maneiras cinco pessoas, A, B, C, D e E, podem ser dispostas em fila indiana? Cada maneira de compor a fila é uma permutação das cinco pessoas, pois qualquer fila obtida é uma sequência ordenada na qual comparecem sempre as cinco pessoas. Assim, o resultado esperado é: P5 = 5! = 5 . 4 . 3 . 2. 1 = 120. Exemplo 3: Baseado no exemplo anterior (5 pessoas, A, B, C, D e E), quantas filas podem ser compostas começando por A ou por B? A 1ª posição da fila pode ser escolhida de duas maneiras (tanto A como B pode iniciá-la). Definido o início da fila, restarão sempre quatro lugares para serem preenchidos pelas quatro pessoas restantes, num total de: P4 = 4! = 24 possibilidades. Pelo PFC, o resultado é: 2x24 = 48. Permutação com elementos repetido: Se entre os n elementos de um conjunto, existem a elementos repetidos, b elementos repetidos, c elementos repetidos e assim sucessivamente, o número total de permutações que podemos formar é dado por: Exemplo 1: Determine o número de anagramas da palavra Matemática. Temos 10 elementos, com repetições. A letra M está repetida duas vezes, a letra A três, a letra T duas vezes. Pela formula teremos: n=10, a=2, b=3, c=2. Exemplo 2: Quantos anagramas podem ser formados com as letras da palavra Maria. Temos: n=5, a=2 (a letra A se repete duas vezes). Combinações: Dado um conjunto A com n elementos distintos, chama-se combinação dos n elementos de A, tomados k a k, a qualquer subconjunto formado por k elementos, ou seja, temos uma combinação quando os agrupamentos conseguidos permanecem iguais ao se inverter a posição dos seus elementos. Observe que de cinco pessoas entre as quais desejamos formar grupos de três, o grupo formado por João, Pedro e Luís é o mesmo grupo formado por Luís, Pedro e João. Temos, então, uma Combinação de cinco elementos em grupos de três. A fórmula da Combinação é dada por: Exemplo 1: Uma turma é formada por 10 alunos. Deseja-se formar uma comissão de três alunos para representação discente na universidade. De quantas maneiras podemos fazer tal escolha? Como ao trocar a ordem das pessoas em cada comissão formada não altera em nada o grupo, temos que trabalhar com combinação. n=10, k=3 Exemplo 2: Escrever todas as combinações dos cinco elementos do conjunto M = {a, e, i, o, u} tomados dois a dois. Devemos determinar todos os subconjuntos de M formados por dois elementos. Lembremos que não importa a ordem dos elementos escolhidos: {a, e} = {e, a}; portanto é combinação. Quando é Arranjo, quando é Combinação: É Arranjo quando os agrupamentos conseguidos ficam diferentes ao se inverter a ordem dos elementos. É Combinação quando os agrupamentos conseguidos não se alteram ao se inverter a ordem dos elementos. Saiba mais Para esta aula sugiro as seguintes tarefas: Leitura o capitulo 6: Probabilidade (pag. 107 a 114), do livro de Estatística Aplicada a Gestão Empresarial. Resolução dos exercícios de 50 ate 80 do capítulo 6 do livro também. Atividade 3) Quantos são os anagramas (diferentes disposições das letras de uma palavra) da palavra PAZ? R: Vamos listar todos os anagramas: PAZ PZA APZ AZP ZPA ZAP --- O número de anagramas que pode ser formado é: P3 = 3! = 3 ∙ 2 ∙ 1 = 6 Aula 7: Probabilidade – Conceitos Básicos Probabilidade: É o estudo das chances. Probabilidades estuda as possibilidades de um evento ocorrer num acontecimento aleatório. A probabilidade representa a relação entre o número de eventos favoráveis ao que se estuda em relação ao número possível de eventos. O cálculo da probabilidade pode ser efetuado de três maneiras: através da definição clássica de probabilidade, através da definição frequência de probabilidade e através do método subjetivo. A probabilidade P(x) de ocorrer um evento x é igual número de maneiras pelas quais x pode ocorrer dividido pelo número total de maneiras pelas quais o evento pode ocorrer. Para quantificar o número de eventos favoráveis e o número de eventos possíveis, empregamos diferentes métodos: Método Clássico: Quando o resultado é provável. Seu emprego é comum nas situações que envolvem dados, moedas e baralhos. Nesses casos, se sabe previamente quais os resultados possíveis e desses, quantos são favoráveis. Exemplos: a) A probabilidade de sair “cara” ao se jogar uma moeda é 50% ou 1/2; b) a probabilidade de extrair uma carta de copas de um baralho é 25% ou 1/4. C) Qual a probabilidade de se extrair uma bola vermelha de uma caixa com 12 bolas, sendo três vermelhas? Resp: 3/12 = 25%. D) Quando dois dados são jogados simultaneamente, existem seis resultados possíveis em cada dado, ou seja, 36 resultados possíveis no total. Qual seria a probabilidade de se obter a soma sete? Resp: Para que a soma seja sete os pares devem ser: {(6,1)}; {(5,2)}; {(4,3)}; {(3,4)}; {(2,5)}; {(1,6)}. Assim, a probabilidade é igual a 6/36 = 1/6. Método Empírico: Depende da frequência de ocorrer o evento, determinada a partir de uma série de observações práticas anteriores. Exemplos: A) em uma cidade de 10.00 habitantes 4.000 são do sexo feminino, estima-se que a probabilidade de um habitante escolhido ao acaso seja do sexo feminino é igual a 4.800/10.000, ou 0,48, ou 48%. Neste caso, a probabilidade está associada à frequência relativa (fi%). B) Qual a probabilidade de encontramos um aluno maior de idade em um colégio, sabendo que uma pesquisa com 1400 alunos apontou 800 maiores de idade. Resp: A probabilidade seria de 800/1400 = 57,14%. Método Subjetivo: A probabilidade é estimada com base na opinião pessoal. Exemplo: um cientista político pode estimar que a probabilidade de vitória da oposição nas próximas eleições seja de 60%. Experimento aleatório: É aquele experimento que quando repetido em iguais condições, podem fornecer resultados diferentes, ou seja, são resultados explicados ao acaso. Quando se fala de tempo e possibilidades de ganho na loteria, a abordagem envolve cálculo de experimento aleatório. Um experimento apresenta as seguintes características fundamentais: É possível conhecer previamente o conjunto de resultados possíveis; Não é possível prever o resultado; Podem repetir-se várias vezes nas mesmas condições. Para entender melhor esses conceitos, convém observar o que há de comum nos seguintes experimentos: Ex.1: Retirar uma carta de um baralho com 52 cartas e observar seu naipe. Ex.2: Jogar uma moeda 10 vezes e observar o número de coroas obtidas. Ex.3: Retirar com ou sem reposição, bolas de uma urna que contém 5 bolas brancas e 6 pretas. Ex.4: Jogar um dado e observar o número mostrado na face de cima. Ex.5: Contar o número de peças defeituosas da produção diária de uma determinada máquina. Espaço amostral: É o conjunto de todos os resultados possíveis de um experimento aleatório. A letra que representa o espaço amostral, “S” ou. Para cada experimento aleatório E, define-se espaço amostral o conjunto de todos os resultados possíveis desse experimento. Consideremos um experimento aleatório. O conjunto de todos os possíveis resultados desse experimento é chamado espaçoamostral (Ω) Ômega. Indicaremos o número de elementos de um espaço amostral por n(Ω). Exemplo 1: a) E = Jogar um dado e observar o número mostrado na face de cima Ω = {1, 2, 3, 4, 5, 6}. b) E = jogar duas moedas e observar os resultados Ω = {(C,C), (C,K), (K,C), (K,K)} onde C = cara K = coroa. Exemplo 2: Lançamos uma moeda honesta e observamos a face voltada para cima: Ω = {K,C}, n(Ω) = 2. Chamamos cada um dos resultados possíveis de ponto amostral. Exemplo 3: Uma urna contém cinco bolas vermelhas e quatro brancas. Duas bolas são extraídas, ao acaso, sucessivamente e sem reposição. Observamos a sequência de cores das bolas sorteadas. Indicando vermelha por V e branca por B, temos: Ω = {(V, V), (V,B), (B,V), (B,B)} --- n(Ω) = 4. Cada par acima é um dos pontos amostrais de Ω. Evento: é um conjunto de resultados do experimento. Em termos de conjunto, é um subconjunto de Ω. Em particular, Ω e Ø (conjunto vazio) são eventos. Ω é dito o evento certo e Ø o evento impossível. Usando as operações em conjunto, podemos formar novos eventos: A U B (A União de B) é o evento que ocorre se A ocorre ou B ocorre ou ambos ocorrem. A ∩ B (A Intercessão de B) é o evento que ocorre se A e B ocorrem simultaneamente, elementos que se repetem. Exemplos: A) Jogar três moedas e observar os resultados: Ω = {(C,C,C), (C,C,K), (C,K,C), (K,C,C), (K,K,K), (K,K,C), (K,C,K), (C,K,K)} Seja E1 o evento: ocorrer pelo menos duas caras. Então: E1 = {(C,C,C), (C,C,K), (C,K,C), (K,C,C)}. B) Lançar um dado e observar o número de cima. Então: E2 = Ω = {1, 2, 3, 4, 5, 6} é um evento certo. C) Lançar um dado e observar a ocorrência de números maior que 8. E3 = Ø é um evento impossível. D) Lançar um dado e observar a saída de face menor que 2. E4 = {1} que é denominado evento simples. OBS: Se A ∩ B = Ø temos que A e B são eventos mutuamente exclusivos, ou seja, quando um ocorre o outro não pode ocorrer. Quando estamos interessados na intersecção de dois eventos utilizamos a conjunção e, ou seja, queremos encontrar os elementos que pertencem ao evento A e ao evento B. No caso da união de dois eventos utilizamos a conjunção ou, ou seja, são elementos que pertencem ao evento A, ou ao B ou a ambos. U = ou --- ∩ = e O complemento do evento A denotado de Ac, é definido como o evento que contém todos os pontos amostrais que não pertencem ao evento A. Ac = Ω - A. Exemplo: Ω = {1, 2, 3, 4, 5, 6} sendo A = {2, 4, 6} e B = {1, 2, 3, 4} temos Ac = {1, 3, 5} e Bc = {5, 6}. Probabilidade de um Evento: Agora podemos quantificar o grau de confiança de qualquer evento. Atribuímos a cada evento um número obtido da soma das imagens de cada um de seus elementos na relação de frequência. Este número chama-se probabilidade do evento. Exemplo: O experimento consiste em extrair uma bola do interior de uma caixa e observar sua cor. Há um total de nove bolas na caixa: duas brancas, três vermelhas e quatro pretas. Qual será a probabilidade de tirar uma bola que não seja preta? Resp: Para solucionar temos que determinar o espaço amostral: O evento “tirar uma bola de cor diferente do preto”, E = {B,V}, consta de dois elementos. Atribuímos a cada evento um número obtido da soma das probabilidades de cada elemento na relação de frequência. Portanto, se somarmos as probabilidades da bola branca, 2/9, e da vermelha, 3/9, que aparecem na relação de frequência, vamos conhecer o valor da probabilidade do evento A, indicado por P(E). Assim, Em alguns experimentos aleatórios, cada um dos resultados (eventos elementares) tem a mesma frequência relativa esperada. Este é o caso de lançar uma moeda ou um dado e comprovar o resultado. Dizemos, então, que o espaço amostral é equiprovável, e que sua probabilidade é uniforme. Saiba mais Para esta aula sugiro as seguintes tarefas: Leitura o capitulo 6: Probabilidade (pag. 91 a 96), e Resolução dos exercícios de 1 até 13 do capítulo 6 do livro Estatística Aplicada a Gestão Empresarial. Atividade Considere o experimento que consiste em pesquisar famílias com três crianças, em relação ao sexo das mesmas, segundo a ordem do nascimento. Enumerar os eventos: A) Ocorrência de dois filhos do sexo masculino; B) Ocorrência de pelo menos um filho do sexo masculino; C) Ocorrência de no máximo duas crianças do sexo feminino. Aula 8: Axiomas da Probabilidade Definição Clássica de Probabilidade: Aplicamos esta definição quando os pontos amostrais do espaço amostral são equiprováveis, ou seja, têm a mesma probabilidade de ocorrer. Por exemplo, quando jogamos um dado equilibrado todas as faces têm a mesma probabilidade de ocorrer, ou seja, 1/6. Dado um evento A, a probabilidade de A, representada por P(A), é obtida através da definição clássica por: p(A) = Número de resultados favoráveis ao evento A / Número total de resultados possíveis Ω. Definição Frequência de Probabilidade: A definição clássica de probabilidade só pode ser aplicada quando os pontos amostrais são igualmente prováveis de ocorrer. Em situações em que isto não ocorre podemos determinar a probabilidade através da definição frequêncial. Esta definição baseia-se em observações repetidas do experimento aleatório. Seja A o evento de interesse. A probabilidade P(A) obtida através da definição frequêncial é dada por: p(A) = Número de vezes que o evento A ocorreu / Número de repetições do experimento aleatório. A ideia utilizada nesta definição é a mesma da frequência relativa. Regras Básicas de Probabilidade: Sejam A e B dois eventos do espaço amostral Ω. Então: Os conceitos básicos a partir dos quais se constrói a definição de probabilidade são conhecidos como os axiomas da probabilidade. Em 1933 o matemático russo Andrei Nikolaevich Kolmogorov lançou as bases axiomáticas da probabilidade. 1°) Associados aos possíveis resultados de um experimento aleatório, existe sempre um espaço amostral e uma álgebra de eventos; 2°) Para todo evento da álgebra, existe um número não-negativo (maior ou igual a zero), chamado de probabilidade, que se atribui a tal evento; 3°) A probabilidade do espaço amostral é igual a 1; 4°) Para quaisquer dois eventos disjuntos (que não compartilham nenhum resultado) a probabilidade da união deles é igual à soma das suas probabilidades; 5º) O 4º Axioma é verdadeiro para infinitas uniões, desde que todos os pares de eventos sejam disjuntos. Evento complementar: Consideramos um evento E relativo a um espaço amostral Ω. Chamamos evento complementar de E – indicado por E – ao evento que ocorre quando E não ocorre E ∩ E ∩ = Ø --- E ∩ E ∩ = Ω Exemplo: Uma urna contém 10 bolas numeradas de 1 a 10. Retira-se da urna, ao acaso, uma bola. Se E é o evento “ocorre múltiplo de3”, então será? Temos: Ω = {1, 2, 3, ..., 10} e E = {3, 6, 9}; logo: E = {1, 2, 4, 5, 7, 8, 10} é o evento “não ocorre múltiplo de 3”. Notemos que E ∩ E ∩ = Ω. Probabilidades em espaços amostrais equiprováveis: Consideramos o espaço amostral Ω formado por k pontos amostrais (ou eventos elementares): Ω = {a1, a2, a3, ..., ak}. Vamos associar cada um desses pontos amostrais um número real, p[ai], ou simplesmente pi, chamado probabilidade de evento [ai], ou seja, probabilidade de ocorrência do ponto amostral ai, tal que: (I) 0 ≤ pi ≤ 1 --- (II) pi = 1, isto é: p1 + p2 + ... + pk = 1. Consideramos aqui os espaços amostrais equiprováveis, isto é, aqueles cujos pontos tem a mesma probabilidade de ocorrer. Assim, se denotarmos por p a probabilidade de ocorrência de cada um dos pontos amostrais de Ω, temos, em (II): k vezes --- p + p + p + ... + p = 1 --- k . p = 1 --- p = 1/k. A probabilidade de ocorrência de um evento E, formado por r pontos amostrais E = {a1, a2, a3, ..., ar}, com r ≤ k, é dada por: p(E) = p1 + p2 + ... + pr --- p(E) = r/k = Numero de elementos de E / Numero de elementos de Ω Esta definição de probabilidade é intuitiva, isto é, a probabilidade de ocorrer determinadoevento é dada pela razão entre o número de casos favoráveis (ou número de casos que nos interessam) e o número de casos possíveis (ou número total de casos). Assim: Uma vez que o número de casos favoráveis coincide com o número de elementos do evento, e o número de casos possíveis corresponde ao número de elementos do espaço amostral, podemos escrever: p(A) = r/k, onde o evento A tem r elementos e k o número possível de elementos. Para ocorrer o evento A, o resultado deve ser algum desses r elementos, que são os casos favoráveis. Exemplo: Uma urna contém 15 bolas numeradas de 1 a 15. Uma bola é extraída ao acaso. Qual a probabilidade de ser sorteada um abola com números maior ou igual a 11? Temos: Ω = {1, 2, 3, ..., 15} Seja p evento E: “número da bola sorteada ≥ 11”. Logo: E = {11, 12, 13, 14, 15}. Assim, Saiba mais Para esta aula sugiro as seguintes tarefas: Leitura o capitulo 6: Probabilidade (pag. 97 a 101), do livro de Estatística Aplicada a Gestão Empresarial e Resolução dos exercícios de 14 até 39 Atividade Aula 9: Axiomas da Probabilidade Revisão: Probabilidade Da União De Dois Eventos: 1°) Teorema da soma: eventos mutuamente exclusivos --- 2°) Eventos com ocorrências simultâneas Exemplo 1: Uma urna contém 25 bolas numeradas de 1 a 25. Uma bola é extraída ao acaso dessa urna. Qual é a probabilidade da bola sorteada ser múltiplo de 2 ou de 3? Consideremos os eventos: A, “o número é múltiplo de 2” e B, “o número é múltiplo de 3”. Querermos encontrar p(A U B). Temos: Exemplo 2: Uma urna contém 25 bolas numeradas de 1 a 25. Uma bola é extraída ao acaso dessa urna. Qual é a probabilidade da bola sorteada ser múltiplo de 5 ou de 7? Probabilidade Condicional: Em muitas situações, podemos ter interesse em encontrar a probabilidade de ocorrência de um evento levando em conta que outro evento já ocorreu. Esta probabilidade recebe o nome de Probabilidade Condicional e é definida a seguir. Dados dois eventos A e B, a probabilidade condicional de A, dado que B ocorreu, é representada por P (A\B) e calculada por: 0)( com , )( )()|( BP BP BAPBAP Seja o evento E: lançar um dado. Seja o evento A = {sair o nº 4}. p(A) = 1/6. Considere agora o evento B = {sair um número par} = {2, 4, 6}. É importante para o cálculo das probabilidades calcular a probabilidade condicional. No exemplo, pode-se estar interessado em avaliar a probabilidade do evento A condicionada à ocorrência do evento B. A probabilidade condicionada é representada por: p(A\B) => lê- se: probabilidade de A dado B. Observe que uma vez dado a informação da ocorrência de um evento, teremos a redução do espaço amostral. Ω = {1, 2, 3, 4, 5, 6} foi reduzido para Ω = {2, 4, 6} e é nesse espaço amostral reduzido é que se avalia a probabilidade do evento. OBS: (\ = dado que, se) o que vem depois da \ (barra) é sempre o evento que já ocorreu. Exemplo: utilizando os dados da tabela abaixo, vamos calcular as seguintes probabilidades: a) Do candidato selecionado aleatoriamente ter nível superior, sabendo que ele não possui experiência anterior. %601006,0 20 12)|( DGP b) Do candidato selecionado aleatoriamente não possuir experiência anterior, sabendo que ele possui nível superior. %33,331003333,0 36 12)|( AGP c) Do candidato selecionado aleatoriamente não ter nível superior, sabendo que ele possui experiência. %601006,0 60 36)|( CFP d) Do candidato selecionado aleatoriamente possuir experiência, sabendo que não possui nível superior. %82,811008182,0 44 36)|( BFP Teorema do Produto: Da definição de probabilidade condicional obtemos o teorema do produto, de grande aplicação no cálculo de probabilidade, dado por: P (A ∩ B) = p(A) . p(B\A). A probabilidade da ocorrência simultânea de dois eventos, A e B, do mesmo espaço amostral, é igual ao produto da possibilidade de um deles pela probabilidade condicional do outro, dado o primeiro. Assim: Exemplo: Em um lote de 12 peças, 4 são defeituosas, 2 são retiradas uma após a outra sem reposição. Qual a probabilidade de que ambas sejam boas? Saiba mais Para esta aula sugiro as seguintes tarefas: Leitura o capitulo 6: Probabilidade (pag. 101 a 107), do livro de Estatística Aplicada a Gestão Empresarial e Resolução dos exercícios de 40 até 49. Aula 10: Teorema de Bayes e Função Binomial Independência de Eventos: Um evento A é considerado independente de outro evento B se a probabilidade de A é igual a probabilidade condicional de A dado B, isto é, se p(A) = p(A\B), ou seja, o evento A é independente do evento B se a probabilidade de A não é afetada pela ocorrência ou não de B. Exemplo 1: Em uma caixa temos 10 peças, das quais 4 são defeituosas. São retirados duas peças, uma após a outra, com reposição. Calcular a probabilidade de ambas serem boas. A= {a primeira peça é boa} -- B= {a segunda peça é boa} --- Notem: A e B são independentes, pois p(B) = P(B/A) --- Logo: P (A ∩ B) = p(A) . p(B) = 6/10 . 6/10 = 9/25 Teorema de Bayes: Seja A1, A2, A3, ... Na, n eventos mutuamente exclusivos tais que Ω = {A1 U A2 U A3, ... U An} Sejam p(Ai) as probabilidade conhecidas dos vários eventos. E B um evento qualquer de Ω tal que são conhecidos todas as probabilidades condicionais p(A/B). Então, para casa “i” temos: O Resultado acima é importante, pois relaciona probabilidade a priori p(Ai) com probabilidade a posteriori p(Ai / B), probabilidade de Ai depois de ocorrer B. Ex.: Suponha a seguinte situação: Escolheu-se uma urna ao acaso e dela extraiu-se uma bola ao acaso. Verificou-se que a bola é branca. Qual a probabilidade da bola ter vindo: a) Da urna 2? b) da urna 3? Variável Aleatória (v.a.): é uma variável que associa um valor numérico a cada ponto do espaço amostral. Ela é denominada discreta quando pode assumir apenas um número finito ou infinito enumerável de valores e é dita contínua quando assume valores num intervalo da reta real. É comum utilizarmos letras latinas para representarmos variáveis aleatórias. Experimentos Binomiais: Há muitos experimentos probabilísticos para os quais a conclusão de cada tentativa pode ser reduzida a dois resultados: sucesso ou fracasso. Quando um jogador de futebol ao bater uma penalidade máxima, por exemplo, das duas, uma: ou ele marca o gol ou não. Experimentos probabilísticos como esse são chamados binomiais. Um experimento binomial é uma experiência probabilística que precisa preencher os seguintes requisitos:1. O experimento é repetido por um número fixo de tentativas, sendo uma independente de todas as outras. 2. Há dois resultados possíveis de interesse em cada tentativa, que podem ser classificados como sucesso (S) ou fracasso (F). 3. A probabilidade de um sucesso (S) é a mesma em cada tentativa. 4. A variável aleatória x conta o número de tentativas com sucesso. Vamos adotar a seguinte notação para experimentos binomiais: Exercício1: Escolha uma carta de um baralho comum e verifique se seu naipe é ouros ou não e recoloque- a no baralho. Repita a experiência cinco vezes. Assim, n = 5. Os resultados para cada tentativa podem ser classificados em duas categorias: S = tirar uma carta de ouros --- F = tirar uma carta de outro naipe. As probabilidades de sucesso e fracasso são: A variável aleatória x representa o número de vezes em que a carta de ouros foi tirada em cinco tentativas. Portanto, os valores possíveis da variável aleatória são: 0, 1, 2, 3, 4 e 5. Por exemplo, se x = 2, então exatamente duas das cinco cartas são de ouros, enquanto as outras três são de outro naipe. Exercício2: Um determinado procedimento cirúrgico tem 85% de chance de sucesso. Esse procedimento é realizado em dez pacientes. Determine se o experimento é binomial. Se sim, especifique os valores den, p e q e enumere os valores possíveis da variável aleatória x. Resp: n = 10 --- p = 0,85 --- q = 1 – 0,85 = 0,15 --- x = 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 --- O experimento é binomial, pois satisfaz as quatro condições da definição. Probabilidades Binomiais: Existem diversos meios de calcular a probabilidade de x sucesso em n tentativas em um experimento binomial. Uma delas é a fórmula da probabilidade binomial. Atividade Uma companhia produz circuitos em três fábricas, I, II e III. A fábrica I produz 40% dos circuitos, enquanto a II e a III produzem 30% cada uma. As probabilidades de que um circuito integrado produzido por essas fábricas não funcione são 0,01; 0,04 e 0,03, respectivamente. Sabendo que um circuito escolhido ao acaso é defeituoso, qual a probabilidade dele ter sido fabricado pela fábrica I? Revisão - Aula 6 a 10 Exercícios ppt
Compartilhar