Buscar

Análise Estatística Resumo das aulas 01 a 10

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 21 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 21 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 21 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Análise Estatística
Resumo das aulas 01 a 05
Aula 01 – Conceitos Introdutórios em estatística.
É na análise que obteremos as conclusões que auxiliarão nas tomadas de decisões.
As análises estatísticas dependem de vários fatores como tamanho da amostra, tipo de dados a serem coletados e do processo de obtenção das informações.
O processo estatístico deve ser bem criterioso e cuidadoso, a fim de que não haja erros grosseiros que levem a resultados distorcidos.
Estatística - informações na forma de dados coletados em pesquisas ou de forma experimental.
Estatística - um conjunto de técnicas e métodos de pesquisa que, entre outros tópicos, envolve o planejamento do experimento a ser realizados, a coleta qualificada dos dados, a inferência (análise e interpretação dos dados), o processamento, a análise e a disseminação das informações.
A coleta, a organização e a descrição dos dados estão a cargo da Estatística Descritiva enquanto que a análise e a interpretação desses dados ficam a cargo da Estatística Indutiva ou Inferencial.
O controle de qualidade foi criado como uma necessidade de resolver problemas na redução de custos, no controle de perdas desnecessárias, na uniformização e normalização da produção, auxiliando as empresas a controlarem, melhor distribuírem e maximizarem os seus recursos, tornando-as assim mais competitivas.
Hoje em dia os métodos de observação, estudo e análise fazem parte da maioria dos aumentos de conhecimentos atuais e são desenvolvidos com base em métodos específicos, que chamamos de métodos científicos.
Métodos - sendo um conjunto de passos e procedimentos que repetidos fornecem um resultado específico.
Dentre os métodos científicos destacamos o método estatístico e experimental
Método Experimental
Deseja analisar como se comportam os resultados ao se alterar algum dos elementos componentes do experimento. É necessário manter constante os demais fatores (causas). Este tipo de pesquisa faz uma análise do problema, montando-se hipóteses.
As alterações nas variáveis tanto em quantidade, quanto em qualidade, permite o estudo das relações de causas e efeitos do referido fenômeno em análise.
Método Estatístico
No método estatístico, vários fatores afetam o fenômeno em estudo que não podem permanecer constantes enquanto fez-se variar a causa que naquele momento nos interessa.
O método estatístico, diante da impossibilidade de manter as causas constantes, admite todas essas causas presentes variando-as, registrando as variações e procurando determinar, no resultado final, que influencias cabem a cada uma delas.
Quando fazemos repetidas observações com relação a um determinado sistema ou fenômeno específico, verificamos que os resultados obtidos não são exatamente os mesmos. A este fato chama-se de variabilidade.
Através da análise estatística, é possível descrever a variabilidade e entender quais as fontes mais importantes, ou quais as de maior potencial e influência na variabilidade do fenômeno.
No método estatístico, observando suas várias etapas, podemos considerar que a mais importante muitas vezes não é a análise de dados.
A etapa que necessita de maior atenção e cuidado é o planejamento de como o conjunto de dados será coletado. Um mau planejamento, ou mesmo uma coleta feita de forma inapropriada pode acarretar em dados inúteis, de onde não se consegue tirar nenhuma informação ou qualquer conclusão coerente.
Abusos da Estatística - quando os dados são apresentados de forma enganosa.
Exemplos como os dados podem ser distorcidos:
Pequenas Amostras
Números Imprecisos
Estimativas por Suposição
Porcentagens Distorcidas
Cifras Parciais
Perguntas Tendenciosas
Pressão do Pesquisador
Más Amostras
Quanto à origem dos dados, podemos classifica-los como: Primários e secundários.
Os dados que podem ser contados e ordenados são considerados: Enumerados.
Fases do Método Estatístico
Coleta de dados
Os dados podem ser primários (informados por quem recolheu os dados) ou secundários (informação dada por terceiros).
Os dados podem ser classificados também de acordo como eles são obtidos:
Dados enumerados – podem ser contados e ordenados. Ex.:Levantamento de estoques, contagem física de pessoas e objetos
Dados mensurados - podem ser obtidos por meio de medições, por instrumentos de medição. Ex.: Medidas de altura, peso, volume, etc.
Dados avaliados – podem ser medidos ou enumerados. São avaliados de forma empírica como por exemplo a estimativa do número de pessoas contidas em uma sala.
Coleta de dados Direta – feita sobre elementos informativos de registro obrigatório como nascimentos, casamentos, óbitos, importação, exportação de mercadorias ou quando os dados são coletados pelo próprio pesquisador através de inquéritos ou questionários. As coletas diretas podem ser:
Contínua – registrados a medida que ocorrem
Periódica – ocorrem em ciclos. Ex.: censo no Brasil.
Ocasional – realizados sem preocupação de periodicidade ou continuidade.
Coleta de dados indireta
São dados já conhecidos oriundos de uma coleta direta feita anteriormente.
Coleta indireta por analogia – dados com relação de casualidade. Induz a informação de uma informação anterior. Ex: No ano passado mais de 1 milhão de pessoas estiveram em Copacabana para o Reveillion. Espera-se que neste anos cerca de 1 milhão de pessoas estejam em Copacabana para o Revellion deste ano.
Coleta indireta por proporcionalização – Realiza-se uma regra de três para achar o valor próximo do esperado. Ex.: Se foram 3 mil pessoas em uma casa de espetáculo com 6 mil lugares, se a casa de shows tiver 4 mil lugares, espera-se receber algo em torno de 2 mil pessoas.
Coleta indireta por indícios – utilizada para analisar aspectos da vida social. Ex.: Indícios de que um determinado cargo dentro de uma instituição bancária é onde ocorre o maior número de fraudes.
Coleta indireta por avaliação - baseado em fatos ocorridos. Ex.: em função das informações cadastradas é possível supor que existam 90 pessoas nesta sala.
Críticas dos dados
Críticas internas – feita diretamente sobre os dados obtidos na coleta, verificando se os dados estão coerentes. Ex.: a soma de números, etc
Críticas externas – busca a causa dos erros nos dados informados, muitas vezes causado por perguntas mal formuladas, distração e expostas com duplo sentido.
Apuração dos dados
Após a coleta e antes da análise é necessário fazer algum tratamento nos dados para melhor visualização. Estes são: agrupamento de dados, resumos e ordenação. A apuração dos dados é a soma e o processamento dos dados obtidos e a disposição mediante critério de classificação. Pode ser manual, eletromecânica ou eletrônica.
Apresentação dos dados
O objetivo da apresentação dos dados é que torne mais fácil o exame daquilo que está sendo objeto de tratamento estatístico. A apresentação dos dados após tratamento pode ser:
Tabular – por meio de tabelas
Apresentação gráfica – por meio de gráficos
Análise dos resultados
Tirar conclusões sobre o todo (população) a partir de informações fornecidas por parte representativa do todo (amostra). Tiramos desses resultados conclusões e previsões.
Aula 02 – Revisão das Medidas e Tendência Central e de Posição.
Medidas de posição central (média aritmética e ponderada, mediana e moda)
Medidas de ordenamento (separatrizes) - quartis, decis e percentis
As medidas de posição central nos apontam a tendência de comportamento dos dados, enquanto as separatrizes nos auxiliam na decisão de qual a cobertura dos dados poderemos atingir ou selecionar.
Medidas de Posição Central
Medidas de posição (são valores que vão orientar quanto a posição da distribuição dos dados numa sequencia ordenada).
Medidas de tendência central – é um valor que tende a melhor representar um conjunto de números, passando a ideia do comportamento geral dos dados. Representam um valor central em torno do qual os dados se concentram e se distribuem, mostrando se essa concentração ocorre no início, no meio ou no final da distribuição, ou até mesmo se estão distribuídosde forma igual ao longo da amplitude considerada.
Quando esses valores estão associados a uma população, chamamos de parâmetros; quando estão ligados a uma amostra, são chamados de estatísticas. Os parâmetros são valores constantes, fixos. Já os valores estatísticos têm dados diferentes, que irão influenciar no cálculo dos valores estatísticos, esses valores não são fixos (variáveis).
Média aritmética – é usada para distribuições simétricas, ou quase simétricas, ou para distribuições que tem um único pico dominante, somando-se todas as observações e dividindo-se pelo número total de observações.
Cálculo:
População
Amostra
Média Ponderada –a média ponderada é muito usada em situações em que os dados são agrupados por frequência, ou em situações em que os dados possuem importâncias diferentes, sendo representados na forma de pesos.
Os dados possuem níveis de importância diferentes dentro do grupo, explicitando essa importância na forma de peso (w).
Multiplicação por escalar
Moda - valor que ocorre com maior frequência em uma relação de dados. Muitas vezes é utilizada por ser a medida de posição de mais rápida visualização. É usada quando temos distribuições extremamente assimétricas ou nas situações irregulares em que dois ou mais pontos de concentração de dados são verificados na série de dados.
Quanto a classificação modal:
Unimodal – quando apresenta apenas uma moda.
Ex.: X= (4,5,5,6,6,6,7,7,8,8) Mo=6 o valor de maior frequência.
Bimodal – quando possui duas modas.
Ex.: X= (1,2,2,2,3,4,4,4,5,5,6) Mo=2 e 4 os valores de maior frequência
Plurimodal ou multimodal – quando apresenta mais de duas modas.
Ex.: X= (1,2,2,2,3,3,3,4,4,4,5) Mo= 2,3 e 4 valores de maior frequência
Amodal – quando todos os valores apresentam a mesma frequência.
Ex.: X= (1,2,3,4,5,6) não apresenta valor predominante.
Mediana – é o valor central da distribuição quando os dados estão ordenados de forma crescente ou decrescente. É usada quando se deseja obter o ponto que divide a distribuição em duas partes iguais, ou quando existem valores extremos que afetam a média de forma acentuada.
Deseja-se o ponto que divide o conjunto em partes iguais. Utilizada para quando a variável em estudo é o salário.
Exemplo:
X= (6,2,7,10,3,4,1,12)
Colocar os dados em ordenados (crescente ou decrescente): X=(1,2,3,4,6,7,10,12)
Ordem ou posição do elemento da mediana (E): 
E= n+1/2
E= 8+1/2=4,5
Para achar a mediana: X4,5, onde x4=4 e X5=6
Med= X4+X5/2=4+6/2=5
Relação entre a Média, a Mediana e a Moda
Com essas três medidas de posição é possível determinar a assimetria da curva de distribuição de frequência. A tabela de distribuição de frequências é composta de uma coluna contendo os valores que compõem a relação de dados e uma coluna com as correspondentes quantidades que cada valor aparece na relação de dados
A mediana se localiza na posição central da distribuição, devendo estar entre os valores da média e moda e podendo até mesmo ser igual a ambas.
O coeficiente de assimetria pode ser calculado pela fórmula do primeiro coeficiente de Pearson. Assimetria da distribuição é positiva ou negativa.
Desvio padrão - terá sempre um valor positivo (ou seja, não é possível ocorrer desvio padrão negativo)
Média=Moda x - Mo=0 Assimétrica nula=simétrica
Média<Moda x – Mo<0 Assimetria negativa
Média>Moda x – Mo>0 Assimetria positiva
Quando a distribuição de frequência é assimétrica ã direita da curva, diz-se que a distribuição te assimetria positiva.
Quando a distribuição de frequência é assimétrica ä squerda da curva, diz-se que a distribuição tem assimetria negativa.
Assimetria de Pearson – é um coeficiente que indica se esta é forte ou fraca
Assimetria fraca AS<1
Assimetria moderada AS<=1
Assimetria forte AS>1
Separatrizes
Quartis – Divide a distribuição de frequência depois de ordenados em quatro partes iguais, contendo a mesma quantidade de elementos.
1º quartil – 25% dos dados abaixo dele
2º quartil – Coincide com a mediana e deixa 50% dos dados abaixo dele
3º quartil – deixa 75% dos dados abaixo dele
4º quartil – 100% dos dados
Fórmula de determinação do quartil:
Qi=X(in/4+1/2)
Qi determina o elemento que separa o quartil i e o quartil seguinte i+1
n= número de dados
1o quartil – Q1 =X(n/4+1/2)
2º quartil – Q2=X(2n/4+1/2)=X(n/2+1/2)
3º quartil – Q3=X(3n/4+1/2)
Decis – Dividem a distribuição de frequência depois de ordenados em dez partes iguais, contendo a mesma quantidade de elementos.
Fórmula de determinação do decil:
Di=X(in/10+1/2)
1o decil – D1 =X(n/10+1/2)
2º decil – D2=X(2n/10+1/2)=X(n/5+1/2)
3º decil – D3=X(3n/10+1/2)
Percentis – Dividem a distribuição de frequência depois de ordenados em 100 partes iguais, contendo a mesma quantidade de elementos.
Fórmula de determinação do percentil:
Pi=X(in/100+1/2)
1o decil – D1 =X(n/100+1/2)
2º decil – D2=X(2n/100+1/2)=X(n/50+1/2)
3º decil – D3=X(3n/100+1/2)
Fórmulas no Excel:
Média =MEDIA(XX:YY)
Mediana =MED(XX:YY)
Moda =MODO(XX:YY)
Aula 03 – .Medidas de Dispersão
Medidas de Dispersão - ver o quanto os dados estão afastados da média.
indica a maior ou menor diferença entre os valores de uma variável, dado da distribuição, e sua medida de posição, normalmente a média.
Estudaremos as seguintes medidas de dispersão:
Amplitude total ou interquartil
Desvio médio
Variância e desvio padrão
Coeficiente de variação
Amplitude
Amplitude Total
n valores ordenados, onde n é a quantidade total de dados, definimos como amplitude total (R) a diferença entre os valores máximo (H) e mínimo (L) da relação.
R= Xmax – Xmin = H - L
Sabendo-se que a quantidade de garrafas de refrigerantes vendidas no mercado, durante uma semana foi de 10,12,13,14,15,16 e 18 garrafas, temos para a amplitude total:
n = 7
H= Xmax = x7 = 18
L= Xmin = x1 = 10
Amplitude total R = 18 – 10 = 8
Amplitude Interquadril (IQR)
Tem como objetivo determinar onde se situam os 50% valores centrais.
IR= Q3 – Q1
Desvio Médio Absoluto
O desvio (di) mede a diferença entre cada valor e a média aritmética. O desvio médio absoluto (MAD) é obtido dividindo o somatório dos módulos de cada desvio pela quantidade de dados (n para amostra e N para população).
Para o desvio médio, deve-se fazer a conta e desprezar o sinal do resultado.
Ex.: X=3,5,7,9,11
Média= 3+5+7+9+11/5 7
Desvio médio Absoluto (3-7)+(5-7)+(7-7)+(9-7)+(11-7)/5 2,4
Variância
A variância é uma medida que não recebe influência de valores extremos, pois leva em consideração todos os valores no seu cálculo. Ela é a média aritmética dos quadrados dos desvios.
Desvio Padrão
É a raiz quadrada da variância.
Coeficiente de Variação
Mede a homogeneidade dos dados, ou seja, mostra a magnitude do desvio padrão em relação à média dos dados como porcentagem.
Quanto maior o valor do coeficiente de variação, menos homogêneo será o conjunto, ou seja, apresenta o maior grau de dispersão.
Exemplo:
	
	X (Média)
	S (desvio da amostra)
	Altura
	176 cm
	5,0cm
	Peso
	69 Kg
	2,0 Kg
< dispersão
(+) homogêneo que o outro
> dispersão
(-) homogêneo
x 100 = 2,90%
x 100 = 2,84%
Fórmulas no Excel
Variância da população VARP(XX:YY)
Variância da amostra VARA(XX,YY)
Desvio Padrão da população DESVPADP(XX:YY)
Desvio Padrão da amostra DESVPAD(XX:YY)
Para obter o ponto médio de uma classe, soma-se ao seu limite inferior a metade de sua amplitude.
A amplitude total é a diferença entre o maior e o menor valor observado da variável.
A soma dos desvios entre cada valor e a média sempre será Zero.
Aula 04 – . Gráficos Estatísticos no Microsoft Excel
Inserir um gráfico menu Inserir, gráfico
Formatar gráfico Ferramentas de gráfico, design
Alternativas de Formatação
Deseja alternar os dados do eixo vertical e o eixo horizontal, pode-se utilizar a opção Alternar linha/coluna (Terceiro ícone).
Diminuir, ou alterar de alguma forma a entrada de dados do gráfico, utiliza-se selecionar dados (quarto ícone)
mudando o layout das colunasopção layout de gráfico.
Alterar as cores de fundo, das colunas e o gradiente das cores, basta escolher a opção Estilos de gráfico,
Torna o gráfico mais apresentável e com um estilo mais profissional.
O gráfico pode ser colocado na mesma planilha onde estão inseridos os dados, ou em uma planilha diferente. Opção local, ainda na opção design.
Menu Layout
Seleção atual, permite formatar uma parte do gráfico 
opção Inserir colocar imagens (figuras e fotos), formas (setas, linhas, figuras geométricas etc.) ou caixas de texto
opção Rótulo inserir e formatar os vários rótulos do gráfico, como rótulo dos dados, título do gráfico e dos eixos, a legenda e a tabela de dados.
Mais opções de títulos inserir título abaixo do eixo horizontal e incluir cores
Rótulos dados que podem ser colocados no gráfico
Eixos é possível alterar os eixos horizontal e vertical
As linhas de grades em um gráfico têm a finalidade de orientar a posição de um valor em comparação aos outros valores do gráfico.
Plano de Fundo, Análise e Propriedades
Opção Análise deseja identificar a tendência dos resultados do gráfico para entender o que acontece com os dados, ou para regressões lineares que são muito usados em estudos estatísticos.
Opção Propriedades permite alterar o nome do gráfico. 
menu Inserir:
Gráfico de Colunas - muito usados em comparações feitas em períodos diferentes de um mesmo item, ou diferentes itens em um único período de tempo
Gráfico de Linhas - utilizado para apresentar evoluções temporais de um ou mais itens, tomando o cuidado de que os intervalos de tempos devem ser iguais.
Gráfico de Dispersão - utilizado para analisar a relação entre duas variáveis eu um eixo xy.
Gráfico de Pareto - também chamado de Diagrama de Pareto, é do tipo colunas, ordenadas na forma decrescente e complementadas com uma linha, indicando a frequência acumulada. Na verdade, trata-se de um gráfico de colunas e linha em dois eixos.
A opção alterar tipo de gráfico fica no menu Design
A opção inserir caixa de texto fica no menu Layout
O Gráfico de Pareto é considerado um gráfico de coluna e linha em dois eixos.
Aula 05 – Medidas de Assimetria e de Curtose. 
O quanto na curva de distribuição dos dados a média está deslocada em relação à mediana.
Verá o grau de achatamento de uma distribuição em relação à curva normal. A curva normal corresponde a uma distribuição teórica de probabilidade.
Natureza da assimetria – o quanto a curva de frequência se afasta da posição de simetria, sendo simétrica quando a média e a moda se coincidem, ou seja, possuem o mesmo valor.
A curva de uma distribuição simétrica tem por característica que o valor máximo encontra-se no ponto central da distribuição. Os pontos equidistantes do centro possuem a mesma frequência.
Medidas de Assimetria
Dificilmente encontramos, na prática, uma distribuição simétrica. Em levantamentos de dados reais, são medidas mais ou menos assimétricas em relação à frequência máxima. A distribuição assimétrica à esquerda ou negativa ocorre quando o valor da moda é maior do que a média. Logo, a distribuição assimétrica à direita ou positiva ocorre quando a moda é menor do que a média.
A diferença entre a moda e a média poderá definir o tipo de assimetria:
Exemplo
Coeficiente de Assimetria
A fórmula X - Mo não permite fazer comparações entre duas distribuições com relação ao seu grau de assimetria. Desta forma, o coeficiente de assimetria de Pearson é muito utilizado para verificar o grau de assimetria das curvas de distribuição.
A
B
C
Medida de Curtose
Curtose é o grau de achatamento de uma distribuição em relação à curva normal, uma distribuição padrão. 
A curva normal corresponde a uma distribuição teórica de probabilidade.
Quando a distribuição apresenta uma curva de frequência com dados mais concentrados em torno da média do que a curva normal, ela chama-se leptocúrtica.
A curva normal, tomada por base para classificação do achatamento das distribuições de frequências, recebe o nome de mesocúrtica.
Quando a distribuição apresenta uma curva de frequência com dados mais dispersos em relação à média do que na curva normal, essa distribuição chama-se platicúrtica.
Coeficinte de Curtose
O coeficiente de curtose define o grau de achatamento da curva.
A fórmula do coeficiente percentílico de curtose: 
C = 930 – 809 = 0,252		 leptocúrtica
 2(1.020 – 780)
C = 82,4 – 65,8 = 0,263			 mesocúrtica
 2(88,6 – 57)
C = 46,5 – 29,7 = 0,277		 platicúrtica
 2(51,2 – 20,9)
A assimetria nos mostra o quanto a média se desloca para a direita ou para a esquerda, mostrando, também, como algumas condições impostas sobre a população podem influenciar o resultado e deslocamento da média.
O grau de curtose indica se a distribuição está mais ou menos concentrada, fazendo com que a curva esteja mais ou menos achatada em relação à curva normal (curva mesocúrtica), padrão de referência para a classificação do grau de curtose.
A curva normal, quanto ao seu grau de curtose, também pode ser chamada de Mesocúrtica.
O grau de assimetria mede a diferença entre a média e a moda, indicando o deslocamento da curva para a direita ou para a esquerda.
O grau de curtose da curva de distribuição mostra o grau de achatamento da curva de distribuição em relação à curva normal.
Aula 06 – Probabilidade
Eventos complementares (p + q = 1 -> q = 1 - p) dos eventos independentes, também conhecido como regra do "e" (p = PA x PB); bem como os eventos mutuamente exclusivos, também conhecidos como regra do "ou" (p = PA + PB).
Probabilidade
A possibilidade de ocorrência de um determinado fato de interesse, em situações onde existem inúmeros casos possíveis e quando não é possível determinar com precisão o real valor do evento. Trabalhamos com chances ou probabilidades.
Experimento Aleatório
O processo aleatório capaz de produzir observações e que possa se repetir indefinidamente no futuro sob as mesmas condições. Um experimento aleatório apresenta variações nos resultados. Os resultados não são determinados antes que tenham sido realizados. É possível indicar todos os seus resultados possíveis, ou seja, as suas probabilidades. É na verdade qualquer processo capaz de gerar um resultado incerto ou casual.
O experimento aleatório apresenta três características:
Observamos que todo experimento que apresentar resultados diferentes quando repetido nas mesmas condições iniciais é considerado um experimento aleatório, e a variabilidade dos seus resultados deve-se ao acaso. A tudo isto liga-se a incerteza, que é a chance de ocorrência do resultado de interesse.
Espaço amostral ou conjunto universo o seu conjunto de possibilidades, isto é, o conjunto formado por todos os possíveis resultados do experimento, geralmente denominado S ou Ω (letra grega que se lê: “ômega”). Definimos por n(S) como sendo o número de elementos do conjunto S, ou seja, o número de resultados possíveis do experimento.
Quanto ao número de elementos:
Cara: Ca Coroa: Co 
Ao lançarmos um dado, existem seis possíveis resultados esperados: 
1, 2, 3, 4, 5 ou 6 
Os dois experimentos independentes têm os seguintes espaços amostrais: 
 Lançamento da moeda: Sm = {Ca, Co}; 
 Lançamento do dado: Sd = {1, 2, 3, 4, 5, 6}; 
O resultado obtido em um lançamento do dado, e também um elemento de S, recebe o nome de ponto amostral. Isto é: 
2  Sd  2 é um ponto amostral de Sd 
 Lançamento da moeda: Sm = {(Ca, Ca); (Ca, Co); (Co, Ca); (Co, Co)}; 
3) Seja um experimento aleatório onde uma moeda é jogada três vezes. O espaço amostral para este experimento será: 
Sm = {(Co, Co, Co), (Co, Co, Ca), (Co, Ca, Co), (Co, Ca, Ca), (Ca, Co, Co), (Ca, Co, Ca), (Ca, Ca, Co), (Ca, Ca, Ca)} 
 Nota: Neste experimento, há oito possíveis resultados no espaço amostral, todos igualmente prováveis de ocorrer. 
4) Sejam os funcionários do setor de RH de uma determinada empresa. Sabe-se que neste setor trabalham seisfuncionários. Um experimento ao acaso seria a escolha aleatória de um dos funcionários. O espaço amostral para este experimento será: 
S = {Carlos, Jackeline, Giulyana, Girlene, Cláudio, Larissa} 
5) Considere uma urna contendo cinco bolas vermelhas e quatro brancas, onde um experimento aleatório é retirar, ao acaso, duas bolas sucessivamente e sem repetição. Uma forma de determinar o espaço amostral () é construindo o diagrama de árvore da sequência de cores das bolas retiradas: 
Bola Vermelha: V; Bola Branca: B 
Espaço Amostral:  = {(V, V), (V, B), (B, V), (B, B)} n() = 4 
6) Uma loja de carros usados possui três automóveis para serem vendidos por um dos seus dois vendedores. Determine as possibilidades dos automóveis que cada um poderá vender em uma semana. Usando duas coordenadas, de modo que a primeira coordenada represente o primeiro vendedor, esboce um diagrama que exiba os pontos correspondentes do espaço amostral. 
S = {(0, 0), (0, 1), (0, 2), (0, 3), (1, 0), (1, 1), (1, 2), (2, 0), (2, 1), (3, 0)}; n(S) = 10
Eventos
Evento – qualquer subconjunto do espaço amostral S.
Qualquer que seja E um conjunto de possíveis resultados do experimento, se E S, então E é um evento de S. Se E = S, chamamos E de evento certo; se E é um conjunto unitário e E S, chamamos E de evento elementar, quando E = Ø, chamamos de evento impossível.
O que não pode acontecer é confundir “chance” com “probabilidade”, pois existe certa diferença entre eles. A chance compara a quantidade de resultados possíveis de A com os resultados possíveis de outro evento (B ou C), enquanto que a probabilidade faz relação entre os resultados possíveis de A com a quantidade total dos resultados possíveis do experimento aleatório.
Probabilidade – Exemplos
1) Sejam os funcionários do setor de RH de uma determinada empresa. Sabe-se que neste setor trabalham seis funcionários. Um evento de interesse A poderia ser a escolha do sexo do funcionário. O espaço amostral para este experimento será: 
Solução: 
S = {Carlos, Jackeline, Giulyana, Girlene, Cláudio, Larissa} 
A = {Carlos, Cláudio} 
2) Considere o experimento de jogar duas moedas, onde pode ocorrer Cara: Ca ou Coroa:Co. Qual a probabilidade de o evento A sair uma cara? 
Solução: 
O espaço amostral S = {(Ca, Ca); (Ca, Co); (Co, Ca); (Co, Co)}; 
3) Seja um experimento aleatório onde uma moeda é jogada três vezes. Seja K o número de caras, o espaço amostral para este experimento será: 
Solução: 
Sm = {(Co, Co, Co), (Co, Co, Ca), (Co, Ca, Co), (Co, Ca, Ca), (Ca, Co, Co), (Ca, Co, Ca), (Ca, Ca, Co), (Ca, Ca, Ca)} 
Assim, os possíveis valores de K (número de caras) serão: K = 0, 1, 2, 3. 2/2 
Nota: Neste experimento, há oito possíveis resultados no espaço amostral. Desde que eles são todos igualmente prováveis de ocorrer, cada resultado tem uma probabilidade de 1/8 de ocorrer. 
4) Um estudo de 500 voos da American Airlines selecionados aleatoriamente mostrou que 430 chegaram no horário (com base em dados do Ministério dos transportes). Qual é a probabilidade de um voo da American Airlines chegar no horário? 
Solução: 
Evento A: voo chegar no horário; n(A) = 430
Eventos Complementares
Eventos Complementares – Exemplos
1) Considerando o lançamento de um dado, determine a probabilidade do evento A de obter um número igual a 6 e do evento de obter um número diferente de 6. 
S = {1, 2, ,3 4, 5, 6}  n(S) = 6 
A = {6}  n(A) = 1 
2) Um estudo de 500 voos da American Airlines selecionados aleatoriamente mostrou que 430 chegaram no horário (com base em dados do Ministério dos transportes). Qual é a probabilidade de um voo da American Airlines chegar no horário e de não chegar no horário? 
Solução: 
Evento A: voo chegar no horário; n(A) = 430 
Evento : voo não chegar no horário;
Eventos Independentes
Eventos Independentes – Exemplos
1) Seja um experimento aleatório representado pelo lançamento de dois dados. A probabilidade de se obter 2 no primeiro dado é: 
A probabilidade de se obter 4 no segundo dado é: 
A probabilidade de se obter, simultaneamente, 2 no primeiro dado e 4 no segundo dado é: 
2) Sejam os eventos independentes A, B, C e D. Determine P(A  B) e P(C  ), sabendo que P(A) = 0,40, P(B) = 0,90, P(C) = 0,75 e P(D) = 0,80. 
P(A B) = P(A).P(B) = 0,40 . 0,90 = 0,36 
P(C  ) = P(C).P() = 0,75 . 0,20 = 0,15
Exemplos
O valor de , dado que P (A) = 0,228 é:
= 1 – P(A)
= 1 – 0,228 = 0,772
Se P(A) = 0,20 e P(B) = 0,25, então é:
P(A B) = P(A) X P(B) = 0,20 X 0,25 = 0,05
Aula 07 –

Outros materiais