Buscar

Analise de Estatística

Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original

Analise de Estatística
Apresentação
Atualmente, qualquer pessoa pode ter acesso a uma enorme quantidade de informações estatísticas. Os profissionais nas funções gerenciais e tomadores de decisões necessitam cada vez mais de ter conhecimentos estatísticos, a fim de entender a informação e usá-la de forma eficaz.
As análises estatísticas dependem de vários fatores como tamanho da amostra, tipo de dados a serem coletados e do processo de obtenção das informações. Desde a definição dos objetivos a serem alcançados até a análise dos resultados obtidos o processo estatístico deve ser bem criterioso e cuidadoso, a fim de que não haja erros grosseiros que levem a resultados distorcidos.
De uma forma decisiva os métodos estatísticos estão inseridos nas mais diversas áreas de conhecimentos e nos seus diversos setores, auxiliando nas mais importantes tomadas de decisões e direcionando muitas melhorias de processos.
Objetivos
Compreender a aplicação da estatística da área de gestão;
Identificar os métodos científico, experimental e estatístico;
Conhecer as fases do método estatístico (coleta, crítica, apuração e apresentação e análise dos dados).
Introdução à Análise Estatística
Atualmente, é fundamental o emprego da Estatística em quase todas as áreas do conhecimento, todas as vezes que estiverem envolvidas informações na forma de dados coletados em pesquisas ou de forma experimental.
Com o objetivo de alcançar uma melhoria dos processos tanto nas áreas industriais como tecnológicas, as ferramentas estatísticas tem alcançado um papel importantíssimo nesse cenário.
O que modernamente se conhece como Estatística:
Um conjunto de técnicas e métodos de pesquisa que, entre outros tópicos, envolve o planejamento do experimento a ser realizado, a coleta qualificada dos dados, a inferência, o processamento, a análise e a disseminação das informações.
Estatística da Área de Gestão
Todo profissional hoje em dia deve estar ciente da importância da Estatística e ter conhecimento de como utilizá-la, a fim de ter um lugar no mercado de trabalho com a capacidade de lidar com as realidades atuais extremamente competitivas. Dentre várias habilidades profissionais, vem crescendo em importância o desenvolvimento do pensamento estatístico, tendo em vista as necessidades de todas as áreas de conhecimentos de uma análise mais apurada durante os processos decisórios.
A metodologia estatística está sendo empregada em várias áreas de conhecimento, tais como nos setores farmacêuticos, médicos e setores industriais diversos, principalmente para melhoria da área de produção.
Controle de qualidade
Observa-se que o controle de qualidade foi criado como uma necessidade de resolver problemas na redução de custos, no controle de perdas desnecessárias, na uniformização e normalização da produção, auxiliando as empresas a controlarem, melhor distribuírem e maximizarem os seus recursos, tornando-as assim mais competitivas.
Aplicação
Um interessante estudo experimental aplicado à pesquisa médica é o relato do primeiro ensaio clínico planejado para comprovar a eficácia do AZT (zidovudina) no prolongamento da vida de aidéticos. Os dados foram publicado por Fischl et al. (1987) e posteriormente discutidos por Soares & Siqueira (1999, p.176-183).
O experimento considerou essencialmente o acompanhamento de 282 pacientes aidéticos durante 24 semanas de tratamento, os quais foram aleatoriamente divididos em dois grupos: o grupo de pacientes tratados com AZT (composto por 145 aidéticos) e o grupo controle, composto por 137 aidéticos que receberam o placebo. A variável resposta (desfecho) é a situação do paciente (sobrevivente ou não sobrevivente) após as 24 semanas de tratamento.
A avaliação da eficácia do AZT para o prolongamento da vida de aidéticos consiste basicamente em comparar as proporções de sobreviventes dos dois grupos. Entre os indivíduos tratados com AZT, a proporção de sobreviventes e 𝑃 𝐴𝑍𝑇= 0,993, enquanto que no grupo de pacientes que receberam o placebo é 𝑃 𝑃𝐿𝐴𝐶𝐸𝐵𝑂 = 0,883.
Aparentemente a proporção de sobreviventes é maior no grupo de pacientes tratados com AZT, mas para estender este resultado para a população, é vital avaliar se as diferenças observadas não são devidas ao acaso, mediante um teste de hipóteses. Neste problema, a estratégia de análise adotada foi o teste de homogeneidade de populações, baseado na estatística (lê-se “qui-quadrado”) de Pearson.
O valor calculado da estatística de teste foi igual a 15,087, cuja probabilidade de significância associada (𝑃 𝑣𝑎𝑙𝑢𝑒 , em inglês) é inferior a 0,0001. Este resultado evidencia que a verdadeira proporção de pacientes aidéticos que sobrevivem após 24 semanas é maior quando são tratados com AZT em relação aos não tratados (isto é, que recebem o placebo).
Métodos
Método Cientifico
Há muito tempo que o homem faz descobertas importantes, que originaram muitos dos conhecimentos atuais. Entretanto muitas dessas descobertas foram ao acaso, ou em função de uma necessidade da época e muitas dessas descobertas não seguiram um caminho, roteiro ou um método específico. Contudo hoje em dia os métodos de observação, estudo e análise fazem parte da maioria dos aumentos de conhecimentos atuais. Até mesmo os conhecimentos obtidos por descobertas ao acaso são desenvolvidos com base em métodos específicos, que chamamos de métodos científicos. Os métodos são as trilhas que nos permite chegar a um objetivo, ou a um determinado resultado, sendo um conjunto de passos e procedimentos que repetidos fornecem um resultado específico. Dentre os métodos científicos destacamos o método estatístico e experimental.
 Método Experimental
Quando se realiza um experimento e se deseja analisar como se comportam seus resultados ao se alterar algum dos elementos componentes do experimento, é necessário manter constante os demais fatores (causas).Quando se usa este tipo de pesquisa, faz-se uma análise do problema, montam-se as hipóteses necessárias. A seguir procede-se a uma manipulação das variáveis referentes ao fenômeno observado, alterando-as da melhor maneira possível. As alterações nas variáveis tanto em quantidade, quanto em qualidade, permite o estudo das relações de causas e efeitos do referido fenômeno em análise. Todo esse procedimento experimental permite que se possa avaliar e controlar os resultados obtidos.
Pontos importantes do método experimental:
Indicar o objeto de estudo;
Determinar as variáveis independentes capazes de influenciar o fenômeno em estudo;
Identificar as ferramentas de análise, controle e observação dos efeitos, resultantes da manipulação das variáveis, sobre o objeto.
Método Estatístico
No nosso dia a dia, quando fazemos repetidas observações com relação a um determinado sistema ou fenômeno específico, verificamos que os resultados obtidos não são exatamente os mesmos. A esta fato podemos chamar de variabilidade.
Como fazer para que essa variabilidade possa fazer parte da nossa tomada de decisão?
Através da análise estatística, é possível descrever a variabilidade e entender quais a fontes mais importantes, ou quais as de maior potencial de influência na variabilidade do fenômeno.
No método estatístico, observando suas várias etapas, podemos considerar que a mais importante muitas vezes não é a análise de dados. Podemos dizer que a etapa que necessita de maior atenção e cuidado é o planejamento de como o conjunto de dados será coletado. Um mau planejamento, ou mesmo uma coleta feita de forma inapropriada pode acarretar em dados inúteis, de onde não se consegue tirar nenhuma informação ou qualquer conclusão coerente.
No método estatístico, observando suas várias etapas, podemos considerar que a mais importante muitas vezes não é a análise de dados. Podemos dizer que a etapa que necessita de maior atenção e cuidado é o planejamento de como o conjunto de dados será coletado. Um mau planejamento, ou mesmo uma coleta feita de forma inapropriada pode acarretar em dados inúteis, de onde não se consegue tirar nenhuma informação
ou qualquer conclusão coerente.
Pequenas Amostras
Números Imprecisos
Estimativas por Suposição
Porcentagens Distorcidas
		1.
		O subconjunto representativo e finito da população através da qual se faz um estudo ou inferência sobre as características da população é chamada de:
	
	
	Amostra
		2.
		A Estatística é um conjunto de técnicas e métodos de pesquisa que envolvem várias fases . Marque a opção que não apresenta uma dessas fases.
	
	
	manipulação dos dados
		3.
		Quando fazemos repetidas observações com relação a um determinado sistema ou fenômeno específico verificamos que os resultados obtidos não são exatamente os mesmos. Acabamos de definir qual parâmetro?
	
	
	variabilidade
		4.
		O tipo de amostragem em que todos os elementos têm a mesma chance de pertencerem à amostra é denominada:
	
	
	Amostragem aleatória
		5.
		A estatística é uma ciência que tem por objetivo coletar, resumir, organizar e analisar um conjunto de dados. De posse do tema a ser pesquisado, a coleta dos dados pode ser feita por:
	
	
	População ou amostra.
		6.
		Não faz parte dos objetivos da análise estatística em negócios:
	
	
	aumento do retrabalho
		7.
		No lançamento de dois dados simultaneamente, qual a probabilidade de se obter dois números pares?
	
	
	25%
		8.
		A seguir é dada a distribuição de frequência correspondente aos diferentes preços de uma  bolsa de couro feminino  em vinte lojas pesquisadas. A porcentagem de lojas com preços maiores ou iguais a R$ 53,00 é igual a:
	PREÇOS
	 NR.  DE LOJAS
	50
	2
	51
	5
	52
	6
	53
	6
	54
	1
	TOTAL
	20
	
	
	35%
Maiores ou igual a 53, temos 7 , P= E/U, logo temos P= 7/20 = 0,35
Aula 2: Revisão das Medidas de Tendência Central e de Posição
Nesta aula, você aprenderá como as medidas de posição central (média aritmética e ponderada, mediana e moda) são determinadas e como permitem uma melhor compreensão dos dados de uma análise estatística. Aprenderá ainda as relações entre média, moda e mediana. Abordaremos as medidas de ordenamento quartis, decis e percentis. Veremos, por fim, como calcular as medidas estatísticas em Microsoft Excel.
As medidas de posição central nos apontam a tendência de comportamento dos dados, enquanto as separatrizes nos auxiliam na decisão de qual a cobertura dos dados poderemos atingir ou selecionar.
Objetivos
Apresentar o cálculo das medidas de posição central e suas relações;
Conhecer as medidas de ordenamento quartis, decis e percentis;
Apresentar o cálculo das medidas estatísticas em Microsoft Excel.
Medidas de Posição Central
Em uma dada distribuição amostral, é possível fazer várias observações, no intuito de entender o comportamento dos seus valores. Podemos, por exemplo, tentar localizar a maior concentração de valores de uma determinada distribuição. Entretanto, para que tenhamos parâmetros de comparação entre as tendências características de cada distribuição, é necessário introduzir conceitos que se expressem através de números.
Veremos então as medidas de posição 1 . As serem estudadas são as medidas de tendência central e as separatrizes.
Média aritmética
Moda
Mediana
Medidas de Tendência Central
As medidas de tendência central são valores que, de maneira condensada, trazem informações contidas nos dados estatísticos. É um valor que tende a melhor representar um conjunto de números. Funcionam como um resumo, passando a ideia do comportamento geral dos dados. Representam um valor central em torno do qual os dados se concentram e se distribuem, mostrando se essa concentração ocorre no inicio, no meio ou no final da distribuição, ou até mesmo se estão distribuídos de forma igual ao longo da amplitude considerada.
Quando esses valores estão associados a uma população, chamamos de parâmetros; quando estão ligados a uma amostra, são chamados de estatísticas. Como o cálculo dos parâmetros é feito em cima de todos os números, os parâmetros são valores constantes, fixos. Já os valores estatísticos são obtidos dos dados selecionados da população, e como para cada amostra temos dados diferentes, que irão influenciar no cálculo dos valores estatísticos, esses valores não são fixos.
Média
Para uma distribuição de dados estatísticos a ser analisada, composta por n valores 𝑥 𝑖 , i = 1, 2 ..., n. É interessante, sempre que possível, ordenar os dados de modo que 𝑥 𝑖 seja o menor valor e 𝑥 𝑛 seja o maior valor da relação de valores da distribuição.
Muitas vezes existe uma concentração maior dos dados em torno de um valor; outras vezes os dados estão equilibradamente distribuídos entre a faixa de valores compreendido pela amplitude dos dados (Amplitude =𝑥 𝑛 - 𝑥 1 ). Esta informação quanto à distribuição muitas vezes é importante, sendo calculada através da média aritmética, ou apenas média.
Outro tipo de média, também bastante utilizada, é a média aritmética ponderada. A média ponderada é muito usada em situações em que os dados são agrupados por frequência, ou em situações em que os dados possuem importâncias diferentes, sendo representados na forma de pesos.
Média Aritmética e Ponderada
A média aritmética é usada para distribuições simétricas, ou quase simétricas, ou para distribuições que têm um único pico dominante. É determinada somando-se todas as observações e dividindo-se pelo número total de observações.
O cálculo da média se dá pela fórmula:
	μ =∑xii=1NN=x1+x2+...+xnNμ =∑xii=1ΝΝ=x1+x2+...+xnN
	μ =∑xii=1nn=x1+x2+...+xnnμ =∑xii=1nn=x1+x2+...+xnn
͞𝑥 = Média aritmética da amostra (𝜇 é usado para a população);
𝑥 𝑖 = Valor representativo de cada variável de dados (𝑥 1, 𝑥 2 , 𝑥 3 ,..., 𝑥 𝑛 );
n = Número total de itens da amostra (N é usado para a população).
Exemplo: Sabendo-se que a quantidade de garrafas de refrigerante vendidas no mercado, durante uma semana, foi de 10, 14, 13, 15, 16, 18 e 12 garrafas, temos para a venda média da semana:
	x=10+14+13+15+16+18+127=987=14x=10+14+13+15+16+18+127=987=14
Logo...
͞𝑥 = 14 litros
... É a média diária nesta semana.
A média ponderada ( ͞𝑥 𝑤 para amostra e 𝜇 𝑤 para população ) é usada em várias ocasiões como por exemplo, em situações em que os dados possuem níveis de importância diferentes dentro do grupo para os diversos dados da distribuição, explicitando essa importância na forma de peso 𝑤 𝑖.
	xw=∑i=1nxiwi∑i=1nwi=x1.w1+x2.w2+...+xn.wnw1+w2+...+wnxw=∑i=1nxiwi∑i=1nwi=x1.w1+x2.w2+...+xn.wnw1+w2+...+wn
Exemplo: Um concurso de três etapas possui peso 2 na primeira etapa, peso 1 na segunda etapa e peso 3 na terceira etapa. Qual a nota final do candidato que tire 5,9 na primeira, 8,4 na segunda e 6,7 na terceira etapa do concurso?
	xw=∑i=1nxiwi∑i=1nwi=11,8.+8,4.+20,12+1+3=40,36=6,7
Moda
Denominamos moda o valor que ocorre com a maior frequência em uma relação de dados. Muitas vezes é utilizada por ser a medida de posição de mais rápida visualização.
A moda (Mo) é usada quando temos distribuições extremamente assimétricas, ou nas situações irregulares em que dois ou mais pontos de concentração de dados são verificados na série de dados. Ou até mesmo nas situações em que se deseja eliminar os efeitos de valores extremos que destoam da normalidade da série de valores.
A moda também pode ser designada como valor típico, valor dominante ou norma.
 Quanto à classificação modal, um conjunto pode ser considerado unimodal, quando apresenta apenas uma moda.
Exemplo:
X = (4, 5, 5, 6, 6, 6, 7, 7, 8, 8) → Mo = 6
(o valor de maior frequência)
 Pode ser considerado bimodal quando possui duas modas.
Exemplo:
X = (1, 2, 2, 2, 3, 4, 4, 4, 5, 5, 6) → Mo = 2 e Mo = 4
(os valores de maior frequência)
 É considerada plurimodal ou multimodal quando apresenta mais de duas modas.
Exemplo:
X = (1, 2, 2, 2, 3, 3, 3, 4, 4, 4, 5) → Mo = 2, Mo = 3 e Mo =
4
(os valores de maior frequência)
 Quando todos os valores apresentam a mesma frequência, o conjunto é considerado amodal.
Exemplo:
X = (1, 2, 3, 4, 5, 6)
(não apresenta valor predominante)
Mediana
A mediana é o valor central da distribuição quando os dados estão ordenados de forma crescente ou decrescente. Normalmente é usada quando se deseja obter o ponto que divide a distribuição em duas partes iguais, ou quando existem valores extremos que afetam a média de forma acentuada. Também existe uma tendência a utilizar a mediana quando o valor a ser analisado ou estudado é salário, ou para informações que possam ser ordenadas de alguma forma, mas que não possuem valores mensuráveis (cor, nomes etc.).
Exemplo:
1) Considere o conjunto de dados: X = (6, 2, 7, 10, 3, 4, 1, 12). Determine a mediana.
2) Colocar os valores em ordem crescente ou decrescente:
 X = (1, 2, 3, 4, 6, 7, 10, 12);
3) Determinar a ordem ou a posição do elemento (E) da mediana:
	En+12=8+12=4,5Εn+12=8+12=4,5
4) Localizar a mediana e calcular o seu valor (para o ocaso de n par):
5) Determinar x4,5, sabendo que:
	x4= 4 e x5 = 6 → Med = x4+x52=4+62=5
Relação entre a Média, a Mediana e a Moda
Com essas três medidas de posição é possível determinar a assimetria da curva de distribuição de frequência. A tabela de distribuição de frequências é composta de uma coluna contendo os valores que compõem a relação de dados e uma coluna com as correspondentes quantidades que cada valor aparece na relação de dados. As medidas de assimetria complementam as informações dadas pelas medidas de posição, a fim de permitir uma melhor compreensão das distribuições de frequências. A mediana se localiza na posição central da distribuição, devendo estar entre os valores da média e moda e podendo até mesmo ser igual a ambas.
Nesta situação temos três casos possíveis:
	1º Caso
	
	Média = Mediana = Moda
	
	A curva da distribuição é simétrica
A curva da distribuição é simétrica
	2º Caso
	
	Média < Mediana < Moda
	
	A curva da distribuição tem assimetria negativa
3º CasoMédia > Mediana > ModaA curva da distribuição tem assimetria positiva
O coeficiente de assimetria pode ser calculado pela fórmula do primeiro coeficiente de Pearson, tornando mais fácil determinar se a assimetria da distribuição é positiva ou negativa:
No denominador da fórmula temos um símbolo que representa o desvio padrão da distribuição. Quando for apresentado o estudo sobre as medidas de dispersão, veremos mais detalhes sobre o cálculo do desvio padrão e seu significado. No momento podemos adiantar que terá sempre um valor positivo (ou seja, não é possível ocorrer desvio padrão negativo). Assim sendo o que vai determinar o sinal da fração é o sinal do numerador.
Média = Moda → ͞𝑥 - Mo = 0 → Assimétrica nula = Simétrica
Média < Moda → ͞𝑥 - Mo < 0 → Assimetria negativa
Média > Moda → ͞𝑥 - Mo > 0 → Assimetria positiva
	
		1.
		A série de dados composta de {6;8;2;0;6;3;2;4;6;6;7;10;3} tem como média aritmética, mediana e moda respectivamente:
	
	
	4,85; 6 e 6
		2.
		Qual é o valor da mediana para o conjunto a seguir de notas de alunos em uma prova de matemática? {2;1;8;3;5;7;6;9;6;4;2;3;10;5;3;3}
	
	
	Nota 4,5
		3.
		Marcos curso o 1º ano do Ensino Médio e obteve notas 8,5 e 5,0 em dois trabalhos realizados, qual deve ser a nota do terceiro trabalho para que a média aritmética dos três seja 6,0?
	
	
	4,5
		4.
		Qual é a Medida de Tendência Central que é definida pela maior frequência?
	
	
	Moda
		5.
		Qual é o valor da mediana para o conjunto a seguir de notas de alunos em uma prova de matemática? {2;1;8;3;5;7;6;9;6;4;2;3;10;5;3;3}
	
	
	Nota 4,5
		6.
		Qual das medidas a seguir NÃO pode ser considerada como sendo medida de tendência central?
	
	
	Desvio Padrão
		7.
		Numa medição foram anotados os seguintes valores.{ 20, 21, 20, 24, 20, 25, 21, 23, 23} . Qual valor representa a mediana?
	
	
	21
		8.
		Uma amostra constituída por 10 mulheres gerou os seguintes resultados: 3 mulheres ganhavam R1.300,00; 2 ganhavam R$900,00 e 5 ganhavam R$600,00. Qual o salário médio?
	
	
	R$ 870,00
Explicação:
Trata-se de média ponderada temos 3x 1300 + 2x 900 + 5 x 600 = 8.700/10 = 870,00
Aula 3: Revisão das Medidas de Dispersão
Medidas de Posição Central
Em uma dada distribuição amostral é possível fazer várias observações no intuito de entender o comportamento dos seus valores. Normalmente as medidas de posição não são suficientes para dar o comportamento de uma distribuição de dados, sendo necessárias informações adicionais que permitam uma melhor análise do fenômeno a ser estudado. É importante levar um ponto em consideração durante a análise dos dados, a dispersão ou variabilidade. A dispersão ou variabilidade indica a maior ou menor diferença entre os valores de uma variável, dado da distribuição, e sua medida de posição, normalmente a média.
Estudaremos as seguintes medidas de dispersão:
1
Amplitude
2
Desvio médio
3
Variância e desvio padrão
4
Coeficente de variação
Amplitude Interquadril
Com o objetivo de determinar onde se situam os 50% valores centrais, pode calcular a Amplitude Interquartil (IQR):
IQR = Q3 – Q1
Amplitude Total
Numa amostra de n valores ordenados, onde n é a quantidade total de dados, definimos como amplitude total (R) a diferença entre os valores máximo (H) e mínimo (L) da relação.
R = xmáx – xmín = H – L
Exemplo
Amplitude total: sabendo-se que a quantidade de garrafas de refrigerantes vendidas no mercado, durante uma semana, foi de 10, 12, 13, 14, 15, 16 e 18 garrafas, temos para a amplitude total:
n = 7;
H = xmáx = x7 = 18;
L = xmín = x1 = 10
Amplitude total: R = 18 – 10 = 8
Desvio Médio Absoluto
O desvio (di) mede a diferença entre cada valor e a média aritmética. O desvio médio absoluto (MAD) é obtido dividindo o somatório dos módulos de cada desvio pela quantidade de dados (n para amostra e N para população).
	MAD=∑|di|n = ∑|xi − x¯|nMAD=∑din = ∑xi - x¯n    (Amostra)
	MAD=∑|di|N = ∑|xi −μ|NMAD=∑diN = ∑xi -μN    (População)
A soma de todos os desvios é igual à zero:
	∑di = ∑xi − x¯= 0
A amplitude total, pela influência dos valores extremos, que muitas vezes podem não representar o comportamento da distribuição dos dados, são considerados instáveis.
Coeficiente de Variação
O coeficiente de variação mede a homogeneidade dos dados, ou seja, mostra a magnitude do desvio padrão em relação à média dos dados como porcentagem. Permitindo caracterizar a dispersão dos dados em função do valor médio. Quanto maior o valor do coeficiente de variação, menos homogêneo será o conjunto.
	CV= σ μ×100CV= σ μ×100    (População)
	CV= s x¯×100CV= s x¯×100    (Amostra)
Quando é necessário comparar duas amostras com média e desvio padrão diferentes, podemos comparar os coeficientes de variação. Quanto maior o valor, menor será a homogeneidade da distribuição, ou seja, apresenta o maior grau de dispersão.
Tomemos os resultados das medidas de altura e pesos de um mesmo grupo de pessoas tiradas de uma sala de aula.
	
	
	s
	ALTURA
	176 cm
	5,0 cm
	PESO
	69kg
	2,0kg
A fim de comparar a dispersão das duas relações de medidas, utilizaremos o coeficiente de dispersão.
	CVALT= 5/ 176=0,0284CVALT= 5 176=0,0284
	CVPESO= 2 /69=0,0290
	
		1.
		A média das notas de uma turma foi 5  e o desvio padrão foi 2. Qual foi o coeficiente de variação?
	
	
	 40%
Explicação:
CV =  DP / média = 2/5 = 0,4 = (x100%) = 40%
		2.
		O coeficiente de Variação é definido por:
	
	
	A razão etre o desvio padrão é a média
		3.
		A média dos valores de uma amostra foi 100  e a variância foi 9. Qual foi o desvio padrão?
	
	
	3
Explicação:
DP = raiz da Variância  = V9 = 3.
		4.
		A folha de pagamento de uma empresa possui amplitude total de R$ 1.500,00. Se o menor salário da folha é de R$ 850.00, maior salário será de:
	
	
	R$ 2.350,00
Explicação:
Amplitude total é a diferença entre o maior e o menor valor  . Portanto  o maior valor é  850 +'1500 = 2350. 
		5.
		A média dos valores de uma amostra foi 100  e o desvio padrão foi 2 . Qual foi a variância?
	
	
	4
Explicação:
Variância = (DP)² = 2²  = 4.
		6.
		Quanto à homogeneidade da distribuição, podemos afirmar que:
 
	
	
	 é pouco dispersa, com Cv=0,17
		7.
		Se a varianção de uma série de dados é igual 4, então, o desvio padrão será igual a:
	
	
	2
Explicação:
Como o desvio padrão é a raiz quadrada da variancia temos a raiz quadrada de 4 que é igual a 2
		8.
		Uma fábrica de carros sabe que os motores de sua fabricação têm duração normal com média 150000 km e o pior e o melhor resultado são 135000 km e 165000 km. Qual o valor do desvio padrão desse estudo?
	
	
	15mil
Explicação:
Desvio padrão =  módulo da diferença de resultados  em relação á média, medido  para cerca de 70% dos resultados.
150 mil - 135 mil  =   165mil - 135 mil =  !5 mil de desvio em relação á média. 
Aula 4: Gráficos Estatísticos no Microsoft Excel
 
		1.
		Como sabemos, a apresentação de dados pode ser realizada através da construção de gráficos. Assim, o tipo de gráfico que é caracterizado em representar os dados pertencentes a uma amostra através de figuras é denominado:
	
	
	Pictograma
Explicação:
Pictograma - Trata-se, de gráficos pertecentes a uma amostra de figuras
		2.
		Para que um gráfico seja inserido no Excel, é necessário que os ___________que se deseja analisar também estejam contidos na planilha.
	
	
	Dados
		3.
		A representação de uma série por meio de retângulos dispostos verticalmente é denominada:
	
	
	Gráfico de colunas
Explicação:
O gráfico de coluna exibe uma série como um conjunto de barras verticais agrupadas por categoria.
		4.
		Analisando o gráfico que representa os salários dos funcionários de um Escritório de Contabilidade, podemos concluir que o número de funcionários consultados foi de:
	
	
	65
		5.
		Em uma escola 80 alunos estudam Administração, 10 estudam Economia e 10 estudam Estatística. Se um aluno é escolhido ao acaso, a probabilidade de que estude Administração é de:
	
	
	
	
	
	80%
		6.
		De sua turma de 30 alunos, é escolhida uma comissão de 3 representantes. Qual a probabilidade de você fazer parte da comissão?
	
	
	10%
		7.
		Analisando o gráfico a seguir o percentual que corresponde aos países desenvolvidos é aproximadamente de:
	
	
	
	
	
	50%
		8.
		No lançamento de UM dado, determine a probabilidade de sair o número 1.
	
	
	1/6
Aula 5: Medidas de Assimetria e de Curtose
Medidas de Assimetria
Nas aulas anteriores, vimos a natureza da assimetria, isto é, quando a curva de frequência se afasta da posição de simetria, sendo simétrica quando a média e a moda coincidem, ou seja, possuem o mesmo valor.
A curva de uma distribuição simétrica tem por característica que o valor máximo encontra-se no ponto central da distribuição. Desta forma, os pontos equidistantes do centro possuem a mesma frequência.
Quando se faz um levantamento estatístico, dificilmente encontramos, na prática, uma distribuição simétrica. O que ocorre, em levantamentos de dados reais, são medidas mais ou menos assimétricas em relação à frequência máxima.
A distribuição assimétrica à esquerda ou negativa ocorre quando o valor da moda é maior do que a média. Logo, a distribuição assimétrica à direita ou positiva ocorre quando a moda é menor do que a média.
Distribuição A
Distribuição A
5 – 5 = 0 → Assimetria nula ou distribuição simétrica
x = 5;
Md = 5;
Mo = 10;
S = 5,0912;
Distribuição B
Distribuição B
5,375 – 6,6 = – 1,225 → Assimetria negativa ou à esquerda.
x = 5,375;
Md = 5,75;
Mo = 6,6;
S = 5,5088;
Coeficiente de Assimetria
A fórmula x = Mo não permite fazer comparações entre duas distribuições com relação ao seu grau de assimetria. Desta forma, o coeficiente de assimetria de Pearson é muito utilizado para verificar o grau de assimetria das curvas de distribuição, definido como:
As=3(x¯−Md)sAs=3(x¯-Md)/s
Se o resultado for:
0,15 <| As |< 1 → Assimetria moderada.
| As |> 1 → Assimetria forte.
Medida de Curtose
Quando a distribuição apresenta uma curva de frequência com dados mais concentrados em torno da média do que a curva normal, ela chama-se leptocúrtica.
A curva normal, tomada por base para classificação do achatamento das distribuições de frequências, recebe o nome de mesocúrtica.
Quando a distribuição apresenta uma curva de frequência com dados mais dispersos em relação à média do que na curva normal, essa distribuição chama-se platicúrtica.
		1.
		Qual é o percentual esperado de casos em uma distribuição normal que estão situados acima da mediana?
	
	
	50%
Explicação:
Ela, apresenta-se em formato de sino, unimodal, simétrica em relação a sua média.
Considerando a probabilidade de ocorrência, a área sob sua curva soma 100%. Isso quer dizer que a probabilidade de uma observação assumir um valor entre dois pontos quaisquer é igual à área compreendida entre esses dois pontos.
		2.
		Quando temos uma distribuição assimétrica à esquerda:
	
	
	A média é menor que a moda.
Explicação:
1o Caso: Média = Mediana = Moda - a curva da distribuição é SIMÉTRICA
2o Caso: Média < Mediana < Moda - a curva da distribuição tem ASSIMETRIA NEGATIVA
3o Caso: Média > Mediana > Moda - a curva da distribuição tem ASSIMETRIA POSITIVA
		3.
		Se uma distribuição possui uma média igual a 12,5 e uma moda igual a 10, podemos afirmar que a distribuição é:
	
	
	Distribuição Assimétrica Positiva.
		4.
		A relação de medida em que a distribuição é Média < Mediana < Moda, denomina-se:
	
	
	Distribuição assimétrica negativa.
		5.
		As distribuições podem ser classificadas como:
	
	
	Distribuição Assimétrica positiva, Distribuição Assimétrica negativa e Distribuição Simétrica.
		6.
		Numa distribuição de valores onde a moda é 5, a média é 7 e a mediana é 6, podemos dizer que se trata de uma distribuição:
	
	
	Positivamente assimétrica
		7.
		Considere os seguintes resultados relativos a três distribuições de frequência:
	Distribuições
	Média
	Moda
	A
	45
	45
	B
	38
	48
	C
	45
	42
Sabe-se que o tipo de asimetria pode ser determinado calculando a diferença entre a média e a moda. Assim, podemos classificar as três distribuições, respectivamente, como:
 
	
	
	Simétrica, assimetrica à esquerda, assimétrica à direita
		8.
		Numa distribuição de frequência de altura de 50 pessoas, a média de altura é igual a 155mm, a mediana é 155 mm e a moda é 155 mm. Com base nessas informações, pode se afirmar que é:
	
	
	distribuição assimétrica nula ou distribuição simétrica
Explicação:
A média, moda e mediana, em uma  distribuição simétrica são iguais
Aula 6: Probabilidade
Estatística
A maioria dos assuntos de que trata a Estatística tem uma natureza aleatória ou probabilística. É esta a importância do estudo dos conhecimentos fundamentais do cálculo da probabilidade, além de ser fundamental no estudo da Estatística Inferencial ou Indutiva.
Experimento Aleatório
É qualquer processo aleatório capaz de produzir observações e que possa se repetir indefinidamente no futuro sob as mesmas
condições. Um experimento aleatório apresenta variações nos resultados, o que faz com que seus resultados a priori não sejam determinados antes que tenham sido realizados. É possível, entretanto, indicar todos os seus resultados possíveis, ou seja, as suas probabilidades. É na verdade qualquer processo capaz de gerar um resultado incerto ou casual.
O experimento aleatório apresenta três características, que possibilitam calcularmos uma probabilidade, são elas:
Característica 1:
Cada experimento pode ser repetido indefinidamente sob as mesmas condições, n vezes (n ∞).
Características 2:
Embora não se possa prever a priori que resultados ocorrerão, pode-se descrever o conjunto de resultados possíveis.
Características 3 :
À medida que se aumenta o número de repetições, surgirá certa regularidade dos resultados, isto é, haverá uma estabilidade na ocorrência da frequência relativa de um particular resultado.
Espaço Amostral
Cada experimento aleatório corresponde, normalmente, a inúmeros resultados possíveis. Chamamos de espaço amostral ou conjunto universo o seu conjunto de possibilidades, isto é, o conjunto formado por todos os possíveis resultados do experimento, geralmente denominado S ou Ω (letra grega que se lê: “ômega”). Definimos por n(S) como sendo o número de elementos do conjunto S, ou seja, o número de resultados possíveis do experimento.
Finito
Número limitado de elementos.
Ex.: S = {1, 2, 3, 4, 5, 6}
Infinito
Número ilimitado de elementos, e pode ser subdividido em: Finito e Infinito.
Enumerável
Quando os possíveis resultados puderem ser postos em concordância biunívoca com o conjunto dos números naturais (N) (caso das variáveis aleatórias discretas).
Não Enumerável
Quando os possíveis resultados não puderem ser postos em concordância biunívoca com o conjunto dos números naturais (caso das variáveis aleatórias contínuas).
Eventos
Seja um espaço amostral S de um experimento aleatório qualquer, consideramos evento qualquer subconjunto desse espaço amostral S.
Logo, qualquer que seja E um conjunto de possíveis resultados do experimento, se E ⊂ S, então E é um evento de S.
Se E = S, chamamos E de evento certo; se E é um conjunto unitário e E ⊂ S, chamamos E de evento elementar; quando E = ∅, chamamos de evento impossível.
Probabilidade
Seja S o espaço amostral de um experimento aleatório, se todos os elementos de S possuem a mesma chance de acontecer, então S é um conjunto equiprovável.
Definimos como sendo a probabilidade de um evento A (A ⊂ S) o valor real P(A), tal que:
P(A)=n(A)/n(S)
Onde:
n(A) = número de elementos de A;
n(S) = número de elementos de S.
A probabilidade de um evento certo é igual a 1: P(S) = 1;
A probabilidade de um evento impossível é igual a 0: P(∅) = 0;
A probabilidade de um evento A qualquer (A ⊂ S) é o valor real P(A), tal que: 0 ≤ P(A) ≤ 1;
Seja n(S) = n e A um evento elementar qualquer, onde n(A) = 1, logo a probabilidade de A será:
P(A)=1/n
O valor de uma probabilidade está dentro do intervalo fechado de números reais que vai de 0 a 1, incluindo as extremidades desse intervalo. A probabilidade pode ser da forma decimal do tipo 0,70, ou representada na forma de percentagem onde o mesmo número é multiplicado por 100. Ficando na forma 70%.
Quanto mais a probabilidade se aproxima de 1, maior é sua possibilidade de ocorrer. Quanto mais se aproxima de 0, o evento se torna mais improvável de ocorrer.
Há três maneiras de estimar ou calcular probabilidades, são elas:
O método subjetivo, que se baseia em estimativas pessoais de probabilidade ou algum tipo de crença.
O método empírico, que leva em consideração a frequência relativa de um determinado evento em cima de um grande número de fatos repetidos.
No método clássico, o espaço amostral tem resultados igualmente prováveis. Em geral, utiliza-se este último método para o cálculo de probabilidades.
O que não pode acontecer é confundir “chance” com “probabilidade”, pois existe certa diferença entre eles. A chance compara a quantidade de resultados possíveis de A com os resultados possíveis de outro evento (B ou C), enquanto que a probabilidade faz relação entre os resultados possíveis de A com a quantidade total dos resultados possíveis do experimento aleatório.
Em uma caixa com 7 bolas brancas, 3 azuis e 4 pretas, a probabilidade de retirar uma bola branca é:
P (branca) = 𝟕/𝟏𝟒 = 0,5 ou 50%
Enquanto que a chance de retirar uma bola branca é 7:7, ou seja, a chance de retirar uma bola branca é a mesma de retirar uma bola de outra cor.
Eventos Complementares
Todo evento pode ocorrer ou não. Se um evento possui uma probabilidade p de sucesso e uma probabilidade de insucesso q, então para esse mesmo evento existe a relação:
p+q=1 → q=1−P
Se P(A) é a probabilidade do evento A, então 𝑃(𝐴 ̅) é a probabilidade do evento não A (complemento de A), tal que:
P(A)+P(A¯¯¯)=1 → P(A¯¯¯)=1−P(A)
Eventos Independentes
Dois eventos são independentes quando o sucesso ou o insucesso de um dos eventos não afeta a probabilidade de sucesso do outro evento e vice-versa. O resultado obtido por um evento independe do resultado obtido no outro evento. Neste caso de eventos independentes, a probabilidade de que os dois eventos se realizem simultaneamente é igual ao produto das probabilidades de sucesso de cada evento.
Sejam dois eventos A e B, onde P(A) = p1 e P(B) = p2, logo um terceiro evento C, definido pela ocorrência simultânea dos eventos A e B, terá probabilidade P(C) = p. E a probabilidade do evento C será função das probabilidades individuais de A e B, dada por:
p=p1×p2p=p1×p2
Outra forma de representar a ocorrência simultânea de dois eventos A e B é P(A ∩ B).
Aula 7: Distribuição Binomial
Tipos de Variáveis
Existem muitos tipos de variáveis que serão utilizadas em um estudo estatístico. É importante compreender o conceito matemático de variável. Variável é algo que se refere a um determinado aspecto do fenômeno que está sendo estudado. Podemos afirmar que a quantidade colhida da safra anual de soja é uma variável. Representemos essa variável pela letra X.
Essa variável pode assumir diversos valores específicos, em função dos anos de safra, por exemplo, X1986, X1990 e X1992.
Variáveis Quantitativas
Referem-se a quantidades e podem ser medidas em uma escala numérica. Exemplos: idade de pessoas, preço de produtos, o peso de recém-nascidos.
As variáveis quantitativas subdividem-se em dois grupos:
Variáveis Quantitativas Discretas
São aquelas que assumem apenas determinados valores tais como 1, 2, 3, 4, 5, 6, dando saltos de descontinuidade entre seus valores. Normalmente referem-se a contagens.
Por exemplo: número de vendas mensais em uma loja, número de pessoas por família, quantidade de internações por hospital.
Variáveis Quantitativas Continuas 
São aquelas cujos valores assumem uma faixa contínua e não apresentam saltos de descontinuidade.
Exemplos dessas variáveis são:
• O peso de pessoas;
• O consumo mensal de energia elétrica;
• O preço de um produto agrícola.
Referem-se ao conjunto dos números reais ou a um de seus subconjuntos contínuos.
Variáveis Qualitativas
Referem-se a dados não numéricos. Exemplos dessas variáveis são: o sexo das pessoas, a cor, o grau de instrução.
As variáveis qualitativas subdividem-se também em dois grupos:
Variáveis Qualitativas Ordinais
São aquelas que definem um ordenamento ou uma hierarquia. Como exemplo, temos o grau de instrução, a classificação de um estudante no curso de estatística, as posições das 100 empresas mais lucrativas etc.
Variáveis Qualitativas Nominais
Não definem qualquer ordenamento ou hierarquia. Como exemplos, temos a cor, o sexo, o local de nascimento etc. Dependendo da situação, uma variável qualitativa pode ser representada (codificada) através do emprego de números (por exemplo: em sexo, representamos homens como sendo “0” e mulheres como sendo “1”). Mas no tratamento estatístico dessa variável codificada, não podemos considerá-la como sendo quantitativa.
Ela continua sendo uma variável qualitativa (pois o é em sua essência e natureza), apesar de sua codificação numérica, que tem como finalidade uma maior finalidade de tabulação de resultados.
Variável Aleatória
função variável aleatória. Costuma-se definir a função variável aleatória por uma letra maiúscula e seus valores por letras minúsculas.
Distribuição Binomial
A distribuição binomial é um prolongamento da distribuição de Bernoulli, devendo ser aplicada em problemas nos quais um experimento é realizado um número de vezes preestabelecido. Cada uma destas repetições é denominada prova ou experimento.
Vamos considerar um experimento aleatório que tenha as seguintes características:
 O experimento deve ser repetido nas mesmas condições, um número finito de vezes, ou seja, considerar n tentativas;
 As provas repetidas devem ser independentes, isto é, o resultado de uma não deve afetar os resultados das demais;
 Cada tentativa admite apenas dois resultados: sucesso e insucesso, com as mesmas probabilidades de ocorrer;
 No decorrer do experimento, a probabilidade p do sucesso e a probabilidade q (q = 1 – p) do insucesso manter-se-ão constantes.
 É  importante entender que, na realização de um experimento qualquer em uma única tentativa, se a probabilidade de realização de um evento (sucesso) é p, a probabilidade de não realização desse mesmo evento (insucesso) é 1 – p = q.
Suponhamos que realizemos o mesmo experimento n vezes, em tentativas sucessivas e independentes. A probabilidade de que um evento se realize k vezes nos experimentos realizados é dada pela função:
f(x)=P(x =k)=(nk)pk.qn−k
Em um dia, a probabilidade de:
(X = k) é a probabilidade de que o evento se realize k vezes em n provas;
p é a probabilidade de que o evento se realize em uma só prova – sucesso;
q é a probabilidade de que o evento não se realize no decurso dessa prova – insucesso;
(nk)(nk) é o coeficiente binomial de n sobre k, igual a n!k!(n−k)!
		1.
		Em um sala de aulas com 60 alunos, há 45 alunas. Qual a probabilidade do professor escolher, de forma aleatória, um aluno do sexo masculino, para responder uma questão na lousa?
	
	
	Probabilidade de 25%
Explicação: Probabilidade de 25%, porque temos 15 alunos do sexo masculino, logo, 15/60 = 0,25 = 25%
		2.
		João reunião 20 torcedores de um clube de futebol, incluindo ele próprio, para fazer um sorteio. O ganhador teria o privilégio de assistir os jogos de todos os domingos desse clube, durante um mês, sem pagar ingresso, e ainda teria direito a ir ao vestiário, ouvir a preleção do técnico antes das partidas. Carlos, que é um dos torcedores, porém muito pessimista, disse que jamais ganharia o prêmio, pois sua chance era menos que 1%, já que os demais tinham mais sorte que ele. Considerando que o sistema é equiprovável, com todos tendo a mesma possibilidade de ganho, qual a real probabilidade de Carlos ouvir as preleções?
	
	
	5%
Explicação:
Já que a chance de ser sorteado é equiprovável  , com 20 participantes a probabilidade e de um qualquer ser sorteado  é 1/20 = 0,05 = 5% .
		3.
		Num aquário estão 20 peixinhos, 7 dos quais são machos. Tiramos um peixinho ao acaso. Qual a probabilidade do peixe ser fêmea?
	
	
	13/20
		4.
		No lançamento de um dado qual é a probabilidade de se obter um número inferior a 4?
	
	
	50%
Explicação: P (1) + P (2) + P (3) = 1 / 6 + 1 / 6 + 1 / 6 = 3 / 6 = 1 / 2 = 0,5 = 50%
		5.
		Determine a probabilidade de uma só coroa aparecer no lançamento de duas moedas simultaneamente.
	
	
	0,50
		6.
		Um baralho possui 52 cartas onde: existem 4 damas. 4 valetes e 4 reis. Qual a probabilidade de eu retirar aleatoriamente uma figura(dama ou valete ou rei)?
	
	
	3/13
		7.
		Em um baralho normal de 52 cartas, qual a probabilidade de se retirar um rei, de forma aleatória, deste baralho?
	
	
	4/52
Explicação:
A probabilidade de sair um rei é de 4/52, porque no baralho temos 4 reis, em um total de 52 cartas
		8.
		Em uma empresa existem 60 funcionárias e 40 funcionários. Sabe-se que metade dos funcionários e um terço das funcionárias usam óculos. Seleciona-se aleatoriamente um empregado. Se ele usa óculos, qual é a probabilidade de que ele seja homem.
	
	
	20/40
Explicação: P(H /O) =P(H e O)/P( O ) = 20/40
Aula 8: Distribuição normal e Gráficos de dispersão
Determinando a variável
Diversos tipos de variáveis são utilizadas em um estudo estatístico. É importante entender o conceito matemático de uma variável.
Chamamos variável aquilo que se refere a um determinado aspecto do fenômeno que está sendo estudado.
Distribuição normal
Entre as distribuições teóricas de variável aleatória contínua, podemos considerar a distribuição normal como uma das mais empregadas.
A observação cuidadosa mostrou que a ideia de que distribuição normal não correspondia à realidade de todos os fenômenos da vida real. De fato, não são poucos os casos representados por distribuições assimétricas (não normais).
1
A variável aleatória X pode assumir todo e qualquer valor real
2
A representação gráfica da distribuição normal é uma curva em forma de sino, simétrica em torno da média (x¯x¯), ponto central e de maior frequência (coincidem média, moda e mediana), que recebe o nome de curva normal ou de Gauss
3
A probabilidade de a variável aleatória X assumir qualquer valor real corresponde à área total sob a curva, ou seja, a área total entre a curva e o eixo das abscissas, que é igual a 1
5
A densidade de probabilidade é mais alta no meio e diminui gradualmente em direção às caudas. Logo, as extremidades da curva normal aproximam-se indefinidamente do eixo das abscissas sem tocá-lo, isto é, a curva normal é assintótica em relação ao eixo das abscissas
6
Por ser padrão, todos os momentos e coeficientes de assimetria são iguais a zero, e o coeficiente de curtose é igual a 0,263
7
Como a curva normal é simétrica em torno da média (x¯x¯), a probabilidade de ocorrer um valor maior que a média é igual à probabilidade de ocorrer um valor menor do que a média, que são iguais à metade da área, ou seja, 0,5. Dizemos que: P(X > x¯x¯)= P(X < x¯x¯)= 0,5
Distribuição normal e variável aleatória
Uma variável aleatória normalmente pode assumir um valor em um determinado intervalo, e o principal interesse é determinar a probabilidade dessa variável.
Cada distribuição normal possui uma função geradora da curva. O cálculo dessa área necessita de conhecimentos matemáticos mais específicos.
		1.
		Classifique as variáveis abaixo em qualitativa e quantitativa, em seguida assinale a alternativa correta. I- Cor da pele._____________ II- Altura.______________ III- Sexo.____________________
	
	
	qualitativa, quantitativa, qualitativa.
		2.
		O experimento binomial pode ser chamado também de ?
	
	
	Eperimento de Bernoulli
Explicação:
Os experimentos binomiais são caracterizados como a probabilidade de repetição de ensaios independentes
logo são também chamados de experimentos de Bernoulli
		3.
		Em um jogo de futebol podemos ter 3 tipos de resultados diferentes: a vitória de um time, a vitória do outro time ou o empate, Sabendo que só a vitória interessa para um time, quantos insucessos podem ocorrer no final de uma partida de futebol?
	
	
	2
		4.
		Uma empresa produz parafusos dos quais 10% são defeituosos. Entre 4.000 parafusos qual a média esperada de defeituosos?
	
	
	400
		5.
		Qual a probabilidade de não tirar o número 3 no lançamento de um dado ?
	
	
	5/6
Explicação:
A probabilidade de tirar 3 é 1/6, logo temos:
q = 1- 1/6 = 5/6
		6.
		Sabendo-se que o sucesso vale 1/3 do fracasso, qual será o valor do fracasso em percentuais?
75%
		7.
		Se o número de sucessos de um evento foi igual a 1/3 , o valor dos insucessos foi de:
	
	
	2/3
		8.
		As variáveis de altura, temperatura e o numero de alunos de uma universidade são,respectivamente exemplos de variáveis quantitativas:
	
	
	Contínua, Contínua a e Discreta

Teste o Premium para desbloquear

Aproveite todos os benefícios por 3 dias sem pagar! 😉
Já tem cadastro?

Outros materiais