Buscar

Foruns de Estatistica

Prévia do material em texto

Definição de Variáveis, qualitativas e quantitativas:
R.:Qualitativa ou atributo: sexo, religião, naturalidade, cor dos olhos, idade.. e todos os outros dados que não são numéricos mas que podemos distinguir para extrair algum determinado dado.
Quantitativa: Ao contrario das outras, como o próprio nome já diz se refere a quantidade e são denominada para alguns dados como valores de uma moeda, a quantidade de sabores de um determinado produto, o peso de uma pessoa, altura entre outros.
Distribuições de probabilidades. De que forma essas distribuições são utilizadas?
R.: Elas são utilizadas para diversos fins, pois nos traz uma versão da possibilidade que um determinado evento pode ocorrer.  Por exemplo, iremos sortear um determinado 2 brindes  a 10 alunos, através do método matemático é possível identificar qual a probabilidade (as chances) dos dois brindes serem sorteadas apenas para meninas ou apenas para meninos, conforme as informações das amostragens na coleta dos dados.
Quando uma medida é preferível à outra, ou seja, qual medida de tendência central irá representar melhor o seu conjunto de dados?
R.: Os valores dessas medidas, geralmente são valores aproximados, podendo ocorrer uma determinada variação, igual aquelas pesquisas de políticos que sempre aparecem que o grau de erro geralmente é 1 ou 2% para mais ou para menos. Enfim, sobre qual medida irá representar melhor o resultado isso vai depender de cada evento, da necessidade de cada coisa para um melhor planejamento, o mais usado é a media aritmética pois  por um “histórico” podemos observar a media de dados daquele evento, agora se eu gostaria de saber a “maioria” dos dados, observo a Moda, pois dai posso preferir o que mais posso adequar a numero de quantidades maiores por exemplo...  Ou ainda a Mediana, cujo posso observar um valor central, trabalhar com algo no “meio” das informações por exemplo.
TABELA:
	CLASSE
	INTERVALO
	Nº DE SALÁRIOS
	FREQUÊNCIA RELATIVA SIMPLES
	FREQUÊNCIA ACUMULADA
	FREQUÊNCIA RELATIVA ACUMULADA
	1
	1-3
	80
	43%
	80
	43%
	2
	3-5
	44
	23,6%
	124
	66,6%
	3
	5-7
	20
	10,8%
	144
	77,4%
	4
	7-9
	24
	13%
	168
	90,3%
	5
	>9
	18
	9,6%
	186
	100%
Informações Extraídas:
- Menos de 10% da população da fabrica recebe o (INCRÍVEL) salário de R$ 14.184,00 conforme valor do salario atual vigente (R$ 788,00).
- A empresa usa em seu orçamento R$ 130.000,00 para pagar 90% dos seus funcionários (Vamos considerar que esses 90% sejam para os colaboradores operacionais.)
- Na tabela com os meus dados, 66,6% dos funcionários recebem menos que 5 salários mínimos.
Ok Alvaro. Complementando, utilizando o número de sua matrícula, podemos que 77,42% dos funcionários ganham até 7 salários mínimos exclusive.
As metricas são importantes para buscar um determinado dado em algum ponto especifico da analise, pode ser utilizado em desenhos tecnicos e qualquer outra ação que busque uma fonte de desvio ou variação quando necessario para a separação dos conjuntos de dados. Por exemplo, dividir uma reta em quatro partes aplicando assim 3 pontos com base nas medidas dos quartis. Vai depender do tipo de informação buscada, utilizar o quartil, decil ou percentil.
Já as medidas de dispersão é possivel analisar o grau de variação do valor central, pois nem sempre apenas com valores de media, moda ou mediana se pode tirar uma conclusão para um trabalho especifico. Até porque a média não vai ajudar muito se você tem uma pesquisa e os dados forem muitos diferentes. Na soma ou subtração o desvio não se altera, na divisão ou multiplicação o desvio fica dividido/multiplicado pela constante.
Alvaro, tiramos a raiz quadrada da variância para obter o desvio padrão, mas porque?
Professor,
Para conservarmos as unidades do desvio e dos dados. Porque dessa forma podemos verificar o grau de diferença da média. Ou seja, quanto mais o desvio maior significa a variancia dos dados e quanto menor ele for, mais significa que o valor está proximo da média. 
É a necessidade dessas medidas para a interpretação de dados e saber interpretá-las. Ex: Quartis divide uma série em 4 partes iguais. 1/4= 25%. Decis em 10 partes iguais, e Percentis em 100 partes iguais. 
Em relação a medidas de Dispersão, elas mostram até que ponto os valores se distinguem acima ou abaixo da tendência central. Existe sim diferença na aplicabilidade das métricas, a diferença é entre dados amostrais e dados populacionais e se são tabulados ou não.
Professor,
Bom Dia!
 
O gráfico de barras (ou de colunas) é utilizado, em geral, para representar dados de uma tabela de freqüências associadas a uma variável qualitativa. Nesse tipo de gráfico, cada barra retangular representa a freqüência ou a freqüência relativa da respectiva opção da variável.
 
Veja a seguir um exemplo de gráfico de barras:
Desmatamento na Amazônia cresce 3,8%
 
Em 28/11, o Instituto Nacional de Pesquisas Espaciais (INPE) informou que o desmatamento na região da Amazônia, medido entre agosto de 2007 e julho de 2008, foi de 11.968 km², de acordo com o resultado do Projeto de monitoramento na Amazônia Legal (Prodes). A taxa 2007-2008 é 3,8% maior que o desmatamento medido no período anterior.
 
 
Um gráfico de pizza mostra o tamanho proporcional de itens que constituem uma série de dados para a soma dos itens. Ele sempre mostra somente uma única série de dados, sendo útil quando você deseja dar ênfase a um elemento importante.  É utilizado para dados qualitativos nominais.
EXEMPLO:
A ilustração a seguir mostra um gráfico de pizza que mostra a quantidade de vendas( em %) em relação ao produto vendido. A legenda está posicionada no centro-direito.
Pois bem, o gráfico de bolhas ele é interessante pois conseguimos organizar o grafico em formas dos valores dos dados. Por exemplo, Você precisa mostrar a quantidade de perda de um determinado produto por tonelada, através do gráfico de bolha você consegue deixar as bolhas no tamanho significativo das perdas, Se você tiver valores percentuais: 10%, 20%, 30% o gráfico representará isso de forma proporcional, A bolha de 30% será maior que 20% que consequentemente será maior que 10%, Contribuindo assim a melhor apresentação dos dados e a melhor compreensão do trabalho por parte do publico.
A distribuição Normal é a mais familiar das distribuições de probabilidade e também uma das mais importantes em estatística.
Sua importância se deve a vários fatores, entre eles podemos citar o teorema central do limite, o qual é um resultado fundamental em aplicações práticas e teóricas, pois ele garante que mesmo que os dados não sejam distribuídos segundo uma normal a média dos dados converge para uma distribuição normal conforme o número de dados aumenta. Além disso, diversos estudos práticos tem como resultado uma distribuição normal. Podemos citar como exemplo a altura de uma determinada população em geral segue uma distribuição normal. Entre outras características físicas e sociais tem um comportamento gaussiano, ou seja, segue uma distribuição normal.
Eventos aleatórios que seguem este padrão enquadram-se na chamada "distribuição normal", representada pela curva também conhecida como Curva de Gauss ou Curva do Sino (Bell Curve).
 
Um exemplo bastante próximo de todos sobre como a curva de distribuição normal ajuda a definir padrões esperados é a pressão arterial.
Ex.: Quando o médico infla a almofada em nosso braço, lê o manômetro e nos informa que o resultado é 12 por 8, nos sentimos aliviados.
Alguém já se perguntou, porém, por que 12/8 e não qualquer outro resultado é considerado padrão de normalidade deste parâmetro médico?
A resposta é simples: as curvas de distribuição normal para a pressão arterial sistólica e diastólica tendem a concentrar seus resultados em torno de 120 e 80 mmHg, respectivamente.
Tadeu, consultando a Tabela da Distribuição Normal verifica-se que P(0 ≤ Z ≤ 0,74) = 0,2704. Sabendo disso, determine a probabilidade para Z ≤ 0,74 
Caro professor e aluno, permita-me contribuircom essa resposta:
P( Z ≤ 0,74) = 0,50 + 0,2704 = 0,7704
Abraços!
Sim.A Distribuição Normal é uma das mais importantes distribuições da estatística, conhecida também como Distribuição de Gauss ou Gaussiana, Sem dúvida já conhecida de alguns como a “curva em forma de sinto”. Foi desenvolvida pelo matemático francês Abraham de Moivre. O estudo do problema dos erros de medida levou à introdução da curva que, mais tarde, recebeu o nome de curva normal.
Além de descrever uma série de fenômenos físicos e financeiros, possui grande uso na estatística inferencial. É inteiramente descrita por seus parâmetros de media e desvio padrão ou seja, conhecendo-se estes consegue-se determinar qualquer probabilidade em uma Normal
Em geral, intervalos de confiança são a forma mais informativa de apresentar os achados principais de um estudo. Contudo, algumas vezes existe um particular interesse em verificar determinadas afirmações ou conjecturas. Por exemplo, podemos estar interessados em determinar se uma moeda é honesta, se certas quantidades são independentes, ou se populações distintas são similares do ponto de vista probabilístico. Cada uma destas afirmações constitui uma hipótese que pode ser associada a um modelo, i.e. pode ser parametrizada .Chamamos de hipótese estatística qualquer afirmação que se faça sobre um parâmetro populacional desconhecido. A idéia básica é que a partir de uma amostra da população iremos estabelecer uma regra de decisão segundo a qual rejeitaremos ou aceitaremos a hipótese proposta. Esta regra de decisão é chamada de teste.  
Angelica, consultando a Tabela da Distribuição Normal verifica-se que P(0 ≤ Z ≤ 0,73) = 0,2673. Sabendo disso, determine a probabilidade para Z ≥ 0,73 
Aproveitando para responder ao questionamento do professor:
P(  Z ≥ 0,73) = 0,50 - 0,2673 = 0,2327
Abraços!!
Conceituando a distribuição normal podemos usá-la para modelar uma variedade de fenômenos físicos naturais, estudos de comportamento humano, processos industriais,etc. e desempenham papel importante nos métodos de inferência estatística. O gráfico da distribuição normal é chamada de curva normal. Algumas importâncias para o estudo da estatística são:
     É um importante modelo de probabilidade para populações estatísticas relativas a variáveis contínuas. É de grande utilidade para uma ampla gama de fenômenos naturais, sejam eles físicos, ambientais, comportamentais, psicométricos, etc., além de erros de medida.
    O Teorema central do limite mostra que, em situações muito gerais, a soma de uma grande quantidade de varáveis aleatórias ou realizações de uma variável aleatória converge para a distribuição normal.
     É a distribuição amostral, exata ou aproximada, de estatísticas de grande importância, como a média amostral, o que a torna extremamente relevante para realização de interferências estatísticas.
Concordo, diversos estudos práticos tem como resultado a distribuição normal. Todas as coletas de dados, com características físicas e sociais tem um comportamento gaussiano seguindo uma distribuição normal. Ela é uma das mais importantes por conseguir esse aplicado tanto na teoria como na prática em grandes fenômenos, o teorema central do limite por exemplo é o resultado fundamental em todas as aplicações,mesmo que os dados coletados não sigam por uma distribuição normal, a média se transforma em uma distribuição normal, ela será sempre continua de uma variável x e seu gráfico curva nomal.
Ok Alvaro. Partindo para a pratica, consultando a Tabela da Distribuição Normal verifica-se que P(0 ≤ Z ≤ 1,6) = 0,4452. Sabendo disso, determine a probabilidade para Z ≥ 1,6. Como o valor tabelado fornece o valor (0 ≤ Z ≤ x), e deseja-se calcular o valor para Z ≥ x, fazemos a seguinte conta:  0,5 -0,4452 = 0,0548 
No teste de hipóteses, acredito que ela sempre vai ser rejeitada se o resultado da amostra não for provavel, caso contrário ela deverá ser provável e testada com análises de amostras anteriores onde deverá a partir daí ser aceita ou não aceito. Algumas situações devem ser observadas, quando estabelecidos as hipoteses, os resultados das amostras não devem ter um valor significamente negativos da hipótese nula (Ho), onde ocorrendo ela não poderá ser rejeitada, diferente quando a hipóteses alternativa contrariar a Ho daí será aceita quando os resultados forem muito diferentes da Ho.
Alvaro, mas sobre teste de hipóteses. Também chamado de teste de significância, o teste de hipótese é um método que nos permite decidir se uma dada hipótese é ou não suportada pela informação fornecida pelos dados de uma amostra. Através do teste de hipóteses podem-se fazer afirmações  sobre determinada característica da população, aceitando ou rejeitando uma hipótese testada.

Continue navegando