Baixe o app para aproveitar ainda mais
Prévia do material em texto
ESTATÍSTICA Prof. Airton A. CASTAGNA Docteur Ingénieur ESTATÍSTICA CONCEITUAÇÃO A estatística envolve técnicas para coletar, organizar, descrever, analisar e interpretar dados, ou provenientes de experimentos, ou vindos de estudos observacionais. A estatística é uma ciência que estuda a variabilidade apresentada pelos dados. Permite-nos, a partir dos dados, retirar conclusões e, também, exprimir o grau de confiança que devemos ter nessas conclusões. É precisamente nesta particularidade, que se manifesta toda a potencialidade da Estatística. ESTATÍSTICA CONCEITUAÇÃO A essência de uma análise estatística é tirar conclusões sobre uma população, ou universo, com base em uma amostra de observações. • POPULAÇÃO: todos os possíveis objetos de estudo. • AMOSTRA: um subconjunto dos objetos de estudo. ESTATÍSTICA CONCEITUAÇÃO Inferência Operação intelectual pela qual se passa de uma verdade a outra, julgada tal em razão de sua ligação com a primeira: a dedução é uma inferência. As inferências podem ser divididas em dois tipos: imediatas e mediatas. a) A inferência imediata consiste em extrair de uma só proposição outra proposição, à qual se atribui o valor de verdade ou falsidade. A inferência imediata pode ser obtida por oposição ou conversão. b) A inferência mediata consiste numa conclusão obtida a partir de duas ou mais proposições. Este tipo de inferências podem ser de três tipos: analógicas, indutivas e dedutivas. ESTATÍSTICA CONCEITUAÇÃO Inferência é o processo pela qual concluímos algo por meio de um raciocínio. De várias proposições nós inferimos uma conclusão. Inferir é, portanto, chegar a uma resposta a partir de juízos anteriores. Por sua vez, o raciocínio é a operação pela qual o pensamento de duas ou mais relações conhecidas infere uma outra relação que desta decorre logicamente. O raciocínio é, portanto, a ligação das proposições. Por exemplo: → Todo metal conduz eletricidade →O ferro é um metal → Logo, o ferro conduz eletricidade. ESTATÍSTICA CONCEITUAÇÃO Há três séculos atrás o belga Johan Baptista Van Helmont plantou uma muda de salgueiro num vaso, ao qual, durante cinco anos, adicionou apenas água. Findo o período obteve uma árvore que pesava 76,7 kg enquanto que ao solo faltavam apenas alguns poucos gramas de terra. Sua conclusão foi de que as árvores eram constituídas apenas por água, desprezando assim o solo faltante. ATENÇÃO, O RACIOCÍNIO TEM LIMITES!!!!!! OBSERVE QUE TODOS OS ELEMENTOS DE UMA POPULAÇÃO TÊM DE TER PELO MENOS UMA CARACTERÍSTICA EM COMUM. Quando uma população é muito grande, podemos, para efeito de cálculo, considerá-la como infinita ainda que a saibamos finita. POPULAÇÃO FINITA INFINITA Ex.: os alunos de cursos superiores da SOUZA MARQUES, em 2012. Ex.: o povo brasileiro (sem considerar período especí- fico) ESTATÍSTICA CONCEITUAÇÃO Como é praticamente impossível trabalhar com a população, deve-se trabalhar com uma parte da mesma. Esta porção é o que chamamos de amostra. Entretanto, se trabalhamos com amostras, é necessário que sejam representativas de suas populações para que não se obtenham resultados distorcidos. ESTATÍSTICA CONCEITUAÇÃO ►Quase sempre é impossível estudar a população como um todo. ►Trabalhar com uma parte que represente a população é mais fácil, mais rápido e mais barato. ►Entretanto, para trabalharmos com amostras, estas precisam ser representativas da população objeto de nosso estudo. ►Em 2006 o IBOPE trabalhou com, aproximadamente, 2.500 eleitores (amostra) para um universo (população) de 127 milhões de eleitores. ESTATÍSTICA CONCEITUAÇÃO Quando procuramos representar a população, em termos quantitativos, buscamos um valor, a este valor denominamos: parâmetro. Se a média de altura dos alunos da SOUZA MARQUES 1,71 m, o valor 1,71 m é um parâmetro da variável altura que nos dá uma ideia da população. ESTATÍSTICA CONCEITUAÇÃO PARÂMETRO POPULAÇÃO Como não trabalhamos com populações, mas com amostras, não determinamos os parâmetros, mas podemos estimá-los. As estimativas da média podem ser diferentes da média paramétrica, embora próximas, àquela. Estimativas diferentes, provavelmente, terão valores diferentes porém próximos e ambas se mantém como estimativas da média paramétrica. A média da amostra é um estimador, já o valor da média é uma estimativa. ESTATÍSTICA CONCEITUAÇÃO Exemplo: dois candidatos (A e B) disputando a prefeitura em município onde realizaram-se três sondagens eleitorais. Os resultados, abstraindo-se os brancos e nulos, são os seguintes: Pesquisa Candidato A Candidato B Primeira 44,7 % 43,2 % Segunda 43,8 % 42,9 % Terceira 45,6 % 44,9 % ELEIÇÃO 45,9 % 43,9 % ESTATÍSTICA CONCEITUAÇÃO ►A amostra deve ser representativa da população para obtermos valores que estimem fidedignamente os parâmetros da população. ►Assim exige-se da amostra: imparcialidade; inexistência de viés; não viciada; não tendenciosa. ESTATÍSTICA CONCEITUAÇÃO ۞ - Amostra casualizada, randômica ou aleatória – quando todos os elementos de uma população têm a mesma probabilidade de participarem da amostra. ۞ – Amostra sistemática – quando adota sistema intervalar de tempo, de espaço ou ordinal para a obtenção dos dados. ۞ – Amostra estratificada – quando dividimos a população em estratos e dentro de cada estrato retiramos uma certa quantidade de elementos. ۞ – Amostra por conveniência – é aquela onde obtém-se os dados por comodidade. ESTATÍSTICA CONCEITUAÇÃO Em Estatística, variável é atribuição de um número ou de uma qualidade determinada a cada característica de uma unidade experimental, ou de uma amostra ou, ainda, de uma população. ESTATÍSTICA CONCEITUAÇÃO ESTATÍSTICA CONCEITUAÇÃO ۞ – Variáveis determinísticas – são variáveis sequenciadas regularmente. A estatística não trabalha com elas. ۞ – Variáveis aleatórias – é quando na sequência de obtenção dos dados inexiste indicativo do próximo. ESTATÍSTICA CONCEITUAÇÃO ۞ – Variáveis qualitativas (categóricas) – podem ser nominais ou ordinais: nominais – são aquelas cujas respostas são encaixadas em categorias e cada categoria é independente da outra.(cores, times, etc.); ordinais – são aquelas onde as categorias mantém uma relação de ordem umas com as outras (conceitos de desempenho escolar, A, B, C, D, E, p.ex.). ESTATÍSTICA CONCEITUAÇÃO ۞ – Variáveis quantitativas – referem-se a quantidades. Quantidade de alunos por turma, peso dos alunos, etc.). ۞ – Variáveis discretas – aquelas que podem assumir somente determinados valores dentro de um campo de variação (R$). ۞ – Variáveis contínuas – aquelas que podem assumir quaisquer valor dentro de um campo de variação.(exemplos de medir ou pesar). ESTATÍSTICA CONCEITUAÇÃO Entre as medidas de tendência central, as mais conhecidas e utilizadas são a média, a mediana e a moda, que numa distribuição simétrica são coincidentes. MEDIDAS DE TENDÊNCIA CENTRAL (POSIÇÃO) MODA: valor mais freqüente numa série de dados. Se existir apenas um valor mais freqüente, a amostra ou população é chamada de unimodal. Se mais de um valor apresenta maior freqüência a amostra será bimodal (dois valores) ou multimodal (mais de dois valores). Quando todos os valores aparecerem uma única vez, denomina-se amostra ou população amodal. MEDIDAS DE TENDÊNCIA CENTRAL (POSIÇÃO) MEDIANA Valor que divide uma amostra ou população ordenada em duas partes. É o valor central em uma série ordenada, com número ímpar de elementos ou a média aritmética dos dois valores centrais em uma série com número par de elementos. MEDIDAS DE TENDÊNCIA CENTRAL (POSIÇÃO) MÉDIA OU MÉDIA ARITMÉTICA A média, ou média aritmética, é o valor obtido pelo quociente entre a soma dos valores da amostra ou população e o seu número. no caso da população, ou n Σ Xi µ = i=1 N MEDIDAS DE TENDÊNCIA CENTRAL(POSIÇÃO) no caso da amostra. Σ Xi X = m = i=1 n n MEDIDAS DE TENDÊNCIA CENTRAL (POSIÇÃO) MÉDIA ARITMÉTICA PONDERADA Quando os valores da variável estão repetidos, podemos representar estas repetições por meio de frequências. Assim definimos frequências ou pesos como sendo o número de vezes em que o valor ocorre. µ = Σ Xi Fi / Σ Fi, no caso de população (Σ Fi = N) = Σ Xi Fi / Σ Fi, no caso de amostra (Σ Fi = n)X MEDIDAS DE TENDÊNCIA CENTRAL (POSIÇÃO) MEDIDAS DE TENDÊNCIA CENTRAL (POSIÇÃO) frequência relativa (porcentagem) fr MEDIDAS DE TENDÊNCIA CENTRAL (POSIÇÃO) frequência absoluta frequência relativa (%) • Como definir o número de classes? - poucas: perde-se muita informação - muitas: pode-se ter pormenores desnecessários O número adequado de classes é definido pelo pesquisador. Na escolha, é conveniente usar extremos de classes fáceis de trabalhar. MEDIDAS DE TENDÊNCIA CENTRAL (POSIÇÃO) MEDIDAS DE TENDÊNCIA CENTRAL (POSIÇÃO) Exemplo - Tabela de variáveis contínuas Informações sobre peso de recém-nascidos medidos ao longo de um ano. Como fazer uma tabela com essa informação? 1)Definir as faixas de pesos (classes) 1,0 – 1,5 1,5 – 2,0 2,0 – 2,5 2,5 – 3,0 3,0 – 3,5 3,5 – 4,0 4,0 – 4,5 4,5 – 5,0 Intervalo de classe: 0,5 kg (escolha pessoal) MEDIDAS DE TENDÊNCIA CENTRAL (POSIÇÃO) 2) Contar quantos dados existem em cada classe 1,0 |– 1,5 ---> 1 1,5 |– 2,0 ---> 3 2,0 |– 2,5 ---> 16 2,5 |– 3,0 ---> 31 3,0 |– 3,5 ---> 34 3,5 |– 4,0 ---> 11 4,0 |– 4,5 ---> 4 4,5 |– 5,0 ---> 2 1,5 2,0 fechado aberto (pertence) (não pertence) extremos de classe: valores limites dos intervalos de classe podem pertencer ou não à classe MEDIDAS DE TENDÊNCIA CENTRAL (POSIÇÃO) HISTOGRAMA Gráfico que fornece os intervalos de classe ao longo do eixo horizontal e as frequências (absolutas ou relativas) no eixo vertical. 1 2 3 4 5 0 5 10 15 20 25 30 35 40 Peso de Recém-nascidos F re q u ê n c ia Peso (Kg) freq 1,25 1,75 2,25 2,75 3,25 3,75 4,25 4,75 5,25 MEDIDAS DE TENDÊNCIA CENTRAL (POSIÇÃO) HISTOGRAMA Gráfico que fornece os intervalos de classe ao longo do eixo horizontal e as frequências (absolutas ou relativas) no eixo vertical. 1 2 3 4 5 0 5 10 15 20 25 30 35 40 Peso de Recém-nascidos F re q u ê n c ia Peso (Kg) freq 1,25 1,75 2,25 2,75 3,25 3,75 4,25 4,75 5,25 MÉDIA GEOMÉTRICA Definimos média geométrica como sendo: G = (X1 × X2 × X3 × … × Xn), ou G = (X1 × X2 × X3 × … × Xn) 1/n OBS.: A média geométrica só é recomendada nos casos em que os dados de apresentem em progressão geométrica. n MEDIDAS DE TENDÊNCIA CENTRAL (POSIÇÃO) A variabilidade das medidas de uma variável é obtida com medidas de dispersão. As mais empregadas são: a variância, o desvio padrão e o coeficiente de variação. MEDIDAS DE DISPERSÃO VARIÂNCIA: obtida pelo quociente entre a soma dos quadrados dos desvios de cada medida em relação à média e o número de graus de liberdade (amostra) ou pelo número de indivíduos (população). MEDIDAS DE DISPERSÃO Σ (Yi – Y)2 n i = 1 n - 1 S2 = Σ (Yi – Y)2 n i = 1 n σ2 = no caso de amostras, e no caso de populações. MEDIDAS DE DISPERSÃO DESVIO PADRÃO: é a raiz quadrada da variância. COEFICIENTE DE VARIAÇÃO: quociente entre o desvio padrão e a média expresso em porcentagem. O coeficiente de variação é a medida da precisão de um experimento. CV = X 100 MEDIDAS DE DISPERSÃO S µ
Compartilhar