Baixe o app para aproveitar ainda mais
Prévia do material em texto
UNIVERSIDADE FEDERAL DO PIAUÍ – UFPI CAMPUS PROFª CINOBELINA ELVAS – CPCE Bom Jesus - PI 2019 ESTATÍSTICA BÁSICA Professora: Priscila Alves Barroso 1. Soma simples n n i i xxxX ...21 1 onde: é o limite inferior (LI) do somatório; é o limite superior (LS) do somatório; é o índice que esta sendo indexando os valores da variável . 1i n i 2. Soma de quadrados 22 2 2 1 1 2 ... n n i i xxxX X 221 2 1 ... n n i i xxxX nn n i ii yxyxyxYX ...2211 1 n i nn n i ii yyyxxxYX 1 2121 1 ...... 3. Quadrado da soma 4. Soma de produtos 5. Produto da soma . Exemplo: Considere amostras de tamanho n = 4 das variáveis X e Y representando o número de brotos por estaca de ipê X = {15,23,22,40} Y = {24,53,30,31} c) a) d) b) e) Estatística Descritiva: Medidas de posição MEDIDAS DE POSIÇÃO : Representar o conjunto de dados por meio de um único valor (Média, mediana e moda) Média ( ̅x) • É a razão entre a soma das observações e o número total delas, determinada pela expressão: • Está na mesma medida da amostra (mm, cm, m, kg, %) x x x x n x n n i i n 1 2 1... n : tamanho amostral (número de observações) • Aplicação: Número de brotações por cepa de Eucalyptus grandis: 0, 2, 3, 1, 0, 1, 2, 2, 3, 1, 2, 3, 2, 1 • Afetada por valores extremos Número de brotações por cepa de Eucalyptus grandis: 0, 2, 3, 1, 0, 1, 2, 2, 3, 1, 2, 3, 2, 25 3,3571 Md - Valor que ocupa a posição central de um conjunto de dados ordenados Cálculo - com base na ordem (rol) dos valores, dependendo do número de observações. Quando número de observações (n) for ímpar: a mediana é o valor da variável que ocupa a posição n 1 2 então Md = X (n+1)/2 Quando o número de observações (n) for par: a mediana é a média aritmética dos valores da variável que ocupam as posições n 2 e n 2 2 então Md = X n 2 + X n 2 2 1º Ordenar 2º Valor Central 1º Ordenar 2ºMédia dos dois valores centrais • Aplicação Moda (Mo) É o valor associado a maior frequência ou probabilidade de ocorrência.Indica a região da máxima frequência. => Amodal Ex. {1, 3, 9, 4} Unimodal Ex. {30, 21, 21, 20, 25} Mo= 21 =>Bimodal Ex. {1, 3, 3, 9, 1, 9, 5, 1, 3} Mo=1,3 Multimodal Ex. {30, 30, 21, 21, 20, 20, 25, 25, } Diâmetro 21.4 22.7 30.6 35.7 34.8 28.5 29.1 28.7 30.1 29.6 Produção 0.82 0.91 1.08 1.23 1.18 1.03 1.05 1.04 1.07 1.06 Seja os valores de diâmetro (em cm) e produção (em metros cúbicos) para uma amostra de 10 plantas de mogno. Calcule: a) Média; b) Mediana; c) Moda Estatística Descritiva: Medidas de dispersão MEDIDAS DE DISPERSÃO: Indicar o quanto os dados se apresentam dispersos em torno de uma medida de posição (amplitude total, variância amostral, desvio-padrão amostral, coeficiente de variação) Um melhorista foi contratado para selecionar clones de eucalipto com a estatura ideal para transplantio (60-110cm) a empresa que o contratou enviou os seguintes dados: (dados fictícios) Área 1 65 80 120 130 126 115 60 45 131 118 Área 2 36 135 150 78 95 115 48 129 82 122 Como pode ser feita a seleção?? È a medida mais simples de dispersão. A amplitude total é a diferença entre o maior e o menor valor da amostra, ou de um conjunto de dados. )min()max( XXATX . Área 1 H = 130-45 =>86 Área 2 H = 150-36 =>114 Desvantagens : 1) Só utiliza valores extremos, nada informando sobre os intermediários; 2) Quando avaliada em amostras, frequentemente fornece uma subestimativa da amplitude populacional, É uma medida da dispersão dos dados em torno da média Cálculo: Soma dos quadrados dos desvios de cada observação em relação a média, leva em consideração o n. 11 2 1 1 2 1 2 2 n n X X n XX S n i in i i n i i X Desvantagem: 1) medida extremamente afetada por valores extremos; 2) a unidade é ao ². (kg², cm², t/ha²) a1 a2 a3 a4 9,0 9,0 9,0 9,0 9,0 7,0 8,0 9,0 10,0 11,0 0,6 3,4 9,8 13,8 17,4 0,6 9,0 9,0 9,0 17,4 Calcular Variância dos seguintes conjuntos de dados : Variância (S²) Área 1 65 80 120 130 126 115 60 45 131 118 Área 2 36 135 150 78 95 115 48 129 82 122 • Como ficaria a questão do melhorista ? Raiz quadrada da variância; Diferença de que é expressa na mesma unidade dos dados. Cálculo: raiz quadrada positiva da variância. 2 XX SS Área 1 65 80 120 130 126 115 60 45 131 118 Área 2 36 135 150 78 95 115 48 129 82 122 a1 a2 a3 a4 9,0 9,0 9,0 9,0 9,0 7,0 8,0 9,0 10,0 11,0 0,6 3,4 9,8 13,8 17,4 0,6 9,0 9,0 9,0 17,4 Calcular Desvio - Padrão: Cálculo: desvio-padrão dividido pela média. É uma medida da homogeneidade, ou dispersão relativa, dos dados. Ideia de precisão do experimento. Compara a dispersão entre conjunto de dados que apresentam médias diferentes. 100 x s CV Compara variabilidade Área 1 65 80 120 130 126 115 60 45 131 118 Área 2 36 135 150 78 95 115 48 129 82 122 Qual amostra é mais homogênea??? a1 a2 a3 a4 9,0 9,0 9,0 9,0 9,0 7,0 8,0 9,0 10,0 11,0 0,6 3,4 9,8 13,8 17,4 0,6 9,0 9,0 9,0 17,4 Calcular CV: Cálculo: desvio-padrão dividido pelo número de observações. É uma medida da precisão com que a média é estimada. Desvio padrão de um conjunto de médias amostrais. Quanto menor o erro-padrão maior a precisão associada à estimativa da média. n S S X X a1 a2 a3 a4 9,0 9,0 9,0 9,0 9,0 7,0 8,0 9,0 10,0 11,0 0,6 3,4 9,8 13,8 17,4 0,6 9,0 9,0 9,0 17,4 Calcular Erro padrão: Área 1 65 80 120 130 126 115 60 45 131 118 Área 2 36 135 150 78 95 115 48 129 82 122 Complementando – Gráficos • Gráficos boxplot (diagrama de caixas) • Centro • Dispersão • Assimetria • Identificação de outliers • Quartis Intervalo interquartil = Q3 – Q1 • Construir o box plot das duas áreas e comparar Área 1 65 80 120 130 126 115 60 45 131 118 Área 2 36 135 150 78 95 115 48 129 82 122 Em um estudo de preservação ambiental de determinada área foram coletadas dez amostras de solo e medido a quantidade de chumbo (em ppm). Sabe-se que o chumbo é um grande contaminante do solo. Os valores observados estão apresentados abaixo. Calcule e interprete: a) Média b) Mediana c) Moda d) Variância e) Desvio padrão f) Erro padrão da média g) Coeficiente de variação h) Amplitude total f) Construir um boxplot EXERCÍCIO
Compartilhar