Prévia do material em texto
N o m e t u t o r | t u r m a Estatística e Indicados Ambientais Dileta Regina Moro Alessio “ UNIDADE 1 - O MÉTODO ESTATÍSTICO E SUA UTILIZAÇÃO NA ANÁLISE DE DADOS “ TÓPICO 1- CONCEITOS APLICADOS À ESTATÍSTICA Dados InformaçãoEstatística A estatística possui uma importância relevante nas pesquisas, pois acrescenta credibilidade aos dados analisados, tendo um grau elevado das conclusões que o pesquisador tem de seus dados coletados e observados. A estatística significa o estado do estudo, tendo como finalidade: I. Decidir o melhor plano (experimental ou observacional) para a execução de uma pesquisa metodologia científica. II. Organizar e resumir dados de contagem, mensuração e classificação raciocínio dedutivo. III. Inferir sobre populações de unidades (indivíduos, animais, objetos) quando uma parte (amostra) é considerada raciocínio indutivo. CONCEITOS APLICADOS À ESTATÍSTICA OS MÉTODOS ESTATÍSTICOS • Estatística descritiva: é aquela que se preocupa com a coleta, que organiza, que descreve, expõe os dados nas tabelas, gráficos, além do cálculo de estimativas de parâmetros representativos desses dados. • Estatística inferencial: a partir das conclusões sobre a população estatística, estabelece-se hipóteses sobre a população de origem. Fonte: Reece et al. (2015. p. 271). Bioestatística Metodologia estatística aplicada às ciências biológicas, com a finalidade planejar, coletar, organizar, resumir, analisar e interpretar os dados, permitindo tirar conclusões biológicas sobre populações a partir do estudo de amostras. A bioestatística pode ser aplicada, também, à medicina e às ciências agrárias, porque ela está voltada às ciências ambientais, pois, muitas vezes, vocês irão utilizar os fatores climáticos, ou dados de população, com diversos fatores que influenciam de forma direta o resultado final. Portanto, a estatística tem como objetivo principal tirar conclusões com base nos resultados observados, levando em consideração todos os fatores envolvidos no estudo. População X Amostra População: é qualquer conjunto de informações que tenham entre si uma característica comum Exemplo: Num bairro, o conjunto das estaturas de todos os moradores constitui uma “população de estaturas”, e o tamanho de uma população é expressa pela letra N (maiúscula). Amostras: são subconjuntos representativos de uma dada população. Esta amostra deve representar de forma significativa seus valores quantitativos e qualitativos, e ela é expressa pela letra n (minúscula). CONCEITOS APLICADOS À ESTATÍSTICA População 1 População 2 População 3 População É qualquer conjunto de informações que tenham entre si uma característica comum (DORIA FILHO, 1999). População Amostra 1 Amostra 2 Amostra São subconjuntos representativos de uma dada população (DORIA FILHO, 1999). Hipótese X nível de significância do teste • Hipótese: é uma suposição formulada a respeito dos parâmetros de uma distribuição de probabilidade de uma ou mais populações. Esta hipótese será testada com base em resultados amostrais, sendo aceita ou rejeitada. Consideramos Ho a hipótese nula, e H1 a hipótese alternativa a ser testada (complementar de Ho). O teste pode levar à aceitação ou rejeição de Ho, que corresponde, respectivamente, à negação ou afirmação de H1”. Ho= hipótese nula H1= aceita a hipótese testada. • Nível de significância de um teste (α): é a probabilidade máxima de rejeitar Ho. Se, por exemplo, utilizarmos o nível de significância de 5%, a hipótese nula (Ho) será rejeitada somente se o resultado da amostra for tão diferente do valor suposto que uma diferença igual ou maior ocorreria com uma probabilidade máxima de 0,05. Na prática, o valor de α é fixo (geralmente, α = 0,01 ou 0,05 ou 0,10) Valores acima de 0,05 são rejeitados. Abaixo ou igual a 0,05 são aceitos. Classificação das variáveis aleatórias Conceito e classificação das variáveis aleatórias Variável aleatória: características de uma população ou uma amostra. As variáveis aleatórias são as questões que o instrumento de coleta de dados (questionário) contempla, por exemplo: idade, estado civil, escolaridade, número de filhos, qual atividade exerce, tempo que exerce a atividade, quantas horas trabalha por semana, se é autônomo ou empregado, e muitas outras. Classificamos das variáveis aleatórias: As variáveis qualitativas= têm seus valores não numéricos, como sexo, estado civil, nível de escolaridade, bairro, profissão, nível de satisfação. ▪ As variáveis qualitativas nominais: quando as diferentes categorias (respostas) não têm relação entre si, ou seja, são independentes, por exemplo, sexo, estado civil, curso de graduação e bairro ▪ As variáveis qualitativas ordinais: quando as categorias têm uma relação entre si, geralmente atribuindo níveis, como o nível de escolaridade e o grau de satisfação do cliente, são denominadas qualitativas ordinais. Classificação das variáveis aleatórias As variáveis quantitativas têm seus valores numéricos, tais como: idade, peso, salário, tempo de serviço, número de filhos. Podem ser divididas em: ▪ As variáveis quantitativas discretas assumem somente valores numéricos inteiros, como: número de filhos, número de alunos, número de computadores. ▪ As variáveis quantitativas contínuas podem assumir qualquer valor numérico, resultado de uma medida dentro de um certo intervalo de variação possível, como: peso, idade e salário. Para compreender melhor e aprofundar os conhecimentos dos assuntos desse tópico, acesse: • Vídeo sobre as noções de estatística: conceitos iniciais (https://youtu.be/DLOQvKvbBW8) • Vídeo estatística - introdução à estatística – conceitos (https://youtu.be/8U1Z- XtYG4Q) • Vídeo sobre as variáveis, população, amostra e técnicas de amostragem (https://youtu.be/2Q7wSgJR-g4) • Vídeo sobre o planejamento de experimentos (https://youtu.be/GWwxpI8rHEw) • Vídeo sobre as explicações sobre testes de hipóteses, nível de significância, erro do tipo I e p-valor (https://youtu.be/DBKbNmKNjdQ) https://youtu.be/DLOQvKvbBW8 https://youtu.be/8U1Z-XtYG4Q https://youtu.be/2Q7wSgJR-g4 https://youtu.be/GWwxpI8rHEw https://youtu.be/DBKbNmKNjdQ MÉTODOS ESTATÍSTICOS MÉTODO EXPERIMENTAL: consiste, através da experimentação, manter constante todas as causas (fatores), menos uma, variando-a de modo que se possa descobrir seus efeitos, caso existam. Esse método passa por várias etapas: observação, hipótese, experimentação e teoria. A pesquisa experimental procura entender de que modo ou por quais causas o fenômeno é produzido, sendo utilizada nos diversos campos da atividade humana, bem como nas disciplinas de física, química, biologia, entre outras. MÉTODO ESTATÍSTICO Com certa frequência, torna-se impossível fazer uso do método experimental, isso se deve porque não é possível manter constantes todos os fatores que envolvem um determinado fenômeno de estudo, pois cada variação que ocorrer você deve registrar e procurar determinar, no resultado final, que influências cabem a cada uma delas, ou seja, é muito importante controlar as variáveis que podem interferir em seu experimento. ETAPAS DO TRABALHO ESTATÍSTICO PLANEJAMENTO – DEFINIÇÃO DO PROBLEMA - definido o problema que se deseja resolver, você faz o levantamento das observações (informações) colhidas de uma determinada população, estudando e verificando quais informações são as mais relevantes para o caso. COLETA DE DADOS: Direta: quando feita sobre elementos informativos de registro obrigatório ou coletados pelo próprio pesquisador. Indireta: quando é feita com base em elementos já pesquisados (revista, jornal, livros etc.) TAMANHO AMOSTRAL: o primeiro passo é estabelecer a sua hipótese de pesquisa, para que possam identificar o tipo de variável envolvida e o tipo de teste estatístico para a qual há fórmula disponível, fixando os níveis máximos de erro do tipo I (α) e do tipo II (β) o tamanho amostral é facilmente calculado, temosdois tipos de estimativas para o tamanho amostral: cálculo para estudos analíticos e cálculo para estudos descritivos. Para compreender melhor e aprofundar os conhecimentos dos assuntos desse tópico, acesse: • Vídeo sobre as fases do método estatístico (https://youtu.be/MbrKzniazv4) • Vídeo sobre a estatística experimental: introdução (https://youtu.be/2jzcEEQ_4Ck) • Vídeo sobre a estatística experimental: conceitos importantes (https://youtu.be/r6bffNKv-zM). https://youtu.be/2jzcEEQ_4Ck https://youtu.be/r6bffNKv-zM Apresentação dos dados Gráficos, como equações e tabelas, mostram como se relacionam duas ou mais grandezas físicas. Tabela: é uma maneira de apresentar de forma resumida um conjunto de observações (dados), têm como vantagem expor de forma organizada, em um só local, os resultados de determinado assunto, de modo a se obter uma visão global mais rápida daquilo que se pretende analisar Série temporal Série geográfica Série especificativa Série mista DISTRIBUIÇÃO POR FREQUÊNCIA Grande número de dados distribuídos numa tabela, sendo representado em poucas linhas. É uma série estatística específica em que os dados encontram- se dispostos em classes ou categorias junto às suas frequências correspondentes. Neste caso, todos os elementos são fixos (época, local, fenômeno). DISTRIBUIÇÃO DE FREQUÊNCIA POR PONTOS É uma série estatística na qual a variável observada está dividida em subintervalos do intervalo total observado, e o tempo, a espécie e a região permanecem fixos. DISTRIBUIÇÃO POR FREQUÊNCIA DISTRIBUIÇÃO DE FREQUÊNCIA POR INTERVALOS Usada para variáveis quantitativas contínuas ou discretas com muitos valores diferentes, sendo as variáveis observadas representadas sob a forma de intervalos. Geralmente, esta variável provém de medições. DISTRIBUIÇÃO POR FREQUÊNCIA Algumas definições Dados Brutos: são os dados originais conforme eles foram coletados, não estando numericamente organizados ou tabelados. Rol: é uma lista, onde os valores são dispostos em ordem crescente ou decrescente. Amplitude Total (H): é a diferença entre o maior valor e o menor valor observado da variável em estudo Limites de Classe: são os números extremos de cada intervalo: sendo assim, temos um limite inferior e um superior. Classe: é cada um dos intervalos em que os dados são agrupados. Ponto médio das classes (Xi): É a média aritmética entre o limite superior e o limite inferior da classe Número de Classes: Quantas classes serão necessárias para representar o fato, calculado pela formula: K = 1 + 3,3 log n Amplitude das Classes (h): h = H/ k Frequência acumulada (Fi): Corresponde à soma das frequências de determinada classe com as anteriores. Frequência relativa (fri): Corresponde ao quociente entre a frequência absoluta da classe e o total de elementos= fri= fr/n GRÁFICOS • O gráfico estatístico é uma forma de apresentação, cujo objetivo é reproduzir, uma impressão mais rápida e viva do fenômeno em estudo, já que, visualmente, os gráficos tendem a ser mais rápidos na compreensão do que as tabelas. • Para que os seus dados tenham uma representação gráfica, eles deverão ter alguns requisitos fundamentais, sendo eles: • Simplicidade: como o próprio nome diz, deve ser simples, os detalhes de importância secundária devem ser retirados, assim como os traços desnecessários que possam levar o observador a uma análise morosa ou com erros. • Clareza: o gráfico deve mostrar um correta interpretação dos valores representativos do fenômeno em estudo. • Veracidade: deve expressar a verdade sobre o fenômeno em estudo. Gráficos O gráfico estatístico é uma forma de apresentação, cujo objetivo é reproduzir, no pesquisador, ou no público em geral, uma impressão mais rápida e viva do fenômeno em estudo, já que, visualmente, os gráficos tendem a ser mais rápidos na compreensão do que as tabelas. Gráfico em linha ou curva: utiliza a linha poligonal para representar a série estatística, muito utilizado para representar uma série temporal. O gráfico em linha constitui uma aplicação do processo de representação das funções num sistema de coordenadas cartesianas. Neste sistema faz-se uso de duas retas perpendiculares; as retas são os eixos coordenados e o ponto de intersecção, a origem. O eixo horizontal é denominado eixo das abscissas (ou eixo dos x) e o vertical, eixo das ordenadas (ou eixo dos y) Gráfico em coluna ou em barras: representa uma série por meio de retângulos, dispostos verticalmente (em colunas) ou horizontalmente (em barras). Quando em colunas, os retângulos têm a mesma base e as alturas são proporcionais aos respectivos dados. E quando em barras, os retângulos têm a mesma altura e os comprimentos são proporcionais aos respectivos dados Gráfico em barras: utilizado para representar uma série geográfica ou especificativa A ordem a ser observada é a cronológica, se a série for temporal, e a decrescente, se for geográfica ou categórica (especificativa). A distância entre as colunas (ou barras), por questões estéticas, não deverá ser menor que a metade nem maior que os dois terços da largura (ou da altura) dos retângulos Gráfico em coluna ou em barras múltiplas: empregado quando se deseja representar, simultaneamente, dois ou mais fenômenos estudados com o propósito de comparação Gráfico em setores: construído com base em um círculo, e é empregado sempre que se deseja ressaltar a participação do dado no total, sendo utilizado na ilustração de dados qualitativos, não devendo ser utilizado quando a variável descrita apresentar mais de seis categorias GRÁFICOS ESPECIAIS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA POR INTERVALOS Histograma: representa gráfica de uma distribuição de frequência por meio de retângulos justapostos, cujas alturas são proporcionais às frequências absolutas e cujas bases correspondem ao intervalo de classe da distribuição. GRÁFICOS ESPECIAIS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA POR INTERVALOS Polígono de frequências: gráfico em linhas formado por segmentos de retas; os pontos extremos dos segmentos correspondem ao par ordenado formado pelo ponto médio de cada classe da distribuição (eixo x) e pela frequência absoluta (eixo y). Para compreender melhor e aprofundar os conhecimentos dos assuntos desse tópico, acesse: • Vídeo sobre os conceitos básicos de estatística: população, amostra, amostragem, variáveis e organização de dados (https://youtu.be/5ctWgFOizkQ) • Vídeo sobre a distribuição de frequências - tabelas e frequência absoluta (https://youtu.be/lhMDXCRyqu4) • Vídeo sobre a como montar tabelas de frequência (https://youtu.be/dwjQ4K2c-no) • Vídeo sobre a organizando dados em tabelas e gráficos (https://youtu.be/Ld3i9Wcqaew) • Vídeo sobre construindo gráfico de barra a partir de uma tabela/parte II (https://youtu.be/rqP84otjpPk) https://youtu.be/Ld3i9Wcqaew https://youtu.be/rqP84otjpPk Métodos de amostragem A seleção dos elementos que irão compor a amostra deve ser feita por uma metodologia adequada, de tal forma que ela seja representativa e que os resultados sejam confiáveis para avaliar as características da população. A amostra deve ser representativa da população extraída, sendo o mais parecido possível Amostragem é a técnica especial de escolher amostras que garantam o acaso na escolha. Assim, cada elemento da população tem a mesma chance de ser escolhido, o que garante à amostra um caráter de representatividade da população • Seleção da Amostra – as amostras devem ser escolhidas de modo a poder aplicar a elas os cálculos de probabilidades. • Amostra Representativa – é aquela que tem as mesmas características da população de onde foi retirada. • Amostra Probabilística – é aquela cujo processo de amostragem permite atribuir a cada elemento da amostra uma probabilidade semelhante à da população. • Amostragem Aleatória – é aquela em que cada um dos elementos da população tem a mesma chance de ser selecionado no levantamentodos dados. Tipos de amostragens AMOSTRA DE CONVENIÊNCIAS: é um procedimento não probabilístico, ou seja, é formada por elementos que o pesquisador reuniu simplesmente porque dispunha deles. AMOSTRAGEM ALEATÓRIA SIMPLES: a amostra é escolhida de tal forma que cada item ou pessoa na população tem a mesma probabilidade de ser incluída AMOSTRAGEM SISTEMÁTICA: quando os elementos da população já se acham ordenados, não há necessidade de construir o sistema de referência (prontuários médicos de um hospital, os prédios de uma rua). Nestes casos, a seleção dos elementos que constituirão a amostra pode ser feita por um sistema imposto pelo pesquisador. AMOSTRAGEM ALEATÓRIA ESTRATIFICADA: quando a população é dividida em estratos (subpopulações), convém que o sorteio dos elementos da amostra leve em consideração tais estratos, daí obtemos os elementos da amostra proporcional ao número de elementos desses estratos, como sexo, idade ou condição econômica Tipos de amostragens AMOSTRAGEM POR CONGLOMERADOS: amostragem aleatória é feita entre agrupamentos (conglomerados) que ocorrem naturalmente na população. Em seguida, os indivíduos que compõem o conglomerado podem ser selecionados por outro sorteio para incluir na amostra final (estudo de populações infantis). AMOSTRAGEM POR ESTÁGIOS MÚLTIPLOS: nesta amostragem é feita uma modificação da amostragem por conglomerados. É bastante usada para reduzir os custos de grandes pesquisas. Envolve o estabelecimento de um conglomerado chamado unidade primária de amostragem, que pode ser uma escola, um bairro etc. Numa segunda etapa são extraídas por sorteio as unidades secundárias, que vão constituir a amostra propriamente dita. Para compreender melhor e aprofundar os conhecimentos dos assuntos desse tópico, acesse: • Vídeo sobre os tipos de amostragem (https://youtu.be/vcTQCIfz9_M) • Vídeo sobre os tipos de amostragem - dicas sobre metodologia científica e coleta de dados (https://youtu.be/9GnYRCzXB0I) • Vídeo sobre os tipos de amostras (https://youtu.be/9qNnRo8pwzE) https://youtu.be/9GnYRCzXB0I Distribuição de Probabilidades A estatística da probabilidade leva em consideração valores diferentes, como média e desvio-padrão VANTAGENS • Compacidade: representação de um grande volume de dados. • Alisamento e interpolação: os dados reais estão sujeitos a variações na amostragem, desta forma a probabilidade estatística permite verificar se um dado é real, se existe falha de dados ou dados errôneos nas distribuições empíricas. • Extrapolação: estimar a probabilidade de eventos extremos à variação de um conjunto de dados particular exige a suposição de eventos ainda não observados. Isso pode ser realizado com a imposição de um modelo de probabilidade (isto é, uma distribuição teórica) ajustado à série de dados. • Distribuição discreta: descreve quantidades aleatórias (dados de interesse) que podem assumir valores particulares e os valores são finitos (a ocorrência de tempestades com granizo). • Distribuição contínua: representa quantidades aleatórias contínuas que podem tomar um número infinito de valores (temperatura, pressão, precipitação, ou qualquer elemento medido numa escala contínua, é uma variável aleatória contínua). Distribuição Binomial Em que cada tentativa tem duas possibilidades excludentes de ocorrência chamada de sucesso e falha. ➢ Um experimento aleatório é chamado binomial se em n repetições os ensaios são independentes; ➢ Cada resultado do ensaio pode assumir somente uma de duas possibilidades: sucesso ou fracasso; ➢ A probabilidade de sucesso em cada ensaio, denotado por ( p ), permanece constante, e a probabilidade de fracasso,1-p, é designada por (q) Exemplo: Admite-se que a probabilidade de nascimento de um menino, como também de uma menina, é igual a ½. Quais são as probabilidades em uma família de 6 filhos de ter: 0,1,2,3,4,5,6 crianças do sexo masculino? (M=masculino; F=feminino). Distribuição de Poisson Distribuição de Poisson: é uma distribuição discreta de probabilidade, ela descreve a probabilidade dos números de ocorrências, num campo ou intervalo contínuo (normalmente tempo e espaço), de eventos bem raros. Exemplo: Uma determinada espécie possui um erro inato no metabolismo com uma incidência de 0,6 por mil espécies. Qual a probabilidade de encontrar 3 casos dessa anomalia numa amostra de mil espécies durante o ano de Distribuição Exponencial DISTRIBUIÇÃO EXPONENCIAL: é aplicada nos casos que queremos analisar o espaço ou intervalo de acontecimentos de um evento. Exemplo: Em uma grande rede corporativa de computadores, as conexões dos usuários ao sistema podem ser modeladas como um processo de Poisson, com média de 25 conexões por hora. Qual a probabilidade de não haver conexões em um intervalo de 6 minutos? Distribuição Normal Representada pela curva normal que tem forma de sino, ou seja, é unimodal e simétrica, e o seu valor de máxima frequência, a moda, coincide com o valor da média e da mediana. A média (μ) é o centro da curva e σ é o desvio-padrão da população, os valores da variável X são representados no eixo horizontal; a média de X é a projeção sobre o eixo do ponto de frequência máxima da curva. A distribuição normal padronizada é aquela na qual a média é (μ)=0 e o desvio padrão é (σ)=1, dessa forma, qualquer distribuição normal com média diferente de zero e desvio- padrão diferente de 1,0, pode ser transformada na normal padronizada Distribuição Normal Exemplo 1: Em uma distribuição de valores de glicose plasmática em jejum em homens normais entre 30 e 39 anos de idade, apresenta a média de μ=100 mg/dL e desvio-padrão σ=15 mg/dL. Qual a proporção de pessoas com glicose plasmática entre 100 e 120 mg/dL? 2º Passo: Na tabela você irá cruzar o intervalo de z=0 e z=1,33, e o valor que você irá obter é 0,4082, ou 40,82%. Então, a proporção de pessoas com concentração de glicose plasmática entre 100 e 200 mg/dL é de 0,4082, ou em torno de 41%. Distribuição Normal Exemplo 1: Em uma distribuição de valores de glicose plasmática em jejum em homens normais entre 30 e 39 anos de idade, apresenta a média de μ=100 mg/dL e desvio-padrão σ=15 mg/dL. Qual a proporção de pessoas com glicose plasmática entre 100 e 120 mg/dL? Distribuição de T de Student O valor de t é a medida do desvio padrão (σ) entre a média (X), estimada a partir de uma amostra aleatória de tamanho n, e a média (μ) da população, usando o erro-padrão da média (EP) como unidade de medida As propriedades da distribuição t de Student são: ➢ A média é igual a zero. ➢ As curvas t são simétricas em torno da média, tem forma de sino, porém mais achatadas. ➢ O intervalo da variável t é: (-∞ ) a (+∞). ➢ A distribuição de t não é descrita por uma única distribuição, mas por uma família de distribuições. Há uma curva t diferente para cada número de graus de liberdade da amostra (n-1). ➢ A variação de t é maior com amostras pequenas do que com as amostras grandes, quando n tende para o infinito (∞), o desvio-padrão (s) tenderá para o σ. ➢ A distribuição t tem como principais aplicações: a comparação de duas médias pelo teste t e estimação dos intervalos de confiança para média populacional. Para compreender melhor e aprofundar os conhecimentos dos assuntos desse tópico, acesse: • Vídeo sobre a distribuição amostral da média (https://youtu.be/iCeee5dx1BQ) • Este vídeo sobre a introdução as distribuições de amostragem (https://youtu.be/__PnlOAp3_s) • Este vídeo sobre a distribuição amostral da diferença das médias (https://youtu.be/-96UAzKnyNI) Interferência estatística Variáveis quantitativas Características que podem ser descritas por números • Variáveis discretas: a variável é avaliada em números que são resultados de contagens e, por isso, somente fazem sentido números inteiros. Exemplos: número de filhos, número de bactérias por litro de leite, número de cigarros fumados por dia. • Variáveis contínuas:a variável é avaliada em números que são resultados de medições e, por isso, podem assumir valores com casas decimais e devem ser medidas por meio de algum instrumento. Exemplos: massa (balança), altura (régua), tempo (relógio), pressão arterial, idade. Interferência estatística Variáveis qualitativas Características que não possuem valores quantitativos, representam uma classificação dos indivíduos • Variáveis nominais: não existe ordenação entre as categorias. Exemplos: sexo, cor dos olhos, fumante/não fumante, doente/sadio. • Variáveis ordinais: existe uma ordenação entre as categorias. Exemplos: escolaridade (1º, 2º, 3º graus), estágio da doença (inicial, intermediário, terminal), mês de observação (janeiro, fevereiro, …, dezembro). Interferência estatística Natureza Escalas estatísticas Os valores associados a cada variável podem ser classificados em escalas de medida, expressando a qualidade ou quantidade dos dados. • Escala nominal: atribui números às categorias apenas para identificá-las, os quais não têm significado quantitativo (1 para “Feminino” e 2 para “Masculino”). • Escala ordinal: atribui números às categorias indicando apenas a ordem, com o sentido de “mais que, maior que”; ou “menos que, menor que” (1 para “Criança”; 2 para “Adolescente”, e 3 para “Adulto”). • Escala intervalar: tem as características de uma escala ordinal, e as distâncias ou diferenças entre quaisquer dois números na escala têm significado. Podemos afirmar que uma medida é igual, maior ou menor e quantificar o valor dessa diferença. Nesse tipo de escala, a unidade de medida e a origem são arbitrárias (temperatura de um indivíduo é medida na escala Fahrenheit). • A escala de razão tem todas as características da escala intervalar e tem ponto zero verdadeiro. Neste tipo de escala, a razão entre quaisquer dois pontos independe da unidade de medida. As grandezas, tais como massa, comprimento, altura podem ser medidas com a escala de razão (altura medida em centímetros (cm)). Interferência estatística Escalas de medidas Interferência estatística Erro de observação Os erros estão ligados à aleatoriedade ou à incerteza modelada pela teoria da probabilidade • Erro sistemático: aquele que sempre ocorre com o mesmo valor quando se usa o instrumento da mesma maneira e no mesmo processo; pode ser causado por falhas do aparelho de medida, calibração incorreta. Também chamado de viés estatístico. Muitas vezes pode ser reduzido por meio de processos padronizados. O uso dos instrumentos padrão da disciplina faz parte do ensino de toda ciência. • Erro aleatório: pode variar de uma observação para outra. O erro ou variação aleatória ocorre devido a fatores que não controlamos, seja porque esse controle seria muito caro, seja porque ignoramos esses fatores. O erro aleatório muitas vezes ocorre quando os instrumentos são empurrados para seus limites. Por exemplo, é comum as balanças digitais apresentarem um erro aleatório dos seus dígitos menos significativos. Arredondamento de números Quatro casas decimais: eliminaremos o algarismo 5 e acrescentaremos uma unidade à casa da esquerda: 2,3694. Três casas decimais: eliminaremos o algarismo 4 e não modificaremos o número da esquerda: 2,369. Duas casas decimais: eliminaremos o algarismo 9 e acrescentaremos uma unidade à casa da esquerda: 2,37. Para compreender melhor e aprofundar os conhecimentos dos assuntos desse tópico, acesse: • Vídeo sobre a inferência estatística - modulo 1:introdução (https://youtu.be/rS8Luw6pTio) • Vídeo sobre o intervalo de confiança para a média com desvio padrão da população desconhecido (https://youtu.be/fwAQyjPEB9Q) • Vídeo sobre o intervalo de confiança para a média com desvio padrão da população conhecido (https://youtu.be/1qPFz8lgSwc) • Vídeo sobre como aprender teste de hipóteses em 4 passos (https://youtu.be/vK_FBEwDidE) https://youtu.be/rS8Luw6pTio https://youtu.be/fwAQyjPEB9Q https://youtu.be/1qPFz8lgSwc https://youtu.be/vK_FBEwDidE