Buscar

Introdução à Estatística: Conceitos Básicos e Arredondamento de Dados

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 19 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 19 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 19 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Introdução a unidade de ensino
 Explorando a temática
Unidade 1 - Introdução à estatística
#115472783
#115472784
Introdução a unidade de ensino
https://student.ulife.com.br/Category/Index?lc=Th6qvdXwFpgQh6fYVaNfKQ==
Podemos entender o método estatístico como um processo para obter, apresentar e analisar características ou valores numéricos, identificando padrões que possibilitam a
tomada de decisão em situações de incerteza. Pode acreditar, se você aplicar o método estatístico para a análise e solução de problemas, muito rapidamente se tornará um
especialista de qualquer área do conhecimento! Num mundo real, completamente cercado de incertezas, ser capaz de identificar padrões de comportamento de pessoas,
projetos, produtos, serviços etc. pode transformá-lo num "mago".
Entretanto, antes de você se transformar num "mago", é necessário um entendimento adequado do método estatístico, que tem suas "armadilhas". Costumamos dizer que
Estatística não é Matemática... é muito mais "difícil". Na verdade, Estatística é uma das áreas da Matemática que, por sinal, é a Ciência cuja aplicação no mundo real
possibilitou ter uma vida incrivelmente confortável. Bom, quando afirmamos que "Estatística não é Matemática", queremos dizer que na Matemática que você aprendeu no
Ensino Fundamental e Médio, os problemas têm usualmente uma única forma de serem resolvidos e devem todos chegar ao mesmo resultado (uma única resposta correta). Na
Estatística, os problemas têm várias formas de serem resolvidos, podem chegar a resultados diferentes, e todos estão corretos! Isso ocorre porque a Estatística requer a
habilidade de considerarmos as coisas dentro de uma perspectiva probabilística, o que vai completamente contra a conceituação usual dos problemas em simplesmente
certo ou errado. Não buscaremos a "verdade absoluta", mas padrões de comportamento que nos possibilitarão tomar decisões com alto grau de confiança.
Para melhor entendermos o que será discutido, o método estatístico será dividido em quatro grandes áreas: 1. amostragem e coleta de dados; 2. análise exploratória de dados
(estatística descritiva); 3. teoria das probabilidades; e 4. decisão na presença de incerteza (inferência). A ideia por trás desta unidade é levar até você o conhecimento
fundamental que lhe permitirá entender a coleta de dados. Estudaremos conceitos fundamentais de Estatística, questões simples, mas essenciais para que tenhamos sucesso
nas outras etapas do método estatístico, que serão discutidas nas próximas unidades. Estes são os objetivos da Unidade 1:
a) apresentar conceitos básicos de Estatística e Probabilidades;
b) identificar as funções e os principais tipos de dados e de variáveis;
c) identificar e corrigir problemas de dados faltantes (missing);
d) configurar o Excel como instrumento de coleta de dados;
e) entender o sistema de endereçamento de células do Excel;
f) construir formulários de coleta de dados no Google Docs; e
g) enviar formulários de coleta de dados por meio de mala direta.
É crucial que você entenda os conceitos que serão discutidos nesta unidade. Sem o entendimento do que seja, por exemplo, uma variável, o seu tipo e a sua função na base de
dados, não há como você ser feliz nas outras etapas do processo!
Explorando a temática
https://student.ulife.com.br/Category/Index?lc=fmXC5HwLJYoNmaZpF91U4A==
Conceitos básicos 
 
Arredondamento de dados 
 
Muitas vezes, tanto em Estatística como em outras áreas do conhecimento ou mesmo em situações do dia a dia, quando trabalhamos com números é comum utilizarmos
algumas técnicas de arredondamento. Vamos às regras? 
Se o algarismo a ser eliminado for maior ou igual a 5, acrescentamos uma unidade ao primeiro algarismo que está situado à sua esquerda.
Exemplo: 25,637867 
Se vamos arredondar com duas casas decimais, o primeiro algarismo a ser eliminado é 7; logo, vamos acrescentar uma unidade ao algarismo 3, então: 25,64.
Se vamos arredondar com três casas decimais, o primeiro algarismo a ser eliminado é 8, e vamos acrescentar uma unidade ao algarismo 7, logo: 25,638.
E se o arredondamento for com quatro casas decimais, o primeiro algarismo a ser eliminado é 6, portanto, vamos acrescentar uma unidade ao algarismo 8, de modo que temos:
25,6379.
Em caso de arredondamento para número inteiro, o primeiro algarismo a ser eliminado é o 6, então vamos acrescentar uma unidade ao algarismo 5, e vai ficar 26.
Se o algarismo a ser eliminado for menor do que 5, não vamos alterar o algarismo da esquerda.
Exemplo: 154,273148 
Se vamos arredondar com duas casas decimais, o primeiro algarismo a ser eliminado é 3; logo, não vamos acrescentar uma unidade ao algarismo 7, então: 154,27.
Se vamos arredondar com três casas decimais, o primeiro algarismo a ser eliminado é 1, e vamos manter o algarismo 3, logo: 154,273.
Já se o arredondamento for com quatro casas decimais, o primeiro algarismo a ser eliminado é 4, portanto, não vamos acrescentar uma unidade ao algarismo 1, de modo que
temos: 154,2731.
Em caso de arredondamento para número inteiro, o primeiro algarismo a ser eliminado é o 2, então vamos manter o algarismo 4 e vai ficar 154.
Você sabe o que é população? E amostra? Vejamos o exemplo a seguir. 
Vamos supor que uma cozinheira esteja preparando dois litros de sopa.
Como ela sabe se a sopa está temperada?
Os dois litros de sopa formam a população, e se a cozinheira comer/provar toda a sopa estará fazendo um censo, o que geraria um absurdo do tipo "É, a sopa estava ótima!".
A cozinheira sabe que em experimentos baseados em ensaios destrutivos, quando a própria análise destrói o dado coletado, o censo é um absurdo. Na verdade, ela sabe que
censos, de modo geral, são inviáveis, muito caros e/ou muito demorados. Mais ainda, ela sabe que se usar uma pequena amostra cuidadosamente retirada, chamada amostra
representativa, poderá tomar decisões sobre toda a população envolvida no problema com um alto grau de confiança.
A cozinheira então retira uma pequena amostra, uma "pitada" da comida, prova-a e generaliza o resultado para toda a sopa. Isso é chamado de inferência: tomar decisões
sobre toda uma população com base em informações parciais de uma amostra (veja a Figura 1).
Entretanto, a cozinheira sabe que para fazer inferências válidas, ela deve tomar cuidado para não trabalhar com amostras viciadas. E o que seria isso?
Se ela retirar uma amostra somente da parte de cima da sopa, muito provavelmente terá uma amostra viciada, isto é, sem representantes de todos os componentes da sopa
como um todo que, nesse caso, é a população amostrada.
E como ela retira uma amostra representativa da sua população ("sopa")? Como a cozinheira procede para obter uma amostra com "representantes" de cada estrato da sopa?
Simples, ela mistura a sopa fazendo uma homogeneização e sorteia uma porção/pitada que será usada no seu processo decisório. Fazendo uma amostragem aleatória, a
cozinheira sabe que terá grande chance de trabalhar com amostras representativas.
Podemos agora resumir esses conceitos.
População: 
a. consiste na totalidade das unidades de observação a partir dos quais ou sobre os quais deseja tomar uma decisão;
b. conjunto de elementos que formam o universo do nosso estudo e que são passíveis de serem observados;
c. conjunto de indivíduos sobre os quais recairão todas as generalizações das conclusões obtidas no estudo;
d. usualmente, as unidades de observações são pessoas, objetos ou eventos;
e. é o universo a ser amostrado;
f. do ponto de vista matemático, a população é definida como um conjunto de elementos que possuem pelo menos uma característica em comum (SILVA, 2001). 
População finita: o número de unidades de observação pode ser contado e é limitado.
Exemplos:
a. alunos matriculados na disciplina Estatística e Probabilidades;
b. todas as declarações de renda recebidas pela Receita Federal;
c. todas as pessoas que compram telefone celular num determinado ano;
d. um lote com N produtos.
População infinita: a quantidadede unidades de observação é ilimitada, ou a sua composição é tal que as unidades da população não podem ser contadas.
 
Exemplos:
a. conjunto de medidas de determinado comprimento;
b. gases, líquidos e alguns sólidos em que as suas unidades não podem ser identificadas e contadas.
Amostra: conjunto de unidades selecionadas de uma população, ou seja, uma parte dos elementos da população.
Amostra representativa: é uma versão em miniatura da população, exatamente como ela é, somente menor. A amostra representativa segue o modelo populacional, tal que
suas características importantes são distribuídas similarmente entre os dois grupos.
Unidade amostral: é a menor parte distinta de uma população, identificável para fins de seleção e construção da amostra.
Amostra aleatória: é aquela obtida por meio de um processo de sorteio ou aleatorização.
Amostra viciada: é aquela que representa apenas parte da população, não possuindo elementos de todos os estratos ou subconjuntos que formam a população como um todo.
Censo: exame de todas as unidades de observação de uma população. Como discutido no exemplo da cozinheira, se a pesquisa envolve ensaio destrutivo, o censo é inviável.
Na verdade, somente se a população-alvo for pequena é razoável observá-la por inteiro por meio do censo, pois mesmo quando viáveis, censos são caros e demorados. Outros
exemplos de ensaios destrutivos, nos quais é impossível aplicar censo, são: pesquisa sobre a força de tração de um lote de barras de aço para construção; pesquisa sobre
contaminação de soro fisiológico em um lote; testes de resistência e durabilidade de um lote de concreto; tempo gasto ao pegar um lote de cimento. 
Amostragem: processo pelo qual uma amostra de unidades da população é retirada e observada. É a parte mais importante do processo de pesquisa. O principal e
fundamental objetivo de qualquer plano de amostragem é selecionar a amostra de tal maneira que ela retrate fielmente a população pesquisada. 
Figura 1 - População-alvo, população amostrada e amostra 
 
 
Fonte: Elaborada pelo autor. 
 
 
 
Inferir significa generalizar resultados de uma amostra para toda a população. 
Por que usar amostras? Por que não incluir no estudo todos os indivíduos da população?
A amostragem deve ser usada porque torna o processo eficiente e preciso. E ela é eficiente, uma vez que o recurso que poderia ser despendido na coleta de dados
desnecessários de um grande número de indivíduos pode ser gasto em outra atividade, como na monitoração da qualidade da própria coleta dos dados. As amostras, por serem
menores do que a população, podem ser estudadas mais rapidamente do que censos e são também mais baratas. Além disso, se o processo de amostragem gerar uma
amostra representativa da população-alvo do estudo, os resultados observados poderão ser generalizados, sem risco de chegar a uma conclusão diferente daquela que seria
obtida se trabalhássemos com toda a população. 
 
 
 
Videoaula: Conceitos básicos
 
Técnicas de amostragem 
Existem algumas técnicas para a determinação da amostragem, das quais vamos destacar as que são mais usuais. Confira!
Amostragem casual ou aleatória simples: qualquer elemento pertencente à população estudada deve ter a mesma chance de ser selecionado. Como o nome indica, a
escolha da amostra deve ser aleatória, por meio de sorteio.
Assim, listamos ou numeramos todos os elementos da população a ser analisada e, então, selecionamos a amostra por meio de sorteio. Como esse processo pode ser
trabalhoso, costumamos utilizar tabelas que já existem para essa finalidade, chamadas tabelas de números aleatórios.
Amostragem proporcional estratificada: nesta técnica, a população é considerada como estratos, ou seja, dividida em subconjuntos, de modo que cada um deles tenha
características comuns entre os seus elementos. O objetivo é dividir a população em subgrupos de elementos com características semelhantes.
É utilizada quando todos os elementos da população podem ser divididos em grupos homogêneos em relação à característica que se quer medir. Assim, conhecendo-se o
tamanho da população, calcula-se a "fração de amostragem", e a amostra será proporcional aos estratos da população.
Por exemplo: 
1º) Uma empresa de informática tem 460 funcionários, dos quais 278 são do sexo feminino e 182 masculino. Considerando a variável sexo para estratificar essa população, foi
selecionada uma amostra proporcional estratificada de 50 funcionários. Calcule a proporção de funcionários de cada sexo contida na amostra.
Resposta: para manter a proporcionalidade, utilizaremos uma regra de três simples.
 
Acompanhe: 
Sexo feminino 
Conceitos básicos
from EAD ANIMA
07:08
#%23NOTIFICATIONITEMPAGEURL%23%23
https://vimeo.com/animaead
https://vimeo.com/animaead
460 → 278 
50 → x 
x = 30,217 ≈ 30
Sexo masculino 
460 → 182 
50 → x 
x = 19,782 ≈ 20 
 
 
 
 
 
 
Nas amostras, vamos trabalhar com valores inteiros, então é preciso utilizar os critérios de arredondamento já abordados acima. Não faz sentido trabalhar com uma amostra de
30,217 mulheres, por exemplo. 
Isso quer dizer que deverão fazer parte da pesquisa 30 mulheres e 20 homens. Observe a proporcionalidade: 
 e 
 e 
 
Isso indica que a amostra selecionada é proporcional à quantidade de funcionários de cada sexo.
2º) Numa certa universidade há um total de 3000 alunos, sendo 1500 do curso de Engenharia Civil, 1000 do curso de Engenharia Mecânica e 500 do curso de Engenharia
Química. Considerando a variável aluno para estratificar essa população, foi selecionada uma amostra proporcional estratificada de 250 alunos. Calcule a proporção de alunos de
cada curso contida na amostra. 
Resposta: para manter a proporcionalidade, utilizaremos uma regra de três simples. 
 
Acompanhe: 
Engenharia Civil 
3000 → 1500 
250 → x 
x = 125 
Engenharia Mecânica 
3000 → 1000 
250 → x 
x = 83,33 ≈ 83
Engenharia Química 
3000 → 500 
250 → x 
x = 41,67 ≈ 42
Amostragem sistemática: é um método que oferece procedimento para a amostragem aleatória, utilizado para situações em que os elementos da população já estão
ordenados.
Como selecionar os elementos de uma amostra sistemática de uma população? Basta seguir os seguintes passos:
I (intervalo de seleção) I = N / n
Sendo que N é o tamanho da população e 
n o tamanho da amostra (n < N) 
m → posição do 1º elemento da amostra, obtido por sorteio (é importante destacar que m deve ser um número menor ou igual a I) 
m + I →posição do 2º elemento da amostra 
m + 2I → posição do 3º elemento da amostra 
(...) 
m + (n - 1).I →posição do último elemento da amostra 
Acompanhe alguns exemplos. 
1º) Uma empresa tem um banco de dados com 4000 clientes cadastrados e decidiu fazer uma pesquisa com esses clientes para saber quais produtos novos eles querem. Para
tal, será escolhida uma amostra sistemática de 500 clientes.
a) Determine os números dos quatro primeiros clientes que participarão da pesquisa, sabendo que o primeiro cliente (obtido por sorteio) seja o de número 7.
b) Qual é o número do último cliente selecionado? 
Resposta: 
N = 4000 e n = 500, 
Logo, I = 4000/500 = 8, ou seja, a cada 8 clientes para participar da pesquisa.
a) O 1º elemento da amostra: 7 (determinado por sorteio, e é menor do que I);
o 2º elemento da amostra: m + I = 7 + 8 = 15; 
o 3º elemento da amostra: m + 2.I = 7 + 2.8 = 7 + 16 = 23; 
o 4º elemento da amostra: m + 3.I = 7 + 3.8 = 7 + 24 = 31. 
b) O último elemento da amostra: 
m + (n - 1).I = 7 + (500 - 1) . 8 = 7 + 499 . 8 = 7 + 3992 = 3999. 
2º) Uma faculdade tem 3500 alunos e pretende fazer uma pesquisa com uma amostra sistemática de 310 alunos.
a) Sabendo que o primeiro aluno sorteado é de número 10, determine os cinco primeiros alunos que participarão da pesquisa.
b) Qual é o número do último aluno selecionado?
Resposta: N = 3500 e n = 310. 
Portanto: I = 3500/310 = 11,29. 
a) 1º elemento: 10 (que é menorque I); 
2º elemento: 10 + 11,29 = 21; 
3º elemento: 10 + 2. 11,29 = 10 + 22,58 = 32,58 = 33; 
4º elemento: 10 + 3. 11,29 = 10 + 33,87 = 43,87 = 44; 
5º elemento: 10 + 4. 11,29 = 10 + 45,16 = 55,16 = 55. 
b) O último elemento: 10 + (310 - 1). 11,29 = 10 + 309 . 11,29 = 10 + 3488,61 = 3499. 
Amostragem de conglomerados: é representado por um grupamento de elementos da população. Tende a produzir uma amostra que gera resultados menos precisos, quando
comparamos com a Amostragem Simples. Para a área Financeira, em grandes populações as amostras produzem um custo bem menor. 
Por exemplo: 
1º) Avaliar a qualidade das maçãs de um caminhão que chega a um setor de distribuição de frutas, as caixas de maçãs são os conglomerados. No primeiro estágio e num
segundo estágio, aleatoriamente, escolhemos dos conglomerados amostras de elementos.
2º) Num conjunto habitacional de uma cidade, os conglomerados são os quarteirões de casas.
Amostragem por conveniência: consiste em selecionar uma amostra disponível. É uma amostragem rápida e de menor custo. Mas corremos o risco de gerar uma resposta
não representativa, pois devemos tomar cuidado com características específicas dos indivíduos (e outros dados) para a pesquisa.
Por exemplo: 
1º) Em estudos clínicos, indivíduos voluntários com certas características específicas (diabetes etc.) candidatam-se a participar de uma pesquisa em laboratório.
2º) Na indústria alimentícia, pessoas que se prontificam voluntariamente a testar certo produto. Dependendo do produto, as pessoas devem ter características específicas, como
idade, esportista ou não etc.
Vejamos agora alguns aspectos relevantes para o campo da amostragem.
Questões da amostragem: qual é o tamanho da amostra? Como a amostra será obtida? Como garantir que a amostra obtida seja representante da população objeto do
estudo? A questão mais importante não é o seu tamanho, mas como a amostra será obtida, pois a amostragem mal feita invalida qualquer pesquisa.
Tamanho da amostra (n): está relacionado ao total de unidades amostradas, usadas no processo de inferência. Certamente, você está curioso em relação ao tamanho
da amostra, porém, como citado anteriormente, esta não é de longe a questão mais importante. Por exemplo, o que você acha que teria mais credibilidade numa
pesquisa sobre a aceitação (ou não) do aborto por parte da população brasileira: resultados de pesquisa realizada no domingo à noite por uma emissora de TV,
envolvendo milhões de pessoas que, após assistirem a uma reportagem sobre o assunto, responderam à pesquisa; ou resultados de uma amostra de 2.500 pessoas
selecionadas aleatoriamente no território brasileiro?
No entanto, esta não é uma questão muito importante para obtermos o tamanho da amostra adequada para uma pesquisa, visto que é necessário estudarmos alguns conceitos
probabilísticos, que serão apresentados somente nas próximas unidades.
 
A maioria das pessoas, quando questionadas sobre qual é o tamanho da amostra necessária para uma pesquisa, tem o raciocínio equivocado de que o tamanho da amostra
(n) tem relação direta com o tamanho da população amostrada (N). Inevitavelmente, a maioria das pessoas afirma erroneamente que uma boa amostra deve conter pelo
menos, digamos, 30% da população. O que a cozinheira diria sobre isso? Para provar dois litros de sopa, quanto de amostra ela teria que avaliar? Isso mesmo, uma pitada. E
para provar 400 litros de sopa, ela beberia um prato inteiro? Não. Ela provará a mesma pitada, pois sabe que o mais importante nesse processo inferencial não é o tamanho da
amostra, mas provar uma amostra não viciada, representativa de toda a sopa. 
Voltando aos processos de amostragem, as amostras podem ser classificadas em probabilísticas e não probabilísticas.
Amostra probabilística: 
existe uma garantia, em termos de probabilidade, de que qualquer membro da população possa ser selecionado para amostra.
Amostra não probabilística: 
os elementos da amostra não são escolhidos por meio de um sorteio.
Carvalho e Couto (2003) apresentam as principais características de tipos de amostragem mais comuns, relacionados principalmente com pesquisas de survey. Outras
amostras, por exemplo, amostragem de minério, de solo, de gases e de líquidos, têm procedimentos próprios que buscam, em última instância, obter amostras que sejam
representativas de cada população envolvida. Em suma, qualquer que seja o esquema de amostragem, probabilístico ou não, devemos sempre garantir que a amostra reflita as
características da população da qual foi retirada. 
 
 
 
 
 
Conforme discutido anteriormente, algumas pessoas acreditam que numa amostra representativa é necessário coletar dados de um percentual mínimo da população, digamos,
30% do total de indivíduos. Isso é absolutamente falso. E o que é pior, mesmo que fosse analisado tal percentual de indivíduos da população, não é o tamanho que garante a
representatividade da amostra, mas a forma como ela é obtida. É a imparcialidade do processo de seleção dos seus elementos e a homogeneidade da distribuição das
características da amostra e da população que garantem a representatividade da amostra. 
 
Vídeoaula: Técnicas de amostragem 
 
 
 
O papel das variáveis numa base de dados: identificação, auxiliares, variáveis explicativas e variável reposta (desfecho) 
O primeiro passo de qualquer processo estatístico é a coleta de dados. Portanto, tudo o mais será alicerçado sobre o que for coletado. Sendo assim, essa fase deve ser
cuidadosamente planejada, já que da qualidade dos dados coletados dependerá toda a análise e a tomada de decisão subsequente.
Antes da coleta de um dado, é importante entender o conceito de variável que está por trás da informação que você procura. A variável contém a informação que você quer
analisar, sob a forma de uma medição sobre determinadas características dos indivíduos estudados e das unidades de observação.
E por que esse conceito é tão importante? Porque, no fim das contas, é a variável que é analisada, e não a informação que ela contém. Por isso, é importante que você, antes
de sair coletando informações, analise o seu questionário de coleta de dados, identifique cada variável envolvida e responda a perguntas como: o que exatamente a variável está
medindo? Para que serve essa variável, e, principalmente, é possível analisá-la? E com que método estatístico? 
 
Uma variável é a quantificação de uma característica de interesse da pesquisa (SOARES; SIQUEIRA, 2002). Refere-se ao fenômeno a ser pesquisado. É o campo de variação
de cada tipo de dado a ser pesquisado. Observe que, como o próprio nome diz, uma variável deve variar, ou seja, se você está coletando dados sobre características de alunos
da disciplina Cálculo Diferencial, podemos pensar em inúmeras variáveis para a unidade de observação "aluno": idade, sexo, curso, local do Ensino Médio, tempo entre final do
Ensino Médio e início da graduação, nota final, percentual de presença às aulas etc. Entretanto, o tipo de disciplina não é uma variável nesse caso, pois ela é constante
(Cálculo Diferencial). 
 
O grau de variabilidade de uma variável é chave no método estatístico e será foco de discussões nas próximas unidades. Contudo, neste momento, é crucial que você
entenda dois aspectos básicos de qualquer variável: o seu tipo e a sua função, o papel que ela exerce na base de dados. 
 
 
 
 
 
Técnicas de amostragem
from EAD ANIMA
08:59
#%23NOTIFICATIONITEMPAGEURL%23%23
https://vimeo.com/animaead
https://vimeo.com/animaead
Toda análise que será feita na base de dados dependerá do seu entendimento sobre o tipo e a função de cada variável coletada! 
 
 
 
 
Vejamos os tipos de funções de cada variável. 
QUADRO 1 - O papel de uma variável numa base de dados 
 
Fonte: Elaborado pelo autor.
Por exemplo: 
1º) Uma família composta de um casal e dois filhos precisa alugar um imóvel (variável de identificação).
Para isso, eles precisam que o imóveltenha:
bom preço;
boa localização;
três quartos;
garagem para dois carros.
São variáveis explicativas que vão influenciar a variável resposta ou desfecho. 
O imóvel que a família vai escolher para alugar será aquele com todas as condições acima (variável resposta ou desfecho).
2º) Uma pessoa está com uma doença (variável de identificação). A evolução da doença (variável explicativa). A variável resposta ou desfecho é a cura ou a morte da pessoa.
A função de cada variável na base de dados, assim como o seu tipo, definirá que tipo de análise será feita. Não subestime esses conceitos, pois sem eles não há como
entender os métodos de análise estatística que serão estudados nas próximas unidades. 
 
Vídeoaula: Variáveis de identificação, auxiliares,explicativas e resposta (desfecho)
#%23NOTIFICATIONITEMPAGEURL%23%23
 
Tipos de variáveis 
Se considerarmos a maioria absoluta das variáveis envolvidas em experimentos de pequeno e médio porte nas áreas de Ciências Exatas e Engenharia, teremos duas situações
para o tipo da variável. 
I) Variável qualitativa ou categórica: é aquela que expressa características ou atributos de classificação, distribuídos em categorias mutuamente exclusivas de objetos
ou entidades. Categorias mutuamente exclusivas ou mutuamente excludentes não podem ser observadas simultaneamente num mesmo indivíduo. Por exemplo, grupo
sanguíneo (A, B, AB, O) é uma variável categórica mutuamente exclusiva: um indivíduo tem somente um grupo sanguíneo, não podendo ser classificado em mais de uma
categoria ao mesmo tempo. Variáveis qualitativas têm um nível baixo de informação, sendo obtidas por um critério de classificação.
E podem ser divididas conforme você pode ver a seguir.
Ordinal: quando representam alguma ordem. 
Por exemplo, viagens de uma pessoa ao longo da vida (primeira, segunda, ...), classificação de objetos (pequeno, médio ou grande); grau de uma doença (fraco, moderado ou
alto) etc. 
Nominal: quando representadas por palavras, categorias ou gêneros. 
Por exemplo, sexo (masculino, feminino), estado civil (com companheiro, sem companheiro), cor de um produto (branco, verde, amarelo, azul), tipo de transmissão de um
carro (manual, automática), conformidade de qualidade de um produto (aceito, não aceito), dia chuvoso (sim, não), resultado final de um aluno numa disciplina (aprovado,
reprovado) etc. 
A análise de uma variável categórica é muito restrita e simples: conta-se quantas unidades amostrais ou resultados observados há em cada categoria da variável e calcula-se o
percentual de ocorrência de cada classe ou categoria. 
II) Variável quantitativa: é aquela obtida por meio de um processo de medição ou contagem.
A variável quantitativa possui o mais alto nível de informação, sendo objeto de inúmeras técnicas de análise. Para cada variável quantitativa, podemos calcular seu valor
médio, mediano, modal, mínimo, máximo, seu desvio padrão, coeficiente de variação, intervalos específicos de variação e outras técnicas analíticas que serão descritas na
próxima unidade.
As variáveis quantitativas são chamadas também de numéricas, mas essa nomenclatura pode gerar confusão, pois o simples fato de alocar números aos resultados de uma
variável não a torna quantitativa. Por exemplo, se os grupos sanguíneos fossem classificados em 1, 2, 3 e 4 (em vez de A, B, AB e O), tal codificação não a tornaria uma variável
quantitativa. Na verdade, para que uma variável seja quantitativa, deve ser possível aplicarmos operações aritméticas aos seus resultados. A capacidade de realizarmos, por
exemplo, somas e subtrações "válidas" aos resultados de uma variável é um indicativo de que ela é quantitativa. É claro que a análise do seu processo de obtenção é mais
importante: os resultados de uma variável quantitativa devem ser obtidos por medição ou contagem. Além disso, essas variáveis podem ser de dois tipos, como você pode
ver a seguir. 
Variáveis de identificação, auxiliares,explicativas e resposta (desfecho)
from EAD ANIMA
02:54
#%23NOTIFICATIONITEMPAGEURL%23%23
https://vimeo.com/animaead
https://vimeo.com/animaead
Contínuas: quando representadas por números reais.
Por exemplo: peso, altura, dosagem e concentrações de produtos químicos e outros insumos, temperatura, pressão, altitude, umidade, largura, diâmetro, comprimento,
voltagem, corrente, quantidade de chuva (mm) etc.
Discretas: quando representadas por números inteiros.
Por exemplo: número de falhas, número de ligações telefônicas, número de mensagens eletrônicas, número de faltas de um aluno numa disciplina etc.
Usualmente, se ela é obtida por medição, então é contínua. Caso seja obtida por meio de contagem, é uma variável discreta.
Algumas variáveis são originalmente de classificação. As notas obtidas por um aluno numa prova são tratadas como quantitativas, mesmo que não sejam obtidas por meio de
um aparelho ou dosador. Nesse caso, a nota de uma prova é tratada como variável quantitativa porque considera-se válido aplicar operações aritméticas aos seus resultados.
Entretanto, será que um aluno que obtém 80 pontos numa disciplina sabe o dobro que um aluno que obteve 40 pontos? Claro que não. Já uma pessoa de 100 Kg tem o dobro de
peso de uma pessoa de 50 Kg. Outro exemplo, as temperaturas medidas em Graus Celsius são tratadas como variáveis quantitativas. Isso quer dizer que um dia com 40ºC tem
o dobro de calor de um dia com 20ºC? Transforme os valores em Graus Celsius para Kelvin e compare o resultado. 
Bom, os conceitos por trás dessa discussão envolvem o nível de mensuração da variável (nominal,
ordinal, intervalar e de razão) que será tratado a seguir. Para efeito prático, consideraremos somente duas categorias de variáveis: quantitativas versus qualitativas
(categóricas). Conforme citado anteriormente, esses são os tipos de variável coletados em problemas típicos de Ciências Exatas e de Engenharia.
Por exemplo: 
1º) Para uma população de funcionários de uma Empresa, foi investigado o valor do salário de cada um deles para efeito de cálculo de média salarial. Essa variável pode ser
classificada como você pode ver a seguir. 
Alternativas: 
(A) Qualitativa Ordinal 
(B) Quantitativa Discreta 
(C) Quantitativa Contínua 
(D) Qualitativa Nominal 
(E) Qualitativa Contínua 
Resposta: 
(C) Quantitativa Contínua (salário médio é mensurado, então é uma variável quantitativa e um valor real contínuo)
2º) Classifique as variáveis em quantitativa discreta, quantitativa contínua, qualitativa ordinal ou qualitativa nominal.
a) Altura 
b) Peso 
c) Religião 
d) Cidade natal 
e) Estado civil 
f) Número de carros emplacados 
g) Bairro onde mora 
h) Volume 
i) Número de funcionários de uma empresa 
j) Marcas de eletrodomésticos 
Resposta: 
a) Quantitativa contínua, pois podemos medir, e os valores são reais.
b) Quantitativa contínua, pois podemos medir, e os valores são reais.
c) Qualitativa nominal, pois a variável é uma palavra: católica, protestante etc.
d) Qualitativa nominal, pois a variável é uma palavra: Osasco, Joinville etc.
e) Qualitativa nominal, pois a variável é uma palavra: solteiro, casado, divorciado etc.
f) Quantitativa discreta, pois podemos medir, e os valores são inteiros (cada carro).
g) Qualitativa nominal, pois a variável é uma palavra: Boa Vista etc.
h) Quantitativa contínua, pois podemos medir, e os valores são reais.
i) Quantitativa discreta, pois podemos medir, e os valores são inteiros (cada funcionário).
j) Qualitativa nominal, pois a variável é uma palavra: Britânia, Arno etc.
Videoaula: Tipos de variáveis
 
Uso do Excel como um sistema de gerenciamento de dados e dos formulários do Google Docs para coleta de informações. 
Duas ferramentas essenciais para coleta de dados de experimentos de pequeno e médio porte na área de Ciências Exatas e Engenharia são o Excel, um dos componentes do
pacote Office da Microsoft, e os Formulários do Google Docs <https://docs.google.com/forms>.O Excel é uma planilha eletrônicacom origens no Lotus 1-2-3 (GAZZARRINI,
2013). As duas ferramentas são extremamente práticas, de grande utilidade e serão discutidas por meio de videoaulas.
Os formulários do Google Docs são ótimos para pesquisas envolvendo pessoas que têm endereço eletrônico (e-mails). Para usá-los, você terá que obter uma lista com os
nomes dos respondentes e os respectivos e-mails. Após construir o formulário de coleta de dados no Google Docs, você poderá enviá-lo usando o mecanismo de "mala direta",
da aba "correspondências" do Word, que também é parte do pacote Office da Microsoft. As respostas enviadas pelos respondentes são automaticamente armazenadas em
planilha eletrônica, facilitando a coleta e a análise dos dados.
É crucial que você domine o Excel como instrumento de coleta de dados e entenda perfeitamente o papel de cada variável a ser coletada. Identificar variáveis explicativas e
desfecho(s) e distinguir entre variável quantitativa e categórica não é algo difícil, mas fundamental para as discussões que serão feitas nas próximas unidades.
Tipos de variáveis
from EAD ANIMA
03:43
#%23NOTIFICATIONITEMPAGEURL%23%23
https://docs.google.com/forms
https://vimeo.com/animaead
https://vimeo.com/animaead
 
Para que você possa treinar, faça os exercícios referentes a esta unidade.
1- Qual é a importância da Estatística Descritiva no processo de análise dos dados estatísticos?
2- Numa grande comunidade do Norte do Brasil, deseja-se fazer uma pesquisa da porcentagem de pessoas que contraíram uma doença contagiosa. Nessa situação, os
pesquisadores devem utilizar o censo ou a amostragem? Por quê?
3- Foi tomada uma amostra de um grupo de estudantes de certo curso de graduação para verificar o conhecimento desses alunos sobre o conteúdo de determinada disciplina.
Os estudantes foram selecionados ao acaso, prestaram um exame e obtiveram as notas indicadas na tabela a seguir, em que também é indicado o sexo do aluno. 
 
 
a) Quais são as variáveis obtidas? 
b) Quais são os tipos (qualitativa ou quantitativa) dessas variáveis? 
c) Para essa situação, descreva qual é a população. Qual é a amostra? 
4- Em uma pesquisa, o pesquisador decidiu fazer as perguntas relacionadas a seguir. 
 
 
O Brasil é o país mais democrático da América Latina. 
(1) Concordo totalmente. 
(2) Concordo parcialmente. 
(3) Discordo totalmente. 
Classifique as variáveis formadas a partir das respostas fornecidas às perguntas em quantitativa discreta, quantitativa contínua, qualitativa ordinal ou qualitativa nominal.
5 - Variável é a característica de interesse que é medida em cada elemento da amostra ou população. Em todas as situações de interesse prático que consideramos, queremos
estudar o comportamento de uma ou mais variáveis. Toda análise dependerá do entendimento sobre a função de cada variável coletada. Por exemplo: numa pesquisa para
explicar por que vinhos possuem classificações diferentes com uvas do mesmo tipo. Associe as colunas e determine a sequência correta.
Funções:
1- variáveis de identificação 
2- variáveis explicativas 
3- variável desfecho
( ) região de plantio 
( ) tipo de cultivo e fabricação 
( ) classificação do vinho 
6- Do texto retirado do Ibram (Instituto Brasília Ambiental) sobre Bioma Cerrado, que fala sobre fauna, vegetação, formações vegetais, formações savânicas, formações
campestres e estado de conservação. 
Considerando essas seis variáveis em negrito, responda quais são as variáveis explicativas e variável(is) resposta(s).
7 - Considere o artigo "Utilização de efluente de frigorífico, tratado com macrófita aquática, no cultivo de tilápia do Nilo", de autoria de Adilson Reidel e outros pesquisadores da
Universidade Estadual do Oeste do Paraná.
Nesse trabalho, os pesquisadores fizeram um experimento em que, resumidamente, foram colocadas amostras aleatórias de alevinos ("filhotes") de tilápia em aquários com
água potável (tratamento A) e em tanques com efluente de frigorífico após passar num sistema de filtro com aguapé (tratamento B), avaliando-se comparativamente o
desenvolvimento e a sobrevivência dos peixes. A pergunta principal da pesquisa era: "É possível cultivar tilápias em efluente de frigorífico tratado com aguapé?" 
Nas tabelas 1 e 2 do artigo, são apresentados alguns resultados e um conjunto de variáveis envolvidas na pesquisa. 
 
TABELA 1 - Valores médios dos parâmetros físico-químicos determinados durante o cultivo da tilápia do Nilo (O.niloticus) 
 
 
 
Fonte: REIDEL et al, 2005. 
 
TABELA 2 - Valores médios de desempenho e sobrevivência de alevinos de tilápia no Nilo, cultivados com água potável e efluente tratado 
 
Fonte: REIDEL et al, 2005. 
 
Respostas: 
1- A Estatística Descritiva tem como principal função resumir os dados e informações investigadas, com o objetivo de expor a estes do modo mais fácil possível. É a parte mais
conhecida da Estatística, representada pelas médias, índices e gráficos presentes nas notícias que circulam pelos jornais, revistas, televisão, sites etc.
2- Amostragem, pois como se trata de uma grande população, analisar o número de pessoas contagiadas levaria muito tempo e seria de alto custo. Além disso, são muitas
variáveis a serem consideradas, o que pode modificar a população original e invalidar o censo.
3- a) As variáveis são: sexo e nota. 
b) Qualitativa: sexo; quantitativa: nota. 
c) População: estudantes de um curso de graduação; amostra: os 20 alunos que foram selecionados para a pesquisa. 
4- Qualitativa: letras a, c, d, f, g, i. 
Qualitativa: letras b, e, h. 
5- (1), (2), (3). 
6- Variáveis explicativas: fauna, vegetação, formações vegetais, formações savânicas e formações campestres.
Variável resposta (desfecho): estado de conservação
7- Esse é um exemplo prático da aplicação de conceitos discutidos na Unidade 1 em experimentos de pequeno e médio porte na área de Ciências Exatas e de Engenharia. O
experimento é baseado em amostragem e analisa o impacto de variáveis explicativas em desfechos diretamente ligados ao objetivo do projeto: sobrevivência dos peixes, peso e
biomassa final no aquário.
Nesse trabalho, são usadas três variáveis-resposta, uma categórica ("O peixe sobreviveu?"; sim ou não) e dois desfechos quantitativos (peso final e biomassa final, medidos em
gramas). Entre as variáveis explicativas envolvidas, a mais importante, que está diretamente ligada ao objetivo da pesquisa, é o tipo de tratamento (A versus B), uma variável
categórica dicotômica (variável que possui duas categorias: sim ou não).
Muitas pessoas têm dificuldade de identificar essa variável explicativa, apesar de ela ser a mais importante na pesquisa. As outras variáveis explicativas são todas quantitativas
e, como tal, foram obtidas por meio de um processo de medição, contagem ou dosagem: temperatura (ºC), oxigênio Dissolvido (mg L-1), condutividade Elétrica (μS cm-1), pH,
peso inicial (g) e biomassa inicial (g).
Nas tabelas apresentadas, aparecem métricas (média, desvio padrão e valor de t de student) que são usadas na análise e na conclusão do projeto. Fique tranquilo, esses
conceitos serão tratados nas próximas unidades!
De qualquer forma, a conclusão da pesquisa para a pergunta "É possível cultivar tilápias em efluente de frigorífico tratado com aguapé?" é: "Sim, é possível cultivar tilápias em
efluente de frigorífico tratado com aguapé. Os dados não mostraram diferença significativa entre os dois tratamentos, tanto em relação ao desenvolvimento quanto à
sobrevivência dos peixes". 
O entendimento completo das razões para chegar a essa conclusão será obtido nas próximas unidades. Entretanto, neste momento, é fundamental que você já entenda
conceitos referentes ao processo de amostragem/coleta de dados e, principalmente, que consiga diferenciar os tipos e as funções das variáveis numa pesquisa. 
 
 
 
 
REFERÊNCIAS 
CARVALHO, D. H.; COUTO, B. R. G. M. Levantamentos por amostragem ou pesquisas de survey. Relatório técnico DCET, n.3, 2003.
GOVERNO DE BRASÍLIA. Ibram. Bioma Cerrado. 2018. Disponível em: <https://www.ibram.df.gov.br/informacoes/meio-ambiente/bioma-cerrado.html>. Acesso em: 08 fev. 2018.
REIDEL, A. et al. Utilização de efluente de frigorífico, tratado com macrófica aquática, no cultivo da tilápia do Nilo. R. Bras. Eng. Agríc. Ambiental, v. 9. (Suplemento). Campina
Grande, PB, 2005.
SOARES, J. F.; SIQUEIRA, A. L. Introdução à Estatística Médica. Belo Horizonte: UFMG, 2002.

Continue navegando

Outros materiais