Buscar

Aula 1. Estatística Descritiva

Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original

Bioestatística
Eduardo Fernandes Santana
Estatística no Dia a Dia
01
Cálculos de possibilidade de vitórias de um time num jogo de futebol.
Estatística no Dia a Dia
01
Relação candidato-vaga de um vestibular ou concurso público.
Estatística no Dia a Dia
01
Eleições.
Estatística no Dia a Dia
01
Teste de DNA relativo à paternidade de uma criança tem estatisticamente 99% de probabilidade de confirmar quem é o verdadeiro pai.
Estatística no Dia a Dia
01
Na Faculdade, nos cálculos de médias do semestre, ou ainda na média para prova final..
Estatística no Dia a Dia
01
Aceitação de um novo produto de mercado, através de pesquisas prévias.
Estatística no Dia a Dia
01
Problemas de visão nos homens!
Estatística no Dia a Dia
01
Estatística no Dia a Dia
Problemas de visão nos homens!
100% dos homens não enxergam o gorila ao lado!!!!
01
Aplicações da Estatística
ÁREA SOCIAL: Pesquisa de Opinião.
ÁREA DE SAÚDE: Medicamentos Genéricos e Epidemias de doenças infecto contagiosas como a meningite.
ÁREA INDUSTRIAL: Controle de Qualidade.
ÁREA FINANCEIRA: Investimento no mercado financeiro.
Conceito de Estatística
Conceito de Estatística
A palavra Estatística tem origem do latim, status (estado) - informações referentes ao Estado.
Ferramenta ou método que ajuda na interpretação e análise de grandes conjuntos de números.
Conjunto de instrumentos que podem ser utilizados para recolher, classificar, apresentar e interpretar conjunto de dados numéricos.
Ciência que se preocupa com a Coleta, Organização, Descrição, Análise e Interpretação de Dados Experimentais..
A palavra Estatística tem origem do latim, status (estado) - informações referentes ao Estado.
Ferramenta ou método que ajuda na interpretação e análise de grandes conjuntos de números.
Conjunto de instrumentos que podem ser utilizados para recolher, classificar, apresentar e interpretar conjunto de dados numéricos.
Ciência que se preocupa com a Coleta, Organização, Descrição, Análise e Interpretação de Dados Experimentais..
Conceito de Estatística
Pesquisa Estatística
Consiste em um trabalho de identificação, reunião, tratamento, análise e apresentação de informações (dados) para satisfazer certas necessidades.
Pesquisas estatísticas são realizadas com os mais diversos objetivos, em áreas tão diversas quanto ciências médicas e biológicas, engenharias, ciências sociais e econômicas, turismo, esporte, ...
Bioestatística
Ciência que se preocupa com a organização, descrição, análise e interpretação de dados experimentais. 
Aplicação dos números para ilustrar a história natural de uma população.
Ciência que trata com planos e métodos de coletas, tabulação e análise de fatos numéricos nas ciências da vida. 
conceitos
Definição
A bioestatística é a aplicação de estatística ao campo biológico e médico. Ela é essencial ao planejamento, coleta, avaliação e interpretação de todos os dados obtidos em pesquisa na área biológica e médica. É fundamental à epidemiologia, à ecologia, à psicologia social e à medicina baseada em evidência.
A Bioestatística tem o objetivo de determinar se um fato na natureza ocorre por um fator determinado ou pelo mero acaso.
Torna a suspeita de que evento clínico esta ligado a uma determinada patologia em evidência científica.
Definição
Bioestatística
Conceitos Iniciais:
População - Qualquer conjunto de informações que tenham entre si uma característica comum que delimite quais elementos pertencem a ela. Ex: população das pessoas com baixa estatura da cidade de Salvador. O tamanho de uma população habitualmente é representado pela letra N.
Amostra - Subconjuntos representativos de uma população. É representado pela letra n. A amostra deve ser parecida com a população extraída , devendo obedecer aos seguintes princípios básicos:
deve ser suficientemente grande;
seus integrantes devem ter sido selecionados ao acaso.
Seleção ao Acaso (random):
Cada um dos componentes da população estudada tem a mesma chance de ser incluído na amostra;
A inclusão de um membro não altera a chance de inclusão dos demais. Caso isso não ocorra, diz-se que a amostra é não randomizada ou viciada - biased.
Bioestatística
Bioestatística
Tipos:
Estatística Descritiva - Utilizada simplesmente para descrever dados, mostrando seus subtipos, sua distribuição, frequência....
Estatística Analítica ou Indutiva - Permite ao investigador ir além da descrição dos dados. Utilizada para comparar grupos e fazer generalizações a partir de resultados obtidos, fazendo inferências sobre a população com base nas amostras.
Tipos de Dados
A estatística engloba os métodos de coleta, resumo, análise e tirada de conclusões a partir dos dados.
Variável/dados pertencerão a um de dois tipos: categóricos ou numéricos. 
Estatística Descritiva
VARIÁVEL
CATEGÓRICA
(qualitativa)
NUMÉRICA
(quantitativa)
Nominal
Ordinal
Discreta
Continua
-----------------------------------------
São representados por porcentagem
--------------------------------------------------
São representados por média±desvio
Padrão ou mediana (intervalo entre
Quartis), etc
Estatística Descritiva
Dados Categóricos (Qualitativos)
Dados Nominais - são dados que se definem exclusivamente por nomes (não são mensurados), sem qualquer ordem. 
Ex: grupo sanguineo (A, AB, B e O), estado civil (casado/viúvo/solteiro,etc), raça, sexo, cor dos olhos, via de parto...
 Podem ser codificados através de números:
1 = masculino
2 = feminino
Os dados não são mensurados, simplesmente são contados! Descritos em termos de porcentagens e proporções e apresentados na forma de diagrama de barras, "pizzas". 
Estatística Descritiva
Gráficos
Dados Categóricos (Qualitativos)
Dados Ordinais - são aqueles que se distribuem por categorias que tem uma ordem. Nesse tipo de dados não há valores intermediários entre as categorias e uma mesma diferença numérica não tem sempre o mesmo significado. 
Ex: Grau de dor (nenhuma, branda, leve, moderada, intensa), Escala de Apgar, de Glasgow, grau de Retinopatia...
Podem ser descritas também por proporção e porcentagem!
Estatística Descritiva
Existe ainda uma classificação de dados categóricos conhecido como Variável Dicotômica ou Binária, quando possuem apenas duas variáveis ou duas possibilidades de resposta: sim ou não, por exemplo.
Estatística Descritiva
Nome - Fulano de Tal
Sexo - Masculino
Idade – 50 anos
Etnia – caucasiano
Tipo Sanguíneo – A
Peso – 60 kg
Creatinina - 0.8mg/Dl
QUAIS SÃO DADOS CATEGÓRICOS?
Estatística Descritiva
Nome - Fulano de Tal
Sexo - Masculino
Idade – 50 anos
Etnia – caucasiano
Tipo Sanguíneo – A
Peso – 60 kg
Creatinina - 0.8mg/Dl
QUAIS SÃO DADOS CATEGÓRICOS?
Estatística Descritiva
Nome - Fulano de Tal
Sexo - Masculino
Idade – 50 anos
Etnia – caucasiano
Tipo Sanguíneo – A
Peso – 60 kg
Creatinina - 0.8mg/Dl
QUAIS SÃO DADOS NUMÉRICOS?
Estatística Descritiva
Nome - Fulano de Tal
Sexo - Masculino
Idade – 50 anos
Etnia – caucasiano
Tipo Sanguíneo – A
Peso – 60 kg
Creatinina - 0.8mg/Dl
QUAIS SÃO DADOS NUMÉRICOS?
Exemplo 1 - Uma indústria de calculadoras eletrônicas, preocupada com vários defeitos que um de seus produtos vem apresentando, fez um levantamento e constatou os seguintes problemas:
A: Defeito na cobertura plástica;
B: Defeito no teclado;
C: Defeito na fonte de energia;
D: Soldas soltas;
E: Defeito na placa da unidade de processamento;
F: Defeito no visor;
G: Outros.
Este é um típico exemplo de dados qualitativos nominais. Nesta situação, para cada item inspecionado, existe uma variável T que representa o tipo de defeito encontrado.
Exemplo
Tipo de Problemas (T)
Frequência
A
10
B
20
C
55
D
80
E
25
F
3
G
7
Exemplo
Exemplo 2: Em um concurso público foram contabilizados os números de pessoas inscritas segundo os níveis de escolaridade: fundamental completo, médio completo, superior completo e pós-graduação completa. Segue abaixo a Tabela com os valores observados.
Exemplo
Nível de escolaridade
Inscritos
Fundamental completo
451
Médio completo
627
Superior completo
292
Pós-graduação completa
95
Exemplo
Nível de escolaridade
Inscritos
Fundamental completo
451
Médio completo
627
Superior completo
292
Pós-graduação completa
95
Neste exemplo, temos um ordem natural entre os atributos (nível de escolaridade) e consequentemente, temos um exemplo de dados qualitativos ordinais.
Apenas para relembrar...
Temos...
Estatística Descritiva
Esses tipos de dados são fácies de serem descritos.
Geralmente basta apresentar o seu número (valores absolutos) e distribuição (porcentagem por categoria).
Podem ser representados através de diagramas de barras verticais (colunas) ou os chamados setoriais ("pizzas").
Descrevendo Dados Nominais e Ordinais
Diagramas de barras verticais (colunas).
Setoriais ("pizzas").
Distribuição da Turma por Grupo Sanguíneo e Fator rh 
Fator rh
rh+
rh-
Totais
Grupo
A
B
AB
O
Totais
Descrevendo Dados Contínuos
Esse tipo de dado pode ser trabalhado para gerar informações que expressem a tendência central e a dispersão.
Descrevendo Dados Contínuos
Medida de Tendência Central.
Dá uma idéia de onde se localiza o centro, ou seja, o ponto médio de um determinado conjunto de dados.
Dispersão.
O modo como os dados se posicionam ao redor do ponto central de um determinado conjunto de dados.
Descrevendo Dados Contínuos
Dispersão 
Tendência Central
Medidas de Tendência Central
	A Medida de Tendência Central dá uma ideia de onde se localiza o ponto médio (centro) de determinado conjunto de dados.
Média;
Mediana;
Moda.
Descrevendo Dados Contínuos
Tendência Central
Dada uma lista de números, uma média é um valor que pode substituir todos os elementos dessa lista sem alterar determinada característica da mesma. Tal característica deverá ser determinada através do enunciado ou do contexto do problema que desejamos resolver.
De longe, a média aritmética é a mais conhecida e a mais utilizada, mas ela não é a única existente.
A Média Aritmética é definida como a soma dos valores observados, dividida pelo número de observações.
Descrevendo Dados Contínuos
Medidas de Tendência Central
Média Aritmética
Descrevendo Dados Contínuos
Medidas de Tendência Central
Média Aritmética
Habitualmente representada por X quando se trata de amostra e por µ quando se trata de populações. 
Valor que, uma vez ordenado todos os resultados, deixa igual número de resultados de cada lado. 
Descrevendo Dados Contínuos
Medidas de Tendência Central
Mediana (Md)
Moda (Mo)
A moda (Mo) é o valor que mais se repete, ou seja, o valor mais provável a ser escolhido. É a única medida de tendência central que pode ter mais de um valor, podendo ser o conjunto amodal, monomodal, bimodal...
Considere os seguintes resultados brutos obtidos, componentes de uma determinada amostra:
Descrevendo Dados Contínuos
Medidas de Tendência Central
56
63
64
65
66
66
69
71
57
64
64
65
66
66
68
72
*Utilizou-se a média aritmética dos dois valores centrais, devido ao n ser um número par.
n = 16
Σx = 1.042
X = 1.042/16 = 65,1
Md = 66 + 65/2 = 65,5*
Mo = 66
Medidas de Dispersão ou Variabilidade
	As Medidas de Dispersão ou Variabilidade dão uma ideia de como os dados se posicionam ao redor do ponto central. É possível afirmar que, quanto menor a dispersão, os dados são mais homogêneos.
As Medidas de Dispersão mais utilizadas são:
Amplitude Total (range);
Variância.
Desvio Padrão;
Descrevendo Dados Contínuos
Dispersão 
Diferença entre o mais alto e o mais baixo valor observado na amostra/população estudada. 
Descrevendo Dados Contínuos
Medidas de Dispersão
Amplitude Total (Range)
Variância e Desvio Padrão
Em um conjunto de dados (com a média já calculada) observa-se que eles se distribuem ao redor desta média para mais e para menos.
 Quanto mais próximo da média estiverem, mais homogênio será o conjunto.
Supondo que alguém queira avaliar a estatura dos alunos do curso de Fisioterapia desta IES, de um determinado semestre, que no momento da pesquisa seja composta de 11 alunos
Descrevendo Dados Contínuos
Medidas de Dispersão
ESTATURA DOS ALUNOS
135
136
138
141
143
152
152
152
157
163
170
Média = 149
Mediana = 152
Valor Máximo = 170
Valor Mínimo = 135
Amplitude Total = 170 – 135 = 35
É necessário saber inicialmente quanto cada resultado se afasta da média. Como esses resultados se afastam para mais e para menos, são obtidos resultados positivos e negativos.
Descrevendo Dados Contínuos
Cálculo da Variância
ESTATURA DOS ALUNOS
135 – 149
14
136 – 149
13
138 – 149
11
141 – 149
8
143 – 149
6
152 – 149
3
152 – 149
3
152 – 149
3
157 – 149
8
163 – 149
14
170 - 149
21
Observação Importante:
 É preciso elevar cada diferença ao quadrado;
 Esse artifício é utilizado na matemática pois caso fossem simplesmente somados os valores (positivos e negativos) eles se anulariam;
 E, se ainda fossem considerados apenas valores absolutos, o fato de um valor se situar para um lado ou para outro da média não teria a mínima importância.
A Variância é calculada dividindo a soma dos quadrados obtida pelo seu tamanho.
Descrevendo Dados Contínuos
Cálculo da Variância
(ESTATURA – MÉDIA)2
(-14)2
196
(-13)2
169
(-11)2
121
(-8)2
64
(-6)2
36
(3)2
9
(3)2
9
(3)2
9
(8)2
64
(14)2
192
(21)2
441
SOMA
1.314
VARIÂNCIA
δ2 = 1.314/11 = 119,45
A Variância é calculada dividindo a soma dos quadrados obtida pelo seu tamanho.
Descrevendo Dados Contínuos
Cálculo da Variância
(ESTATURA – MÉDIA)2
(-14)2
196
(-13)2
169
(-11)2
121
(-8)2
64
(-6)2
36
(3)2
9
(3)2
9
(3)2
9
(8)2
64
(14)2
192
(21)2
441
SOMA
1.314
VARIÂNCIA
δ2 = 1.341/11 = 119,45
DESVIO PADRÃO
 O DP é a raiz quadrada da Variância.
DP = = 10,92
 119,45
Descrevendo Dados Contínuos
Cálculo da Variância
VARIÂNCIA DA AMOSTRA
δ2 = 1.341/11-1 = 131,40
DESVIO PADRÃO DA AMOSTRA
 O DP é a raiz quadrada da Variância.
DP = = 11,43
 131,40
Observação Importante:
 Caso esses alunos fossem uma amostra de uma certa população, seria necessário um ajuste matemático, pois os valores das amostras estão mais próximas das médias das amostras do que realmente ocorre na população, onde valores extremos são mais fácies de ocorrer;
 Condicionou-se, através de cálculos matemáticos, que deve-se subtrair “1” do denominador (amostra) para melhor estimar o DP de uma população.
 Supondo que os dados avaliados fossem amostra de uma população de alunos desta IES, os cálculos ficariam da seguinte forma:
Coeficiente de Variação
A magnitude do Desvio Padrão depende da unidade de medida de uma variável particular e, assim, um Desvio Padrão medido em dias será numericamente muito maior do que o mesmo desvio medido em meses.
O Coeficiente de Variação expressa o Desvio Padrão com porcentagem do valor da média.
O Coeficiente de Variação independe da unidade de medida usada!
Permite comparar dispersões de dados entre estudos onde foram usadas unidades de medidas diferente: polegadas e centímetros, por exemplo 
Coeficiente de Variação
 Coeficiente de Variação igual a 100% indica que o DP é igual a média; quanto menor ele for, mas homogênea será a amostra.
 Menor ou igual a 15% - Baixa dispersão – homogênea, estável.
 Entre 15% e 30% - Média dispersão.
Maior que 30% - Alta dispersão, heterogênea. 
 
Coeficiente de Variação
 Exemplo: Considere as notas da primeira Verificação de Aprendizagem duas turmas de Bioestatística do Curso de Fisioterapia (6AM e 6ÄN):
TURMA
NÚMERODE ALUNOS
NOTA MÉDIA
DESVIO PADRÃO
COEFICIENTEDE VARIAÇÃO
PSICOLOGIA[M]
n
5
4
80%
PISCICOLOGIA[N]
n
40
4
10%
 Ao se interpretar esses valores, pode-se afirmar quê:
 Na primeira distribuição, em média, os desvios relativamente à média atingem 80% do valor desta.
 Na segunda distribuição, porém, a distribuição
dos desvios relativamente à média atingem em média 10%. As percentagens mostram os pesos dos DP sobre a distribuição.
Distribuição de Frequências
EX: Rendimento dos alunos de bioestatística (NASSAU) – primeira avaliação.
Organização dos dados brutos de forma tabular;
Utilizar intervalos e frequências de forma a condensar os dados de forma a tornar a análise mais fácil.
Distribuição de Frequências
NOTA
NÚMERO DE ALUNOS
0
5
1
1
2
2
3
4
5
3
6
3
7
4
8
2
9
1
10
1
CATEGORIA
FREQUÊNCIA
0 –3
12
4 – 6
7
7– 10
8
CATEGORIA
FREQUÊNCIA
%
0 –3
12
44,5
4 – 6
7
25,9
7– 10
8
29.6%

Teste o Premium para desbloquear

Aproveite todos os benefícios por 3 dias sem pagar! 😉
Já tem cadastro?

Outros materiais

Materiais relacionados

Perguntas relacionadas

Perguntas Recentes