Buscar

Minitab_-_Apostila_-_FZEA-USP

Prévia do material em texto

INTRODUÇÃO AO USO DO 
MINITAB 
NAS DISCIPLINAS DE ESTATÍSTICA 
DO CURSO DE 
GRADUAÇÃO EM ZOOTECNIA 
DA FZEA/USP 
 
 
 
 
 
 
Material preparado pelo Prof. Dr. César Gonçalves de Lima 
E_mail: cegdlima@usp.br 
 
Para uso nas aulas das disciplinas: 
ZAB 230 - Estatística I, ZAB 216 - Estatística II e 
ZAB 050 - Utili zação de pacotes estatísticos na análise de dados experimentais 
 
 
 
 
 
 
 
 
 
PIRASSUNUNGA - SP 
Março / 2004 
 
Introdução ao uso do MINITAB® 
1 
 
1. INTRODUÇÃO 
 
O MINITAB consiste de uma planilha de dados diversos comandos e subcomandos usados 
para executar operações matemáticas e diversas análises estatísticas. Uma planilha pode conter: 
• colunas de dados denotadas por C1, C2,..., 
• constantes denotadas por K1, K2, ... 
• matrizes numéricas de dados, denotadas por M1, M2,... 
Na apresentação dos comandos/subcomandos, a letra E pode denotar tanto uma constante, quanto 
uma coluna ou matriz. 
Na janela principal do Minitab encontramos uma régua que disponibil iza os grupos de 
comandos e subcomandos usados para manipulação de arquivos – File; edição de dados – Edit; 
manipulação de dados − Manip; cálculos envolvendo colunas − Calc; cálculos de estatísticas e de 
diversos tipos de análises estatísticas − Stat; contrução de gráficos − Graph; um editor de coman-
dos − Editor ; um controlador das janelas de trabalho − Window, além de uma boa tela de auxílio − 
Help. 
 
 
 
 As quatro janelas de trabalho são apresentadas como: 
• Session: que é usada para digitarmos os comandos e visualizarmos a saída dos resultados; 
• Data: que é a planilha de dados; 
• History: que guarda uma cópia de todos os comandos usados numa sessão, e 
• Info: que apresenta informações sobre as colunas, as constantes e as matrizes definidas numa 
sessão. 
 
 As colunas e as constantes podem ter nomes, devendo-se evitar o uso de acentos. Por exem-
plo: para nomearmos a coluna C1 com o nome “Tratamento” , a coluna C2 com o nome “Producao” 
e a constante K2 com o nome “ProducaoMedia” util izamos o seguinte comando: 
MTB > NAME C1 ' Tratamento ' C2 ' Producao ' K1 ' ProducaoMedia ' 
 Os comandos e subcomandos podem ser digitados em letras maiúsculas e/ou minúsculas, 
não havendo necessidade de entrarmos com mais do que as suas quatro primeiras letras. Por 
exemplo, para calcular a menor das produções e colocar o resultado em K2, podemos usar os 
comandos: 
MTB > Let K2 = Minimum(C2) ou MTB > Let K2 = Mini(C2) 
que os resultados serão idênticos. Ao invés do número da coluna – C2 – também pode ser usado o 
seu nome: 
MTB > Let K2 = Mini(Producao) 
Os dados da planilha podem ser digitados diretamente na planilha Data, copiados de um 
outro programa e colados na planilha ou lidos de arquivos já existentes. As colunas com valores 
numéricos apresentam seus valores colados à direita e as colunas com valores alfanuméricos, além 
de indicar essa coluna com uma letra – T, apresentam seus valores colados à esquerda. 
A seguir, apresentamos algumas informações sobre o uso efetivo do Minitab em alguns 
pontos relevantes do curso de Estatística II : 
a) revisão de estatística descritiva, visando a obtenção de medidas de tendência central e de disper-
são, além de gráficos e tabelas; 
 
Introdução ao uso do MINITAB® 
2 
 
b) simulações e cálculo de probabilidades; 
c) intervalos de confiança para a média e para a proporção; 
d) testes de hipóteses para a média de uma população, comparação de médias e de variâncias de 
duas populações; 
e) correlação e análise de regressão. 
 
 
 
EXERCÍCIOS DE APLICAÇÃO – REVISÃO DE ESTATÍSTICA DESCRITIVA 
 
Entre com os dados das variáveis C1: Idade, C2: Peso e C3: Altura, na janela Data. 
 
Idade Peso Altura 
22 70 1.75 
19 85 1.88 
17 48 1.63 
17 72 1.80 
19 89 1.82 
21 76 1.72 
19 62 1.85 
17 68 1.80 
19 49 1.64 
18 71 1.80 
20 54 1.75 
20 52 1.64 
19 70 1.77 
19 76 1.80 
17 73 1.75 
18 55 1.70 
21 93 1.80 
26 51 1.65 
20 45 1.53 
19 57 1.70 
18 65 1.78 
18 92 1.83 
17 69 1.75 
18 56 1.64 
19 54 1.70 
18 75 1.83 
18 71 1.81 
20 75 1.78 
 
Siga corretamente as instruções e tente “traduzir” as saídas. 
 
1) Para visualizar os dados na tela: Manip > Display data e 
selecionar em Columns, constants and matrices to display, 
as colunas C1, C2 e C3. Como alternativa, na janela Session, 
entrar com: 
MTB > print c1 c2 c3 
ou 
MTB > print ' Idade' ' Peso' ' Altura' 
 
2) Para obter estatísticas descritivas das variáveis: Stat > Basic 
Statistics > Describe Statistics... e selecionar as colunas 
C1, C2 e C3. Como alternativa, entrar com o comando: 
MTB > Desc c1 c2 c3 
 
3) Para obter essas estatísticas para as variáveis C2: Peso e C3: 
Altura, para cada um dos valores de C1: Idade: Stat > Basic 
Statistics > Describe Statistics... selecionar as colunas C2 e 
C3 e selecionar em By variables: a coluna C1. Como 
alternativa, usar: 
MTB > Desc c2 c3; 
SUBC> by c1. 
 
4) Para construir um histograma dos dados da variável C2: 
Peso: Graph > Histogram.. e escolher C2 em Graph 
variables. Alternativa: 
MTB > Histo c2 
 
5) Para construir o histograma de C2 definindo os limites (cutpoints) das classes: Graph > 
Histogram... escolher C2 em Graph variables, entrar em Options..; em Type of Intervals 
clicar em Cutpoint; em Definition of Intervals, clicar em Midpoint/Cutpoint positions: e 
entrar com os valores 1.60 1.70 1.80 1.90 2.00, com espaços entre os números. 
 
6) Para visualizar a relação entre as variáveis C2: Peso e C3: Altura: Graph > Plot.. e escolher C2 
como Graph variables: Y e C3 como Graph variables: X. Como alternativa, usar: 
MTB > plot c2*c3 
 
 
Introdução ao uso do MINITAB® 
3 
 
7) Para construir um box-plot dos dados de C3: Altura: Graph > Boxplot.. e escolher em Graph 
variable: Y, a coluna C3. Ou então, usar: 
MTB > boxplot C3 
 
8) Para obter uma distribuição de freqüências da variável discreta C1: idade: Stat > Table > Tally, 
escolher como Variables: a coluna C1 e marcar Counts e Percents em Display. Como alterna-
tiva, usar: 
MTB > Tally 'Idade'; 
SUBC> Counts; 
SUBC> Percents. 
 
9) Para obter uma tela com diversas estatísticas descritivas, distribuição de freqüências, box-plot, 
teste de normalidade dos dados de C2: Peso, além de intervalos de confiança para a média e para 
a mediana: 
MTB> %Describe c2 ou MTB> %Describe 'Peso' 
 
 
2. AS OPÇÕES DA BARRA STAT 
 
O MINITAB oferece diversas opções para análise descritiva e inferencial de dados experi-
mentais. Praticamente todas as opções aparecem no menu Stat da barra principal do programa: 
 
 
A seguir, apresentaremos alguns detalhes de cada uma das opções deste menu. Maiores informações 
sobre as opções podem ser obtidas em Help, no botão , ou usando a tecla F1, Menu Commands 
e Stat Menu. 
• Basic Statistics (Stat Menu > Basic Statistics) 
 Permite calcular diversas estatísticas descritivas, executar testes de hipóteses, calcular a correla-
ção e covariâncias entre variáveis numéricas e testar a normalidade dos dados. Os principais co-
mandos são: 
� �
Display Descriptive Statistics: produz uma tabela com estatísticas descritivas: número de 
valores (N); média (Mean); mediana (Median); tri-média (TrMean);desvio padrão (StDev); 
erro padrão da média (SE Mean); menor valor (Minimum); maior valor (Maximum);1o quartil 
(Q1) e 3o quartil (Q3). Também produz gráficos como o histograma (Histogram); gráfico de 
pontos (Dotplot), boxplot (BoxPlot) e um gráfico resumo (Graphical summary) com diversas 
estatísticas descritivas, intervalos de confiança para a média, mediana e desvio padrão e um 
teste de normalidade dos dados (Anderson-Darling Normalitty Test). 
 
Introdução ao uso do MINITAB® 
4 
 � �
Store Descriptive Statistics: calcula diversas estatísticas descritivas e grava os resultados na 
planilha. � �
1-Sample Z: calcula um Intervalo de Confiança e executa o teste de hipótese para a média de 
uma população normal com variância populacional conhecida (z-test).� �
1-Sample t: calcula um Intervalo de Confiança e executa o teste de hipótese para a média de 
uma população normal com variância populacional é desconhecida (t-test). � �
2-Sample t: calcula um Intervalo de Confiança e executa o teste de hipótese para comparar as 
médias de duas populações normais (t-test) de variâncias iguais ou não. � �
Paired t: testa a diferença entre médias quando os dados estão pareados. � �
1 Proportion: calcula um intervalo de confiança e executa um teste para a proporção. � �
2 Proportions: calcula um intervalo de confiança e executa um teste para a diferença entre 
duas proporções. � �
2 Variances: executa um teste para a igualdade (homogeneidade) de variâncias de duas 
populações usando os testes F e de Levene. � �
Correlation: calcula o coeficiente de correlação de Pearson entre variáveis numéricas e o 
nível descritivo do teste H0: ρ = 0 vs. H1: ρ ≠ 0. Opcionalmente, grava os resultados numa 
matriz de correlações. � �
Covariance: calcula a covariância entre variáveis numéricas e grava os seus valores numa 
matriz de covariâncias. � �
Normality Test: testa a normalidade dos dados (Testes de Anderson-Darling, Ryan-Joiner e 
Kolmogorov-Smirnov) e apresenta um gráfico normal de probabil idades (normal probability 
plot). 
 
• Regression (Stat > Regression) 
Permite executarmos análises de regressão simples, polinomial e múltipla com os mecanismos 
stepwise, forward e backward de seleção de variáveis e regressão logística. Produz gráficos para 
análise de resíduos e ajusta alguns modelos de regressão logística. 
 
• ANOVA (Stat > ANOVA) 
Permite executarmos a análise de variância, testar a homogeneidade de variâncias e gerar diver-
sos gráficos. Os principais comandos são: � �
Oneway: executa a análise de variância com um fator (one way), com as respostas em uma 
coluna e os índices em outra. Também possibil ita a comparação das médias através dos testes 
de Tukey, Dunnett etc. � �
Oneway (Unstacked): executa a análise de variância para o modelo com um fator (One way), 
com as respostas de cada tratamento colocadas em colunas diferentes. � �
Twoway: executa a análise de variância para o modelo com dois fatores (Two way) e dados 
balanceados. � �
Analysis of Means: mostra um gráfico de Análise de Médias e uma tabela resumo para dados 
normais, binomiais e de Poisson. � �
Balanced ANOVA: analisa dados uni ou multivariados, balanceados, através de modelos 
mistos com fatores cruzados e hierárquicos. � �
General Linear Model: executa a análise de variância para dados uni ou multivariados e 
desbalanceados com fatores cruzados e hierárquicos e covariáveis. Executa também a análise 
de variância multivariada. � �
Fully Nested ANOVA: executa a análise de variância para modelos hierárquicos (nested) e 
estima componentes de variância para cada variável resposta. 
 
Introdução ao uso do MINITAB® 
5 
 � �
Balanced MANOVA: executa a análise de variância multivariada de delineamentos balan-
ceados (todas as combinações de níveis de fatores devem ter o mesmo número de repetições). � �
General MANOVA: executa a análise de variância multivariada de delineamentos balan-
ceados ou desbalanceados, ou que envolve covariáveis. � �
Test for Equal Variances: executa os testes F, de Bartlett e de Levene para a homogeneidade 
de variâncias. � �
Interval Plot...: produz um gráfico de grupos de médias com barras de erro padrão ou de 
intervalos de confiança das médias. � �
Main Effects Plot: gera um gráfico de médias dos níveis dos fatores. � �
Interactions Plot: gera um gráfico da interação dos níveis dos fatores (ou matriz de gráficos) 
 
• DOE (Design of Experiments) (Stat > DOE) 
 Disponibil iza diversas opções para criação e análise de delineamentos experimentais ortogonais. 
 
• Control Charts (Stat > Control Charts) 
 Disponibil iza diversos tipos de gráficos para o controle de qualidade para dados numéricos ou 
não. 
 
• Quality Tools (Stat > Quality Tools) 
 Disponibil iza diversas técnicas para construção de gráficos de qualidade e checa a acurácia e a 
precisão de um sistema de medidas. 
 
• Reliability/Survival (Stat > Reliability/Survival) 
 Disponibil iza alguns comandos para analisar dados de tempos de falha e ferramentas para esti-
mar a variabil idade de funções que descrevem tais distribuições. Possibil ita também a análise de 
tabelas de sobrevivência. 
 
• Multivariate (Stat >Multivariate) 
 Proporciona a execução de análises multivariadas, como a de Componentes Principais (PCA), 
Análise de Fatores ou Fatorial, Análise Discriminante etc. 
 
• Time Series (Stat > Time Series) 
 Disponibil iza a análise de séries temporais e diversas técnicas de análise descritiva de tais 
conjuntos de dados. 
 
• Tables (Stat > Tables) 
 Imprime tabelas de contingência com uma ou duas entradas para variáveis associadas e executa 
uma análise de Qui-quadrado. � �
Cross Tabulation: imprime tabelas de contingência e tabelas de estatísticas para variáveis 
associadas. � �
Tally: imprime tabelas de freqüência absolutas e percentuais de variáveis numéricas. � �
Chisquare Test: executa a análise de Qui-quadrado de tabelas de contingência. 
• Nonparametrics (Stat > Nonparametrics) 
 Permite a execução de diversos testes não paramétricos, como os Testes dos sinais, de Wilcoxon, 
Mann-Whitney, Kruskal-Wall is etc., além da construção de intervalos de confiança para a 
mediana. 
 
• EDA (Exploratory Data Analysis) (Stat > EDA) 
 Disponibil iza diversas ferramentas para fazer uma análise exploratória de dados, como os 
gráficos de ramos e folhas (stem-and-leaf), boxplot etc. Tais métodos são utili zados antes dos 
métodos tradicionais de análise, ou para examinar os resíduos de um modelo. Também são úteis 
 
Introdução ao uso do MINITAB® 
6 
 
para identificar observações discrepantes e examinar a violação de suposições de modelos, como 
a não linearidade dos resíduos ou a heterocedasticidade das variâncias. 
 
 
3. USANDO O MINITAB PARA SIMULAÇÕES E CÁLCULO DE PROBABI-
L IDADES 
 
 Vamos explorar a capacidade do MINITAB de simular distribuições de probabil idades de 
variáveis aleatórias discretas (Bernoulli , Binomial, Poisson etc.) e contínuas (Exponencial, Normal, 
Qui-quadrado, t-Student, F-Snedecor etc.), que pode ser feito através do comando random, disponí-
vel em Calc > Random Data. 
Além disso, o MINITAB também tem recursos para o cálculo de probabil idades, com os 
comandos: PDF (probability distribution function) e CDF (cumulative distribution function), que 
estão disponíveis em Calc > Probabil ity Distributions. 
 A seguir serão apresentados alguns detalhes de aplicação desses comandos em exemplos 
bastante comuns nos estudos já desenvolvidos nas aulas de Estatística I e que voltarão a ser necessá-
rios nas aulas do curso de Estatística II e Estatística Experimental. 
 
COMANDO PDF (probability distribution function): Permite calcular probabilidades (distribui-
ções discretas) ou densidades (distribuições contínuas). O nosso propósito é o de calcular proba-
bil idades para variáveis discretas. Por exemplo: para a distribuição Binomial, X ~B(n, p), é pos-
sível usar este comando com dois propósitos diferentes: 
 
i) Construir uma distribuição de probabilidades completa para a Binomial, com parâmetros n e p. 
Por exemplo, para n = 7 e p = 0,3: 
MTB > PDF; 
SUBC> BINOMIAL 7 0.3. 
gera a seguinte saída: 
 
 
Probability Density Function 
Binomial with n = 7 and p = 0.300000 
 x P( X = x) 
 0 0.0824 
 1 0.2471 
 2 0.3177 
 3 0.2269 
 4 0.0972 
 5 0.0250 
 6 0.0036 
 7 0.0002 
 
ii ) Calcular a probabilidade de que a v.a. X ~ B(n = 7 e p = 0.3) assuma o valor k = 4, ou seja, 
calcular P(X = 4). 
MTB > PDF 4; 
SUBC> BINOMIAL 7 0.3. 
 
 
Probability Density Function 
Binomial with n = 7 and p = 0.300000 
 x P( X = x) 
 4.00 0.0972 
 
 
 
Introdução ao uso do MINITAB® 
7COMANDO CDF (cumulative distribution function): permite calcular a probabili dade acumula-
da até um valor k fixado, ou seja, calcular F(k) = P(X ≤ k). Para uma distribuição binomial com 
n = 7 e p = 0.3, podemos calcular P(X ≤ 4) utili zando os resultados já calculados anteriormente, 
fazendo: 
P(X ≤ 4) = P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3) + P(X = 4) 
 = 0,0824 + 0,2471 + 0,3177 + 0,2269 + 0,0972 
 = 0,9712 
Porém, este resultado pode ser obtido mais facilmente utilizando o comando CDF: 
MTB > CDF 4; 
SUBC> BINOMIAL 7 0.3. 
 
 
Cumulative Distribution Function 
Binomial with n = 7 and p = 0.300000 
 x P( X <= x) 
 4.00 0.9712 
 
ou seja: a probabil idade de encontrarmos até 4 sucessos, quando X ~ B(7; 0,3) é igual a 0,9712. 
 
Podemos estar interessados também, em calcular probabil idades acumuladas para diversas 
distribuições associadas a variáveis contínuas, como a normal, qui-quadrado, F-Snedecor, t-Student 
etc. Por exemplo: para calcular a probabilidade de uma variável normal reduzida, N(µ = 0; σ2 = 1), 
assumir valores iguais ou inferiores a 1, P(Z ≤ 1), usamos o comando: 
MTB > CDF 1; 
SUBC> NORMAL 0 1. 
 
 
Cumulative Distribution Function 
Normal with mean = 0 and standard deviation = 1.00000 
 x P( X <= x) 
 1.0000 0.8413 
 
 
OBS: Quando usamos uma variável normal reduzida, não precisamos indicar quais são os valo-
res da média e do desvio padrão, ou seja, basta usar os comandos: 
MTB > CDF 1; 
SUBC> NORMAL. 
A probabil idade da variável aleatória "X = altura dos calouros 99", que tem distribuição 
normal com média 1,70m e variância 0,01m2 (e desvio padrão 0,10m), assumir valores iguais ou 
inferiores a 1,85, P(X ≤ 1,85), pode ser obtida com o comando: 
MTB > CDF 1.85; 
SUBC> NORMAL 1.70 0.10. 
 
 
Cumulative Distribution Function 
Normal with mean = 1.70000 and standard deviation = 0.100000 
 x P( X <= x) 
 1.8500 0.9332 
 
ou seja, 93,3% dos calouros 99 têm altura igual ou inferior a 1,85 metros. 
 
Introdução ao uso do MINITAB® 
8 
 
COMANDO INVCDF ( inverse cumulative distribution function): Faz o papel inverso do coman-
do CDF, ou seja, calcula o número x , que deixa à sua esquerda a probabil idade indicada. Deste 
modo, o comando: 
MTB > INVCDF 0.95; 
SUBC> NORMAL. 
 
 
Inverse Cumulative Distribution Function 
Normal with mean = 0 and standard deviation = 1.00000 
 P( X <= x) x 
 0.9500 1.6449 
 
ou seja, o valor 1,6449 ≅ 1,65, da normal reduzida, deixa à sua esquerda uma área igual a 95%, 
ou ainda: P(X ≤ 1,65) = 0,95. 
Outro exemplo: “ Qual é a altura, acima da qual estão 28% dos calouros de 99?” . Para tanto, 
basta usar o comando: 
MTB > INVCDF 0.72; 
SUBC> NORMAL 1.70 0.10. 
 
 
Inverse Cumulative Distribution Function 
Normal with mean = 1.70000 and standard deviation = 0.100000 
 P( X <= x) x 
 0.7200 1.7583 
 
ou seja, abaixo de 1,76m estão 72% dos calouros 99, ou então, acima de 1,76m estão 28% dos 
calouros de 99. 
 
 
COMANDO RANDOM: Permite gerar amostras aleatórias de distribuições teóricas associadas a 
variáveis discretas ou contínuas. Por exemplo: estamos interessados em estudar um experimento 
que consiste em contar o "número de eleitores favoráveis a um certo candidato A" numa amostra 
de 10 eleitores, supondo que a porcentagem de eleitores favoráveis a este candidato tenha sido 
estimada em 0,70. (Perceba nesta descrição que a variável envolvida tem distribuição binomial 
de parâmetros n=10 e p=0,70). Assim os comandos: 
MTB > RANDOM 15 C1; 
SUBC > BINOMIAL 10 0.7. 
MTB > PRINT C1 
simulam (e mostram) os resultados de 15 experimentos binomiais com n = 10 eleitores e p = 
0,70, colocando-os na coluna C1: 
 
 
Data Display 
C1 
 8 7 6 5 7 8 8 8 6 7 8 7 4 6 6 
 
 
Como sabemos que a média de uma variável com distribuição binomial, X ~ B(n; p) é igual a 
E(X) = np e a variância é igual a Var(X) = np(1-p), temos que E(X) = 7 e Var(X) = 2,1 (e desvio 
padrão = 1,4491). Para verificar se a amostra é representativa dessa população, usamos: 
MTB > DESCRIBE C1 
 
 
Introdução ao uso do MINITAB® 
9 
 
 
Descriptive Statistics 
 
Variable N Mean Median Tr Mean StDev SE Mean 
C1 15 6.733 7.000 6.846 1.223 0.316 
 
Variable Min Max Q1 Q3 
C1 4.000 8.000 6.000 8.000 
 
e podemos perceber que a amostra representa razoavelmente bem a referida população, já que a 
média e o desvio padrão amostrais foram iguais a 6,733 e 1,2223, respectivamente. 
 
 Se estivermos interessados em gerar uma amostra de tamanho n = 40 da variável X = "pesos 
corporais de frangos da linhagem Hubbard, aos 42 dias de idade", sabendo-se que esta variável 
tem distribuição normal N(µ = 1,80; σ2 =0,01), usamos o comando: 
MTB > RANDOM 40 C5; 
SUBC> NORMAL 1.80 0.10. 
Para imprimir os dados simulados de C2 e as estatísticas descritivas correspondentes, usamos: 
MTB > PRINT C5 
 
 
Data Display 
C5 
 1.88368 1.90070 1.74597 1.65488 1.74494 1.60249 1.78853 1.75199 
 1.85025 1.95905 1.70512 1.82874 1.86497 1.96199 1.81543 1.71719 
 1.70791 1.98492 1.77098 1.67058 1.84883 1.80105 1.84905 1.73582 
 1.84269 1.74938 1.74669 1.61301 1.84342 1.61336 1.84578 1.84137 
 1.60558 1.79857 1.66694 1.87760 1.75625 1.70891 1.83445 1.72964 
 
 
MTB > DESCRIBE C2 
 
Descriptive Statistics 
 
Variable N Mean Median Tr Mean StDev SE Mean 
C1 40 1.7807 1.7747 1.7841 0.1770 0.0280 
 
Variable Min Max Q1 Q3 
C1 1.3367 2.1235 1.6640 1.9001 
 
OBS: dificilmente os pesos que você obteve utilizando esses mesmos comandos serão idênticos 
a esses. Lembre-se que o Minitab gera amostras aleatórias... 
 
Se estivermos interessados em arredondar para duas casas decimais os pesos dos frangos 
que estão em C5 e colocá-los em C6, usamos o comando round da seguinte maneira: 
MTB > LET C6 = 0.01*ROUND(100*C5) 
MTB > PRINT C6 
 
Data Display 
C3 
 1.88 1.90 1.75 1.65 1.74 1.60 1.79 1.75 1.85 1.96 
 1.71 1.83 1.86 1.96 1.82 1.72 1.71 1.98 1.77 1.67 
 1.85 1.80 1.85 1.74 1.84 1.75 1.75 1.61 1.84 1.61 
 1.85 1.84 1.61 1.80 1.67 1.88 1.76 1.71 1.83 1.73 
 
 
Introdução ao uso do MINITAB® 
10 
 
 
COMANDO SAMPLE: Possibilita sortear amostras com ou sem reposição de alguma população 
conhecida. Como exemplo, podemos utilizar os dados de peso da coluna C3 como sendo a popu-
lação da qual queremos sortear uma amostra aleatória de tamanho 10. Isto pode ser feito de duas 
maneiras: 
 
 i) sem reposição: 
MTB > S AMPLE 1 0 C 3 C 10 
coloca em C10 os dez valores de C3 (peso de frangos aos 42 dias) sorteados ao acaso e sem 
reposição. 
 
ii ) com reposição: 
MTB > SAMPLE 1 0 C 3 C 11; 
SUBC> REPLACE. 
coloca em C11 os dez valores de C3 sorteados ao acaso e com reposição. 
 
 
4. INTERVALOS DE CONFIANÇA 
 
 O objetivo principal deste material é apresentar os comandos do Minitab que podem ser 
usados para a construção de intervalos de confiança para a média (µ) de uma população com distri-
buição normal e para a proporção p de uma variável dicotômica. 
 
 
4.1. INTERVALO DE CONFIANÇA PARA A MÉDIA DE UMA POPULAÇÃO COM DIS-
TRIBUIÇÃO NORMAL 
 
CASO 1: I.C. (µµ) quando a variância populacional (σσ2) é conhecida 
 
Usar o caminho Stat > Basic Statistics > 1-Sample z, ou o comando ZINTERVAL: 
MTB > Z I NTERVAL [ coef i ci ent e d e c onf i ança] s i gma C i 
Comentários: 
• Esse comando permite calcular o I.C.(µ) a partir dos dados amostrais de uma variável Ci que 
tem distribuição normal com desvio padrão σ = sigma, conhecido. 
• Se não informarmos o valor do desvio padrão, o Minitab assumirá sigma = 1; 
• Se não informarmos qual o valor do coeficiente de confiança, o Minitab assumiráγ = 95%; 
 
 
Exemplo: Calcular o I.C. para a média das idades dos alunos de Estatística I da turma de 1997, 
que tem distribuição normal e desvio padrão σ = 1, baseado na seguinte amostra de n = 10 
alunos: {19; 17; 19; 18; 17; 20; 18; 19; 20; 18} . Após colocarmos os dados na coluna C7, 
usamos o comando: 
MTB > N AME C 7 ' I dade' 
MTB > ZINTERVAL 95 1 C7 
 
 
Introdução ao uso do MINITAB® 
11 
 
 
Confidence Intervals 
 
The a ssumed s i gma = 1 . 00 
 
Var i abl e N Mean St Dev SE Mean 95. 0 % C I 
Id ade 10 18. 500 1. 080 0. 316 ( 17. 880, 19. 120) 
 
ou seja: o I.C.(µ; γ = 95%) = [17,88; 19,12] anos contem o verdadeiro valor da idade média dos 
alunos de Estatística I, com 95% de confiança. Se quisermos um I.C.(µ) com uma confiança γ = 
99%, basta trocarmos no comando acima, o valor 95 por 99. 
 
 
CASO 2: I.C.(µµ) quando a variância populacional (σσ2) é desconhecida 
 
Usar o caminho: Stat > Basic Statistics > 1-Sample t ou o comando TINTERVAL: 
 
MTB > TINTERVAL [coeficiente de confiança] Ci 
 
• Permite calcular o I.C. para a média µ de uma variável Ci (ou mais variáveis) com distribuição 
normal e variância populacional (σ2) desconhecida; 
• O Minitab se incumbe de estimar a variância, já que ela é desconhecida. 
 
Exemplo: calcular o I.C. γ = 95%, para a média das idades dos alunos de Estatística I, que tem 
distribuição normal, baseado na seguinte amostra de n = 10 alunos: {19; 17; 19; 18; 17; 20; 18; 
19; 20; 18}. 
MTB > TINTERVAL 95 C1 
 
 
Confidence Intervals 
Var i abl e N Mean St Dev SE Mean 95. 0 % C I 
Id ade 10 18. 500 1. 080 0. 342 ( 17. 727, 19. 273) 
 
Ou seja: o intervalo [17,727; 19,273] anos, contem o verdadeiro valor da média das idades dos 
alunos do curso de Estatística I, com γ = 95% de confiança. 
 
 
 
4.2. INTERVALO DE CONFIANÇA PARA A PROPORÇÃO (p) 
 
Para calcularmos o I.C.(p) podemos entrar com os dados numa coluna (Ci) ou indicar o 
tamanho da amostra e o número de sucessos. 
 
Exemplo: numa amostra de n = 100 elementos, temos 42 sucessos e 58 fracassos, então devemos 
criar uma coluna (C8, por exemplo) com 42 números “1” e 58 números “0” , de modo que a média 
desta coluna seja igual a 42/100 = 0.42, que coincide com a proporção de sucessos. No Minitab, 
isso é feito com o comando: 
MTB > s et c8 
DATA> 4 2( 1) 5 8( 0) 
DATA> e nd 
 
 
Introdução ao uso do MINITAB® 
12 
 
CASO 1: Amostras grandes 
Como neste caso o intervalo de confiança é baseado na distribuição normal, usar o caminho Stat 
> Basic Statistics > 1 Proportion... e escolher C8 em Samples in columns: e em Options 
marcar Use test and interval based on normal distr ibution, ou o comando: 
MTB > POne c8; 
SUBC> UseZ. 
resultando em: 
 
Test and CI for One Proportion: C8 
 
Test of p = 0.5 vs p not = 0.5 
Success = 1 
 
Variable X N Sample p 95.0% CI Z-Value P-Value 
C8 42 100 0.420000 (0.323264; 0.516736) -1.60 0.110 
 
e podemos afirmar que o intervalo [0,32; 0,52] contem a verdadeira proporção de sucessos com 
uma confiança de 99%. 
Note que este comando também executa um teste de hipóteses para a proporção, cujos resultados 
serão comentados quando tratarmos desse assunto. 
 
 
CASO 2: Amostras pequenas (usa a distr ibuição binomial) 
Em Stat > Basic Statistics > 1 Proportion... escolher C8 em Samples in columns: ou o coman-
do: 
MTB > Pone c8 
resultando em: 
 
 
Test and CI for One Proportion: C8 
 
Test of p = 0.5 vs p not = 0.5 
Success = 1 
 Exact 
Variable X N Sample p 95.0% CI P-Value 
C8 42 100 0.420000 (0.321986; 0.522881) 0.133 
 
OBS: Vale observar que esse intervalo tem uma amplitude maior que o do intervalo de confiança 
baseado na distribuição normal. 
 
 Ao invés de entrarmos com os dados na coluna C8 podemos especificar em Stat > Basic 
Statistics > 1 Proportion... > Summarized data, o número de tentativas (Number of trials) igual a 
100 e o número de sucessos (Number of successess) igual a 42. A seguir devemos escolher se o IC 
será baseado na distribuição normal (Use test and interval based on normal distr ibution) ou não. 
 
 
 
 
Introdução ao uso do MINITAB® 
13 
 
5. TESTES DE HIPÓTESE PARA A MÉDIA DE UMA DISTRIBUIÇÃO NOR-
MAL E PARA A PROPORÇÃO 
 
5.1. TESTE PARA A MÉDIA (µµ) QUANDO A VARIÂNCIA POPULACIONAL É CONHE-
CIDA 
 
Usar o caminho Stat > Basic Statistics > 1-Sample z ou o comando ZTEST, cuja sintaxe é: 
MTB > ZTEST [µ0] [sigma] C; 
SUBC> ALTERNATIVE [k]. 
• Executa o teste de hipótese: H0: µ = µ0 vs. H1: µ < µ0 (ou H1: µ ≠ µ0 ou H1: µ > µ0) quando a 
variância é conhecida. 
• Se não informarmos os valores de µ0 e sigma, o Minitab assume os valores 0 e 1, respectiva-
mente. 
• Para a hipótese alternativa H1: µ < µ0 devemos escolher k = –1; para H1: µ ≠ µ0, usar k = 0 e 
para H1: µ > µ0, usar k = +1. 
• Se o valor de k for omitido, o programa assume k = 0; 
 
 
Exemplo: Testar a hipótese de que a idade média dos alunos de Estatística I é igual a 18 anos, 
admitindo que σ2 = 1, baseado na amostra de n = 10 alunos: {19; 17; 19; 18; 17; 20; 18; 19; 20; 
18}. Após digitarmos os dados na coluna C1, usamos o comando: 
MTB > ZTEST 18 1 C1; 
SUBC> ALTERNATIVE 0. 
Ou então: Stat > Basic Statistics > 1-Sample z, escolhemos C1 em Variables, colocamos o 
valor 18 em Test mean, escolhemos not equal em Alternative e digitamos o valor 1.0 em 
Sigma. Em ambos os casos, o resultado é o seguinte: 
 
 
Z-Test 
 
Test of mu = 18.000 vs mu not = 18.000 
The assumed sigma = 1.00 
Variable N Mean StDev SE Mean Z P 
Idade 10 18.500 1.080 0.316 1.58 0.11 
 
que apresenta uma descrição das hipóteses envolvidas no teste, o valor do desvio padrão (σ = 1), 
o tamanho da amostra (n = 10), o valor da média amostral ( x =18,50), o desvio padrão amostral 
(s = 1,080), o erro padrão da média (s( x ) = 0,316), o valor da estatística Z (zcalc = 1,58) e o nível 
descritivo do teste ( α̂ = P = 0,11), ou seja, para rejeitarmos H0 precisamos assumir um nível de 
significância igual ou superior a 11%. 
 
 
5.2. TESTE PARA A MÉDIA QUANDO A VARIÂNCIA POPULACIONAL É DESCONHE-
CIDA 
 
Usar o caminho: Stat > Basic Statistics > 1-Sample t ou o comando TTEST, cuja sintaxe é: 
MTB > TTEST [µ0] C; 
SUBC> ALTERNATIVE [k]. 
 
Introdução ao uso do MINITAB® 
14 
 
• É usado quando queremos realizar um teste de hipótese para a média de uma população nor-
mal e desconhecemos a variância populacional σ2. 
• Sua sintaxe é bastante similar à do comando ZTEST . 
 
Exemplo: Para testar a hipótese de que idade média dos alunos de Estatística I é igual a 18 anos, 
usamos o comando: 
MTB > TTest 18 C1; 
SUBC> Alternative 0. 
Ou seguimos o caminho: Stat > Basic Statistics > 1-Sample t, escolhemos C1 em Variables, 
colocamos o valor 18 em Test mean e escolhemos not equal em Alternative. O resultado é o 
seguinte: 
 
 
T-Test of the Mean 
 
Test of mu = 18.000 vs mu not = 18.000 
 
Variable N Mean StDev SE Mean T P 
Idade 10 18.500 1.080 0.342 1.46 0.18 
 
Como o valor do nível descritivo do teste é relativamente grande (α̂ = P = 0,18), podemos 
assumir que os alunos de Estatística I, em média, não têm idade diferente de 18 anos. 
 
 
5.3. TESTE PARA A PROPORÇÃO 
 
Usar o caminho: Stat > Basic Statistics > 1 Proportion ou o comando Pone. Quando os 
dados já estiverem digitados em numa coluna (Ci) e utili zarmos a distribuição normal (caso de 
grandes amostras), devemos usar os comandos: 
MTB > POne Ci; 
SUBC> Test [p]; 
SUBC> Alternative [k]; 
SUBC> UseZ. 
Se não optarmos pela aproximação normal, devemos excluir o subcomando da última linha. Outra 
possibilidade consiste em indicarmos o número de elementos da amostra (Number of trials) e o nú-
mero de casos favoráveis (Number of successes)em Summarized data. 
 
Exemplo: Precisando saber se um candidato vai se reeleger como prefeito de Pirassununga, foi feita 
uma pesquisa com 180 eleitores, dentre os quais, 95 são favoráveis à reeleição. Ao nível α = 5% 
podemos concluir que a proporção de eleitores favoráveis à reeleição é superior 50%? 
 
Seguimos o caminho: Stat > Basic Statistics > 1 Proportion, em Summarized data, digitamos 
180 como Number of tr ials: e 95 em Number of successes. A seguir, em Options, indicamos em 
Test proportion o valor 0.50, em Alternative: greater then e usamos a opção Use test and 
interval based on normal distr ibution. Como alternativa, digitamos: 
MTB > POne 180 95; 
SUBC> Test .50; 
SUBC> Alternative 1; 
SUBC> UseZ. 
 
Introdução ao uso do MINITAB® 
15 
 
 
 
Test and CI for One Proportion 
 
Test o f p = 0 . 5 v s p > 0 . 5 
Sampl e X N Sampl e p 95. 0% Lower B ound Z- Val ue P- Val ue 
1 95 180 0. 527778 0. 466572 0. 75 0. 228 
 
e podemos concluir que a hipótese H0: p = 0,50 não deve ser rejeitada, pois o nível descritivo do 
teste é muito alto ( α̂ = P = 0,228), ou seja, a reeleição do candidato A não está garantida. 
 
 
6. COMPARAÇÕES ENTRE AS MÉDIAS DE DUAS DISTRIBUIÇÕES NOR-
MAIS 
 
Para compararmos as médias de duas populações normalmente distribuídas e independentes, 
ou seja, Ho: µµi = µµj versus H1: µµi ≠≠ µµj (ou H1: µµi > µµj ou ainda H1: µµi < µµj), quando as variâncias 
populacionais são desconhecidas, seguimos o caminho Stat > Basic Statistics > 2-Sample t ou usa-
mos o comando: 
MTB > T WOSAMPLE [ coef i ci ent e d e c onf i ança] C i C j 
• Ci e Cj identificam as colunas onde estão inseridos os valores amostrais das duas populações. 
• Se as variâncias populacionais forem consideradas iguais, usamos também o subcomando 
POOLED. 
• Se o coeficiente de confiança (γ) for omitido, será calculado um I.C. para a diferença entre as 
médias populacionais assumindo γ = 95%. 
 
Exemplo: Utilizando os dados do exemplo da seção 4.1e assumindo que uma outra amostra de ida-
des foi retirada da turma de 1998, cujos resultados foram {18; 19; 19; 19; 18; 18; 17; 18; 19; 18}, 
desejamos testar se as idades médias das turmas de 1997 e 1998 podem ser consideradas iguais. 
 �
 C1 C2 C3 C4 
 1997 1998 Amostra Idade 
1 19 18 1 19 
2 17 19 1 17 
3 19 19 1 19 
4 18 19 1 18 
5 17 18 1 17 
6 20 18 1 20 
7 18 17 1 18 
8 19 18 1 19 
9 20 19 1 20 
10 18 18 1 18 
11 2 18 
12 2 19 
13 2 19 
14 2 19 
15 2 18 
16 2 18 
17 2 17 
18 2 18 
19 2 19 
20 2 18 
Os dados das amostras podem estar coloca-
dos em colunas diferentes (C1 e C2, respectiva-
mente) ou empilhadas na coluna C4, mas com a 
coluna C3 indicando o número da amostra corres-
pondente, de acordo com a figura abaixo: 
Para empilharmos os dados das colunas C1 
(1997) e C2 (1998) na coluna C4, colocando em 
C3 um índice associando o número da amostra, 
usamos o comando: 
MTB > Stack (c1 c2) c4; 
SUBC> Subscripts c3. 
Como já sabemos, antes de compararmos as 
médias, devemos saber se podemos admitir que as 
variâncias das idades das duas turmas podem ser 
consideradas iguais ou não. 
Para compararmos as variâncias das duas 
turmas, que consiste em testar H0: 21σ = 
2
2σ versus 
H1: 21σ ≠ 22σ , usamos: 
 
Introdução ao uso do MINITAB® 
16 
 
MTB > % Var t est C 4 C 3; 
SUBC> C onf i dence 9 5. 0. 
Resultando em: 
 
Test for Equal Variances 
 
Response Idade 
Factors Amostra 
ConfLvl 95.0000 
 
Bonferroni confidence intervals for standard deviations 
 Lower Sigma Upper N Factor Levels 
0.706534 1.08012 2.17499 10 1 
0.441500 0.67495 1.35911 10 2 
 
F- Test (normal distribution) 
Test Statistic: 2.561 
P- Value : 0.177 
 
Levene's Test (any continuous distribution) 
 Test Statistic: 2.939 
Ou seja, pelos testes F e de Levene, a igualdade das variâncias foi aceita, pois o nível descritivo 
associado às estatísticas foi igual ou superior a 0,104 (valor que pode ser considerado alto!). 
Após a decisão sobre a igualdade (ou não) das variâncias, podemos comparar as médias popula-
cionais, usando o teste t-Student conveniente. 
 
 
CASO 1. AS VARIÂNCIAS POPULACIONAIS FORAM CONSIDERADAS IGUAIS 
 
 Seguimos o caminho: Stat > Basic Statistics > 2-Sample t, em > Samples in different 
columns indicamos C1 em First e C2 em Second. A seguir escolhemos Alternative: not equal e 
clicamos em Assume equal variances. Alternativamente, usamos o comando: 
MTB > TWOSAMPLE 9 5 c 1 c 2; 
SUBC> A l t er nat i ve 0; 
SUBC> p ool ed. 
 
 
Two-Sample T-Test and CI: Amostra 1; Amostra 2 
 
Two- sample T for Amostra 1 vs Amostra 2 
 
 N Mean StDev SE Mean 
Amostra1 10 18.50 1.08 0.34 
Amostra2 10 18.300 0.675 0.21 
 
Difference = mu Amostra 1 - mu Amostra 2 
Estimate for difference: 0.200 
95% CI for difference: ( - 0.646; 1.046) 
T- Test of difference = 0 (vs not =): T - Value= 0.50 P - Value= 0.626 DF= 18 
Both use Pooled StDev = 0.901 
 
Observe que são apresentados: 
• a média (mean), o desvio padrão (StDev) e o erro padrão da média (SE Mean) de cada uma das 
amostras; 
 
Introdução ao uso do MINITAB® 
17 
 
• um intervalo de confiança para a diferença das médias, com γ = 95%; 
• o valor da estatística t-Student (T=0.50), o nível descritivo do teste ( α̂ = P = 0.626) e o número 
de graus de liberdade (DF=18); 
• o valor do desvio padrão comum (Both use Pooled StDev) é 0,901 e é usado no teste porque 
assumimos que as variâncias podem ser consideradas iguais. 
• Como o nível descritivo do teste foi alto ( α̂ = P = 0,63), não temos motivos para rejeitar a hipó-
tese H0 e concluímos que as idades médias das turmas de 1997 e 1998 são iguais. 
 
Podemos também realizar o teste com os dados que estão empilhados em C3 e C4, usando os 
comandos: 
MTB > TWOT 95 C4 C3; 
SUBC> Alternative 0; 
SUBC> Pooled. 
Ou usando o caminho: Stat > Basic Statistics > 2-Sample t e indicamos C4 em Samples in the 
column > Samples e C3 em Subscripts. A seguir escolhemos Alternative: not equal e clica-
mos em Assume equal variances. 
 
 
CASO 2. AS VARIÂNCIAS POPULACIONAIS FORAM CONSIDERADAS DIFERENTES 
 
Para desejamos comparar as médias de duas populações normalmente distribuídas e com 
variân-cias desconhecidas e diferentes, usamos o caminho: Stat > Basic Statistics > 2-Sample t, 
em > Samples in different columns indicamos C1 em First e C2 em Second. A seguir escolhemos 
Alternative: not equal, mas não selecionamos Assume equal variances. 
Quando não usamos a opção Assume equal var iances, o Minitab faz a comparação das 
médias usando a estatística t-Student aproximada, com número de graus de liberdade calculados 
pela fórmula de Sattertwait. Alternativamente, podemos usar o comando: 
MTB > TWOSAMPLE C1 C2 
 
 
Two Sample T-Test and Confidence Interval 
 
Two sample T for Amostra1 vs Amostra2 
 N Mean StDev SE Mean 
Amostra1 10 18.50 1.08 0.34 
Amostra2 10 18.300 0.675 0.21 
 
95% CI for mu Amostra1 - mu Amostra2: ( -0.66, 1.06) 
T-Test mu Amostra1 = mu Amostra2 (vs not =): T=0.50 P=0.63 DF=15 
 
Ou seja: como o nível descritivo do teste foi alto (0,63), não temos motivos para rejeitar a hipóte-
se H0 e então, concluímos que as médias dos dois grupos de idades são iguais. 
 
 
 
Introdução ao uso do MINITAB® 
18 
 
7. COMPARAÇÃ O DE MÉDIAS DE DUAS POPULAÇÕES DEPENDENTES – 
DADOS PAREADOS. 
 
 Outro problema bastante comum consiste em compararmos as médias de duas populações 
normais que não são independentes, ou seja, os dados são pareados. 
 
Exemplo (Apostila de Estatística II ) Com o objetivo de testar (α = 5%) se a suplementação de 
alfafa aumenta o ganho médio de peso de coelhos em mais de 0,10kg, foram utilizados 8 pares de 
coelhos. Os resultados foram os seguintes: 
Par no 1 2 3 4 5 6 7 8 
X (com) 0,72 0,90 0,67 0,83 0,67 0,93 0,80 0,75 
Y (sem) 0,32 0,49 0,510,45 0,70 0,52 0,35 0,60 
 
Para fazermos a comparação de médias proposta, precisamos criar as três colunas de dados: C5, 
C6 e C7, que é obtida: 
MTB > Let c7 = c5 - c6 
�
 C5 C6 C7 
 Com Sem D=Com-Sem 
1 0.72 0.32 0.40 
2 0.90 0.49 0.41 
3 0.67 0.51 0.16 
4 0.83 0.45 0.38 
5 0.67 0.70 -0.03 
6 0.93 0.52 0.41 
7 0.80 0.35 0.45 
8 0.75 0.60 0.15 
 
Após a criação da coluna C7, para testarmos 
H0: µD = 0,10 vs H1: µD > 0,10, seguimos o 
caminho: Stat > Basic Statistics > 1-Sample t, 
escolhemos C7 em Variables, colocamos o valor 
0.10 em Test mean e escolhemos greater than 
em Alternative. Uma maneira alternativa, com-
siste em entrar com o comando: 
MTB > ttest 0.10 C7; 
SUBC> alternative 1. 
 
Resultado em: 
 
 
T-Test of the Mean 
 
Test o f m u = 0 . 1000 v s m u > 0 . 1000 
 
Var i abl e N Mean St Dev SE Mean T P 
D=COM- SEM 8 0. 2913 0. 1746 0. 0617 3. 10 0. 0087 
 
Como o nível descritivo do teste é muito pequeno (p = 0.0087) rejeitamos a hipótese H0 e com-
cluímos que a suplementação de alfafa aumenta o ganho médio de peso de coelhos em mais de 
0,10 kg. 
 
Outra alternativa de executar o teste consiste em util izar os comandos: 
MTB > P ai r ed ' Com' ' Sem' ; 
SUBC> Test . 10; 
SUBC> Al t er nat i ve 1 . 
ou o caminho: Stat > Basic Statistics > Paired t..., indicando C5 como First sample e C6 em 
Second sample. Resultando em: 
 
 
Introdução ao uso do MINITAB® 
19 
 
 
Paired T-Test and CI: Com; Sem 
 
Paired T for Com - Sem 
 N Mean StDev SE Mean 
Com 8 0.7837 0.0988 0.0349 
Sem 8 0.4925 0.1240 0.0438 
Difference 8 0.2912 0.1746 0.0617 
 
95% lower bound for mean difference: 0.1743 
T-Test of mean difference = 0.1 (vs > 0.1): T-Value = 3.10 P-Value = 0.009 
 
 
 
 
 
8. CORRELAÇÃO E REGRESSÃO LINEAR SIMPLES 
 
 A seguir veremos como usar o Minitab para estudar o relacionamento entre duas variáveis 
quantitativas, calculando o coeficiente de correlação linear (de Pearson) entre elas e ajustando uma 
reta que relaciona uma variável Y (variável resposta ou dependente) e outra variável X (também 
chamada de covariada, variável explanatória ou independente). 
 
 
8.1. COEFICIENTE DE CORRELAÇÃO LINEAR DE PEARSON 
 
Exemplo (da Apostila de Estatística I I ) Com o objetivo de estudar a relação entre o peso médio 
de coelhos ao abate (Y), em quilogramas, e o tamanho de ninhada (X), foram coletados na granja do 
Campus os dados apresentados a seguir. 
X: Tamanho da ninhada 4 8 6 1 7 3 7 5 
Y: Peso médio ao abate 2,125 1,980 2,270 2,300 1,880 2,320 1,860 2,050 
 
Vamos colocar os dados das variáveis X e Y nas colunas C8 e C9. 
 
C8 C9 �
 
Ninhada Peso 
1 4 2.125 
2 8 1.980 
3 6 2.270 
4 1 2.300 
5 7 1.880 
6 3 2.320 
7 7 1.860 
8 5 2.050 
 
Para visualizarmos a possível relação entre as variáveis: 
Ninhada e Peso ao Abate, seguimos o caminho: Graph > Plot 
e em Graph variables escolhemos C9 em Y e C8 em X, por 
exemplo. Ou então, digitamos: 
MTB > plot C9*C8 
(note que os valores da coluna C9 vão aparecer no eixo-y e os 
valores da coluna C8, no eixo-x) 
 
• Pode-se observar no gráfico que, à medida que o tamanho da ninhada aumenta, ocorre uma 
diminuição do peso ao abate, indicando uma correlação negativa entre as duas variáveis. 
 
 
 
Introdução ao uso do MINITAB® 
20 
 
87654321
2.35
2.25
2.15
2.05
1.95
1.85
Ninhada
P
es
o
 
Gráfico de dispersão dos pesos ao abate (kg) e tamanhos de ninhada de coelhos 
 
Para calcularmos o coeficiente de correlação linear de Pearson entre as colunas C8 e C9 segui-
mos o caminho: Stat > Basic statistics > Correlation... e escolhemos C8 e C9 como Variables. 
Ou então, digitamos: 
MTB > Correlation C8 C9 
 
 
Correlations: Ninhada; Peso 
 
Pearson correlation of Ninhada and Peso = -0.776 
P-Value = 0.024 
 
• confirmada a correlação negativa (–0,776) entre o tamanho da ninhada e o peso ao abate. A hi-
pótese H: ρ(X, Y) = 0 foi rejeitada, pois o nível descritivo do teste (P-Value= 0,024) foi peque-
no. Concluimos então que existe uma dependência entre X: tamanho da ninhada e Y: peso ao 
abate de coelhos. 
 
 
 
8.2. REGRESSÃO LINEAR SIMPLES 
 
Exemplo (Apostila de Estatística II ) Determinar a reta que relaciona a Absorbância (Y) com a 
concentração de nitrito (X, em mg/100ml) em amostras de mortadela. Os dados experimentais são: 
X: nitrito 0,5 1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0 
Y: Absorbância 0,040 0,078 0,145 0,215 0,300 0,340 0,395 0,460 0,560 0,715 
 
Antes de realizarmos os cálculos, é importante visualizarmos a (possível !) relação linear entre as 
variáveis X: Nitrito e Y: Absorbância. Isso pode ser feito através do comando: 
MTB > plot C11*C10 
 
Introdução ao uso do MINITAB® 
21 
 
Colocando os dados de X: Nitrito e Y: Absorbância nas colunas C10 e C11, respectivamente, a 
análise de regressão é feita da seguinte maneira: Stat > Regression > Regression... e escolhe-
mos C11 como Response, e C10 como Predictors. Ou então, usamos o comando: 
MTB > R egr ess C 11 1 C 10 
 
 
The regression equation is 
Y:Absorbância = - 0.0044 + 0.0724 X:Nitrito (1) 
 
Predictor Coef SE Coef T P 
Constant - 0.00439 0.01975 - 0.22 0.830 (2) 
X:Nitrit 0.072350 0.003698 19.56 0.000 (3) 
 
 S = 0.03271 R - Sq = 98.0% R - Sq(adj) = 97.7% (4) 
Analysis of Variance (5) 
 
Sourc e DF SS MS F P 
Regression 1 0.40947 0.40947 382.69 0.000 
Residual Error 8 0.00856 0.00107 
Total 9 0.41803 
 
Unusual Observations (6) 
Obs X:Nitrit Y:Absorb Fit SE Fit Residual St Resid 
 10 9.00 0.7150 0.6468 0.0194 0.0682 2.59R 
 R denotes an observation with a large standardized residual 
 
Onde podemos identificar: 
(1) A equação da reta ajustada: Y:Absorbância = –0.0044 + 0.0724 X:Nitrito. 
(2) A estimativa do intercepto ( â = –0,00439), o seu erro padrão (0,01975), o valor da estatística 
para o teste H0: a = 0 vs. H1: a ≠ 0 é T = –0,22 e o nível descritivo do teste é P = 0,830. 
(3) A estimativa da inclinação ( b̂= 0,072350), o seu erro padrão (0,003698), o valor da estatísti-
ca para o teste H0: b = 0 vs. H1: b ≠ 0 é T = 19,56 e o nível descritivo do teste é P = 0,000. 
(4) A estimativa do desvio padrão é s = 0,03271, o coeficiente de determinação (R2) é R-Sq = 
98,0% e o coeficiente de determinação ajustado (R2ajust) para o número de parâmetros é R-
Sq(adj) = 97,7% 
(5) O quadro da análise de variância para a regressão, indicando que o modelo de regressão 
linear foi significativo (isto é, explica bem o relacionamento entre Y e X), já que a fonte de 
variação associada ao modelo (Regression) é significativa (P = 0.000) 
(6) Indica que a décima observação (X = 9 e Y = 0,7150) apresenta um grande residuo padro-
nizado, sendo uma séria candidata a outlier. 
 
Comentários: o intercepto pode ser retirado do modelo, pois a hipótese H0: a = 0 não foi rejeita-
da; o coeficiente angular da reta (inclinação) não é nulo, pois a hipótese H0: b = 0 foi rejeitada; o 
valor alto do coeficiente de determinação (R2) indica uma boa qualidade do ajuste. 
 
Para solicitarmos a construção de um gráfico dos resíduos do modelo em função da variável X: 
Nitr ito, após definirmos o modelo de regressão linear, vamos para Graphs > Residuals for 
Plots > Regular e em Residuals versus the var iables: escolhemos C10. O gráfico resultante 
sugere a não existência de aleatoriedade dos resíduos e a presença de um outlier. 
 
 
Introdução ao uso do MINITAB® 
22 
 
 
9876543210
0.05
0.00
-0.05
X:Nitrit
R
es
id
ua
l
Residuals Versus X:Nitrit
(response is Y:Absorb)
outlier
 
 
Se quisermos que o modelo de regressão não contenha o intercepto, fazemos: Stat > Regression 
> Regression..., como Response escolhemos a coluna C11 e comoPredictors, a coluna C10 e 
em Options desmarcamos a opção Fit intercept. Ou então, utili zamos o comando: 
MTB > R egr ess ' Y: Absor banci a' 1 ' X: Ni tr i t o' ; 
SUBC> NoConst ant ; 
 
 
The regression equation is 
Y:Absorbancia = 0.0716 X:Nitrito 
 
Predictor Coef SE Coef T P 
Noconstant 
X:Nitrito 0.071649 0.001832 39.12 0.000 
 
S = 0.03094 
 
Analysis of Variance 
Source DF SS MS F P 
Regression 1 1.4644 1.4644 1530.18 0.000 
Residual Error 9 0.0086 0.0010 
Total 10 1.4730 
 
Unusual Observations 
Obs X:Nitrit Y:Absorb Fit SE Fit R esidual St Resid 
 10 9.00 0.71500 0.64484 0.01648 0.07016 2.68R 
 
 
• Dos resultados apresentados, temos que a estimativa da inclinação da reta que passa pela origem 
é 0,071649, um pouco inferior à do modelo com intercepto (0.072350). 
• Mais uma vez, o Minitab indica que a décima observação é candidata a valor discrepante. 
Sugestão: retirar este par de valores (X=9, Y=0,7150) do conjunto de dados e refazer a análise. 
• Como exercício, faça isso e verifique que o problema da presença de outlier fica resolvido e as 
conclusões sobre o modelo não se alteram. 
 
Introdução ao uso do MINITAB® 
23 
 
 
9. TABELAS DE CONTINGÊNCIA 
 
 No módulo Stat > Tables encontramos as ferramentas para construção de tabelas, como: 
• Cross tabulation: constrói tabelas de contingência para uma, duas ou mais variáveis categóri-
cas. As suas células podem conter contagens, porcentagens e estatísticas descritivas tais como a 
média e o desvio padrão, associadas a variáveis numéricas. Também disponibil iza o teste de 
Quiquadrado testar a associação de variáveis. 
• Tally: constrói tabelas com freqüências absolutas, percentuais e percentuais acumuladas para os 
valores distintos das variáveis. 
• Chi-Squared Test: faz o teste de Quiquadrado de uma tabela de contingência. 
• Multiple Correspondence Analysis: executa a análise de correspondência para três ou mais 
variáveis categóricas. 
 
Para exercitar o uso de alguns desses comandos, vamos utilizar os dados da tabela com 
características da turma de Estatística II de 1997. 
 
 
1) Para construir uma distribuição de freqüências da variável Idade, seguimos o caminho Stat > 
Tables > Tally..., selecionamos a variável Idade e todas as opções de Display, ou digitamos: 
MTB > T al l y ' I dade' ; 
SUBC> Count s; 
SUBC> CumCount s; 
SUBC> Per cent s; 
SUBC> CumPer cent s. 
 
 
Tally for Discrete Variables: Idade 
Id ade Count C umCnt Per cent C umPct 
 18 5 5 16. 13 16. 13 
 19 9 14 29. 03 45. 16 
 20 8 22 25. 81 70. 97 
 21 6 28 19. 35 90. 32 
 22 1 29 3. 23 93. 55 
 23 2 31 6. 45 1 00. 00 
 N= 31 
 
 
 
 
2) Será que a maioria dos alunos que fizeram escola pública (2o grau) também fez cursinho? 
Para ajudar a responder essa pergunta, vamos construir uma tabela de contingência das variáveis: 
Escola pública? e Cursinho? usando: Stat > Tables > Cross tabulation..., escolhendo as 
variáveis: Escola pública? e Cursinho? e selecionando como Display: Counts e Row percents, 
ou digitamos: 
MTB > T abl e ' Escol a P úbl i ca?' ' Cur s i nho?' ; 
SUBC> Count s; 
SUBC> RowPer cent s. 
 
 
 
 
 
Introdução ao uso do MINITAB® 
24 
 
 
 
Rows: Escol a Pública? Columns: Cursinho? 
 
 não sim All 
 
 não 10 15 25 
 40.00 60.00 100.00 
 
 sim 1 5 6 
 16.67 83.33 100.00 
 
 All 11 20 31 
 35.48 64.52 1 00.00 
 
 Cell Contents -- Count 
 % of Row 
 
onde podemos perceber que 83,33% dos alunos que fizeram o 2o em Escola Pública precisaram 
fazer cursinho; dentre os alunos de escola particular, essa porcentagem cai para 60%. 
 
Para testarmos se existe alguma relação entre essas duas variáveis categóricas, podemos 
solicitar o teste de Quiquadrado para as hipóteses 
H0: Cursinho? é independente de Escola Pública? 
H1: Cursinho? é dependente de Escola Pública? 
 
usando os comandos: 
MTB > T abl e ' Escol a P úbl i ca?' ' Cur s i nho?' ; 
SUBC> C hi squar e. 
 
 
Rows: Escola Pública? Columns: Cursinho? 
 
 não sim All 
 
 não 10 15 25 
 sim 1 5 6 
 All 11 20 31 
 
Chi - Square = 1.151; DF = 1; P - Value = 0.283 
2 cells with expected counts less than 5.0 
 
• como o nível descritivo é alto (P-value=0,283) não rejeitamos H0 e concluímos que as duas 
variáveis classificatórias são independentes. 
 
 
3) Construir uma tabela com estatísticas básicas da variável C4: peso, por C2: sexo e por C13: 
Fuma?, mais o teste de Quiquadrado para verificar se o ato fumar independe do sexo: 
MTB > t abl e c 2 c 13; 
SUBC> s t at s c 4; 
SUBC> c hi sq. 
 
 
 
 
 
 
 
Introdução ao uso do MINITAB® 
25 
 
 
 
 
 
Rows: Sexo Columns: Fuma? 
 
 não sim All 
 F 1 0 3 13 
 56.380 62.333 57.754 
 6.050 15.373 8.582 
 10 3 13 
 
 M 15 3 18 
 80.267 79.000 80.056 
 16.241 13.077 15.414 
 15 3 18 
 
 All 25 6 31 
 70.712 70.667 70.703 
 17.614 15.693 17.007 
 25 6 31 
Chi - Square = 0.199; DF = 1; P - Value = 0.656 
2 cells with expected counts less than 5.0 
 
 Cell Contents -- 
 Peso:N 
 Mean 
 StDev 
 Count 
 
 
4) Para construir uma tabela com três variáveis classificatórias C2: Sexo, C10: Alojamento? e C12: 
Esporte?, podemos usar o comando 
MTB > t abl e c 2 c 10 c 12 
 
Control: Esporte? = não 
 Rows: Sexo Co lumns: Alojamen 
 
 não sim All 
 
 F 1 2 3 
 M 4 1 5 
 All 5 3 8 
 
 Control: Esporte? = sim 
 Rows: Sexo Columns: Alojamen 
 
 não sim All 
 
 F 1 9 10 
 M 6 7 13 
 All 7 16 23 
 
 Cell Contents -- 
 Count 
 
 Se trocarmos a ordem das colunas no comando, mudamos a disposição das variáveis na tabela. 
Podemos também alterar a apresentação dos resultados na tabela, para evidenciar alguma relação 
ou para compactar a saída dos resultados, utilizando o subcomando layout . 
 
Introdução ao uso do MINITAB® 
26 
 
Neste mesmo exemplo, onde temos 3 variáveis classificatórias, se quisermos que a tabela apre-
sente uma variável nas linhas e duas variáveis nas colunas, devemos usar: 
MTB > t abl e c 2 c 10 c 12; 
SUBC> l ayout 1 2 . 
 
 
Rows: Sexo Columns: Alojamen / Esporte? 
 
 não sim All 
 -------------- -------------- ----- 
 não sim não sim All 
 
 F 1 1 2 9 13 
 M 4 6 1 7 18 
 All 5 7 3 16 31 
 
 Cell Contents -- 
 Count 
 
 
Se quisermos ainda, que seja apresentada a porcentagem de alunos por sexo nas diversas classes 
e a média de C14: Estatística I, usamos: 
MTB > t abl e c 2 c 10 c 12; 
SUBC> l ayout 1 2 ; 
SUBC> r owper cent s; 
SUBC> mean C 14. 
 
 
 Rows: Sexo Columns: Alojamen / Esporte? 
 
 não sim All 
 -------------- -------------- ----- 
 não sim não sim All 
 
 F 7.69 7.69 15.38 69.23 100.00 
 6.0000 8.4000 2.95004.3667 4.5846 
 
 M 22.22 33.33 5.56 38.89 100.00 
 6.5250 3.5500 4.4000 5.6000 5.0556 
 
 All 16.13 22.58 9.68 51.61 100.00 
 6.4200 4.2429 3.4333 4.9063 4.8581 
 
 Cell Contents -- 
 % of Row 
 Estat - I: Mean 
 
 
Onde podemos notar: 
• que a porcentagem de alunas que praticam esporte é maior dentre aquelas que moram no alo-
jamento; 
• essa característica também se mantém entre os alunos, mas de forma menos sensível; 
• dentre os alunos de ambos os sexos que não moram no alojamento, a média em Estatística I 
foi maior entre aqueles que não praticam qualquer tipo de esporte. 
 
Introdução ao uso do MINITAB® 
27 
 
INTRODUÇÃO AO USO DO MINITAB NA ANÁ LISE DE VARIÂNCIA 
(COM EXEMPLOS) 
 
EXEMPLO 1. DELINEAMENTO INTEIRAMENTE CASUALIZADO (DIC) 
 
Com o objetivo de avaliar a utilização do farelo bruto realizou-se um experimento com duração de 
28 dias, envolvendo 4 tratamentos (0, 10, 20 e 30% de substituição) e 5 repetições por tratamento. 
Cada parcela foi constituída de 50 pintos de um dia de idade da linhagem "Ross", sendo 25 machos 
e 25 fêmeas. Os resultados dos ganhos de peso médio, em kg, de cada parcela são: 
% de substituição por farelo bruto 
0% 10% 20% 30% 
0.60 0.82 0.79 0.82 
0.62 0.85 0.83 0.81 
0.61 0.78 0.82 0.79 
0.64 0.79 0.81 0.80 
0.63 0.80 0.82 0.79 
 
C1 C2 C3 �
 
Farelo Repet GP 
1 0 1 0.60 
2 0 2 0.62 
3 0 3 0.61 
4 0 4 0.64 
5 0 5 0.63 
6 10 1 0.82 
7 10 2 0.85 
8 10 3 0.78 
9 10 4 0.79 
10 10 5 0.80 
11 20 1 0.79 
12 20 2 0.83 
13 20 3 0.82 
14 20 4 0.81 
15 20 5 0.82 
16 30 1 0.82 
17 30 2 0.81 
18 30 3 0.79 
19 30 4 0.80 
20 30 5 0.79 
• A criação de uma planilha (Worksheet) com esses dados 
envolve a digitação dos dados em três colunas: a 
primeira (C1) de nome Farelo, indicando os níveis de 
tratamento; a segunda (C2) de nome Repet, com o 
número da repetição dentro de cada tratamento e a 
terceira (C3) de nome GP, com os correspondentes 
ganhos de peso. 
• Para exibir esses dados no monitor, usamos o mouse e 
clicamos em Manip > Display data... A seguir selecio-
namos as colunas C1, C2 e C3 com um clique duplo 
sobre seus nomes e depois clicamos em Ok. Uma forma 
alternativa consiste em entrar com o seguinte comando 
na janela Session: 
MTB > print c1-c3 
• Para calcular algumas estatísticas descritivas da coluna 
de ganhos de peso, usamos: 
MTB > describe c3; 
 
Resultando em: 
 
 
Descriptive Statistics 
Variable Farelo N Mean Median Tr Mean StDev SE Mean 
GP 0 5 0.62000 0.62000 0.62000 0.01581 0.00707 
 10 5 0.80800 0.80000 0.80800 0.02770 0.01240 
 20 5 0.81400 0.82000 0.81400 0.01517 0.00678 
 30 5 0.80200 0.80000 0.80200 0.01304 0.00583 
 
Variable Farelo Min Max Q1 Q3 
GP 0 0.60000 0.64000 0.60500 0.63500 
 10 0.78000 0.85000 0.78500 0.83500 
 20 0.79000 0.83000 0.80000 0.82500 
 30 0.79000 0.82000 0.79000 0.81500 
 
 
Introdução ao uso do MINITAB® 
28 
 
Se quizermos calcular somente a média e o desvio padrão de GP de cada um dos tratamen-
tos, podemos fazer: Stat > Table > Cross Tabulation, escolher como Classification variables a 
coluna C1 Farelo; em Summaries escolher C2 GP como Associated variables: e marcar no 
Display os nomes Means e Standard deviations. Como alternativa, entramos com o comando: 
MTB > table c1; 
SUBC> mean c3; 
SUBC> stdev c3. 
 
 
Rows: Farelo 
 
 Ganho Ganho 
 Mean StDev 
 1 0.62000 0.01581 
 2 0.80800 0.02775 
 3 0.81400 0.01517 
 4 0.80200 0.01304 
 All 0.76100 0.08540 
 
 
Se quisermos testar a homogeneidade das variâncias dos tratamentos, devemos clicar em Stat > 
ANOVA > Homogeneity of variance e a seguir, escolher em Response a coluna C3 GP e em 
Factors a coluna C1 Farelo. Ou então usar o comando: 
MTB > %Vartest c3 c1 
 
O resultado consiste de um gráfico com intervalos de confiança para os desvios padrões dos trata-
mentos e os resultados dos testes de Bartlett e de Levene. Vale lembrar que podemos assumir que 
as variâncias são iguais se o P-value (nível descritivo do teste) for superior a 5% (mais comum!) 
ou a 10%. 
 
0.100.050.00
95% Confidence Intervals for Sigmas
P-Value : 0.548
Test Statistic: 0.731
Levene's Test
P-Value : 0.439
Test Statistic: 2.705
Bartlett's Test
Factor Levels
30
20
10
 0
Homogeneity of Variance Test for GP
 
 
Para fazer a análise de variância dos dados desse experimento, cujo delineamento é o inteira-
mente casualizado com 5 repetições/tratamento, comparar as médias através do teste de Tukey 
 
Introdução ao uso do MINITAB® 
29 
 
(α= 5%) e calcular os resíduos (e gravar em C5) para, posteriormente, verificarmos se os erros 
têm distribuição normal, devemos clicar em Stat > ANOVA > Oneway, escolher em Response a 
coluna C3 GP, em Factor a coluna C1 Farelo, em Comparisons a opção Tukey, family error 
rate: 5 e clicar no quadro Store residuals. Ou então, entrar com o comando: 
MTB > o neway c 3 c 1 c 4; 
SUBC> T ukey 5 . 
 
Analysis of Variance for Ganho (1) 
 
Source DF SS MS F P 
Farelo 3 0.132900 0.044300 124.79 0.000 
Error 16 0.005680 0.000355 
Total 19 0.138580 
 Individual 95% CIs For Mean 
 Based on Pooled StDev (2) 
Level N Mean StDev ---- +--------- +--------- +--------- +-- 
1 5 0.62000 0.01581 ( -- * - ) 
2 5 0.80800 0.02775 ( - * -- ) 
3 5 0.81400 0.01517 ( - * -- ) 
4 5 0.80200 0.01304 ( -- * - ) 
 ---- +--------- +--------- +--------- +-- 
Pooled StDev = 0.01884 0.630 0.700 0.770 0.840 
 
 
Tukey's pairwise comparisons (3) 
 
 Family error rate = 0.0500 
Individual error rate = 0.0113 
Critical value = 4.05 
 
Intervals for (column level mean) - (row level mean) 
 
 1 2 3 
 
 2 - 0.22213 
 - 0.15387 
 
 3 - 0.228 13 - 0.04013 
 - 0.15987 0.02813 
 
 4 - 0.21613 - 0.02813 - 0.02213 
 - 0.14787 0.04013 0.04613 
 
Comentários sobre os resultados: 
(1) no quadro da análise de variância podemos verificar a significância do fator Farelo (p<0,0001), 
ou seja, podemos afirmar que existe pelo menos um efeito não nulo do fator Farelo sobre o GP, 
ou que pelo menos duas das médias do fator Farelo são diferentes entre si, quanto ao GP. 
(2) o número de observações, a média e o desvio padrão de cada nível do fator Farelo, além de 
intervalos de confiança para as médias, podendo-se observar que os animais que receberam os 
níveis 10, 20 e 30 tiveram um GP similar entre si e superior ao nível 0 (zero). 
(3) resultados da comparação das médias do fator Farelo utilizando o teste de Tukey (5%). São 
apresentados intervalos de confiança para a diferença entre as médias dos diversos níveis. 
Diferenças significativas entre médias podem ser identificadas nos intervalos onde os limites 
(inferior e superior) têm o mesmo sinal. Pode-se perceber que as comparações envolvendo o 
nível “0” são significativas e que as comparações envolvendo outras duas médias não são 
significativas. A tabela seguinte, resume esses resultados: 
 
Introdução ao uso do MINITAB® 
30 
 
 
Farelo Média 
0 0.62000 a 
10 0.80800 b 
20 0.81400 b 
30 0.80200 b 
 
OBSERVAÇÃ O IMPORTANTE: como o fator Farelo é uma variável quantitativa, não é indi-
cado o uso de qualquer método de comparação múltipla para avaliar as possíveis diferenças 
entre as médias desse fator. Neste caso,é indicado um estudo de regressão, para estudarmos a 
relação entre os níveis do fator Farelo e os ganhos de peso dos animais. 
 
Com o Minitab, podemos visualizar o comportamento das respostas médias fazendo: Stat > 
ANOVA > Main Effects plot.. e escolhendo C3 GP como Responses: e C1 Farelo como Factors:. 
Do gráfico resultante pode-se perceber uma tendência quadrática de resposta de Y (ganho de peso) 
em função de X (% de substituição por farelo bruto). Para ajustar uma equação do segundo grau, 
fazemos Stat > Regression > Fitted Line Plot... e escolhemos C3 GP como Response (Y) e C1 
Farelo como Predictor (X) e finalmente, escolhemos Quadratic em Type of Regression Model. 
 
 
 
O resultado é um gráfico de dispersão com o desenho da curva ajustada, sua equação é GP = 
0.6282 + 0.02052 Farelo - 0.0005 Farelo**2 , uma estimativa do desvio padrão dos dados é S = 
0,0270120, o coeficiente de determinação R-Sq = 91.0 % e o coeficiente de determinação ajustado 
R-Sq(adj) = 90.0 %, indicando um ótimo ajuste do modelo. 
A partir da equação de regressão ajustada, podemos estimar a porcentagem de substituição 
de farelo que proporciona o maior ganho de peso. Para tanto, igualamos a zero a derivada primeira 
de GP em relação a X (Farelo): 
dx
)GP(d
 = 0,02052 – 0,0010X = 0 ⇒ X = 
0010,0
02052,0
 = 20,52 
e obtemos o ponto de resposta máxima é Farelo = 20,52% e GP = 0,84 kg no intervalo de 28 dias. 
 
 
Introdução ao uso do MINITAB® 
31 
 
Se os dados de GP dos tratamentos 0, 10, 20 e 30% estivessem digitados nas colunas C5, 
C6, C7 e C8, respectivamente: 
 
C5 C6 C7 C8 �
 
0% 10% 20% 30% 
1 0.60 0.82 0.79 0.82 
2 0.62 0.85 0.83 0.81 
3 0.61 0.78 0.82 0.79 
4 0.64 0.79 0.81 0.80 
5 0.63 0.80 0.82 0.79 
A mesma análise pode ser feita clicando-se em Stat > ANOVA > Oneway (Unstacked) e, a seguir, 
escolher em Responses (in separate columns) as colunas C5 a C8, ou entrar com o comando: 
MTB > aovoneway C5-c8 
Com esta opção, somente serão mostrados os quadros (1) e (2), não havendo possibili dade de se 
comparar os pares de médias através do teste de Tukey. 
 
Para testar a normalidade dos erros podemos clicar em Stat > Basic Statistics > Normality 
test e a seguir escolher em Variable a coluna C5 RESI1 e em Tests for Normality, escolher um 
dos testes disponíveis (Anderson-Darling, Ryan-Joiner ou Kolmogorov-Smirnov). 
O resultado do teste de Anderson-Darling permite concluir que os erros do modelo (estima-
dos pelos resíduos gravados em C5 RESI1) têm distribuição normal, pois o teste forneceu um nível 
descritivo muito alto (P-Value = 0,909). Um modo mais rápido de executar esse teste consiste em 
usar o comando: 
MTB > %NormPlot c5 
P-Value: 0.909
A-Squared: 0.176
Anderson-Darling Normality Test
N: 20
StDev: 0.0172901
Average: 0
0.040.030.020.010.00-0.01-0.02-0.03
.999
.99
.95
.80
.50
.20
.05
.01
.001
P
ro
ba
bi
lit
y
RESI1
Normal Probability Plot
 
 
Comentários: 
a) neste tipo de análise ainda podemos utili zar alguns gráficos, como por exemplo, o dotplot e o 
boxplot, para avaliar a distribuição, a variabilidade, a assimetria, a presença de valores discrepan-
tes nos dados originais, além do histograma, normal plot etc. dos resíduos para avaliar a sua dis-
tribuição. 
b) se a variável que define o fator é quantitativa, sempre devemos optar por uma análise de regres-
são para estudar o comportamento das respostas em função dos níveis desse fator. 
 
Introdução ao uso do MINITAB® 
32 
 
EXEMPLO 2. DELINEAMENTO INTEIRAMENTE CASUALIZADO - EXPERIMENTO 
FATORIAL 
 
No setor de suinocultura do Campus foi feito um estudo sobre o consumo diário de ração, 
em kg/dia, em suínos no período de crescimento/ acabamento, envolvendo três tipos de ração (R1: 
farelada; R2: granulada e R3: peletizada) e duas formas de arraçoamento (A1: à vontade e A2: 
controlada) e utilizando 4 animais/tratamento. Os dados experimentais resultantes estão apresenta-
dos na tabela abaixo: 
 
Ração 
Arraçoamento 
Farelada Granulada Peletizada 
2.63 2.19 2.31 
2.64 2.21 2.30 
2.65 2.22 2.30 
À vontade 
2.70 2.20 2.28 
2.28 2.32 2.19 
2.26 2.30 2.18 
2.23 2.31 2.16 
Controlada 
2.20 2.30 2.21 
 
A planilha com os dados é construída de modo similar à do Exemplo 1: nas três primeiras 
colunas estão as informações sobre o tipo de ração (C1), o tipo de arraçoamento (C2) e o número 
da repetição (C3); em C4 estão os dados do consumo diária de ração, em kg/dia. Uma parte da 
planilha está apresentada a seguir. Vale notar que a letra -T nas colunas C1 e C2 indica que elas não 
são numéricas. 
 
C1-T C2-T C3 C4 �
 
Racao Arracoamento Repet Consumo 
1 Farelada A vontade 1 2.63 
2 Farelada A vontade 2 2.64 
3 Farelada A vontade 3 2.65 
4 Farelada A vontade 4 2.70 
5 Farelada Controlada 1 2.28 
6 Farelada Controlada 2 2.26 
7 Farelada Controlada 3 2.23 
8 Farelada Controlada 4 2.20 
 continua... 
Uma tabela com as médias de consumo, por tipo de ração e tipo de arraçoamento é obtida 
com os comandos: 
MTB > table c1 c2; 
SUBC > means c4. 
 
Introdução ao uso do MINITAB® 
33 
 
 
 
Rows: Racao Columns: Arracoam 
 
 À vontad Controla All 
 
 Farelada 2.6550 2.2425 2.4488 
 Granulad 2.2050 2.3075 2.2563 
 Peletiza 2.2975 2.1850 2.2413 
 All 2.3858 2.2450 2.3154 
 
 Cell Contents -- 
 Consumo:Mean 
 
 
Podemos inverter a disposição das variáveis classificatórias fazendo: 
MTB > t abl e c 2 c 1; 
SUBC > m eans c 4. 
 
 
 Rows: Arracoam Columns: Racao 
 
 Farelada Granulad Peletiza All 
 
 À vonta d 2.6550 2.2050 2.2975 2.3858 
 Controla 2.2425 2.3075 2.1850 2.2450 
 All 2.4488 2.2563 2.2413 2.3154 
 
 Cell Contents -- 
 Consumo:Mean 
 
 
Para testar a homogeneidade de variâncias clicamos em Stat > ANOVA > Homogeneity of 
variance e a seguir, escolhemos em Response a coluna C4 Consumo e em Factors as colunas C1 
Racao e C2 Arracoam. Ou então, podemos usar o comando: 
MTB > % var t est c 4 c 1 c2 
 
 
Introdução ao uso do MINITAB® 
34 
 
 
Da figura, podemos perceber que pelos testes de Bartlett (P-Value = 0,225) e de Levene (P-Value = 
0,265) a homogeneidade das variâncias foi aceita, e podemos realizar análise de variância. 
 
IMPORTANTE: Se a homogeneidade das variâncias for rejeitada, a análise de variância não deve 
ser utili zada para comparar os tratamentos, já que isso pode interferir nos resultados finais. Soluções 
para este problema envolvem a busca de uma transformação da variável resposta ou o uso de méto-
dos de análise não paramétricos. 
 
 
A análise de variância do experimento fatorial 3x2 (3 tipos de ração e 2 tipos de arraçoa-
mento) em um delineamento inteiramente casualizado com r = 4 repetições, considerando os fatores 
de efeito fixo, é feita clicando-se em Stat > ANOVA > Twoway, escolher em Response a coluna 
C4 Consumo, em Row factor a coluna C1 Racao, em Column factor a coluna C2 Arracoam Store, 
além de clicar em Display means e Store residuals. 
 
 
Two-way ANOVA: Consumo versus Racao; Arracoamento 
 
Analysis of Variance for Consumo 
Source DF SS MS F P 
Racao 2 0.214233 0.107117 211.30 0.000 
Arracoam 1 0.119004 0.119004 234.75 0.000 
Interaction 2 0.267633 0.133817 263.97 0.000 
Error 18 0.009125 0.000507 
Total 23 0.609996 
 
 Individual 95% CI 
Racao Mean ---------- +--------- +--------- +--------- +- 
Farelada 2.4488 ( -- * -- ) 
Granulad 2.2563 ( -- * -- ) 
Peletiza 2.2413 ( -- * - ) 
 ---------- +--------- +------- -- +--------- +- 
 2.2800 2.3400 2.4000 2.4600 
 
 Individual 95% CI 
Arracoam Mean ---- +--------- +--------- +--------- +------- 
À vontad 2.3858 ( -- *-- ) 
Controla 2.2450 ( -- * -- ) 
 ---- +--------- +--------- +--------- +------- 
 2.2500 2.3000 2.3500 2.4000 
 
 
Como o número de repetições é o mesmo para todos os tratamentos, uma alternativa para 
realizar a análise, consiste em utilizar a opção Balanced Anova... Escolhemos então Stat > 
ANOVA > Balanced Anova...; em Responses C4 Consumo; em Model escrevemos Racao 
Arracoam Racao*Arracoam e em Storage marcamos Residuals. Em Options... > Display means 
corresponding to the terms escrevemos Racao Arracoam Racao*Arracoam. Ou então, entramos 
com o comando: 
MTB > a nova c 4 = c 1 c 2 c 1* c2; 
SUBC > m eans c 1 c 2 c 1* c2; 
SUBC > r es i dual s c 4. 
 
Introdução ao uso do MINITAB® 
35 
 
 
 
 ANOVA: Consumo versus Racao; Arracoamento 
 
Fact or Type L evel s V al ues 
Racao f i xed 3 Far el ada Gr anul ada P el et i zada 
 Ar r acoam f i xed 2 A v ont ade C ont r ol ada 
 
Analysis of Variance for Consumo 
Source DF SS MS F P 
Racao 2 0.21423 0.10712 211.30 0.000 
Arracoam 1 0.11900 0.11900 234.75 0.000 
Racao*Arracoam 2 0.26763 0.13382 263.97 0.000 
Error 18 0.00912 0.00051 
Total 23 0.61000 
 
Means 
 
Racao N Consumo 
Farelada 8 2.4488 
Granulada 8 2.2563 
Peletizada 8 2.2413 
 
Arracoam N Consumo 
À vontade 12 2.3858 
Controlada 12 2.2450 
 
Racao Arracoam N Consumo 
Farelada À vontade 4 2.6550 
Farelada Controlada 4 2.2425 
Gran ulada À vontade 4 2.2050 
Granulada Controlada 4 2.3075 
Peletizada À vontade 4 2.2975 
Peletizada Controlada 4 2.1850 
 
 
Comentários: 
• a interação Racao*Arracoam foi significativa (P < 0,001), indicando que o consumo dos animais 
que receberam um certo tipo de ração (farelada, granulada ou peletizada) depende do tipo de 
arraçoamento (à vontade ou controlada) ou vice-e-versa. 
• os efeitos individuais de Ração (P < 0,001) e de Arraçoamento (P < 0,001) foram significativos, 
mas esses resultados não tem grande importância porque a interação foi significativa. 
 
• A interação pode ser melhor entendida analisando-se os gráficos apropriados que são obtidos 
em Stat > ANOVA > Interactions plot , escolhendo a coluna C4: Consumo em Responses:, 
em Factors, as colunas C1: Racao e C2: Arracoam e selecionando Display full interaction plot 
matrix. De forma alternativa, pode-se utili zar o comando 
MTB > % I nt er act c 1 c 2; 
SUBC> Response c 4; 
SUBC> Ful l . 
 
 
 
Introdução ao uso do MINITAB® 
36 
 
Co
ntr
ola
da
Co
ntr
ola
da
A v
on
tad
e
A v
on
tad
e
Pe
let
iza
da
Pe
let
iza
da
Gr
an
ul
ad
a
Gr
an
ul
ad
a
Fa
re
lad
a
Fa
re
lad
a
2.6
2.4
2.2
2.6
2.4
2.2
Racao
Arracoamento
Controlada
A vontade
Peletizada
Granulada
Farelada
Controlada
A vontade
Peletizada
Granulada
Farelada
Interaction Plot - Data Means for Consumo
 
 
 
Exemplo 3. DELINEAMENTO EM BLOCOS CASUALIZADOS E EXPERIMENTO EM 
PARCELAS SUBDIVIDIDAS 
 
Para estudar o efeito de três níveis de adubação (A) e de dois espaçamentos (E) na altura 
(em centímetros) de certo tipo de plantas, planejou-se um experimento em parcelas subdivididas 
num delineamento em blocos casualizados. Os tratamentos principais correspondem a três níveis de 
adubação (A0, A1 e A2) e os tratamentos secundários a dois espaçamentos (E1 e E2). Os blocos (I, II, 
II I, IV) controlam a fertilidade do solo. Os dados são apresentados a seguir: 
 
 A0 A1 A2 
Bloco E1 E2 E1 E2 E1 E2 
I 58 44 85 59 66 54 
II 77 59 90 68 93 75 
III 38 30 73 45 67 53 
IV 52 34 77 55 64 48 
 
A planilha com os dados é construída de modo similar à dos exemplos anteriores: nas três 
primeiras colunas estão as informações sobre os níveis de adubação (C1: Adubacao), os dois espa-
çamentos (C2: Espacamento) e os blocos (C3: Bloco); em C4 estão as alturas em centímetros (C4: 
Altura). 
Se os quadros auxil iares de totais forem necessários para o cálculo de somas de quadrados 
da interação entre Adubação e Espaçamento, podemos utili zar os comandos 
MTB > table c1 c2; 
SUBC> sums c4. 
 
resultando em: 
 
Introdução ao uso do MINITAB® 
37 
 
 
 
Tabulated Statistics 
 
 Rows: Espacame Columns: Adubacao 
 A0 A1 A2 All 
 E1 225.000 325.000 290.000 840.000 
 E2 167.000 227.000 230.000 624.000 
 All 392.000 552.000 520.000 1464.000 
 
 Cell Contents -- 
 Altura:Sum 
 
 
Para testar a homogeneidade das variâncias, podemos (verifique!) utili zar o comando: 
MTB > %Vartest C4 C1 C2 
e, como os níveis descritivos dos testes de Bartlett (P = 0.883) e de Levene (P= 0.953) são muito 
altos podemos aceitar a hipótese de homogeneidade das variâncias. (Verifique!!!) 
 
Para realizar a análise de variância deste experimento em parcelas subdivididas num delinea-
mento em blocos casualizados, consideraremos os níveis do fator C1: Adubacao aplicados às parce-
las e os níveis de C2: Espacamento, aplicados às subparcelas, ambos de efeito fixo. Para que os 
testes F de significância sejam feitos corretamente, devemos considerar o fator Bloco como de 
efeito aleatório. 
Daí utilizarmos a seqüência: Stat > ANOVA > Balanced Anova... e inserimos as informa-
cões necessárias como apresentado na figura seguinte. Em Storage marcamos Residuals e em 
Options... > Display means corresponding to the terms escrevemos: Adubacao Espacamento 
Adubacao*Espacamento. De modo alternativo, podemos entrar com o comando: 
MTB > anova c4 = c3 c1 c1*c3 c2 c1*c2; 
SUBC> random c3; 
SUBC> residuals c5; 
SUBC> means c1 c2 c1*c2; 
 
 
Resultando em: 
 
Introdução ao uso do MINITAB® 
38 
 
 
 
ANOVA: Altura versus Bloco; Adubacao; Espacamento 
 
Factor Type Levels Values 
Bloco random 4 I II III IV 
Adubacao fixed 3 A0 A1 A2 
Espacame fixed 2 E1 E2 
 
Analysis of Variance for Altura 
 
Source DF SS MS F P 
Bloco 3 2352.00 784.00 14.70 0.004 
Adubacao 2 1792.00 896.00 16.80 0.003 
Bloco*Adubacao 6 320.00 53.33 8.42 0.003 
Espacame 1 1944.00 1944.00 306.95 0.000 
Adubacao*Espacame 2 127.00 63.50 10.03 0.005 
Error 9 57.00 6.33 
Total 23 6592.00 
 
Means 
 
Adubacao N Altura 
A0 8 49.000 
A1 8 69.000 
A2 8 65.000 
 
Espacame N Altura 
E1 12 70.000 
E2 12 52.000 
 
Adubacao Espacame N Altura 
A0 E1 4 56.250 
A0 E2 4 41.750 
A1 E1 4 81.250 
A1 E2 4 56.750 
A2 E1 4 72.500 
A2 E2 4 57.500 
 
 
 Vale notar que os testes de significância da ANOVA foram realizados corretamente: para 
testar o efeito de Bloco e de Adubação, que estão relacionados à variação entre parcelas, foi 
utilizado o QM da interação Bloco*Adubacao, que corresponde ao QMResiduo(a); nos demais 
testes relacio-nados à variação entre subparcelas, foi utilizado o QM do Error, que corresponde ao 
QMResiduo(b). 
 
Como a interação entre os fatores Adubacao e Espacamento foi significativa, podemos estudá-la 
através dos gráficos apropriados: Stat > ANOVA > Interactions plot, escolhendo em Factors C1 
Adubacao e C2 Espacamento, em Raw response data in: a coluna C4 Altura e clicando em 
Display full interaction plot matrix. 
 
Introdução ao uso do MINITAB® 
39 
 
 
 
 
 
Se quisermos que também sejam calculadas as E(QM) e as estimativas dos componentes de 
variâncias dos fatores de efeito aleatório, que são muito úteis no melhoramento animal, basta sele-
cionarmos em Options... o

Continue navegando