Buscar

Análise de Dados

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 42 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 42 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 42 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Aula 1 - O que é Estatística?
1. 
A estatística pode ser definida como um ramo da matemática aplicada que estuda maneiras de coletar, organizar, analisar, interpretar e chegar a conclusões ou antecipações sobre eventos ou populações a partir da investigação e de considerações de uma parte do todo. A maior parte dos autores divide a estatística em duas partes: descritiva ou inferencial, outros em três ramos: estatística descritiva, inferência estatística e estatística probabilística.
Marque a alternativa que contém a definição de estatística descritiva.
B. 
A estatística descritiva se responsabiliza pela descrição dos dados, ou seja, a coleta, a apresentação (seja ela por meio de gráficos, tabelas ou números) e a organização dos dados, facilitando a sua interpretação.
A estatística descritiva é empregada para a ordenação, a exposição e a sumarização de dados quantitativos, relacionados aos atributos de um fenômeno que estamos estudando, ou seja, trata da descrição dos dados, amostrais ou populacionais.
A estatística inferencial é utilizada quando nosso objetivo é a generalização do que estamos estudando, isto é, a partir de amostras, chegamos a conclusões para populações.
Dados são informações (fatos ou números) obtidas a partir da coleta, geralmente sintetizadas por meio de gráficos, tabelas, medidas centrais, etc., a fim de serem interpretadas.
População é o conjunto de todos os elementos, apresentando, pelo menos, uma característica em comum, que representa o universo que será observado no estudo em questão.
Amostra é uma fração da população que será representada. É sempre um subconjunto finito de elementos selecionados do conjunto maior: a população.
2. 
A estatística tem aplicações em diversas áreas do conhecimento, podendo ser utilizada em qualquer situação que envolva a coleta, a descrição e a análise de dados, visando à tomada de decisão. No entanto, é muito importante, em um estudo estatístico, identificar o tipo de variável envolvida a fim de escolher o melhor método de análise dos dados.
Com base no exposto, marque a alternativa que contém uma variável quantitativa discreta.
A. 
Quantidade de garrafas de refrigerantes vendidos em uma loja de supermercado em um dia.
A quantidade de garrafas de refrigerantes vendidos em uma loja de supermercado em um dia é uma variável quantitativa discreta.
O tempo em que os pacientes permanecem na sala de espera para serem atendidos é uma variável quantitativa contínua.
O setor (ramo) de atividade de uma empresa é uma variável qualitativa nominal.
O porte de uma empresa, bem como o grau de instrução dos pacientes em atendimento são exemplos de variável qualitativa ordinal.
3. 
As aplicações da estatística são inúmeras, desde a interpretação de notícias de jornais para um leitor leigo até testes de hipóteses, regressões e controles estatísticos de qualidade, estando presente nas mais diversas áreas do conhecimento, como, por exemplo, engenharias, saúde, economia, marketing, entre outras. Nesses casos, lida-se com dados estatísticos, que são informações (fatos ou números) obtidas a partir da coleta, em geral sintetizadas por meio de gráficos, tabelas, medidas centrais, etc., a fim de serem interpretadas.
Assinale a alternativa que contém uma aplicação envolvendo dados qualitativos.
D. 
Construção do perfil do cliente de uma loja com base em dados de sexo e escolaridade.
Dados quantitativos: informações numéricas que quantificam algo. Sendo assim, seus valores são sempre expressos por números. Os dados quantitativos podem ser discretos (provenientes de contagem, ou seja, apenas números inteiros) ou contínuos (provenientes de medida, expressos por um número real, inteiro ou não).
Dados qualitativos: informações não númericas que identificam uma característica dos elementos investigados. Os dados qualitativos podem ser respostas de nomes, locais, incidência, ou não de uma doença (em geral, respostas como sim ou não), cor de pele, entre outras.
A quantidade de peças defeituosas de uma indústria é um dado quantitativo.
O percentual de desempregados de uma cidade é calculado com dados quantitativos.
A análise da variação do número de atendimentos em uma unidade de emergência é feita com dados quantitativos.
A análise da variação do percentual de crianças com vacinação em dia em uma unidade básica de saúde nos últimos 12 meses contém dados quantitativos.
A construção do perfil dos clientes de uma loja com base no sexo e na escolaridade contém dados qualitativos vindo das variáveis sexo e escolaridade.
4. 
A estatística tem aplicações nas mais diversas áreas, mas, para utilizá-la, é necessário conhecer as etapas de um estudo estatístico para uma interpretação eficiente dos resultados. Todo estudo estatístico depende de um planejamento detalhado e cada etapa se submete à determinação da etapa anterior.
Marque a alternativa que contém a descrição correta de uma dessas etapas.
C. 
No planejamento de coleta de dados, é necessário delinear como os elementos pesquisados serão selecionados de modo que a amostra seja imparcial e represente fielmente a população.
A definição do problema deve ser o primeiro passo para qualquer pesquisa. Na prática, definir o problema é transformar o tema da pesquisa em uma pergunta que deverá ser respondida ao final de todo o processo que segue.
A coleta de dados será determinada pelo tipo de pesquisa — em função do problema de pesquisa, devemos planejar se esta será de caráter experimental ou de levantamento.
No planejamento de coleta de dados, é necessário delinear a forma como os elementos pesquisados serão selecionados de modo que a amostra seja imparcial e represente fielmente a população. Ou seja, é preciso definir as técnicas de amostragem quando a pesquisa não é realizada com todos os elementos da população, mas, sim, com uma amostra.
A organização deve ser feita mediante critérios de classificação, em ordem alfabética para dados qualitativos ou crescente para dados quantitativos, por exemplo. A disposição dos dados de maneira adequada facilita a análise e inibe que o erro aconteça ou que algum dado não seja considerado.
Após conhecer todas as características dos dados, a partir da análise, devem ser feitas as conclusões sobre a população, ou seja, o todo considerado na pesquisa. Por meio da estatística inferencial, é possível fazer deduções e previsões relevantes com o intuito de responder o problema inicial da pesquisa.
5. 
A estatística pode ser útil tanto em problemas teóricos quanto em situações cotidianas. Frequentemente, pesquisadores coletam dados sobre opiniões e estilos de vida das pessoas a fim de inferir sobre a população em questão.
Com os dados, é possível criar campanhas de marketing direcionadas para os consumidores de determinado produto ou elaborar políticas públicas que melhoram a qualidade de vida das pessoas. Todavia, para que a pesquisa seja confiável, é importante conhecer as técnicas e etapas de uma investigação estatística.
Uma das etapas fundamentais em uma pesquisa estatística inclui organização, apresentação e análise dos dados. Sobre essa etapa, marque a alternativa correta.
D. 
As medidas descritivas são uma maneira generalizada de notar o conjunto de elementos como um todo, classificando-os descritivamente quando possível.
Com os dados coletados, tem-se o que se chama de dados brutos da pesquisa.
Depois de organizados, os dados são apresentados em tabelas, gráficos ou histogramas a fim de ficarem mais evidentes para análise.
Os dados quantitativos, além de serem analisados a partir de tabelas e gráficos, permitem analisar por meio de medidas descritivas.
As medidas descritivas são uma maneira generalizada de notar o conjunto de elementos como um todo, classificando-os descritivamente quando possível.
O gráfico de pizza é um exemplo de apresentação gráfica visual. E as medidas estatísticas são resumos numéricos como, por exemplo, as de tendência central e as de dispersão.
Xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
Aula 2 - Coleta de dados: estatísticae bibliografia 
1. 
A análise dos dados é uma das fases mais importantes da pesquisa. A partir dela, é possível apresentar:
B. 
resultados e conclusão.
O primeiro passo da pesquisa é delimitar o objeto de investigação (o problema) dentro dos temas possíveis. Nessas etapas que vão ocorrendo, ocorre a escolha do tema, do objeto, da justificativa, dos objetivos e da metodologia, para, só depois da coleta de dados, se ter a análise destes. Essa análise proporcionará resultados e conclusão. 
2. 
“A observação é uma técnica de coleta de dados para obter informações que utiliza os sentidos na observação de determinados aspectos da realidade” (MARCONI; LAKATOS, 2005, p. 192). Dentre as diversas formas de realizar a observação, existe a observação sistemática, que pode ser definida como:
D. 
observação estruturada, planejada e controlada.
A observação sistemática também pode ser denominada observação estruturada, planejada e controlada. Essa técnica utiliza instrumentos para coleta de dados, diferentemente da observação assistemática.
A observação assistemática é o meio em que o pesquisador procura recolher e registrar os fatos da realidade sem a utilização de meios técnicos especiais, ou seja, sem planejamento ou controle. Na observação participante, o observador se envolve com o grupo, transformando-se em um dos seus membros.
A observação em equipe é um tipo de observação realizada por várias pessoas com o mesmo objetivo.
3. 
As técnicas de coleta de dados são um conjunto de regras ou processos utilizados por uma ciência, ou seja, correspondem à parte prática da coleta de dados (LAKATOS; MARCONI, 2001). Dentre os instrumentos de coleta de dados, há a entrevista, que pode ser definida como:
E. 
encontro entre duas pessoas, a fim de que uma delas obtenha informações a respeito de determinado assunto, mediante uma conversação de natureza profissional.
A entrevista é o encontro entre duas pessoas, a fim de que uma delas obtenha informações a respeito de determinado assunto, mediante uma conversação de natureza profissional.
A técnica de coleta de dados para obter informações que utiliza os sentidos na observação de determinados aspectos da realidade é a observação. O conjunto predeterminado de perguntas criadas para coletar dados dos correspondentes é chamado de questionário. Quem se fundamenta na lógica de utilizar várias fontes de evidências é a triangulação.
O conjunto de métodos estatísticos utilizados em situações nas quais diversas variáveis são medidas simultaneamente, em cada elemento amostral, não é uma das análises de dados.
4. 
A análise dos dados é uma das fases mais importantes da pesquisa, pois, a partir dela, serão apresentados os resultados e a conclusão da pesquisa, conclusão esta que poderá ser final ou apenas parcial, deixando margem para pesquisas posteriores (MARCONI; LAKATOS, 1996).
Para a análise dos dados, é possível utilizar a estatística descritiva univariada e a estatística multivariada. Marque a opção que descreve corretamente a estatística multivariada.
A. 
A estatística multivariada pode ser definida como um conjunto de métodos estatísticos utilizados em situações nas quais diversas variáveis são medidas simultaneamente, em cada elemento amostral.
A estatística multivariada pode ser definida como um conjunto de métodos estatísticos utilizados em situações nas quais diversas variáveis são medidas simultaneamente, em cada elemento amostral.
O conjunto de técnicas de análise das comunicações que tem por objetivo enriquecer a leitura e ultrapassar as incertezas, extraindo conteúdos por trás da mensagem analisada, é chamado de análise de conteúdo.
As univariadas são utilizadas quando há uma única medida de cada elemento na amostra ou quando há várias medidas de cada elemento.
5. 
O instrumento de coleta de dados que se fundamenta na lógica de utilizar várias fontes de evidências é chamado de:
B. 
triangulação.
A triangulação se fundamenta na lógica de utilizar várias fontes de evidências. A utilização de várias fontes na coleta de dados é uma necessidade e ao mesmo tempo um ponto forte muito importante para estudos de caso, principalmente. A entrevista, o formulário, a observação e o questionário também são considerados instrumentos de coleta de dados, mas não utilizam várias fontes de evidências. Na verdade, cada um tem sua forma peculiar de recolher e registrar as informações. 
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
Aula 03- Variáveis qualitativas e variáveis quantitativas
1. 
Sabemos que as variáveis podem ser qualitativas (nominais ou ordinais) ou quantitativas (discretas ou contínuas). Além disso, as variáveis qualitativas, de acordo com o número de categorias, podem ser classificadas em dicotômicas ou politômicas. Com base no exposto, identifique a alternativa em que a variável seja classificada como "qualitativa nominal dicotômica".
B. 
Inatividade: sim, não.
As variáveis Autopercepção de saúde (excelente, muito boa, boa e regular), Motivo da última consulta (prevenção, acompanhamento, tratamento) e local da última consulta (hospital, consultório, clínica) são exemplos de variáveis qualitativas politômicas, pois possuem mais de duas categorias. A variável Número de hospitalizações no último ano é quantitativa discreta e a variável Inatividade (sim, não) é qualitativa dicotômica, pois possui duas categorias. 
2. 
Em uma investigação estatística um dos primeiros passos é a identificação dos tipos de variáveis envolvidos no estudo. As variáveis cujas repostas são dadas por números inteiros que nem mesmo hipoteticamente poderiam receber vírgula são chamadas de:
D. 
Quantitativa discreta.
As variáveis qualitativas são as observações que apresentam qualidades ou atributos, podendo ser nominais (sem ordenação) ou ordinais (com ordenação). As variáveis quantitativas são as observações que apresentam números, resultantes de contagem ou mensuração, podendo ser discretas (números inteiros) ou contínuas (números não inteiros). Assim, as variáveis cujas repostas são dadas por números inteiros, são chamadas de quantitativas discretas. 
3. 
Em estatística, as variáveis são classificadas em dois tipos: qualitativas e quantitativas. Além disso, cada um dos tipos ainda pode ser subdividido. As variáveis cujas repostas são dadas por números com vírgulas são classificadas com
E. 
Quantitativa contínua.
As variáveis qualitativas são as observações que apresentam qualidades ou atributos, podendo ser nominais (sem ordenação) ou ordinais (com ordenação). As variáveis quantitativas são as observações que apresentam números, resultantes de contagem ou mensuração, podendo ser discretas (números inteiros, ou seja, sem vírgula) ou contínuas (números não inteiros, ou seja, decimais ou reais). Logo, as variáveis cujas repostas são dadas por números com vírgulas são classificadas como quantitativas contínuas. 
4. 
As variáveis qualitativas além de serem classificadas em nominais ou ordinais, também podem ser politômicas ou dicotômicas. Identifique a variável classificada como "qualitativa ordinal politômica".
E. 
Estado geral de saúde: péssimo, ruim, regular, bom excelente
As variáveis quantitativas são observações que apresentam números. Já as qualitativas são as apresentam qualidades ou atributos e, caso envolvam algum tipo de ordenação, são chamadas de ordinais, como é o caso de Estado geral de saúde: péssimo, ruim, regular, bom excelente. Como há mais de duas categorias, ela é politômica. 
5. 
A média é uma medida numérica que que busca encontrar um ponto de equilíbrio entre os valores da variável. Assim, para que tipo de variável não se pode calcular média?
B. 
Categórica nominal.
A média pode ser calculada para variáveis quantitativas. Portanto, não é possível calculá-la para variáveis categóricas nominais, pois são qualitativas. 
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
aula 4 - Linguagem estatística: quadros, tabelas e gráficos
1. 
Assinale a alternativa que representa o significado da linguagemestatística.
E. 
A estatística significa estimar parâmetros desconhecidos de uma população com uma amostra.
A estatística serve para mensurar dados quantitativos; significa estimar parâmetros desconhecidos de uma população com uma amostra. Para que haja a estatística, é necessária a análise de dados. A estatística é o resultado mais finalizado de determinada pesquisa. Em outras palavras, dentro do campo da estatística, relacionam-se empiricamente conceitos que representam os problemas/as perguntas a serem respondidos. 
2. 
Quais são os tipos de variáveis que existem dentro do campo da estatística?
C. 
Variáveis discretas (nominal, ordinal e numérica) e contínuas.
Os tipos de variáveis são importantes, pois auxiliam a construir os quadros, as tabelas e os gráficos. São tipos de variáveis: discretas (nominal, ordinal e numérica) e contínuas. As variáveis estão relacionadas à mensuração. Nas ciências sociais, tal processo de mensurar é muito complexo. 
3. 
Quais foram as formas de apresentação de dados identificadas nesta Unidade de Aprendizagem?
B. 
Quadros, tabelas e gráficos.
Nesta Unidade de Aprendizagem, que abordou a linguagem estatística, foram apresentadas as seguintes formas de apresentação de dados: quadros, tabelas e gráficos. 
4. 
Após o acesso ou a apresentação dos dados, a pesquisa ainda não está concluída. O que precisa ser feito para finalizá-la?​​​​​​​
A. 
Analisar os dados à luz da dimensão teórico-metodológica definida pelo pesquisador.
Os dados não falam por si mesmos. Por isso, é preciso analisar os dados à luz de uma dimensão teórico-metodológica. Sendo assim, para identificar os dados, é necessário, primeiramente, estruturar uma pesquisa que contenha tema, delimitação do tema, problema de pesquisa, objeto e objetivos, etc., para que, assim, o pesquisador saiba o que está analisando por meio dos dados e identifique aquilo que trará à sua pesquisa as respostas necessárias. 
5. 
O que são variáveis?
C. 
São os distintos valores que determinadas características dentro de determinada pesquisa assumem.
As variáveis de uma pesquisa são os distintos valores que determinadas características dentro de determinada pesquisa assumem. Dessa forma, o que auxilia na distinção dos valores é a análise de mensuração. Como colocado acima, mensurar, dentro das ciências sociais, não é algo simples, pois necessita-se de muita clareza de construção. Para tratar as variáveis estatísticas, é necessário efetuar uma distinção didática. 
Xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
aula 5 - Organização de dados: tabelas e gráficos
1 Um gráfico de linhas fornece uma representação mais clara das variáveis dependentes do tempo. É comumente utilizado para a representação de tendências ou variáveis ao longo do tempo. O gráfico a seguir mostra a cotação do dólar americano no último ano.
Analise suas informações e marque a afirmativa correta.
B. 
Os meses de julho e outubro apresentam queda em relação ao seu mês anterior.
Observe que o crescimento de meses sucessivos vai de janeiro a junho e o dólar fica estável entre agosto e setembro e também entre novembro e dezembro. O gráfico de linhas serve para representar variáveis quantitativas ao longo do tempo. ­
2 - Por meio de um recurso gráfico, é possível extrair diversas informações relevantes. Para isso, é extremamente importante saber analisar um gráfico. Nesse contexto, considere a situação em que dois amigos participam do grupo de criação de produtos de uma empresa e estão lançando um novo relógio, sendo que o protótipo foi testado por 30 pessoas e, após o teste, elas indicaram o grau de satisfação com o produto. Esse protótipo só continuará em processo de desenvolvimento caso o nível de satisfação da pesquisa seja superior a 80%.
Com base no gráfico dos resultados do teste, o processo de desenvolvimento irá continuar?
C. 
Não, pois, considerando os satisfeitos, não se atinge o percentual de 80% de satisfação.
O percentual de satisfeitos deve considerar os muito satisfeitos e os satisfeitos. Esse percentual é de 73,33% — logo, inferior a 80%. Assim, pode-se concluir que o projeto não deve continuar. 
3. 
As tabelas de distribuição de frequência fornecem informações sobre a amostra em estudo que são bem importantes, como a contagem, em números absolutos, dos dados observados e o quanto cada uma delas representa do todo.
Nesse contexto, considere um gerente de banco que está fazendo o levantamento dos tipos de atendimento que os funcionários realizam em determinado dia em uma agência bancária. Os dados desse levantamento são os seguintes:
B. 
30,8%; 25,0%; 21,7%; 15,0%; 7,5%.
4. 
Gráficos servem para melhorar a visualização de dados dentro da estatística. Eles permitem identificar tendências, fazer comparações, classificar informações, entre outras tarefas importantes para a análise de dados. Para isso, existem diferentes tipos de gráfico que buscam trazer diversas informações para enriquecer as suas análises. As alternativas a seguir mostram gráficos e um exemplo de utilização.
Assinale a alternativa que relaciona corretamente o gráfico com o seu tipo de uso.
B-Pode ser utilizado para quaisquer tipos de variáveis. 
5- A maneira mais simples de apresentar dados é por meio de tabelas. Ao organizar números em linhas e colunas, a informação transmitida pela tabela pode ser realçada para que uma rápida análise seja suficiente para entendê-la e, então, sejam gerados gráficos mais adequados para a representação dos seus dados. Considere um administrador que fez um levantamento com as idades dos funcionários da sua empresa.
Os dados estão na tabela de distribuição de frequências por intervalo a seguir:
b- Você acertou! 
O gráfico de setores serve para variáveis qualitativas; o de pontos, para correlação; o de rosca tem a mesma finalidade do gráfico de setores; o de barras serve para quaisquer variáveis para dados categóricos ou representar tabelas de distribuição de frequências por ponto. O histograma é adequado para representar uma tabela de distribuição de frequências para dados dispostos por intervalos. 
Xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
aula 8Organização dos dados quantitativos
1. 
Os dados referem-se à altura (em metros) de uma amostra de 25 indivíduos. Organize os dados em ordem crescente e informe a menor estatura mensurada: 2,00; 1,65; 1,63; 1,61; 1,69; 1,60; 1,58; 1,52; 1,90; 1,67; 1,82; 1,90; 1,70; 1,65; 1,60; 1,78; 1,91; 1,49; 1,53; 1,68; 1,67; 1,50; 1,51; 1,70; 1,88.
E. 
A menor estatura é de 1,49m.
Ordenando os dados, temos:
1,49 1,50 1,51 1,52 1,53 1,58 1,60 1,60 1,61 1,63 1,65 1,65 1,67
1,67 1,68 1,69 1,70 1,70 1,78 1,82 1,88 1,90 1,90 1,91 2,00
A partir dessa organização, podemos observar que o menor valor é 1,49m. 
Ao perguntar a uma amostra de 40 pessoas o número de horas de espera em um pronto atendimento, obtivemos os seguintes dados: 
A organização dos dados facilita sua leitura e interpretação. Assim, podemos ordenar os dados. Depois construímos uma tabela, cujas colunas são número de horas (xi) e frequência com que cada xi apareceu nos dados (fi):​​​​​​​ 
3. 
Os dados quantitativos a seguir se referem ao peso (em quilograma) de uma amostra de 15 indivíduos. Organize os dados em ordem crescente e informe o maior peso mensurado: 75,300; 81,000; 63,200; 65,020; 51,350; 50,200; 49,900; 49,950; 49,900; 92,300; 53,400; 50,100; 91,800; 92,520; 79,500.
E. 
92,520kg.
Esse valor é o maior peso porque é o último do conjunto de dados organizado em ordem crescente.
Ordenando os dados, temos:
49,900 49,900 49,950 50,100 50,200 51,350 53,400 63,200 65,020 75,300 79,500 81,000 91,800 92,300 92,520
A partir dessa organização, podemos observar que o maior valor é 92,520kg.
4. 
Existem valores repetidos nos dados a seguir que se referem ao peso (em quilograma) de uma amostra de 15 indivíduos?
75,300; 49,900; 81,000; 49,950; 50,100; 49,900; 92,300; 53,400; 91,800; 92,520; 79,500; 63,200; 65,020; 51,350;50,200.
D. 
Sim, pois o valor 49,900kg aparece duas vezes.
O mesmo peso foi apresentado duas vezes no conjunto de dados. Por isso, consideramos que ele se repete, sendo o mais frequente.
Ordenando os dados, temos:
49,900 49,900 49,950 50,100 50,200 51,350 53,400 63,200 65,020 75,300 79,500 81,000 91,800 92,300 92,520
A partir dessa organização, podemos observar que o valor 49,900kg se repete.
5. 
Em um estudo sobre os benefícios da prática de atividade física, perguntou-se o número de vezes por semana que as 40 pessoas entrevistadas praticam atividade física. Os dados a seguir mostram os resultados:
1 3 0 3 5 4 5 3 3 4
6 7 5 0 4 3 3 6 4 0
5 4 3 4 4 5 6 5 6 6
3 3 0 5 6 7 7 6 4 3
Marque a alternativa que apresenta o gráfico adequado para esses dados.
Xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
Aula 9 - Tabelas de frequência simples
1. 
Ao construirmos uma tabela de frequência simples é muito importante conhecer cada um de seus elementos e saber dispô-los na ordem correta.
Na primeira coluna de uma tabela de agrupamento simples, é apresentada ____________________.
A. 
A variável em estudo.
As colunas em uma tabela de frequência simples representam: variável em estudo, frequência absoluta simples, frequência relativa simples e frequência acumulada. Em alguns estudos, também pode aparecer uma última coluna para a frequência acumulada relativa. 
2. 
Em uma tabela de frequência simples existem símbolos utilizados para a representação de seus elementos.
Os símbolos x e f em uma tabela de agrupamento simples representam, respectivamente:
D. 
A variável em estudo e frequência absoluta simples.
Em uma tabela de frequência é importante distinguirmos símbolos x, f, fr, F e Fr onde:
x: valores da variável quantitativa em estudo.
f: frequência absoluta simples
fr: frequência relativa simples
F: Frequência acumulada
Fr: Frequência acumulada relativa 
3. 
Dentre os elementos que devem constar em uma tabela de frequência simples estão as frequências.
Os símbolos F e fr em uma tabela de agrupamento simples representam, respectivamente:
A. 
A frequência acumulada e frequência relativa.
Em uma tabela de frequência temos os símbolos:
x: valores da variável quantitativa em estudo.
f: frequência absoluta simples
fr: frequência relativa simples
F: Frequência acumulada
Fr: Frequência acumulada relativa 
4. 
Na construção de uma tabela de frequência simples, é necessário realizar um cálculo para a frequência relativa simples e para a frequência acumulada relativa.
A frequência relativa simples é obtida realizando-se qual cálculo?
E. 
A frequência relativa simples é o percentual de ocorrências do valor x, a proporção em que cada valor ocorre. Obtém-se esse valor dividindo-se cada valor de f pelo total de f.
Em uma tabela de frequência temos:
Frequência absoluta simples: é obtida com o número de vezes em que a variável em estudos se apresenta no conjunto de dados.
Frequência acumulada: é calculada somando-se a frequência absoluta simples da linha anterior à da linha de cálculo.
Frequência relativa simples: é o percentual de ocorrências do valor x, a proporção em que cada valor ocorre. Obtém-se esse valor dividindo-se cada valor de f pelo total de f.
A frequência acumulada relativa: é calculada para se saber a proporção de pessoas em determinado valor ou categoria. Obtém-se por meio da divisão de F pelo total de f.
5. 
Uma das colunas da tabela de frequência simples é destinada à frequência acumulada.
Como é construída a coluna da frequência acumulada?
A. 
A frequência acumulada indica quantos indivíduos têm frequência igual ou menor do que um determinado valor. Obtém-se esse valor somando-se a f da linha desejada com a f dos valores menores do que o desejado.
A frequência acumulada representa todas as frequências absolutas simples somadas até determinado valor da tabela. Soma-se a f da linha 1 com a da linha 2, e assim sucessivamente. 
Xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
Aula 10 - Tabelas de frequência agrupadas em intervalos de classe
1. 
Em uma investigação estatística, os dados podem ser organizados por rol ou por distribuição de frequências, podendo ser por ponto ou por intervalo. Por que alguns conjuntos de dados são organizados em tabelas de frequência agrupadas em intervalos de classes?
D. 
São organizados em tabelas de frequência agrupadas em intervalos de classe para condensar a informação, suprimir o número de linhas da tabela e tornar a estética visual mais agradável, facilitando a compreensão dos dados.
Em conjuntos de dados muito extensos, é necessário condensar a informação sem perder a estética visual, pois facilita a leitura dos dados. Nessas situações, a tabela de agrupamento de dados por intervalo de classes auxilia a organizar o conjunto de dados muito grande (condensar a informação) e torná-lo mais atrativo à interpretação. A estética visual e a facilidade em ler os dados em uma tabela de agrupamento de dados por intervalo de classes é muito importante, mas é para a organização de um conjunto de dados muito grande que esse tabela de frequência agrupada por intervalos de classe é fundamental. 
2 Os dados abaixo referem-se à taxa de creatinina na urina de 24 horas (mg/100 mL) em uma amostra de 36 homens normais. Organize uma tabela de frequência por intervalo de classes, adotando classes iguais, de modo que a primeira seja 1,00 ├ 1,15. 
3 - Considere que em um estudo sobre a altura de estudantes da Educação Infantil até o Ensino Médio de uma escola, foi obtida a seguinte tabela de frequência: 
A frequência absoluta refere-se ao número de vezes que aparecem dados naquele intervalo de dados dentro do conjunto. A frequência relativa refere-se ao quanto do todo aquele intervalo representa. No problema, temos 36 dados, então para obter a frequência relativa, basta dividir a frequência absoluta por 36. 
4 - Considere que em um estudo sobre a altura de estudantes da Educação Infantil até o Ensino Médio de uma escola, foi obtida a seguinte tabela de frequência: 
C. 
13,90%.
A frequência relativa percentual se refere a quanto aquele intervalo representa dentro do todo. Assim, para a classe 1,75 ├ 1,90 temos frequência absoluta 5 e o problema apresenta 36 dados, então ficamos com: 
5. 
Ao construir uma tabela de agrupamento por intervalos é preciso estar atento aos símbolos, para que a tabela seja construída adequadamente e possa ser utilizada a análise de dados. Assim, o que significam os símbolos ┤, ├ e ├┤, respectivamente?
D. 
Intervalo aberto à esquerda, intervalo aberto à direita e intervalo fechado à direita e esquerda.
A linha na vertical significa fechado (o número está contido) e a falta dessa linha no símbolo significa aberto (ou número não contido). Logo, o primeiro símbolo é o de intervalo aberto à esquerda e fechado à direita, o segundo símbolo é o de intervalo fechado à esquerda e aberto à direita e o terceiro símbolo é de intervalo fechado tanto à esquerda quanto à direita. 
---------------------------------------------------------------------------------
Aula 11 - Representações gráficas
1. 
A variável qualitativa nominal com poucas categorias deve ser representada por qual tipo de gráfico?
B. 
b) Gráfico de setores (pizza).
Utilizado em variáveis qualitativas nominais (com poucas categorias 
2. 
Qual o melhor tipo de gráfico para expressar o acompanhamento ao longo do tempo de uma determinada variável
D. 
d) Gráfico de linhas.
Utilizado em variáveis qualitativas nominais (com poucas categorias 
3. 
Qual o melhor tipo de gráfico para expressar a variável de peso?
E. 
e) Gráfico histograma.
Utilizado em variáveis quantitativas contínuas. 
4. 
Qual o melhor tipo de gráfico para expressar a variável de número de filhos?
D. 
d) Gráfico de colunas.
Utilizado em variáveis quantitativas discretas. 
5. 
As variáveis de gênero, número de irmãos, etnia e altura devem ser representadas, respectivamente,por quais gráficos?
B. 
b) Gráficos de setores, colunas, barras e histograma.
A sequência está adequada ao tipo de variável, respeitando as características de cada gráfico. 
---------------------------------------------------------------------------------
Aula 12 Organização de dados: tabelas e gráficos utilizando o Excel
1. 
Um profissional de Educação Física treina atletas de alto rendimento. Às vésperas de um campeonato, ele resolve submetê-los à medição de VO2 para avaliar melhor seus rendimentos físicos. O VO2 máximo pode ser medido como “milímetros de oxigênio, utilizado em um minuto por quilograma de peso corporal de cada um”.
Como você classificaria essa variável?
E. 
Quantitativa contínua.
O VO2 máximo é uma variável quantitativa, pois se tem como resposta um número. Esse número é contínuo, uma vez que poder ser fracionado. 
2. 
Considerando a medição de VO2 máximo, caso o profissional de Educação Física agrupasse os dados em uma tabela de distribuição de frequências por intervalos, qual seria a representação gráfica apropriada para essa tabela?
D. 
Histograma.
Quando se tem uma tabela de distribuição de frequências por intervalos, a representação correta é o histograma. Gráfico de pizza é para variáveis qualitativas. Gráficos de colunas e barras são para quaisquer variáveis, desde que não estejam agrupadas por classes. Diagrama de dispersão verifica a relação entre duas variáveis. 
3. 
O Excel traz muitas análises estatísticas, assim como também realiza análises descritivas e alguns testes de hipóteses.
Assinale o teste que serve para testar duas médias.
C. 
Teste t para duas amostras independentes.
Correlação e regressão servem para verificar a existência de correlação e fazer previsões. O teste ANOVA serve para testar mais de duas médias. O teste t para duas amostras serve para testar duas médias. O teste F serve para testar a igualdade de variâncias, já o teste qui-quadrado serve para testar a associação de variáveis. 
4. 
Desejando representar o nível de atividade física de uma comunidade, um pesquisador perguntou a uma amostra de 200 pessoas o seu nível de atividade física. As opções de respostas eram: muito ativo, ativo, regularmente ativo e sedentário.
Com o objetivo de analisar esses resultados, qual análise descritiva você poderia recomendar a ele?
C. 
Tabela de distribuição de frequências.
Sendo o nível de atividade física uma variável qualitativa nominal, entre essas análises somente a tabela de distribuição de frequências se enquadra. 
5. 
Com o objetivo de verificar a igualdade de média de frequência cardíaca em três modalidades diferentes do esporte, um profissional da Educação Física realiza uma pesquisa com 45 pessoas.
Considerando que a média de frequência cardíaca segue uma distribuição normal, qual teste você recomendaria a esse profissional para que ele possa verificar essa hipótese?
C. 
Teste ANOVA
O teste indicado é o ANOVA, uma vez que ele serve para testar mais de duas médias. 
------------------------------------------------------------------------------
aula 13 Medidas de posição: média, mediana e moda
1. 
Entende-se por média aritmética simples a soma de todos os elementos de um conjunto de dados dividida pela quantidade de elementos do conjunto. Nesse contexto, considere que em determinado momento na BMF&BOVESPA eram negociados 10 títulos de R$ 20.000,00, 6 títulos de R$ 10.000,00 e 4 títulos de R$ 5.000,00.
Dados os títulos, assinale a alternativa que contém o valor médio correto em R$ dessa negociação na bolsa.
B. 
14.000,00.
2. 
Você já parou para pensar sobre como as lojas planejam os seus estoques de determinado produto? Ainda que existam várias marcas de um mesmo produto, há aquele que tem maior saída. Para analisar esse tipo de situação, é utilizada a moda. Nessa mesma linha de raciocínio, considere três candidatos a um emprego que estão disputando uma única vaga. A empresa informou que passarão para a próxima etapa apenas os dois que apresentarem as modas mais altas nas atividades já realizadas até agora.
Observe as notas de cada um deles:
Candidato X: 3, 4, 3, 7, 3,8
Candidato Y: 2, 4, 4, 9, 4, 2
Candidato Z: 5, 8, 4, 7, 3, 9
Assinale a alternativa que indica quais dos candidatos serão aprovados e a que explica se a moda é um bom critério de seleção.
D. 
Passarão os candidatos X e Y. Moda não costuma ser o melhor critério de escolha, pois desconsidera as notas que não se repetem.
O candidato Z, mesmo tendo as notas mais altas, não será escolhido, pois nenhuma delas se repete, ou seja, ele não tem moda em suas notas. Diante disso, vê-se que a moda pode não ser o melhor critério de escolha, uma vez que o candidato Z, mesmo tendo as notas mais altas, foi excluído. Passarão os candidatos X e Y. A moda não costuma ser o melhor critério de escolha, pois desconsidera as notas que não se repetem. 
3. 
A média de uma variável é uma das medidas mais utilizadas e, portanto, é considerada muito importante. Nesse contexto, considere dois candidatos a uma vaga de trabalho que se classificaram para a etapa final e farão uma última prova valendo 10 pontos, totalizando sete notas. Observe, a seguir, as notas de cada um deles até o momento:
Candidato X: 3, 4, 3, 7, 3, 8, X7 = 5
Candidato Y: 2, 4, 4, 9, 4, 2, Y7 = 4
​​​​​​​onde X7 e Y7 são, respectivamente, as notas dos candidados X e Y na prova 7.
O contratado será aquele que obtiver a maior média em todas as sete provas. O candidato X, ao fazer a prova, teve nota igual a 7, ou seja X7 = 7. Nesse caso, assinale a alternativa que indica corretamente se o candidato Y conseguirá superá-lo, sabendo que a nota é sempre um número inteiro.
D. 
Não, nem se conseguir tirar 10.
4. 
A mediana é uma medida de tendência central que indica exatamente o valor central de uma amostra de dados. Pensando nesse conceito e na forma de condução dos dados para encontrar a mediana, suponha que a quantidade de hotéis três estrelas espalhados pelas cidades do litoral de determinado estado seja: 10, 1, 3, 10, 5, 2, 10, 3, 7, 8.
Assinale a alternativa que contém a interpretação correta do cálculo da mediana desse conjunto de dados.
D. 
Há 50% das cidades com mais de seis hotéis três estrelas e 50% das cidades com menos de seis hotéis três estrelas.
5 A média aritmética é um dos conceitos da estatística que é estudado desde muito cedo. Ela também é uma das medidas mais utilizadas na prática. Para além de problemas mais simples, podem-se usar a média e a mediana para analisar situações mais complexas. Nesse contexto, considere uma empresa que selecionou seis funcionários fumantes e promoveu um pequeno ciclo de palestras com esclarecimentos sobre os efeitos prejudiciais do cigarro à saúde. Após essas palestras, foram coletados dados sobre a quantidade de cigarros que cada um desses fumantes estava consumindo diariamente até a data da palestra, e uma semana depois eles foram novamente questionados sobre a quantidade de cigarros diária. O gestor deseja verificar se os funcionários diminuíram o consumo de cigarros após as palestras. Caso seja verificado que eles diminuíram pelo menos cinco cigarros diários, em média, após a palestra, a empresa iniciará um programa de combate ao fumo com base no que foi apresentado nas palestras.
Tais dados são expressos da seguinte maneira:
D. 
O gestor deve iniciar a campanha de combate ao fumo, pois a média da diferença do consumo diário entre o antes e depois foi de 5,8 cigarros.
-------------------------------------------------------
aula 14 Estatística aplicada: Medidas de Dispersão
1. 
O grau para o qual os dados numéricos tendem a dispersar-se em torno de um valor médio é denominado de variação ou dispersão dos dados. Existem várias medidas de dispersão ou variação, sendo as mais comuns:
C. 
Amplitude, variância e desvio padrão.
A média não é medida de variação, é na verdade uma medida central, a moda e a mediana, também são medidas de tendência central, se obtém o centro com princípios diferentes. Logo somente a Amplitude, a Variância e o Desvio Padrão sãoas medidas de dispersão ou variação. 
2. 
Quanto as medidas de dispersão, pode-se dizer que as afirmações a seguir:
I) A variável que mede o desvio em relação à média, em unidades de desvio padrão, é denominada variável padronizada e é uma quantidade adimensional (ou seja, independe das unidades usadas).
II) Às vezes, o desvio padrão correspondente aos dados de uma amostra é definido com (N – 3), em lugar de N nos denominadores das Equações, porque o valor resultante representa uma estimativa melhor do desvio padrão da população da qual a amostra foi extraída.
III) Dentre outras medidas de dispersão ou variação, podemos encontrar: o desvio médio, a semi-amplitude interquartílica e a amplitude entre os percentis 10 e 90.
C. 
I e III estão corretas.
Somente as afirmações I e III estão, pois às vezes, o desvio padrão correspondente aos dados de uma amostra é definido com (N – 1), em lugar de N nos denominadores das Equações e não (N-3). A variável que mede o desvio em relação à média, em unidades de desvio padrão, é denominada variável padronizada, isto está correto. O desvio médio, a semi-amplitude interquartílica e a amplitude entre os percentis 10 e 90, também são formas de medir a dispersão. 
3. 
Um pesquisador fez uma pesquisa de altura em uma turma do ensino primário, composta por 10 alunos, e obteve os seguintes resultados em centímetros: 99, 99, 103, 107, 106, 107, 99, 102, 100, 107. Qual é a amplitude das alturas dos alunos dessa sala?
C. 
8.
Este é o valor da amplitude pois 107-99 = 8. 
4. 
Qual o desvio padrão amostral do conjunto B: { 1,1,3,4,5,1,3 } .
E. 
1,61.
5. 
A metrologia é uma ciência que trabalha aspectos tanto teóricos quanto a prática da medição e também os princípios de incertezas envolvidos. Em que atividades metrológicas são aplicadas as medidas de dispersão?
C. 
Estimativa de incerteza de medição, estudos de confiabilidade metrológica e no controle estatístico de processo.
A única resposta correta é a estimativa de incerteza de medição, estudos de confiabilidade metrológica e no controle estatístico de processo. Sendo estas atividades que exemplificam a utilização das medidas de dispersão. Não existindo outras aplicações, e condições aonde seriam úteis na metrologia. 
---------------------------------------------------------------------
ala 15 Preparação de Dados
1. 
Marque a opção que informa o processo completo e correto da preparação de dados da pesquisa de marketing.
Esta é a ordem correta e completa do processo de preparação de dados da pesquisa. 
2. 
O passo inicial na verificação dos questionários é examiná-los para constatar a completude e qualidade da entrevista. Para garantir a exatidão desta etapa, colocam-se alguns fatores de corte, sendo considerados como inaceitáveis por parte dos pesquisadores. Observe as opções abaixo e aponte qual delas apresenta um motivo INCORRETO para não aceitar um questionário.
D. 
Quando o questionário aparece com muitas respostas semelhantes, deixando claro uma certa tendência de respostas do entrevistado.
Isso não pode ser previsto ou avaliado pelo pesquisador. Aquilo que o respondente declara é sua percepção sobre as perguntas. 
3. 
Muitas vezes, o pesquisador avalia os questionários e se depara com dados insatisfatórios. Nestas situações, ele precisa lidar com dados não colaborativos para a pesquisa. Observe as afirmativas abaixo, verifique quais são corretas e escolha a adequada.
I) Retorno ao campo: os questionários com respostas insatisfatórias podem ser devolvidos ao campo, onde os entrevistadores tornam a fazer contato com os entrevistados.
II) Completando valores faltantes: se não for possível devolver os questionários ao campo de trabalho, o pesquisador pode atribuir valores arbitrários às respostas insatisfatórias.
III) Eliminação de respondentes insatisfatórios: nesta abordagem, os entrevistados com respostas insatisfatórias são reavaliados e têm uma segunda chance.
C. 
I e II estão corretas.
São situações com as quais o pesquisador precisará lidar para a pesquisa. 
4. 
Do que se trata a verificação de consistência?
B. 
A verificação de consistência identifica os dados que estão fora do intervalo, que são inconsistentes logicamente ou que apresentam valores extremos.
A verificação faz a identificação e procura corrigir. Os dados fora do intervalo são inadmissíveis e devem ser corrigidos. 
5. 
Na última etapa do processo de preparação, em que se trata das análises, existem técnicas estatísticas comumente utilizadas. Leia as opções abaixo e escolha qual delas NÃO APRESENTA uma técnica adequada.
C. 
Técnicas de escalonamento.
Técnicas de escalonamento são realizadas no início do processo de concepção da pesquisa, não na fase de análise dos dados coletados. 
---------------------------------------------------------------------------------------------------
aula de 16 tratamento de dados
1. 
Estruturar o processo de tratamento de dados é importante para o uso das técnicas adequadas e para o aumento da confiabilidade das informações geradas.
O que se pode afirmar sobre as etapas que compõem o processo de tratamento de dados?
D. 
A etapa de aplicação da técnica de tratamento engloba seis subetapas, entre elas está fazer as medições necessárias e identificar as características pretendidas na amostra selecionada.
O processo de tratamento de dados é composto pelas seguintes etapas: compreensão dos dados, organização dos dados, eliminação de erros, seleção da forma de tratamento adequada, aplicação da forma escolhida e análise dos resultados. A etapa de eliminação de erros busca identificar discrepâncias para que os dados sejam representativos e possam conduzir a informações assertivas. A etapa de análise dos dados tratados busca examinar e investigar os resultados gerados ao aplicar as técnicas selecionadas. A etapa de aplicação da técnica de tratamento de dados selecionada busca fazer as medições necessárias e identificar as caraterísticas pretendidas na amostra selecionada. A etapa de compreensão dos dados consiste no contato inicial do analista com os dados em busca de familiarização. 
2. 
Algumas formas de tratamento de dados estão relacionadas às medidas de tendência central. São formas simples de tratamento de dados que podem gerar informações importantes.
O que é correto afirmar sobre essas formas de tratamento de dados?
C. 
A mediana é o valor médio de uma distribuição ordenada, que apresenta o mesmo número de valores acima e abaixo do referido índice.
A média aritmética simples é o quociente da divisão da soma dos valores das observações de uma amostra pelo número de elementos da amostra. A mediana é o valor médio de uma distribuição ordenada, que apresenta o mesmo número de valores acima e abaixo do referido índice. A moda é o valor que apareceu com a maior frequência na amostra. 
3. 
Os gráficos são amplamente utilizados para estruturar, organizar, categorizar dados e apresentar tendências. Trata-se de ferramentas simples, mas com grande potencial e amplamente utilizadas em projetos de modelagem e simulação.
Sobre os gráficos, analise as afirmações a seguir e assinale a opção correta.
E. 
No gráfico de controle, o fato de todos os elementos estarem dentro dos limites de controle nem sempre indica que o processo está controlado.
O histograma representa um conjunto de retângulos com bases sobre um eixo, dividido segundo os tamanhos das classes. O gráfico de controle é elaborado por meio de três linhas paralelas, sendo uma linha média e os limites superiores e inferiores de controle. Por meio do histograma é possível identificar informações como centralidade e amplitude da amostra. Por meio do gráfico de controle é possível avaliar se os elementos de determinada amostra obedecem ou não às características ou aos parâmetros preestabelecidos. No gráfico de controle, o fato de todos os elementos estarem dentro dos limites de controle nem sempre indica que o processo está controlado. As tendências positivas (muitos pontos em ascensão) e negativas (muitos pontos em decréscimo)precisam ser avaliadas. 
4. 
Uma situação frequente é ter observações de uma variável aleatória cuja distribuição é desconhecida. Para esses casos, são utilizados os testes de aderência. Considere os dados sobre os defeitos de produtos produzidos em um dia por uma indústria: 7 itens trincados, 9 itens amassados, 2 itens tortos. A empresa esperava ou aceitaria as seguintes quantidades: 3 itens trincados, 4 itens amassados e 1 item torto.
Por meio do teste qui-quadrado, é possível afirmar que a discrepância entre os dados observados e os dados esperados é de:
B. 
aproximadamente 12,6, o que representa certa discrepância entre o esperado e o observado.
A discrepância é dada pelo somatório do quadrado das diferenças das frequências observadas e das frequências esperadas, divididas pelas frequências esperadas. A discrepância pode ser calculada por meio da seguinte equação: ((7–3)2/3) + ((9–4)2/4) + ((2–1)2)/1) = 5,33 + 6,25 + 1 = 12,58. 
5. 
Os testes de aderência são utilizados para testar modelos e avaliar se os dados de uma amostra se conformam ou não a uma distribuição de probabilidade específica. Sobre os testes de aderência, analise as afirmações a seguir:
I. Os testes avaliam duas hipóteses: se os dados da amostra se conformam a determinada distribuição de probabilidade ou se os dados da amostra não se conformam a determinada distribuição de probabilidade.
II. Por meio dos testes de aderência é possível avaliar se existem discrepâncias entre as frequências esperadas e as frequências observadas em uma amostra preestabelecida.
III. São exemplos de testes de aderência os testes qui-quadrado e Kolmogorov-Smirnov.
Está correto o que se afirma em:
E. 
todas as alternativas.
Os testes de aderência avaliam se os dados de uma mostra assumem ou não determinada distribuição de probabilidade. Por meio dos testes de aderência é possível avaliar se existem discrepâncias entre as frequências esperadas e as frequências observadas em uma amostra preestabelecida. O teste qui-quadrado permite fazer esse tipo de avaliação, por exemplo. Quanto maior o valor de x2, mais discrepâncias existem entre os valores esperados e observados. Os testes qui-quadrado e Kolmogorov-Smirnov são exemplos de testes de aderência. 
-----------------------------------------------------------------------------------------------------
AULA 17 Ferramentas utilizadas em ciência de dados e Big Data
1. 
A visualização de dados, também chamada de DataViz, precisa ser muito bem elaborada, pois ela é o produto do esforço do cientista de dados. Pensando nisso, entre as bibliotecas a seguir, quais têm foco ​​​​​​​em visualização de dados?
D. 
Matplotlib e Seaborn.
Entre as inúmeras bibliotecas existentes para Python, é possível destacar duas que são responsáveis por visualização de dados: Matplotlib e Seaborn.
As alternativas que combinam as bibliotecas Numpy, Pandas, Scikit-learn e Statsmodels estão incorretas, pois elas não são essencialmente consideradas para visualizações. As bibliotecas Numpy e Pandas são focadas em análise de dados, enquanto as bibliotecas Scikit-learn e Statsmodels são utilizadas em aprendizagem de máquina e modelagem estatística.
2. 
O RStudio é um ambiente de desenvolvimento integrado para a linguagem R. Nele há áreas para editor de código, console, histórico, files, plots, packages, help, viewer, etc. O que faz a aba packages?
E. 
Exibe as bibliotecas e a descrição e a versão de cada uma.
A aba packages é essencial, pois exibe ao desenvolvedor os pacotes disponíveis para instalação ou que já estão instalados dentro do RStudio. Nessa aba, também é possível verificar uma descrição sucinta sobre cada biblioteca e suas versões, mostrando quais são as bibliotecas do usuário e quais são as bibliotecas do sistema.
É incorreto afirmar que a aba packages é responsável pela verificação de erros de código-fonte. Os erros gerados ou a execução bem-sucedida de códigos são exibidos no console. Também não é papel da aba packages a exibição dos pacotes que serão excluídos no RStudio: não há uma ferramenta para isso. Os recursos de ajuda se localizam na aba help.
3. 
Gráficos são recursos fundamentais em projetos de data science, pois ampliam a capacidade de entendimento das pessoas sobre um conjunto de informações. Quais características dos dados podem ser identificadas por meio de um gráfico?
A. 
Padrões entre elementos do dataset.
Por meio de um gráfico, o público-alvo consegue identificar semelhanças, padrões e até mesmo diferenças entre os conjuntos de dados analisados. Além disso, por ser visual, a interpretação é facilitada, já que o usuário consegue observar nitidamente a alteração no comportamento de determinado elemento.
Gráficos são resultados de uma visualização de dados e por isso não exibem o conteúdo de mensagens de erro, nem linhas de código das linguagens Python, R ou qualquer outra.
4. 
O desempenho e a vasta gama de bibliotecas faz com que Python ​​​​​​​seja uma das linguagem preferidas por cientistas de dados, sendo amplamente utilizada em todo o mundo. Nesse contexto, qual é o propósito da biblioteca Pandas?
C. 
A biblioteca Pandasapresenta recursos avançados para atuar com análise de dados.
A biblioteca Pandas é muito poderosa, pois gerencia recursos eficazes para análises de dados. Como uma de suas características, podemos destacar a manipulação e importação de arquivos Excel dentro de projetos em Python.
É importante mencionar, todavia, que a biblioteca Pandas não conta com recursos de animação e também não há recursos para edição de imagens. Embora seja uma biblioteca voltada para análises de dados, o seu propósito não é substituir a linguagem R. A biblioteca também não tem recursos de compartilhamento de dados com a linguagem R.
5. 
A linguagem R apresenta uma sintaxe bastante simples de ser compreendida e, portanto, de fácil aprendizagem para um cientista de dados iniciante. Considerando esse cenário, qual é o significado ​​​​​​​do comando getwd()? 
B. 
Retorna o caminho no qual a linguagem R está sendo executada.
O comando getwd() retorna o path exato em que se está rodando a linguagem R, ou seja, o caminho no qual o processo responsável pela execução da linguagem está sendo executado.
É inválido, portanto, mencionar que o comando constrói na memória do computador uma variável estática ou que gerencia o consumo de memória. Além disso, esse comando não tem em sua estrutura a capacidade de retornar a lista de pacotes instalados no RStudio e também não exibe mensagens de alerta no console do RStudio.
----------------------------------------------------------------------------------------------------------------
Aula 18 Estatística descritiva para ciência de dados
1. 
Diversos materiais na Internet definem a ciência de dados como responsável apenas pelo processamento de dados. Entretanto, ela é responsável por outras etapas extremamente importantes para o uso de dados. Qual alternativa mostra a sequência correta de todas as etapas do ciclo da ciência de dados?
C. 
Entender o problema, coletar os dados, armazenar os dados, processar os dados, explorar as informações dos resultados, comunicar os resultados e fornecer feedback.
As etapas do ciclo da ciência de dados que devem ser seguidas são:
1- entender o problema como um todo para determinar quais variáveis são importantes;
2- coletar os dados;
3- armazenar os dados;
4- processar os dados;
5- explorar as informações dos resultados;
6- comunicar os resultados;
7- fornecer feedback ao setor que solicitou o uso da ciência de dados.
Para processar os dados, é necessário armazená-los. Após comunicar os resultados, há a última etapa, para fornecer feedback ao setor que solicitou o uso da ciência de dados. Antes de coletar os dados, é fundamental entender o problema como um todo para determinar quais variáveis são importantes. Além disso, todas as etapas apresentadas devem seguir a ordem; assim, é necessário entender o problema como um todo para determinar quais variáveis são importantes e só depois coletar os dados. A etapa de armazenamentodos dados deve ser feita antes do processamento deles. 
2. 
O uso da ciência de dados vem se tornando comum nos últimos anos. Apesar disso, ainda existem pessoas que expressam de forma errada a correlação entre estatística e ciência de dados.
Qual é a explicação correta sobre a correlação entre estatística e ciência de dados?
E. 
A estatística é uma ferramenta da ciência de dados e é utilizada nas etapas de processar os dados e explorar as informações dos resultados.
A ciência de dados e a estatística, além de serem distintas, não são apenas para analisar dados.
Apesar de a estatística descritiva ser uma ferramenta ou método utilizado pela ciência de dados, ela não é utilizada na etapa de coletar os dados, e sim nas etapas de processar os dados e explorar as informações dos resultados. A ciência de dados é responsável por todas as etapas do ciclo de análise de dado 
3. 
Um questionário geral visando a analisar um grupo de pessoas com acompanhamento nutricional foi desenvolvido, composto pelas variáveis sexo, peso, altura, número de filhos, telefone e mês de início do acompanhamento. Classifique a classe de cada variável e assinale a alternativa que representa a sequência correta
A. 
Qualitativa nominal, quantitativa contínua, quantitativa contínua, quantitativa discreta, qualitativa nominal e qualitativa ordinal.
A sequência correta é: qualitativa nominal, quantitativa contínua, quantitativa contínua, quantitativa discreta, qualitativa nominal e qualitativa ordinal.
A variável sexo é qualitativa nominal mesmo se fosse utilizado número no lugar de letra para indicar sexo masculino (1) ou feminino (2).
As variáveis peso e altura podem assumir valores não inteiros, ou seja, são quantitativas contínuas.
A variável número de filhos só pode assumir valores discretos, ou seja, é quantitativa discreta.
O telefone, apesar de ser composto por números, não apresenta valores quantitativos, nem pode ser ordenado, ou seja, é uma variável qualitativa nominal.
O mês de início do acompanhamento é qualitativa ordinal, uma vez que existe uma ordenação entre as categorias. 
4 Em uma escola no interior de São Paulo, é comum que o professor de Educação Física faça a medição de altura dos alunos no início do ano letivo e faça uma comparação entre as alturas medidas. Para isso, o professor mediu a altura de 100 alunos e montou uma tabela com a distribuição de frequência de altura.
O que é possível concluir a partir da tabela?
B. 
A maioria dos alunos tem entre 1,70 e 1,75m de altura. A minoria dos alunos tem entre 1,75 e 1,80m. Do total de alunos, 59% têm entre 1,50 e 1,70m.
A partir dos dados da tabela, é possível verificar que a maioria dos alunos tem entre 1,70 e 1,75m de altura. A minoria dos alunos tem entre 1,75 e 1,80m. E, do total de alunos, 59% têm entre 1,50 e 1,70m. 
5. 
A estatística descritiva é responsável pela etapa inicial de análise de dados. Por meio de suas métricas, é possível analisar a posição das variáveis e analisar a dispersão.
Escolha a alternativa que melhor explica as medidas em estatística descritiva.
E. 
Média, mediana, moda e quartis (1.º e 3.º) são medidas para análise de posição. A média é a soma de todas as observações dividida pelo número total de observações. A moda é o valor que a variável assume com maior frequência. A mediana, também conhecida como 2.º quartil, indica um valor que é maior que 50% das amostras ordenadas. O 1.º quartil (25%) indica um valor em que 25% das amostras ordenadas são menores, e o 3.º quartil (75%) indica um valor em que 75% das amostras ordenadas são menores. A amplitude e o coeficiente de variação são medidas de dispersão. A amplitude é dada pela diferença entre o valor máximo e o valor mínimo da variável. O coeficiente de variação é uma medida de dispersão relativa, que elimina o efeito da magnitude dos dado
Média, mediana, moda e quartis (1.º e 3.º) são medidas para análise de posição.
O 1.º quartil (25%) indica um valor em que 25% das amostras ordenadas são menores, e o 3.º quartil (75%) indica um valor em que 75% das amostras ordenadas são menores.
A média é a soma de todas as observações dividida pelo número total de observações.
A moda é o valor que a variável assume com maior frequência.
A mediana, também conhecida como 2.º quartil, indica um valor que é maior que 50% das amostras ordenadas.
A amplitude e o coeficiente de variação são medidas de dispersão. A amplitude é dada pela diferença entre o valor máximo e o valor mínimo da variável. O coeficiente de variação é uma medida de dispersão relativa, que elimina o efeito da magnitude dos dados. 
---------------------------------------------------------------------------------------------
Aula 19 Análise de Dados Utilizando Dashboards
1. 
Uma das técnicas utilizadas pelos dashboards é a de visualização de dados. Essa técnica fornece uma perspectiva única sobre o conjunto de dados, por meio da qual você pode visualizar dados de várias maneiras diferentes. Em geral, as visualizações permitem mapear as dimensões em seus dados para propriedades visuais de formas geométricas. Com base nisso, podemos afirmar que a visualização de dados:
A. 
é a representação de dados em um formato pictórico ou gráfico.
A visualização de dados permite que dados sejam representados utilizando diferentes formatos gráficos e cores. O objetivo da visualização é simplificar o valor dos dados, promover a compreensão sobre eles, e comunicar conceitos e ideias importantes. 
2. 
Os dashboards fornecem um local central para os usuários acessarem, interagirem e analisarem informações atualizadas, a fim de que possam solucionar problemas de forma mais inteligente. Um bom dashboard permite monitorar e medir o desempenho e as métricas em tempo real e em qualquer lugar. Quais dos itens a seguir pode ser considerado um benefício do uso de dashboards nas áreas de negócio?
C. 
Capacidade de tomar decisões com base em dados.
O uso de dashboards permite uma facilidade em alinhar estratégias e metas, já que exibem informações úteis para esta atividade. Além disso, o uso de dashboards permite que os usuários obtenham insights e tomem melhores decisões baseados em dados e informações reais. 
3. 
A criação de dashboards tem algumas boas práticas que melhoram a qualidade final do produto e oferecem mais valor ao usuário. Este processo, de acordo com as práticas recomendadas para o design de dashboards, é a culminação de um processo de BI que abrange geralmente o preenchimento de requisitos, a definição de KPIs e a criação de um modelo de dados. Com base nisso, assinale qual dos itens a seguir é considerado uma boa prática de criação de dashboards.
E. 
Envolver os usuários finais no design do dashboard.
É importante que o dashboard possa ser personalizado para que se adéque em diferentes objetivos. Do contrário, em alguns casos, pode ser necessário criar um novo dashboard. Para isso, os usuários finais são envolvidos no processo. 
4. 
Ciência de dados é uma mistura multidisciplinar de inferência de dados, desenvolvimento de algoritmos e tecnologia para resolver problemas analiticamente complexos. O seu núcleo é baseado nos dados que são encontrados como informações brutas, streaming, e guardadas em armazéns de dados corporativos. Com base nessas informações, qual a relação entre dashboards e ciência de dados?
A. 
Dashboards permitem uma entrega maior de valor dos dados obtidos por meio da ciência de dados.
Dashboards são artefatos utilizados pelos cientistas de dados para oferecer valor ao usuário final. Os dashboards exibem de forma gráfica as informações e dados que são analisados por meio da ciência de dados, logo fornecem uma forma de entregar mais valor ao usuário. 
5. 
Os dashboards são cada vez mais vistos como ferramentas críticas para que as empresas obtenham insights instantâneos e de longo prazo a partir de seus armazéns de grandes volumes de dados em crescimento. Em empresas, os dashboards ajudam a equipe de TI a converter e comunicar rapidamente dados corporativos complexos em visualizações significativas,revelando indicadores-chave de desempenho. Assim, os executivos recebem todas as ferramentas de que precisam para aprofundar ainda mais a análise, a fim de que possam revelar o que realmente está acontecendo. Com base nisso, o que deve ser evitado durante a criação de um dashboard?
D. 
Design exageradamente chamativo ou desordenado.
É possível criar excelentes dashboards com poucas variações de componentes/cores e com alguns textos informativos. O importante é que eles exibam a informação corretamente e permitam o fácil entendimento. Devemos evitar um design exageradamente chamativo ou desordenado, tentando incluir informações demais sem restringir dados brutos o suficiente. 
------------------------------------------------------------------------------------------------------------------
Aula 20 Power BI
1. 
O Data Analysis Expressions (DAX) é uma coleção de funções, operadores e constantes que podem ser usados em uma fórmula, ou expressão, para calcular e retornar um ou mais valores. Analise as seguintes afirmativas sobre DAX:
I - Fórmulas DAX podem executar cálculos complexos que envolvem agregações personalizadas, filtragem e também o uso de valores condicionais.
II - Algumas funções da DAX fornecem inteligência de tempo, que permite criar cálculos usando intervalos de datas e comparar os resultados em períodos semelhantes.
III - DAX é útil para diferentes propósitos, porém os usuários de Excel não podem usar DAX para criar modelos de dados no suplemento Power Pivot.
IV - As funções de DAX nunca aceitam uma referência de células ou um intervalo como referência, mas aceitam uma coluna ou tabela como referência.
Estão corretas as afirmativas:
C. 
I, II e IV.
As fórmulas DAX podem executar cálculos complexos que envolvem agregações personalizadas, filtragem e também o uso de valores condicionais, criando fórmulas eficientes e ajudando você a tirar o máximo proveito de seus dados. Além do mais, algumas de suas funções fornecem inteligência de tempo, que permite criar cálculos usando intervalos de datas para realizar a comparação dos resultados em períodos parecidos. E, por fim, as funções de DAX nunca aceitam uma referência de células ou um intervalo como referência, mas aceitam uma coluna ou tabela como referência. O DAX é útil para diferentes propósitos, bem como para usuários de Excel, que podem usar DAX para criar modelos de dados no suplemento Power Pivot. 
2. 
Na era das tecnologias de gestão, as ferramentas de apoio à decisão se tornaram imprescindíveis, inclusive nas organizações públicas. O Power BI é uma dessas ferramentas, a qual permite uma ampla modelagem e análise em tempo real para dar suporte ao mecanismo de decisões, bem como à análise de projetos de uma organização inteira.
Analise as seguintes afirmativas sobre essa ferramenta da Microsoft:
I - O Power BI tem três elementos: o Desktop, o serviço do Power BI e o Mobile, que trabalham em conjunto para permitir que você crie, interaja, compartilhe e consuma seus dados como quiser.
II - No Power BI, o fluxo de trabalho comum começa no Power BI Desktop quando um relatório é criado.
III - Os relatórios são publicados no serviço do Power BI e, depois, podem ser compartilhados para outros usuários que consomem as informações por meio do Power BI Mobile.
IV - Os blocos de construção básicos no Power BI são: visualizações, conjuntos de dados, análises, painéis e blocos.
Das afirmativas, estão corretas:
B. 
I, II e III.
O Power BI tem três elementos: o Desktop, o serviço do Power BI e o Mobile, que trabalham em conjunto para permitir que você crie, interaja, compartilhe e consuma seus dados como quiser, e seus relatórios são publicados no serviço; depois, já podem ser compartilhados para outros usuários, que consomem as informações por meio do Power BI Mobile. No Power BI Desktop, o fluxo de trabalho começa quando um relatório é criado.
Os blocos de contrução do Power BI são: dashboards, relatórios, pastas de trabalho, conjuntos de dados e fluxos de dados.
3. 
O Power BI tem muitas funções, permitindo, dessa forma, que o usuário do negócio tenha mais conexão com seus dados e obtenha respostas mais rápidas e da melhor forma.
Sobre o contexto de funções do Power BI, qual o principal objetivo da criação e da configuração de um dashboard?
D. 
O principal objetivo é facilitar a visualização e o entendimento das informações da organização, bem como facilitar as tomadas de decisões.
O principal objetivo do dashboard é facilitar a visualização e o entendimento das informações da organização, bem como as tomadas de decisões. Elementos visuais como gráficos e indicadores de gestão permitem que tanto os gestores quanto sua equipe consigam monitorar o andamento de metas e resultados com clareza, pois são elementos altamente interativos, dinâmicos, customizáveis e intuitivos.
Recurso para transformar colunas em linhas: o principal objetivo é auxiliar nas edições de dados por meio do editor do Power Query.
Recurso Medidores e Cartões de Único Número: o principal objetivo é realizar a comparação de valores diante de suas métricas ao longo de determinado período.
Recurso Coletar Dados da Web: o principal objetivo é a obtenção de dados por meio de uma página da Web pelo link de acesso.
Recurso Gráfico de Dispersão: o principal objetivo é a utilização para pontuar dados em um eixo vertical e em um horizontal visando exibir o quanto uma variável é afetada por outra.
4. 
Analise as afirmações sobre o BI e julgue verdadeiro (V) ou falso (F):
( ) O BI abrange uma grande variedade de tecnologias e aplicativos para gerenciar parte do ciclo de vida dos dados.
( ) A implementação de BI em uma organização envolve a captura não apenas dos dados corporativos, mas também do conhecimento sobre os dados.
( ) O foco das ferramentas de BI está na automação operacional e no relatório.
( ) Existem somente três componentes básicos que todo ambiente de BI deve fornecer: banco de dados, consulta de dados e ferramentas de análise e de apresentação e visualização de dados.
A sequência correta é:
C. 
F, V, F, F.
A implementação de BI em uma organização envolve a captura não apenas dos dados corporativos, mas também do conhecimento sobre os dados, pois, ao criar um dashboard, por exemplo, o usuário deverá saber que dados deverão ser apresentados e o que se espera desse dashboard, levando em consideração qual a mensagem que está tentando transmitir e que público deseja atingir. O BI é capaz de gerenciar todo o ciclo de vida dos dados, e não apenas uma parte. O foco do BI é no monitoramento de indicadores, e não apenas em relatórios.
Os componentes de BI são: fontes de dados, Data Warehouse (DWH), Online Analytical Processing (OLAP), Data Mining, Extract, Transform, Load (ETL) e ferramentas de visualização.
5. 
O Power BI é uma ferramenta de visualização e criação de relatório de dados baseada em nuvem, a qual possibilita que os usuários gerem relatórios on-line. Depois que os relatórios são gerados, os usuários podem compartilhá-los com seus colegas no local de trabalho.
Analise as seguintes afirmativas sobre os recursos do Power BI:
I - Permite que os usuários transformem dados em recursos visuais e os compartilhem com colegas.
II - Permite que os usuários explorem e analisem dados de apenas uma fonte.
III - Depois que uma entrega é feita, os usuários podem exibi-la em vários dispositivos compatíveis com o aplicativo Power BI.
IV - Permite que os usuários expandam os compartilhamentos nas organizações com governança e segurança integradas.
Quais afirmativas estão corretas?
D. 
I, III e IV.
Dentre os diversos recursos do Power BI, podem-se citar três. Há a permissão para que o usuário transforme seus dados em recursos visuais, possibilitando, dessa forma, que sejam compartilhados com os demais colegas dentro da organização com governança e segurança integradas. Outro recurso interessante envolvendo o compartilhamento de um recurso visual é a possibilidade de acesso dele por meio de dispositivos compatíveis com o Power BI. Podem-se citar como exemplos de dispositivosmóveis acessíveis ao Power BI o sistema iOS (iPad, iPhone, iPod Touch ou Apple Watch), o telefone ou tablet Android ou dispositivo com Windows 10. Uma de suas grandes vantagens é permitir que os usuários explorem e analisem dados de todas as fontes (em uma exibição all-in-one).

Outros materiais