Conceitos e Aplicações Básicas de Estatística
A Estatística é uma ciência que coleta, organiza, analisa e interpreta dados para a tomada de decisões e é amplamente cobrada em diversos concursos pelo país. Portanto segue um resums introdutório do assunto.
População, Universo, Amostra, Amostragem e Variáveis
População
A população (ou universo) é o conjunto completo de elementos, indivíduos ou objetos que possuem uma característica em comum e são o foco de um estudo estatístico. A população pode ser finita ou infinita.
- Exemplo: O conjunto de todos os moradores de uma cidade, todas as árvores de uma floresta, ou todas as peças produzidas em uma fábrica.
Universo
O termo universo é frequentemente usado como sinônimo de população, englobando todos os elementos do estudo. Seu uso depende do contexto.
- Exemplo: Se queremos estudar o peso médio dos alunos de uma escola, os alunos formam o universo ou a população.
Amostra
Uma amostra é um subconjunto da população que é selecionado para representar o todo. Analisar uma amostra ao invés de toda a população pode economizar tempo, recursos e esforço. Porém, para que os resultados sejam confiáveis, é importante que ela represente bem as características da população.
- Exemplo: Selecionar 100 pessoas aleatórias de uma cidade que possui 500.000 habitantes para estimar a renda média.
Amostragem
A amostragem é o processo pelo qual se escolhe uma amostra da população. Existem vários tipos de amostragem:
- Amostragem Aleatória Simples: Cada elemento da população possui a mesma probabilidade de ser escolhido.
- Exemplo: Sorteio de nomes em uma urna para seleção.
- Amostragem Estratificada: A população é dividida em grupos (estratos) com características semelhantes, e a amostra é escolhida proporcionalmente em relação aos estratos.
- Exemplo: Dividir a amostra por faixa etária antes de selecionar os participantes.
- Amostragem Sistemática: Seleciona-se os elementos de forma ordenada e periódica.
- Exemplo: Escolher a cada décima pessoa em uma lista de nomes.
- Amostragem por Conveniência: Escolhe-se os indivíduos mais fáceis de acessar.
- Exemplo: Fazer uma pesquisa apenas com pessoas presentes em um shopping.
Variáveis
As variáveis são as características ou atributos que se busca medir ou observar durante um estudo estatístico. Elas podem ser classificadas em:
Variáveis Qualitativas
- Representam qualidades ou categorias.
- Não podem ser medidas numericamente, apenas classificadas.
- Exemplo: Cor dos olhos (azul, verde), estado civil (solteiro, casado).
Dividem-se em:
- Nominal: Não existe ordem entre as categorias (ex.: cor dos olhos).
- Ordinal: Existe uma ordem natural (ex.: grau de escolaridade).
Variáveis Quantitativas
- Representam números e podem ser medidas.
- Exemplo: Altura (cm), idade (anos), peso (kg).
Dividem-se em:
- Discretas: Números inteiros (ex.: número de filhos).
- Contínuas: Qualquer valor num intervalo (ex.: altura, temperatura).
Medidas de Tendência Central
As medidas de tendência central descrevem o valor em torno do qual os dados tendem a se concentrar. As principais são:
Média
A média aritmética é a soma de todos os valores dividida pelo número de observações. Ela é fortemente influenciada por valores extremos (outliers).
- Fórmula Matemática:

Onde:
- xˉxˉ é a média.
- xixi são os valores observados.
- nn é o número total de observações.
- Exemplo: As notas de uma turma são: 8, 7, 6, 9. A média é:

Média Ponderada
Fórmula
A fórmula para calcular a média ponderada é:

Onde:
- xˉ p é a média ponderada.
- xi representa cada valor da amostra.
- wi é o peso associado a cada valor xixi.
Exemplo
Suponha que um estudante tenha as seguintes notas em quatro disciplinas, com pesos diferentes atribuídos a cada uma:
- Nota 1 (Matemática): 8,0 com peso 3
- Nota 2 (História): 7,0 com peso 2
- Nota 3 (Ciências): 6,5 com peso 4
- Nota 4 (Educação Física): 9,0 com peso 1
Para calcular a média ponderada das notas:
- Multiplicar cada nota pelo seu respectivo peso:
- Matemática: 8,0 ⋅ 3 = 24, 08, 0⋅3 = 24,0
- História: 7,0 ⋅ 2 = 14, 07, 0 ⋅ 2 = 14,0
- Ciências: 6,5 ⋅ 4 = 26, 06, 5 ⋅ 4 = 26,0
- Educação Física: 9,0 ⋅ 1 = 9,0
- Somar os produtos das notas com seus pesos:

- Somar os pesos:

- Calcular a média ponderada:

Portanto, a média ponderada das notas do estudante é 7,3.
Mediana
A mediana é o valor central de um conjunto de dados ordenado. Se houver um número par de observações, calcula-se a média entre os dois valores centrais.
- Exemplo: Para os dados 10, 15, 20, 25, 30, a mediana é 20.
Para os dados 2, 4, 6, 8, 10, 12, a mediana é:

Moda
A moda é o valor que aparece com maior frequência no conjunto de dados. Um conjunto pode ser:
- Unimodal (uma moda), bimodal (duas modas) ou amodal (sem moda).
- Exemplo: Para o conjunto 3, 5, 7, 7, 8, 9, a moda é 7.
Medidas de Dispersão
As medidas de dispersão indicam o grau de variabilidade ou espalhamento dos dados em relação à média.
Amplitude
A amplitude é a diferença entre o maior e o menor valor dos dados.
- Fórmula Matemática:
Amplitude=Valor máximo−Valor mínimo
- Exemplo: Para o conjunto 4, 8, 10, 15, a amplitude é:
15−4=11
Variância
A variância mede o quão dispersos os valores estão em relação à média.
- Fórmula Matemática:

Exemplo Prático
Suponha que temos as seguintes notas de um aluno em 5 provas:
- Notas: 7, 8, 6, 9, 10
Passo 1: Calcular a média (xˉ)
Primeiro, vamos calcular a média das notas:

Passo 2: Calcular a soma dos quadrados das diferenças em relação à média
Agora, precisamos calcular a diferença de cada nota em relação à média, elevar ao quadrado e somar esses valores.
- (7−8)² = (−1)² = 1
- (8−8)² = (0)² = 0
- (6−8)² = (−2)² = 4
- (9−8)² = (1)² = 1
- (10−8)² = (2)² = 4
Agora, somamos esses valores:

Passo 3: Calcular a variância
Agora, substituímos na fórmula da variância:

Resultado
Portanto, a variância das notas do aluno é 2,5.
Interpretação
Uma variância de 2,5 indica que, em média, as notas estão dispersas em torno da média (8) por um valor quadrático, que é útil para avaliar a variabilidade das notas. Uma variância baixa significaria que as notas estão mais próximas da média, enquanto uma variância alta indicaria uma maior dispersão.
Desvio Padrão
O desvio padrão é a raiz quadrada da variância. Ele expressa a dispersão na mesma unidade dos dados.
- Fórmula Matemática:

- Exemplo: Em um conjunto de dados com média 10 e variância 4, o desvio padrão é DP=4=2
Porcentagem
A porcentagem é uma maneira de expressar proporções ou razões em relação a 100. Ela é usada para mensurar partes de um todo ou mudanças relativas entre valores.
Fórmulas Básicas
- Porcentagem:

- Cálculo do aumento ou redução percentual:

Exemplo de Aplicação
- Um produto custava R$100,00 e teve um aumento de 20%. O novo preço é:

- Um salário cai de R$2.000,00 para R$1.800,00. A redução percentual é:
