Estatística
Conceitos para entender pesquisas
Carlos Alberto Campagner*
Especial para a Página 3 Pedagogia & Comunicação
Especial para a Página 3 Pedagogia & Comunicação
Às vésperas das eleições, os jornais trazem a manchete: "31,6% devem votar no candidato A". E o que isso quer dizer? Que o candidato será eleito? Para entender esse tipo de enunciado, é necessário compreender alguns conceitos de estatística, a área da matemática que cuida da probabilidade.
Para entender uma pesquisa eleitoral, por exemplo, é necessário conhecer alguns conceitos:
População é o universo que vai ser tema da pesquisa. No caso das pesquisas eleitorais, os eleitores brasileiros.
Como seria quase impossível consultar mais de 125 milhões de eleitores, delimita-se o número de entrevistados, o grupo que vai servir de amostragem.
Amostragem é um número reduzido de pessoas que representa a população total. Escolher quais pessoas serão entrevistadas é um problema complexo.
Se metade dos eleitores são mulheres e ser mulher é um fator que interfere no voto, então metade da amostragem deve ser de mulheres. Se a classe social a que pertence o eleitor interfere no voto, a amostragem deve se aproximar ao máximo das diversas classes sociais que formam a população.
Desse modo, se cada pessoa entrevistada representa o voto de 100.000 pessoas da população, cada entrevistado deve ser uma amostra, a mais fiel possível, dessas 100.000 pessoas.
Apesar de todo cuidado para escolher o público, e para calcular as previsões, os resultados não são exatos. Tanto que toda reportagem, de jornal ou televisão, deve exibir uma margem de erro da pesquisa.
Normalmente 3 ou 4 pontos percentuais para mais ou para menos.
Para entender como são feitos os cálculos, também é importante ter algumas noções básicas de estatística: média, desvio padrão e variância.
Representação gráfica com porcentagens. Note que o total das partes dá 100%. |
População é o universo que vai ser tema da pesquisa. No caso das pesquisas eleitorais, os eleitores brasileiros.
Como seria quase impossível consultar mais de 125 milhões de eleitores, delimita-se o número de entrevistados, o grupo que vai servir de amostragem.
Amostragem é um número reduzido de pessoas que representa a população total. Escolher quais pessoas serão entrevistadas é um problema complexo.
Se metade dos eleitores são mulheres e ser mulher é um fator que interfere no voto, então metade da amostragem deve ser de mulheres. Se a classe social a que pertence o eleitor interfere no voto, a amostragem deve se aproximar ao máximo das diversas classes sociais que formam a população.
Desse modo, se cada pessoa entrevistada representa o voto de 100.000 pessoas da população, cada entrevistado deve ser uma amostra, a mais fiel possível, dessas 100.000 pessoas.
Apesar de todo cuidado para escolher o público, e para calcular as previsões, os resultados não são exatos. Tanto que toda reportagem, de jornal ou televisão, deve exibir uma margem de erro da pesquisa.
Normalmente 3 ou 4 pontos percentuais para mais ou para menos.
Para entender como são feitos os cálculos, também é importante ter algumas noções básicas de estatística: média, desvio padrão e variância.
Média, desvio padrão e variância
Noções de estatística
Carlos Alberto Campagner*
Especial para a Página 3 Pedagogia & Comunicação
Especial para a Página 3 Pedagogia & Comunicação
Quanto foi a sua média de matemática no último bimestre? Um dos conceitos mais básicos e cotidianos da estatística, a média nada mais é que um valor que "representa" vários outros. Com os exemplos a seguir, você vai ver que é fácil.
Imagine que, no bimestre, João fez cinco atividades que valiam nota nas aulas de matemática. Ele começou bem, mas terminou o bimestre mal. Tirou as seguintes notas: 9, 7, 5, 3, 2.
Qual será a sua média no fim do bimestre?
Para facilitar os cálculos, vamos adotar o seguinte padrão: S é a soma das notas, e n é o número de notas que ele teve.
A média (M) será:
Note que a sua média não é igual a nenhuma das notas que ele tirou. É um número que mostra, mais ou menos, como João foi no bimestre.
É importante, então, conhecer outra medida, a de que diferença (dispersão) existe entre a média e os valores do conjunto.
Voltando ao exemplo das notas de João, podemos calcular o desvio, que é a diferença de cada nota em relação à média:
Outro dado importante em estatística é obtido pela soma dos desvios ao quadrado. Cada desvio é elevado ao quadrado e, em seguida, somados:
A soma dos quadrados dos desvios dividida pelo número de ocorrências é chamada de variância.
Logo:
Outro valor que pode ser obtido a partir da média e da variância é o desvio padrão. Como os desvios foram elevados ao quadrado, deve-se tirar a raiz quadrada da variância e achar o desvio padrão:
Só para se ter uma idéia melhor do que significa o desvio padrão veja o seguinte exemplo:
Notas: (9, 9, 9, 1, 1, 1)
A média será:
E o desvio padrão será Dp = 4 (tente calculá-lo por conta própria).
Note que, apesar de esse aluno ter tido média 5, seu desempenho foi muito irregular (variou de 4 pontos! 5+4 =9 e 5-4 = 1), o que não é tão bom assim.
No exemplo anterior pode-se interpretar que as notas, no geral, variaram entre (5,2 + 2,56) = 7,76 e (5,2 - 2,56) = 2,64 , ou seja, Joãozinho teve desempenho mais regular que esse outro aluno.
*Carlos Alberto Campagner é engenheiro mecânico, com mestrado em mecânica, professor de pós-graduação e consultor de informática.Imagine que, no bimestre, João fez cinco atividades que valiam nota nas aulas de matemática. Ele começou bem, mas terminou o bimestre mal. Tirou as seguintes notas: 9, 7, 5, 3, 2.
Qual será a sua média no fim do bimestre?
Para facilitar os cálculos, vamos adotar o seguinte padrão: S é a soma das notas, e n é o número de notas que ele teve.
A média (M) será:
Note que a sua média não é igual a nenhuma das notas que ele tirou. É um número que mostra, mais ou menos, como João foi no bimestre.
Medidas de dispersão
Muitas vezes, a média não é suficiente para avaliar um conjunto de dados. Por exemplo, quando se fala em um grupo de mulheres com idade média de 18 anos. Esse dado, sozinho, não significa muito: pode ser que no grupo, muitas mulheres tenham 38 anos, e outras tantas sejam menininhas de dois!É importante, então, conhecer outra medida, a de que diferença (dispersão) existe entre a média e os valores do conjunto.
Voltando ao exemplo das notas de João, podemos calcular o desvio, que é a diferença de cada nota em relação à média:
Notas | Desvio | |
---|---|---|
9 | 5,2 | 3,8 |
7 | 5,2 | 1,8 |
5 | 5,2 | - 0,2 |
3 | 5,2 | - 2,2 |
2 | 5,2 | - 3,2 |
Outro dado importante em estatística é obtido pela soma dos desvios ao quadrado. Cada desvio é elevado ao quadrado e, em seguida, somados:
Valores | Média | Desvio | Quadrado dos desvios |
9 | 5,2 | 3,8 | 14,44 |
7 | 5,2 | 1,8 | 3,24 |
5 | 5,2 | - 0,2 | 0,04 |
3 | 5,2 | - 2,2 | 4,84 |
2 | 5,2 | - 3,2 | 10,24 |
Soma dos quadrados dos desvios | 32,8 |
A soma dos quadrados dos desvios dividida pelo número de ocorrências é chamada de variância.
Logo:
Outro valor que pode ser obtido a partir da média e da variância é o desvio padrão. Como os desvios foram elevados ao quadrado, deve-se tirar a raiz quadrada da variância e achar o desvio padrão:
Só para se ter uma idéia melhor do que significa o desvio padrão veja o seguinte exemplo:
Notas: (9, 9, 9, 1, 1, 1)
A média será:
E o desvio padrão será Dp = 4 (tente calculá-lo por conta própria).
Note que, apesar de esse aluno ter tido média 5, seu desempenho foi muito irregular (variou de 4 pontos! 5+4 =9 e 5-4 = 1), o que não é tão bom assim.
No exemplo anterior pode-se interpretar que as notas, no geral, variaram entre (5,2 + 2,56) = 7,76 e (5,2 - 2,56) = 2,64 , ou seja, Joãozinho teve desempenho mais regular que esse outro aluno.
Nenhum comentário:
Postar um comentário