Lista de termos estatísticos usados em pesquisas (parte 2)

Esse post finaliza a lista de ontem sobre os termos estatísticos que jornalistas deveriam saber. O post original foi publicado pelo blog Journalist’s Resource e recomendado pelo José Roberto de Toledo. Em frente:

  •  A outra ameaça para a validade de uma amostra é a noção de viés. O viés pode vir de várias formas diferentes, mas a mais comum acontece na seleção dos participantes da pesquisa. Por exemplo, se os participantes tomarem a iniciativa de se escolherem para um grupo de amostragem, então os resultados não serão mais externamente válidos. Isso acontece porque o tipo de pessoa que quer participar de um estudo não é necessariamente semelhante à população sobre a qual queremos fazer inferências.
  • Quando duas variáveis mudam de valores juntas (ambas crescem ou caem, ou assumem valores em direções opostas), dizemos que elas são correlacionadas.
  • Análise de regressão é uma forma de determinar se existe uma correlação entre duas variáveis e quão forte é essa correlação. No nível mais básico, isso envolve desenhar um gráfico do tipo X/Y (no nosso exemplo, níveis educacionais e taxas de criminalidade), procurando pela média de efeito causal. Isso significa observar como os pontos do gráfico estão distribuídos estabelecendo uma linha de tendência. De novo, correlação não implica necessariamente causalidade.
  • O desvio padrão ajuda a descobrir quanto há de variação dentro de um grupo de valores. Ele mede o desvio (diferença) do valor esperado (a média).
  • Ao analisar resultados, cuidado com os termos: Average, mean (ambos significam “média” em português) e median (mediana). Os dois primeiros termos se referem ao valor médio de um grupo de números. Some todos os elementos, divida pelo número de valores e essa é a média. A mediana, contudo, é o valor central e pode ser útil se existe um número muito grande ou pequeno em uma coleção de valores; digamos, o salário do Bill Gates em uma lista de salários comuns.
  • Causalidade é quando a mudança de uma variável provoca a alteração de outra. Por exemplo, a temperatura do ar e a luz do Sol estão correlacionadas (quando o Sol nasce, a temperatura sobe), mas a causalidade segue apenas em uma direção. Isso é conhecido como causa e efeito.
  • Quando a causalidade tiver sido estabelecida, o fator que conduz a mudança (no exemplo acima, a luz do Sol) é a variável independente. A variável que é conduzida é chamada de variável dependente.
  • Apesar de a causalidade ser fácil de provar em alguns momentos, frequentemente pode ser uma tarefa difícil por causa de variáveis de confusão (fatores desconhecidos que afetam as duas variáveis sendo estudadas). Os estudos precisam de experimentos bem planejados e executados para garantir que os resultados são confiáveis.
Infelizmente não consegui encontrar nenhum curso online e gratuito em português. Existe um PDF do INPE que parece dar uma boa introdução em português sobre o assunto. Em inglês, existem vários. Alguns exemplos: Star TrekExperiment Resources.