terça-feira, 3 de junho de 2008

Análise Qualitativa de Dados

Inicia-se hoje, com a Análise Qualitativa de Dados, a segunda parte do Tema "Análise de Dados", desta Unidade Curricular.

A Análise Qualitativa de Dados gerou técnicas próprias que, actualmente, caracterizam uma metodologia específica. Neste domínio, importa salientar duas ideias básicas:
  1. A análise de dados deve ser estudada em estreita relação com as abordagens metodológicas qualitativas e não deve ser reduzida a técnicas que o investigador selecciona e aplica arbitrariamente;
  2. A análise é mediada pelos objectivos da investigação, devendo, portanto, obedecer a uma meta e a orientações claras (Colás, 1997).
Retomando a Dissertação “Processos de Liderança e Desenvolvimento Curricular no 1º. Ciclo do Ensino Básico: Estudo de Caso” e privilegiando o estudo empírico realizado nesta investigação, nomeadamente, o que diz respeito à análise de dados (pp. 110-183), é-nos solicitada uma reflexão sobre algumas questões.

Nessa reflexão, deverão ser tidos em conta o corpus recolhido pela investigadora e a metodologia de análise adoptada na Dissertação em análise.

As questões para reflexão são as seguintes:

1) Se desenvolvesse uma investigação centrada no objecto de estudo desta Dissertação, escolheria a entrevista como método de recolha de informação?

2) Os procedimentos adoptados para a análise das entrevistas adequam-se aos objectivos da investigação?

3) Quais são as principais etapas de análise de conteúdo seguidas pela autora?

4) A análise de conteúdo revela-se um método adequado para o tratamento da informação recolhida?

5) De acordo com as leituras que realizou, poderiam ter sido seguidas outras metodologias de análise das entrevistas?

6) Compare a sistematização da análise de conteúdo realizada pela autora com os outputs parciais publicados no espaço de documentos sobre análise qualitativa (“Análise Qualitativa.Tratamento” e Análise Qualitativa.Quadros). Que comentários lhe sugerem as diferenças que identifica?

As respostas a estas questões serão publicadas, até 9 de Junho de 2008, inclusive, no Fórum Livre da Actividade, criado no espaço da Unidade Curricular.

segunda-feira, 2 de junho de 2008

Balanço da semana: 25 Mai 2008 - 01 Jun 2008

À partida, uma semana que previa "apenas" a resolução de um problema, afigurava-se como uma semana relativamente "fácil" no âmbito desta Unidade Curricular.

Mas, identificadas as questões do problema e relida a Dissertação que já houvera sido objecto de análise, aquando do estudo sobre uma das técnicas quantitativas de recolha de dados, o "Questionário", apercebemo-nos do grande desafio que se nos colocava e que ficou bem patente nas propostas de resolução para as 3 perguntas do problema.

Efectivamente, esta foi uma actividade que exigiu o remobilizar e reavivar de conhecimentos de Probabilidades e Métodos Estatísticos, já com alguns anos, mas numa área do conhecimento da qual gostamos particularmente.

Na abordagem que se faz ao estudo/projecto de investigação, em termos da análise quantitativa dos dados, é muito importante manter, permanentemente, como referência, o(s) objectivo(s) da investigação, as hipóteses de investigação colocadas (no caso de estudos confirmatórios, utilizando abordagens dedutivas) ou as questões investigativas (no caso de estudos exploratórios, utilizando abordagens indutivas), entre outros aspectos que possam auxiliar na manutenção do "rumo" que a investigação deve seguir, dentro dos prazos previstos, para que haja eficiência e não se desperdicem recursos.

São estes aspectos que permitirão ao investigador, depois de organizados os dados recolhidos, saber como deve explorar esses dados, através, neste caso, da análise quantitativa desses dados, com recurso a técnicas de análise quantitativa, em particular, recorrendo à aplicação de testes estatísticos paramétricos ou não paramétricos, consoante a natureza e escala de medida das variáveis em análise, assim como das amostras/grupos, entre outros aspectos.

É sobretudo da análise da relação entre variáveis, assim como da análise de diferenças entre amostras/grupos (independentes e/ou dependentes), com recurso a testes estatísticos e para um determinado nível de significância estatística (valor complementar do intervalo de confiança, no intervalo 0 a 1), que se obtêm a maior parte das conclusões relativamente aos dados recolhidos.

Consoante os casos, poderá haver a possibilidade de aplicação de um ou outro tipo de teste estatístico e, muitas vezes, a aplicação de um único teste estatístico acaba por não revelar toda a informação necessária, havendo nesses casos, e quando possível, que recorrer a testes complementares. Isto é particularmente verdade no caso de testes não paramétricos, que não têm a mesma "força" dos testes paramétricos.

Foi uma semana muito produtiva, pois independentemente da proposta de resolução do problema a que se acabou por chegar, esta actividade obrigou a aprofundar bastante este assunto, assim como as matérias afins, algo que seria mais difícil de acontecer se não houvesse uma situação prática para ilustrar e sobre a qual se pôde trabalhar.

Apesar de em regime de auto-aprendizagem, com estudo e trabalho individual, pode afirmar-se que esta foi mais uma semana produtiva.

Encerrado o capítulo da análise quantitativa de dados, abre-se um novo capítulo, no contexto deste tema, relativo à análise qualitativa de dados.

Análise Quantitativa de Dados - Caso Prático (cont.)

No post anterior foi explicitada, em detalhe, a proposta de resposta à Pergunta 1 do Caso Prático de Técnicas Quantitativas de Análise de Dados.

Este post inclui as respostas às duas perguntas restantes do Caso Prático.

Pergunta 2)

99 Professores indicaram que nunca utilizaram computador com os alunos (pág. 99). Poder-se-á dizer que estes professores tendem a ser os que indicam que se sentem constrangidos a usar as TIC frente aos alunos (pergunta 101), ou os que indicam que o uso das TIC na sala de aula exige novas competências por parte dos professores (pergunta 105), ou os que indicam que os conteúdos da Internet não se adequam à disciplina (pergunta 107) ou ainda os que indicam que as TIC não melhoram a aprendizagem de Inglês (pergunta 112)? Que testes estatísticos faria para verificar as hipóteses colocadas? Que nível de significância pensaria adequado para estes testes?


Intuitivamente e a priori, existiria a tendência para considerar estas associações como verdadeiras, mas o rigor científico exigível numa investigação obrigaria à respectiva comprovação, hipótese a hipótese, com recurso a testes estatísticos.

Neste caso particular, teríamos de relacionar a dimensão “99” (correspondente ao número de professores que, na questão 73, responderam que nunca utilizaram computador com os alunos), hipótese a hipótese, com as dimensões correspondentes às respostas às questões 101, 105, 107 e 112, respectivamente.

As questões 101, 105, 107 e 112 correspondem a “Perguntas do Tipo 2” (Hill & Hill, 2005: 110) e as respectivas respostas foram dadas numa escala ordinal. De acordo com estes autores, “embora as perguntas do Tipo 2 usem escalas ordinais tem-se que, quando a distribuição das respostas é unimodal e mais ou menos normal, é vulgar tratar os valores numéricos ligados com as respostas como tendo sido obtidos através de uma escala métrica”, dando-se “o nome de «escalas de avaliação» às escalas ordinais ligadas com perguntas de Tipo 2.

Para analisar as respostas dadas nas «escalas de avaliação» usam-se normalmente métodos paramétricos” (2005: 111-112). Assim, assumindo que os dados estão, mais ou menos, de acordo com os pressupostos dos métodos paramétricos, e que o que está em causa, hipótese a hipótese, é a diferença entre duas amostras dependentes (pois pretende-se saber se os professores que nunca utilizaram computador com os alunos tendem a ser os “mesmos” que “concordaram” nas respostas às questões 101, 105, 107 e 112, respectivamente), poderíamos utilizar o teste estatístico “t de student para duas amostras dependentes” (também designadas de “grupos emparelhados”), já que se coloca a hipótese de os dados de uma amostra estarem, de alguma forma, relacionados com os dados da outra amostra.

De qualquer modo, à semelhança do que se referiu na resposta à Pergunta 1) deste Caso Prático, teríamos de estar na posse das respostas dos inquiridos para, de acordo com a matriz de organização dos dados, verificar as respectivas associações entre as amostras (grupos), duas a duas, para cada uma das hipóteses colocadas.

As hipóteses (alternativa - H1) a testar seriam, assim, as seguintes:

a) Respostas às questões 73 e 101, comparando 99 “Nunca” (41,3% em 240) com 97 (40,4% em 240): H1 “Os professores que nunca utilizaram computador com os alunos, são os que indicam que se sentem constrangidos a usar as TIC frente aos alunos.”;

b) Respostas às questões 73 e 105, comparando 99 “Nunca” (41,3% em 240) com 147 (61,3% em 240): H1 “Os professores que nunca utilizaram computador com os alunos, são os que indicam que o uso das TIC na sala de aula exige novas competências por parte dos professores.”;

c) Respostas às questões 73 e 107, comparando 99 “Nunca” (41,3% em 240) com 113 (47,1% em 240): H1 “Os professores que nunca utilizaram computador com os alunos, são os que indicam que os conteúdos da Internet não se adequam à disciplina.”;

d) Respostas às questões 73 e 112, comparando 99 “Nunca” (41,3% em 240) com 134 (55,8% em 240): H1 “Os professores que nunca utilizaram computador com os alunos, são os que indicam que as TIC não melhoram a aprendizagem de Inglês.”.

O teste estatístico vai permitir ao investigador, saber, com um determinado grau de probabilidade de erro, se a Hipótese Nula (H0) se verifica (ou não). Essa probabilidade de erro corresponde ao nível de significância (α), pelo que quanto mais pequeno for o α maior será o intervalo de confiança para que se verifique H1, para o caso de rejeição de H0.

Neste tipo de teste estatístico, normalmente considera-se como adequado um nível de significância de 0,05 (correspondente a um intervalo de confiança de 95%), se bem que se possam utilizar valores de α inferiores, como, por exemplo, α = 0,01.

No caso presente, definido o nível de significância para cada uma das 4 (quatro) hipóteses antes colocadas, calcular-se-ia a respectiva probabilidade (p-value) de observação, com recurso ao teste estatístico adequado (neste caso “t de student para duas amostras dependentes”).

Para um α igual a 0,05, do ponto de vista da significância estatística, se o p-value for menor que 0,05, o resultado não é significante; mas se o p-value for menor ou igual a 0,05, o resultado é significante (em particular: se o p-value estiver entre 0,01 e 0,05, diz-se que o resultado é significante; se o p-value estiver entre 0,001 e 0,01, diz-se que o resultado é muito significante; se o p-value for menor que 0,001, o resultado é extremamente significante.

Na resolução desta pergunta, tomou-se a opção de sugerir a utilização do teste estatístico "t de student para duas amostras dependentes", pelas razões antes indicadas (em virtude de testar as hipóteses de relação entre variáveis dependentes, 2 a 2 variáveis, tal como especificado), mas também pelo modo como a pergunta está formulada ("ou" em vez de "e"):

"99 Professores indicaram que nunca utilizaram computador com os alunos (pág. 99). Poder-se-á dizer que estes professores tendem a ser os que indicam que se sentem constrangidos a usar as TIC frente aos alunos (pergunta 101), ou os que indicam que o uso das TIC na sala de aula exige novas competências por parte dos professores (pergunta 105), ou os que indicam que os conteúdos da Internet não se adequam à disciplina (pergunta 107) ou ainda os que indicam que as TIC não melhoram a aprendizagem de Inglês (pergunta 112)?"

Caso na pergunta estivesse "e" no lugar do "ou", estaríamos perante a relação entre "k amostras dependentes" (dependentes pelas razões também já antes justificadas, em número de 1 + 4), com k = 5.

Neste caso não faz sentido utilizar a "t de Student" pois este é um teste estatístico que só lida com 2 amostras. Deste modo, deveria utilizar-se o "Teste de Friedman", um teste estatístico não-paramétrico.

Pergunta 3)

Analise os dados encontrados e que estão expostos na dissertação. Gostaria ainda de colocar outras hipóteses de relações entre esses dados? Explicite uma dessas relações e indique qual o teste estatístico que consideraria adequado para verificar essa relação.


Sim, por exemplo a relação entre a “Falta de computadores” (pergunta 113 do Questionário) e o “Acesso difícil às salas com computadores” (pergunta 114 do Questionário), no que aos “Obstáculos à integração das TIC” diz respeito.

Tratando-se de variáveis ordinais, poderíamos utilizar o “Coeficiente de Correlação de Spearman (ρ)” (teste estatístico não-paramétrico) para verificar a relação entre ambas.

Este teste estatístico tem as vantagens de não fazer nenhuma suposição sobre a distribuição de frequências das variáveis (o que não acontece com os testes paramétricos) e, ao contrário, por exemplo, do “Coeficiente de Correlação de Pearson”, não exige o pressuposto de que a relação entre as variáveis seja linear ou, tão pouco, que as variáveis sejam medidas em intervalo de classe.

Estas são algumas das razões pelas quais o “Coeficiente de Correlação de Spearman (ρ)” é, normalmente, utilizado para testar relações entre variáveis ordinais.

No que diz respeito à "escolha de testes estatísticos", neste link encontram-se vários critérios de escolha e possibilidades de análise.