projeto de investigaÇÃo do estÁgio pÓs-doc
TRANSCRIPT
PROJETO DE INVESTIGAÇÃO DO ESTÁGIO PÓS-DOC
Cícero Costa Quarto
Projeto de pesquisa
Machine Learning no Auxílio à Formação Otimizada de Grupos para a
Aprendizagem Colaborativa
São Luís (MA)/Brasil - 2020
1. CONSTRUINDO O OBJETO DE INVESTIGAÇÃO
Nesta seção são descritos os elementos estruturais básicos para o
desenvolvimento sistemático do referente projeto de pesquisa, constituindo, desta
forma, o norte e o alicerce do desenvolvimento da investigação proposta. São eles:
Contextualização, Motivação, Questão de Pesquisa, Objetivos e Visão geral
metodológica da pesquisa.
1.1 Contextualização
Cada vez mais cresce o número de aplicativos de apoio aos docentes e tutores
visando auxiliá-los na tomada de decisões em ambientes ricos em tecnologias para uma
aprendizagem participativa e colaborativa mais eficiente [33]. Essa ocorrência é em
parte impulsionada por evidências de que a aprendizagem colaborativa apoiada por
computador, a denominada CSCL (do inglês Computer-Supported Collaborative
Learning) pode melhorar o aprendizado do aluno e, também, motivada por uma
tendência crescente de locais de trabalho mais colaborativos em indústrias [26].
Quando o trabalho é realizado em grupo de forma colaborativa, as habilidades
individuais podem ser complementadas pelo conhecimento e pela experiência de outros
membros do grupo. Além disso, a interação entre eles permite que sejam identificadas
inconsistências e falhas em seus pensamentos ao encontrar outros pontos de vistas e
entendimentos [37], [19].
Do ponto de vista pedagógico, o importante é considerar processos
colaborativos, menos hierárquicos e menos formatados, que combinam o melhor dos
percursos individuais com momentos de aprendizagem em grupo [27]. Os métodos de
ensino e aprendizagem centrados nos alunos, torna-os protagonistas do processo, dando
forte ênfase nas suas interações colaborativas em grupo e na efetiva participação do
professor na implementação de estratégias para que eles entendam melhor os materiais
de estudo, assim como capacitá-los a trabalhar numa sinergia única para resolver
problemas, atribuições e criação de novos produtos [32]. A nova geração conectada
prefere o papel de protagonista do que o de espectador. É preciso que os cursos se
adequem a essa nova necessidade. Daí o uso de metodologias ativas de aprendizagem
(Censo EaD.Br 20171).
[46] já chamavam a atenção que, com o suporte à colaboração entre os
indivíduos, em contextos de aprendizagem virtual, o campo CSCL pode fornecer
relevantes contribuições, entretanto, ao mesmo tempo, traz alguns desafios para a área,
tais como: a) qual seria a mais adequada representação afetiva dos alunos para a
aprendizagem colaborativa? b) qual seria a melhor distribuição dos alunos em grupos,
de forma a potencializar a aprendizagem de grupo? e c) como modelar e implementar
computacionalmente as respostas para tais abordagens?
1.2 Motivação
Recentemente, tem sido enfatizada a verificação da influência dos traços de
personalidade dos alunos na formação de grupos e na criação de mecanismos para
automatizar e apoiar a formação dos grupos em ambientes CSCL, na expectativa de
1 Disponível em: http://www.abed.org.br/arquivos/CENSO_EAD_BR_2018_digital_portugues.pdf
contribuir para o design de cenários colaborativos mais efetivos e de melhor
desempenho [37].
[28] destacavam que diferentes abordagens vinham sido desenvolvidas para
ajudar os professores a distribuir os alunos em grupos com base em um conjunto de
restrições. No entanto, consideravam estes autores, que as ferramentas existentes muitas
vezes não conseguiam a atribuir alunos para determinados grupos, criando um problema
conhecido como “estudantes órfãos”. [10] pontua que formar grupos sem considerações
cuidadosas muitas vezes provoca problemas como a participação desproporcional de
indivíduos, desmotivação e resistência ao trabalho de grupo.
[18] enfatizavam que a formação de grupo é o primeiro passo para projetar
estratégias CSCL, onde os alunos podem aprender e participar de um grupo. Ainda para
estes autores, pode-se analisar e combinar características como formação cultural,
conhecimentos, habilidades, estilos, funções para criar uma sinergia positiva entre os
participantes que vai remeter a interações significativas e melhores situações de
aprendizagem.
[20] consideram que a aprendizagem colaborativa é amplamente aceita como
uma abordagem para promover a eficácia da aprendizagem e a satisfação do aluno. No
entanto, ainda para os autores, a qualidade e os resultados da colaboração dependem de
vários fatores, entre os quais a formação do grupo desempenha um papel importante, e
concluem que as abordagens existentes levam em consideração grupos formados por
meio de alocação aleatória ou com base em certos critérios, como desempenho
acadêmico, características e habilidades de comunicação.
[15] enfatizam que comunidades virtuais são usadas para diferentes grupos
sociais e profissionais, onde a comunicação entre os membros da comunidade muda de
um indivíduo para outro. Entretanto, pontuam ainda estes autores, as técnicas existentes
não conseguem agrupar as pessoas de comportamento semelhante para formar a
comunidade virtual. Para solucionar tais problemas, concluem os autores, as técnicas de
machine learning podem ser utilizadas para formar a comunidade virtual baseada em
comportamentos de influência, suspeita e confiança com melhor precisão de
classificação e menor consumo de tempo.
[29] relevam que enfrentar os desafios da formação de grupos eficientes tem
sido crucial para o sucesso dos sistemas modernos de trabalho e educação em rede de
computadores, e complementam que a formação de grupos tem sido estudada por
décadas em diferentes áreas como Psicologia, Sociologia e Educação e pode ser feita de
diferentes maneiras e considerando diferentes abordagens, critérios e características dos
indivíduos. Embora esta possa parecer uma tarefa simples, a formação de grupos torna-
se complexa e importante à medida que cresce o número de indivíduos e/ou os critérios
definidos para o agrupamento [28], [6], [38].
[4] frisam que as técnicas de aprendizado de máquina tornam possível deduzir
mais informações significativas dos dados processados pela mineração de dados, assim
como tais informações significativas ajudam as organizações a estabelecer suas políticas
futuras em uma base mais sólida e a obter vantagens importantes em termos de tempo e
custo. Em [17], tem-se que o aprendizado de máquina pode fornecer maneiras proativas
de vulnerabilidades de segurança previstas que podem ser reparadas antes que o dano
seja feito.
Diante do cenário, trazido através das Seções 1.1 e 1.2, esta pesquisa busca
contribuir na atenuação dos problemas derivados da má formação de grupos para
processos de ensino e aprendizagem colaborativa apoiada por computador (CSCL). Para
tal, o trabalho alicerça-se nas áreas de Psicologia Positiva, Educação, Estatística e
Ciência da Computação, de forma a fundamentar a modelagem, implementação e
validação do SAMFAR (Sistema Autônomo de Mensuração de Fitness de
Autorrelatos), um componente da arquitetura geral do sistema HERMES de apoio à
formação otimizada de grupos para a aprendizagem colaborativa. O HERMES é
composto por três componentes: os Sistemas Autônomos, as Bases de Dados e as
Interfaces de Visualização. A Figura 1 ilustra a arquitetura geral do sistema HERMES e
a Tabela 1 a descrição dos supracitados componentes.
Figura 1: Arquitetura geral do sistema HERMES [35]
Fonte: O autor (2020).
Tabela 1: Componentes estruturais da arquitetura de sistema HERMES.
Fonte: O autor (2020)
Componentes Descrição/Funcionalidades
de sistema
GAAln
Grupo de Agentes Alunos são um subsistema de relações sociais, de
interações entre alunos, que compartilham certas características,
interagem uns com os outros, aceitam direitos e obrigações. São
aqueles em que todos os membros compartilham as decisões tomadas
e são responsáveis pela qualidade do que é produzido em conjunto,
conforme suas possibilidades e interesses.
SAProf
Sistema Autônomo Professor é responsável pela formação do
agrupamento inicial de alunos, pelo planejamento e organização da
disciplina no ambiente virtual de ensino e aprendizagem (AVEA),
além da gestão de alunos (social e técnica). Conteúdos do curso –
materiais instrucionais digitais para apoiar a aprendizagem do aluno
(p.ex. softwares, jogos, videoaulas, docs, links, áudios, imagens, e-
books, blogs, pdfs, etc)
SAMAR
Sistema Autônomo de Mensuração de Autorrelatos: disponibiliza o
Termo de Consentimento Livre Esclarecido (TCLE) aos alunos, que
têm a opção de participar ou não da pesquisa. O aluno, ao aceitar
participar, são coletados dados básicos sobre o mesmo, como nome,
idade e sexo. Logo em seguida, ele é instruído a responder a um
questionário quantitativo referente às três escalas de autorrelatos2
esperança, autoestima e autoeficácia. Ao responder a todas às
escalas, é mostrado ao aluno o seu perfil de autorrelatos obtido,
considerando a relação PerfilDeAutorrelato Vs. Percentis.
SAMFAR
Sistema Autônomo de Mensuração de Fitness de Autorrelatos é
responsável pelo cálculo da probabilidade estimada do Potencial de
Colaboração do Aluno (PCAj). Essa estatística representa o fitness do
aluno, ou seja, o quão o aluno é capaz de colaborar em grupo. A base
de conhecimento (BC) do SAMFAR é baseado em modelos
matemáticos de regressão linear múltipla e regressão logística binária,
os quais são utilizados para treinar a máquina em seu aprendizado.
SAACG
Sistema Autônomo de Avaliação de Colaboração de Grupo. É
responsável em calcular o Potencial de Colaboração do Grupo
(PCGj).
Bases de Dados
Bases de Dados de Perfis de Autorrelatos do Aluno (BDPAA), Base
de Dados de Fitness de Autorrelatos do Aluno (BDFAA), Base de
Dados de Desempenho de Colaboração de Grupo (BDDCG) e Logs
do AVEA (LAVEA).
CMD
Componente de Mineração de Dados permite identificar se o Perfil de
Autorrelato do Aluno Vs. Papel no grupo e/ou fitness inicial do aluno,
definido inicialmente através de autorrelatos, se mantém ou se
modifica durante o processo de aprendizagem. Em caso de
modificação, é necessário redefinir novos grupos de aprendizagem
com objetivo de otimizar a aprendizagem colaborativa de cada grupo.
Interfaces de
Visualização
As Interfaces de Visualização têm a função de apresentar os dados
armazenados nas BDPAA, BDFAA, BDDCG e LAVEA sob a forma
de relatórios de tabelas e gráficos. Além disso, o componente também
oferece suporte para exibição de outras informações através de
formulários Web, como o TCLE e o questionário de autorrelatos,
quando solicitado pelos sistemas autônomos do HERMES.
O ramo hoje conhecido como Psicologia Positiva é a ciência da experiência
positiva subjetiva, dos traços individuais positivos e instituições positivas que procura
melhorar a qualidade de vida, vindo esta trazer para este novo século, contribuições para
o entendimento científico e para intervenções em indivíduos, famílias e comunidade
[43]. No que tange à Psicologia Positiva, a incursão desta tem por justificativa subsidiar
a investigação das características positivas do aluno esperança, autoestima e
autoeficácia que sejam as mais adequadas para as configurações de grupos, e desta
forma fomentar a potencialização da aprendizagem de grupos colaborativos. Para tal,
referências como [39], [45], [2], [43], [32] são exploradas.
Da Educação, os estudos de [40], [8][3], [7][14], [27], [34], dentre outros são
estudados. Na visão destes estudiosos da educação, estamos em uma etapa de profundas
mudanças na transição para a sociedade da informação, que afetam o processo de ensino
e aprendizagem, exigindo de organizações, professores e alunos a encontrarem novos
modelos de educação em todas as situações. Dos estudos de [14], em especial, a
pesquisa explora as teorias e modelos de colaboração, os quais fornecem uma visão
sobre como e por que as pessoas trabalham em grupo através da Teoria da Atividade, o
2 Disponível em [...]
Modelo 3C de Colaboração, Padrões de Colaboração e o Modelo de Tuckman, este
sobre o desenvolvimento de grupo. De acordo com [14], as teorias e modelos de
colaboração nos apoiam a analisar o trabalho em grupo para que possamos selecionar e
projetar sistemas colaborativos.
Da Estatística, a pesquisa se beneficia de seus métodos e técnicas, de forma a
apoiar a análise exploratória de dados, bem como a construção dos modelos
matemáticos lineares multivariados, de forma a auxiliar o aprendizado supervisionado
de máquina baseado nas técnicas de classificação e predição para a tomada de decisão
de formação otimizada de grupos para a aprendizagem colaborativa. Estudos de [22],
[1], [9], [11], [12], [50] e [5] são bem-vindos para essa fundamentação teórica.
Por fim, da área de Ciência da Computação, a pesquisa se beneficia da subárea
Inteligência Artificial, mais especificamente de Machine Learning (Aprendizado de
Máquina) baseado na abordagem simbólica. Citando Simon (1983), [24] define o
aprendizado como qualquer mudança em um sistema que melhore o seu desempenho na
segunda vez que ele repetir a mesma tarefa ou outra tarefa da mesma população. [17]
trazem que aprendizado de máquina é uma forma de IA que permite que um sistema
aprenda com os dados e não através de programação explícita, no entanto, o
aprendizado de máquina não é um processo simples.
[17] destacam que a vantagem do aprendizado de máquina é que é possível
utilizar algoritmos e modelos para prever resultados. Para os autores, isso é possível
garantindo que os cientistas de dados que fazem o trabalho estejam usando os
algoritmos certos, ingerindo os dados mais apropriados (que sejam precisos e limpos) e
usando os modelos de melhor desempenho, e concluem que, se todos esses elementos se
juntam, é possível treinar continuamente o modelo e aprender com os resultados,
aprendendo com os dados, assim como a automação desse processo de modelagem,
treinamento do modelo e teste leva a previsões precisas para dar suporte à tomada de
decisões nas diversas áreas de conhecimento.
[17] ressalta que ao treinar um sistema de aprendizado de máquina, conhece-se
as entradas (por exemplo, receita do cliente, histórico de compras, localização e assim
por diante) e se conhece sua meta desejada (prevendo a propensão de um cliente a se
desligar). No entanto, pondera este autor, a grande incógnita são as funções matemáticas
para transformar esses dados brutos em uma previsão de rotatividade de clientes. À
medida que o algoritmo de aprendizagem é exposto a mais e mais dados do cliente, o
sistema se torna mais preciso na previsão da probabilidade de rotatividade do cliente.
De acordo com [17], o treinamento de um algoritmo de aprendizado de máquina para
criar um modelo preciso pode ser dividido em três etapas, conforme apontados a seguir
e descritos logo em seguida: a) Representação, b) Avaliação e c) Otimização.
a) Representação: o algoritmo cria um modelo para transformar os dados
inseridos nos resultados desejados. À medida que o algoritmo de aprendizado é
exposto a mais dados, ele começa a aprender a relação entre os dados brutos e
quais pontos de dados são fortes preditores para o resultado desejado.
b) Avaliação: à medida que o algoritmo cria vários modelos, um ser humano ou o
algoritmo precisará avaliar e pontuar os modelos com base em qual modelo
produz as previsões mais precisas. É importante lembrar que após o modelo ser
operacionalizado, ele ficará exposto a dados desconhecidos.
c) Otimização: depois que o algoritmo cria e pontua vários modelos, seleciona-se
o algoritmo de melhor desempenho. À medida que se expõe o algoritmo a
conjuntos mais diversos de dados de entrada, seleciona-se o modelo mais
generalizado.
Conforme ilustrado na Figura 2, [17] destacam que existem quatro subconjuntos
principais de Inteligência Artificial (IA). No contexto desta pesquisa, é enfocado o
aprendizado de máquina. No entanto, para entender o aprendizado de máquina, é
importante colocá-lo em perspectiva.
Figura 2: IA é categoria geral que inclui Aprendizado de Máquina e
Processamento de Linguagem Natural (NLP).
Fonte: [17].
Da Figura 2, tem-se:
Reasoning (Raciocínio): O raciocínio da máquina permite que um sistema
faça inferências com base em dados. Em essência, o raciocínio ajuda a preencher as
lacunas quando há dados incompletos.
Processamento de Linguagem Natural (NLP): NLP é a capacidade de
treinar computadores para compreender tanto o texto escrito quanto a fala humana. As
técnicas de NLP são necessárias para capturar o significado de texto não estruturado de
documentos ou comunicação do usuário. Portanto, a NLP é a principal forma de os
sistemas interpretarem o texto e a linguagem falada. As ferramentas necessárias para
NLP incluem categorização, ontologias, escutas, catálogos, dicionários e modelo de
linguagem.
Planning (Planejamento): O planejamento automatizado é a capacidade de
um sistema inteligente atuar de forma autônoma e flexível para construir uma sequência
de ações para atingir um objetivo final.
[17] destacam que criar um aplicativo de aprendizado de máquina ou
operacionalizar um algoritmo de aprendizado de máquina é um processo iterativo. Não
pode-se simplesmente treinar um modelo uma vez e deixá-lo sozinho – mudanças de
dados, preferências evoluem e concorrentes surgem. Portanto, precisa-se manter o
modelo atualizado quando entrar em produção. Ainda para [17], o ciclo de aprendizado
de máquina é contínuo e a escolha do algoritmo de aprendizado de máquina correto é
apenas uma das etapas, e pontua que as etapas do ciclo de aprendizado de máquina são
as que seguem listadas: i) Identificação de dados, ii) Preparação de dados, iii) Escolha
do algoritmo de aprendizado de máquina, iv) Treinamento, v) Avaliação, vi)
Implementação, vii) Predição e viii) Avaliação das predições. Abaixo, são trazidas as
definições de cada etapa, segundo [17].
◙ Identificação de dados; Identificar as fontes de dados relevantes é a primeira
etapa do ciclo de aprendizado de máquina. Além disso, conforme é desenvolvido o
algoritmo de aprendizado de máquina, deve-se pensar em expandir os dados de destino
para melhorar o sistema.
◙ Preparação de dados: Certifique-se que os dados estejam limpos, protegidos
e controlados. Ao criar-se um aplicativo de aprendizado de máquina com base em dados
imprecisos, o aplicativo falhará.
◙ Escolha do algoritmo de aprendizado de máquina: Pode-se ter vários
algoritmos de aprendizado de máquina aplicáveis aos dados e desafios de negócios.
◙ Treinamento: Precisa-se treinar o algoritmo de aprendizado de máquina para
criar o modelo. Dependendo do tipo de dados e algoritmo, o processo de treinamento
pode ser Supervisionado, Não Supervisionado ou Aprendizado por Reforço.
◙ Avaliação: Avalie os modelos para encontrar o algoritmo de melhor
desempenho.
◙ Implementação: Algoritmos de aprendizado de máquina criam modelos que
podem ser implementados em aplicativos na nuvem e no local.
◙ Predição: Após a implementação, comece a fazer previsões com base em
novos dados de entrada.
◙ Avaliação das predições: Avalie a validade das previsões. As informações
que são coletadas na análise das previsões estão inseridas no ciclo de aprendizado de
máquina para ajudar a melhorar a precisão.
[17] destacam que depois que o modelo começar a fazer previsões, deve-se
repetir o processo avaliando os dados que estão sendo avaliados, assim como chamam a
atenção para questões do tipo: todos os dados são relevantes? Existem novos conjuntos
de dados que podem ajudar a melhorar a precisão das previsões?, e concluem que ao
aprimorar continuamente os modelos e avaliar novas abordagens, pode-se manter os
aplicativos baseados em aprendizado de máquina relevantes.
De acordo com [17], as técnicas de aprendizado de máquina são necessárias para
melhorar a precisão dos modelos preditivos. Dependendo da natureza do problema de
negócios que está sendo tratado, existem quatro diferentes abordagens com base no tipo
e volume de dados, a saber: a) Supervised Learning (Aprendizagem Supervisionada), b)
Unsupervised Learning (Aprendizagem Não Supervisionada), c) Reinforcement
Learning (Aprendizagem por Reforço) e d) Neural Networks and Deep Learning (Redes
Neurais e Aprendizagem Profunda). Considerando as características técnico-
metodológicas desta pesquisa, a abordagem de aprendizado de máquina mais adequada
a ser utilizada é a Supervised Learning, a qual é descrita a seguir.
■ Supervised Learning: A aprendizagem supervisionada (do inglês
Supervised Learning) geralmente começa com um conjunto estabelecido de dados e um
certo entendimento de como esses dados são classificados. A aprendizagem
supervisionada se destina a encontrar padrões em dados que podem ser aplicados a um
processo analítico. Esses dados possuem recursos rotulados que definem o significado
dos dados. Por exemplo, pode haver milhões de imagens de animais e incluir uma
explicação sobre o que cada animal é, e então pode-se criar um aplicativo de
aprendizado de máquina que distingue um animal do outro. Ao rotular esses dados
sobre tipos de animais, pode-se ter centenas de categorias de espécies diferentes. Como
atributos e os significados dos dados foram identificados, eles são bem compreendidos
pelos usuários que estão treinando os dados modelados para que se ajustem aos detalhes
dos rótulos. Quando o rótulo é contínuo, é uma regressão; quando os dados vêm de um
conjunto finito de valores, é conhecido como classificação. Em essência, a regressão
usada para aprendizagem supervisionada ajuda a entender a correlação entre as
variáveis. Um exemplo de aprendizagem supervisionada é a previsão do tempo. Ao usar
a análise de regressão, a previsão do tempo leva em consideração padrões
meteorológicos históricos e as condições atuais para fornecer uma previsão do tempo.
Os algoritmos são treinados usando exemplos pré-processados e, neste ponto, o
desempenho dos algoritmos é avaliado com dados de teste. Ocasionalmente, os padrões
identificados em um subconjunto dos não podem ser detectados na grande população de
dados. Se o modelo for ajustado para representar apenas os padrões que existem no
subconjunto de treinamento, pode ser criado um problema chamado “overfitting”.
Overfitting significa que o modelo é ajustado com precisão para os dados de
treinamento, mas pode não ser aplicável para grandes conjuntos de dados
desconhecidos. Usar dados imprevistos para o conjunto de teste pode ajudá-lo a avaliar
a precisão do modelo na precisão de resultados. Os modelos de treinamento
supervisionado têm ampla aplicabilidade a uma variedade de problemas de negócios,
incluindo detecção de fraudes, soluções de recomendação, reconhecimento de voz ou
análise de risco.
[17] ressaltam que as disciplinas de estatística, mineração de dados e
aprendizado de máquina têm uma função na compreensão dos dados, na descrição das
características de um conjunto de dados e na localização de relacionamentos e padrões
nesses dados para construir um modelo, e concluem que há muita sobreposição na
maneira como as técnicas e ferramentas dessas disciplinas são aplicadas para resolver
problemas de negócios. Ainda para [17], os modelos de aprendizado de máquina
alavancam algoritmos estatísticos e os aplicam para prever análises.
Tem-se em [17] que o aprendizado de máquina usa uma variedade de algoritmos
que aprendem iterativamente a partir dos dados para melhorar, descrever dados e prever
resultados. Ainda para estes autores, um modelo de aprendizado de máquina é a saída
gerada quando se treina seu algoritmo de aprendizado de máquina com dados. Após o
treinamento, ao fornecer uma entrada a um modelo, tem-se uma saída. Por exemplo, um
algoritmo preditivo cria um modelo preditivo. Então, ao fornecer dados ao modelo
preditivo, recebe-se uma previsão com base nos dados que treinaram o modelo [17].
[17] pontuam que o valor do aprendizado de máquina é que ele permite que se
aprenda continuamente com os dados e preveja o futuro, bem como destacam, também,
que esse poderoso conjunto de algoritmos e modelos está sendo usado em todos os
setores para melhorar e obter insights sobre padrões e anomalias nos dados. [17]
ressaltam que o aprendizado de máquina tornou-se um dos tópicos mais importantes nas
organizações de desenvolvimento que procuram maneiras inovadoras de aproveitar os
ativos de dados para ajudar a empresa a obter um novo nível de entendimento. Com os
modelos apropriados de aprendizado de máquina, as organizações têm a capacidade de
prever continuamente as mudanças nos negócios, para que possam prever melhor o que
virá a seguir. Como os dados são constantemente adicionados, os modelos de
aprendizado de máquina garantem que a solução seja atualizada constantemente.
1.3 A questão de pesquisa
Após a identificação das áreas de pesquisa e dos problemas e desafios
envolvendo a formação otimizada de grupos para contextos de aprendizagem
colaborativa apoiada por computador, a referente pesquisa se norteia pela seguinte
questão investigativa que segue:
“É possível o machine learning auxiliar a formação otimizada de grupos para
potencializar a aprendizagem colaborativa apoiada por computador quando
considera as características positivas do indivíduo esperança, autoestima e
autoeficácia?”
1.4 Objetivos
[44] pontuam que os objetivos de uma pesquisa são elaborados para caracterizar
o seu alcance e utilizados para delimitar o seu problema. Os objetivos estabelecidos
nesta pesquisa de pós-doutorado são apresentados na forma geral (forma genérica) e
objetivos específicos (forma exata), conforme seguem.
1.4.1 Objetivo geral
Treinar a máquina como ferramenta de apoio para a tomada de decisão na
formação otimizada de grupos para contextos CSCL considerando como atributos
preditores perfis de autorrelatos positivos do indivíduo.
1.4.2 Objetivos específicos
● descrever as variáveis positivas do indivíduo esperança, autoestima e
autoeficácia consideradas, bem como a importância das mesmas na formação otimizada
de grupos para contextos CSCL;
● mensurar as variáveis positivas do indivíduo esperança, autoestima e
autoeficácia consideradas importantes na formação otimizada de grupos para contextos
CSCL;
● definir as abordagens de formações de grupos baseadas nos perfis de
autorrelatos do indivíduo;
● construir os modelos matemáticos de aprendizado de máquina baseados em
perfis de autorrelatos positivos do indivíduo para o treinamento da máquina na
formação otimizada de grupos para contextos CSCL;
● implementar o treinamento do aprendizado de máquina baseado nos modelos
matemáticos construídos;
● avaliar o desempenho do aprendizado de máquina implementado;
● otimizar o desempenho do aprendizado de máquina implementado;
● publicar os resultados da pesquisa em periódicos da área.
1.5 Caracterização metodológica da pesquisa
[21] destaca que a ciência se apresenta como um processo de investigação que
procura atingir conhecimentos sistematizados e seguros. Para que se alcance esse
objetivo é necessário que se caracterize e planeje o processo de investigação. Ainda para
este autor, planejar significa, aqui, traçar o curso de ação que deve ser seguido no
processo de investigação científica. O planejamento de uma pesquisa depende tanto do
problema a ser investigado, da sua natureza e situação espaço-temporal em que se
encontra, quanto da natureza e nível de conhecimento do investigador, conclui [21].
Portanto, baseado nos estudos de [25], [44] e [21], acerca da metodologia da pesquisa
científica, a Figura 3 traz a caracterização geral metodológica da referente pesquisa.
Figura 3: Caracterização geral metodológica da pesquisa.
Fonte: [44].
1.6 Organização do texto da pesquisa
Além do Capítulo 1, já descrito, o texto da pesquisa é estruturado e organizado
em mais quatro capítulos, a saber: O Capítulo 2 é reservado para a Fundamentação
teórica. A Metodologia de pesquisa é descrita no Capítulo 3. No Capítulo 4 são
trazidos os Resultados esperados. Por fim, o Cronograma de execução é discriminado
no Capítulo 5. A Tabela 2 traz instâncias de cada capítulo supracitado.
Tabela 2: Instâncias dos capítulos da pesquisa
Fonte: O autor (2020).
Capítulos Instâncias
1
● Contextualização;
● Motivação;
● A questão de pesquisa;
● Objetivos;
● Caracterização metodológica da pesquisa;
● Organização do texto da pesquisa.
2
● Psicologia Positiva: conceitos, variáveis psicológicas positivas,
mensuração de variáveis positivas do indivíduo;
● Teorias e Modelos de Colaboração: conceitos de colaboração e de
aprendizagem colaborativa, teoria da atividade, modelo 3C de colaboração,
padrões de colaboração e o modelo de tuckman.
● A arquitetura de sistema HERMES: conceitos, concepção, modelagem,
implementação e validação;
● Estatística: conceitos, análise exploratória multivariada de dados,
construção e implementações dos modelos de regressões lineares e
logísticos binários e validações dos modelos matemáticos para aprendizado
de máquina;
● Machine Learning (ML): fundamentos, técnicas (métodos), algoritmos e
ferramentas de implementação, validação do aprendizado de máquina;
● Trabalhos relacionados: visão geral do estado da arte acerca de formação
otimizada de grupos para aprendizagem colaborativa (abordagens, critérios
de formações e técnicas computacionais de implementação).
3
Metodologia: instrumentos e métodos de implementação e validação da
pesquisa.
4
Resultados esperados: visão geral dos resultados esperados através do
desenvolvimento da pesquisa.
5
Cronograma de execução: conjunto de passos com suas respectivas datas
previstas de execução, que permitirão chegar alcançar os objetivos e à
resposta ao problema de pesquisa formulado.
2. FUNDAMENTAÇÃO TEÓRICA
[13] pontua que fundamentação teórica são os principais conceitos teóricos para
os estudos, análise e reflexões, sobre os dados e/ou informações coletadas. Ainda para o
autor, a fundamentação teórica não deve se constituir em um "resumo" de obras lidas,
mas sim, em uma apresentação das ideias presentes nas obras estudadas, mostrando a
relação que possuem com o tema e a questão de pesquisa escolhidos, caracterizando
assim o progresso para o estado da arte.
Portanto, baseado no conceito de [13], acerca de fundamentação teórica, essa
seção é reservada para a apresentação das subseções que descreverão o aporte teórico
que apoiam o desenvolvimento da investigação proposta. Desta forma, a referente seção
é constituída de seis subseções, conforme seguem discriminadas na Tabela 3.
Tabela 3: Subseções da fundamentação teórica
Fonte: O autor (2020)
Subseções Conteúdo Descrição Importância para a
pesquisa
Referências
Básicas
2.1 Psicologia
Positiva
Fundamentos,
conceitos da área e
objeto de estudo.
Métodos de
avaliação das
variáveis positivas
do indivíduo.
Modelagem do perfil
de autorrelato do
indivíduo. Definição
dos atributos
preditores dos
modelos matemáticos
para o aprendizado de
máquina.
[30], [31],
[49]
2.2
Teorias e
modelos de
colaboração
Teorias
psicopedagógicas
da aprendizagem
colaborativa, tais
como a Teoria da
Atividade, Modelo
Compreensão do
trabalho de grupo.
Construção de scripts
de atividades
colaborativas.
Avaliação da
[14], [42]
3C, Padrões de
Colaboração e
Modelo de
Tuckman.
colaboração de grupo,
Apoio à avaliação do
desempenho do
aprendizado de
máquina (calibração
dos algoritmos de
máquina.
2.3 O sistema
HERMES
Sistema autônomo
de apoio à
formação otimizada
de grupos para
contextos CSCL
Implementação do
componente
SAMFAR de
mensuração de fitness
de autorrelatos do
indivíduo. Módulo do
aprendizado de
máquina para a
formação otimizada
de grupos para
contextos CSCL.
[35]
2.4
Estatística
Multivariada
de Dados
Fundamentos,
tratamento e análise
de dados para a
descoberta de
conhecimento.
Construção dos
modelos matemáticos
de regressão linear
múltipla e de
regressão logística
binária aplicados ao
aprendizado de
máquina.
[12]
2.5
Machine
Learning
(ML)
Fundamentos,
técnicas e
ferramentas.
Modelagem e
implementações das
tarefas do
aprendizado de
máquina
Classificação e
Predição do PCGj
(Classe Especial).
[24], [17],
[41], [47]
2.6 Trabalhos
relacionados
Pesquisas no Brasil
e no Mundo
relacionadas à
temática proposta
na referente
investigação
científica
Permite enxergar
pesquisas já
desenvolvidas mais
próximas do trabalho
em questão, a nível
nacional e
internacional. Permite
destacar o que já foi
feito de importante e
resultados obtidos
sobre o problema em
questão. São trabalhos
que complementam
ou que são utilizados
para fins de
comparação, de forma
[16],
[48], [15],
[36], [23]
que sirvam para
enfatizar as diferenças
e contribuições da
referente pesquisa em
questão e assim
contribuir para o
avanço do estado da
arte.
3. METODOLOGIA
Para o desenvolvimento do referente projeto de pesquisa, métodos e
instrumentos são necessários, de forma a nortear, sistematicamente, através de etapas e
passos metodológicos, o alcance dos objetivos e resposta à questão de pesquisa
formulada. São eles: a) Planejamento estatístico, b) Planejamento de Machine Learning
e c) Avaliação da otimização de formação de grupos.
a) Planejamento estatístico: a.i) definição da amostra populacional, a.ii) coleta de
dados (mensuração das variáveis psicológicas positivas esperança, autoestima e
autoeficácia), a.iii) montagem do dataset “Autorrelatos” (estruturação,
transformação e carregamento) – contém os atributos preditores (variáveis
explicativas) e a classe especial (variável resposta), a.iv) análise exploratória de
dados multivariada, a.v) construção dos modelos matemáticos de regressão
linear múltipla e regressão logística binária (modelo linear generalizado – GLM
(Generalized Linear Model), a.vi) validação dos modelos de regressão linear
múltipla e regressão logística binária (uso de métricas de desempenho da
predição (acurácia) do modelo (análise da matriz de confusão, análise de
sensitividade, análise de especificidade, análise da curva ROC (do inglês
Receiver Operating Characteristic), análise de significância estatística do
modelo preditor (teste Qui-Quadrado e estatística z de Wald)
b) Planejamento de Machine Learning: b.i) definição do problema, b.ii)
preparação dos dados, b.iii) definição dos algoritmos3 de aprendizado de
máquina, b.iv) melhorando os resultados e b.v) apresentando os resultados.
Dentre os diversos algoritmos de aprendizado de máquina existentes, esta
pesquisa emprega os algoritmos de regressão. Os algoritmos de regressão são
comumente usados para análises estatísticas e são algoritmos chave para uso em
aprendizado de máquina. Os algoritmos de regressão ajudam os analistas a
modelar relacionamentos entre pontos de dados. Os algoritmos de regressão
podem quantificar a força da correlação entre as variáveis em um conjunto de
dados. Além disso, a análise de regressão pode ser útil para prever os valores
futuros dos dados com base nos valores históricos [17].
c) Validação da pesquisa: a pesquisa culmina com experimentos para validar a
eficácia do aprendizado de máquina na formação otimizada de grupos para
3 Os algoritmos de aprendizado de máquina são geralmente escritos em linguagens como Java, Python e R. Cada uma dessas linguagens inclui bibliotecas de aprendizado de máquina que oferecem suporte a uma variedade de algoritmos de aprendizado de máquina. Nesta pesquisa utiliza-se a linguagem R, principalmente por ser uma linguagem de código aberto (Open Source). A página oficial do projeto R.
aprendizagem colaborativa. A realização de ações metodológicas, como
planejamento e execução de experimentos, apresentação e análise de resultados
são descritos nessa etapa, com objetivo de remeter às contribuições, conclusões
e perspectivas de trabalhos futuros. As supracitadas ações são descritas a seguir:
(i) Planejamento e execução de experimentos: nessa etapa se define onde
e como são realizados os experimentos da validação da eficácia do
aprendizado de máquina no auxílio à formação otimizada de grupos para
aprendizagem colaborativa. Para tal, são demandadas, planejadas e
executadas ações metodológicas, a saber: a) definição da população
(universo da pesquisa), b) definição das amostras populacionais (n), c)
instrumentos de coleta de dados utilizados (escalas de autorrelatos), d)
mensuração de autorrelatos esperança, autoestima e autoeficácia (perfil
de autorrelato do indivíduo), e) abordagens de formação de grupos
(aleatória – ou randômica, sistema – a partir da formação desejada pelo
professor ou sistema computacional, livre – os alunos escolhem seus
próprios pares de trabalho), f) critérios ou restrições de formação de
grupos (% de cada perfil de esperança, autoestima e autoeficácia em cada
grupo?), g) preparação do AVEA (Ambiente Virtual de Ensino e
Aprendizagem – criação dos grupos, disponibilização de conteúdos de
ensino e aprendizagem, avaliações de aprendizagem, ferramentas de
TICs – Tecnologias de Informação e Comunicação), h) script de
avaliação da colaboração de grupo, i) apresentação de resultados e j)
análise e discussões de resultados.
4. RESULTADOS ESPERADOS
Esta seção traz os resultados e impactos estimados pelo alcance desta pesquisa,
estes expressos através de suas principais contribuições e relevância. Desta forma, pode-
se pontuar os seguintes resultados esperados, conforme segue especificado abaixo.
◙ modelos matemáticos de regressões para predições da capacidade de
colaboração de grupos;
◙ aprendizado de máquina no auxílio à formação otimizada de grupos para
aprendizagem colaborativa;
◙ ferramenta de apoio à tomada de decisão para a implantação de políticas
públicas no processo ensino e aprendizagem baseado na Web;
◙ ferramenta de apoio para projetistas de ambientes de aprendizagem
colaborativa apoiada por computador.
5. CRONOGRAMA DE EXECUÇÃO
Atividades 2021 2022
mar abr mai jun jul ago set out nov dez jan fev
Planejamento
estatístico
Planejamento de
Machine Learning
Validação da
pesquisa
Escrita de artigo e/ou
capítulo de livro
Submissão de artigo
e/ou capítulo de livro
REFERÊNCIAS
[1] P. D. Allison. Multiple regression: a primer. Pine Forge Press, 1998.
[2] A. Bandura. (1997). “Self-efficacy: the exercise of control”. New York: W. H.
Freeman. A. 3. Ed. – São Paulo: Pearson Prentice Hall, 2007.
[3] K. Boehner, R. De Paula, P. Dourish and P. Sengers (2007). How emotion is made
and measured. International Journal of Human-Computer Studies, 65(4), 275-291.
[4] H. I. Bulbul; UNSAL, Özkan. Comparison of classification techniques used in
machine learning as applied on vocational guidance data. In: 2011 10th
International Conference on Machine Learning and Applications and Workshops.
IEEE, 2011. p. 298-301.
[5] W. O. Bussab e P. A. Morettin. Basic Statistics – 9. ed. – São Paulo: Saraiva, 2017.
[6] J. R. Citadin, A. Kemczinski and A. Matos. The formation of groups for
collaborative learning: a systematic mapping of the literature. In: XIX International
Conference on Informatics in Education, 2014, pp. 46-54.
[7] C. Coll e C. Monereo. "Psicologia da educação virtual: Aprender e Ensinar com as
Tecnologias da Informação e da Comunicação" Pré-Jornada: Caderno de Leitura II
(2008): 25. Ed. Artmed, 2010.
[8] A. R. Damásio. O mistério da consciência: do corpo e das emoções ao
conhecimento de si. São Paulo: Companhia das Letras, 2000, p. 474.
[9] J. L. Devore. Probability and statistics: for engineering and science. São Paulo:
Cengage Learning, 2012.
[10] P. Dillenbourg. Over-scripting CSCL: The risks of blending collaborative
learning with instructional desing. In: Three Worlds of CSCL. Can we support
CSCL?, pp. 61-91. Open University Nederland, Heerlen (2002).
[11] L. P. Fávero, P. Belfiore, F. L. Silva and B. L. Chan. Data Analysis: Multivariate
Modeling for Decision Making. Rio de Janeiro: Campus Elsevier, 2009.
[12] L. P. Fávero and P. Belfiore. Data Analysis Manual. Data Analysis Manual. 1.
ed. – Rio de Janeiro: Elsevier, 2017.
[13] U. Flick. Introdução à metodologia de pesquisa: um guia para iniciantes – Porto
Alegre: Penso, 2013.
[14] H. Fuks, A. B. Raposo, M. A. Gerosa, M. Pimentel, D. Filippo e C. J. P. de
Lucena. Teorias e modelos de colaboração. In: Sistemas Colaborativos/(Org.),
Mariano Pimentel e Hugo Fuks – Rio de Janeiro: Campus, 2011
[15] R. Gnanakumari and P. Vijayalakshmi. Investigation Study on Virtual
Community Formation in Social Networks. In: 2019 IEEE International Conference
on Electrical, Computer and Communication Technologies (ICECCT). IEEE, 2019.
p. 1-6.
[16] S. C. Harris and V. Kumar. Identifying student difficulty in a digital learning
environment. In: 2018 IEEE 18th International Conference on Advanced Learning
Technologies (ICALT). IEEE, 2018. p. 199-201.
[17] J. Hurwitz and D. Kirsch. Machine learning for dummies. IBM Limited Edition,
v. 75, 2018.
[18] S. Isoatani, A. Inaba, M. Ikeda e R. Mizoguchi. (2009). An ontology engineering
approach to the realization of theory-driven group formation. International Journal
of Computer-Supported Collaborative Learning, 4(4), 445-478.
[19] S. Jarvelã, P. A. Kirschner, A. Hadwin, H. Jãrvenoia, J. Malmberg, I. Kollar and
L. Lee. (2015). “Regulated learning”. In cscl: Theoretical progress for learning
success. Keynote from Nov, 26, 2015.
[20] N. Joseph, N. Pradeesh, S. Chatterjee and K. Bijlani. (2017, September). A novel
approach for group formation in collaborative learning using learner preferences. In
2017 International Conference on Advances in Computing, Communications and
Informatics (ICACCI) (pp. 1564-1568). IEEE.
[21] J. C. Koche. Fundamentos de Metodologia Científica: teoria da ciência e
iniciação à pesquisa. Petrópolis, RJ: Vozes, 2011.
[22] R. Larson and B. Farber. Applied statistics. 4. ed. – São Paulo: Pearson Prentice
Hall, 2010.
[23] M. R. C. Lima. Genetic Algorithms in the Formation of Groups for Computer
Supported Cooperative Learning. Masters dissertation. Electricity Engineering
Graduate Program. Federal University of Maranhão (UFMA) - Brazil, 2006. url.
[24] G. F. Luger. Inteligência Artificial – 6. ed. – São Paulo: Pearson Eduaction do
Brasil, 2013.
[25] M. de A. Marconi e E. M. Lakatos. Fundamentos de Metodologia Científica – 5.
ed. – São Paulo: Atlas, 2003.
[26] N. Miyake. Introduction to computer supported collaborative learning.
In: Proceedings of the 8th iternational conference on Computer supported
collaborative learning. International Society of the Learning Sciences, 2007. p. 827-
827.
[27] J. M. Moran. Distance education, more focused on research and collaboration.
Fernandes Selmar Rocha Fidaldo [et. al.] (org.). Distance education means, actors
and processes. Belo Horizonte: CAED-UFMG, 2013.
[28] A. Ounnas, H. Davis, and D. Millard. (2008). A framework for semantic group
formation. In Advanced Learning Technologies, 2008. ICALT’08. Eighth IEEE
International Conference on, pages 34–38. IEEE.
[29] D. A. Owens, E. A. Mannix and M. A. Neale. "Strategic formation of groups:
Issues in task performance and team member selection." Research on managing
groups and teams 1.1998 (1998): 149-165.
[30] J. C. Pacico e M. R. Bastianello. Instrumentos para avaliação da esperança
disposicional e escala de esperança cognitiva. In: Avaliação em Psicologia
Positiva/(Org.), Cláudio Simon Hutz - Porto Alegre: Artmed, 2014a.
[31] J. C. Pacico, S. B. Ferraz e C. S. Hutz. Autoeficácia - Yes We Can! In:
Avaliação em Psicologia Positiva/Organizador, Cláudio Simon Hutz - Porto Alegre:
Artmed, 2014b.
[32] S. S. Paludo and S. H. Koller. Positive Psychology: A New Approach to Old
Questions. PAIDEIA, 17 (36), 9-20, 2007.
[33] H. Pangestu; M. Karsen and U. Y. Chandra. Evaluation of Collaborative
Learning Tools Implementation to Improve Learning Quality in Higher Education.
In: 2019 International Conference on Information Management and Technology
(ICIMTech). IEEE, 2019. p. 477-481.
[34] F. Putze e T. Schultz "Adaptive cognitive technical systems." Journal of
neuroscience methods 234 (2014): 108-115.
[35] C. C. Quarto. “Towards the optimized formation of groups for collaborative
learning”. Thesis (doctorate degree). Federal University of Rio Grande do Sul,
Center for Interdisciplinary Studies in New Technologies in Education, Postgraduate
Program in Informatics in Education, Porto Alegre, BR-RS, 2016. url .
[36] S. Ray. (2019, February). A quick review of machine learning algorithms. In
2019 International conference on machine learning, big data, cloud and parallel
computing (COMITCon) (pp. 35-39). IEEE.
[37] R. C. D. Reis. Formation of groups in cscl environments using personality traits
associated with collaborative learning theories. 2019. Doctoral thesis. University of
Sao Paulo. url.
[38] H. M. Reis, B. de Oliveira, S. Isotani and I. Gasparini (2014). “Investigating
cultural aspects in the formation of collaborative learning groups: a review of the
literature”. Computer Books, 8(3), 25-29.
[39] M. Rosenberg. “Society and the adolescent self-image”. Revised edition.
Middle-town, CT: Wesleyan University Press, 1989.
[40] J. Roschelle e S. Teasley (1995). The construction of shared Knowledge in
collaborative problem solving. In C. O´Malley (Ed.), Computer-supported
collaborative learning (pp. 69-197). Berlin, Germany: Springer Verlag.
[41] S. Russel and P. Norvig Artificial intelligence: A modern approach, 3ed. [S.l.]:
Rio de Janeiro: Elsevier, 2013.
[42] M. E. Sardelich. Learning to assess learning. In: SILVA, Marco; SANTOS,
Edméa (Org.). Learning assessment in online education. São Paulo: Loyola, 2006. p.
211-226.
[43] M. Seligman and M. Csikszentmihalyi. (2000). Positive psychology: An
introduction. American Psychologist, 55, 5-14.
[44] E. L. da Silva e E. M. Menezes. Metodologia da Pesquisa e Elaboração de
Dissertações – 4. ed. – Florianópolis: UFSC, 2005.
[45] S. Staats. "Hope: A comparison of two self-report measures for adults."Journal
of Personality Assessment 53.2 (1989): 366-375.
[46] G. Stahl, Koschmann, T. Koschmanm and D. Suthers. (2006). Computer-
supported collaborative learning: An historical perspective. In R. K. Sawyer (Ed.),
Cambridge handbook of the learning sciences (pp. 409-426). Cambridge, UK:
Cambridge University Press. Available at
http://GerryStahl.net/cscl/CSCL_English.pdf in English,
[47] P. de Toledo, R. Pérez-Rodriguez, P. de Miguel, A. Sanchis and P. Serrano
(2019, July). Prediction of patient evolution in terms of Clinical Risk Groups form
routinely collected data using machine learning. In 2019 41st Annual International
Conference of the IEEE Engineering in Medicine and Biology Society (EMBC) (pp.
1721-1724). IEEE.
[48] R. Yadhunath, S. Srikanth, Sudheer, A. Sudheer and S. Palaniswamy (2019,
December). Identification of Criminal Activity Hotspots using Machine Learning to
Aid in Effective Utilization of Police Patrolling in Cities with High Crime Rates. In
2019 4th International Conference on Computational Systems and Information
Technology for Sustainable Solution (CSITSS) (Vol. 4, pp. 1-6). IEEE.
[49] C. Zanon e C. S. Hutz. Escala de Afetos Positivos e Afetos Negativos (PANAS).
In: Avaliação em Psicologia Positiva/Organizador, Cláudio Simon Hutz - Porto
Alegre: Artmed, 2014.
[50] Z. Zhang, Y. Li, Z. Li and S. Liu. (2019, May). Multiple Linear Regression for
High Efficiency Video Intra Coding. In ICASSP 2019-2019 IEEE International
Conference on Acoustics, Speech and Signal Processing (ICASSP) (pp. 1832-1836).
IEEE.