projeto de investigaÇÃo do estÁgio pÓs-doc

PROJETO DE INVESTIGAÇÃO DO ESTÁGIO PÓS-DOC

Cícero Costa Quarto

Projeto de pesquisa

Machine Learning no Auxílio à Formação Otimizada de Grupos para a

Aprendizagem Colaborativa

São Luís (MA)/Brasil - 2020

1. CONSTRUINDO O OBJETO DE INVESTIGAÇÃO

Nesta seção são descritos os elementos estruturais básicos para o

desenvolvimento sistemático do referente projeto de pesquisa, constituindo, desta

forma, o norte e o alicerce do desenvolvimento da investigação proposta. São eles:

Contextualização, Motivação, Questão de Pesquisa, Objetivos e Visão geral

metodológica da pesquisa.

1.1 Contextualização

Cada vez mais cresce o número de aplicativos de apoio aos docentes e tutores

visando auxiliá-los na tomada de decisões em ambientes ricos em tecnologias para uma

aprendizagem participativa e colaborativa mais eficiente [33]. Essa ocorrência é em

parte impulsionada por evidências de que a aprendizagem colaborativa apoiada por

computador, a denominada CSCL (do inglês Computer-Supported Collaborative

Learning) pode melhorar o aprendizado do aluno e, também, motivada por uma

tendência crescente de locais de trabalho mais colaborativos em indústrias [26].

Quando o trabalho é realizado em grupo de forma colaborativa, as habilidades

individuais podem ser complementadas pelo conhecimento e pela experiência de outros

membros do grupo. Além disso, a interação entre eles permite que sejam identificadas

inconsistências e falhas em seus pensamentos ao encontrar outros pontos de vistas e

entendimentos [37], [19].

Do ponto de vista pedagógico, o importante é considerar processos

colaborativos, menos hierárquicos e menos formatados, que combinam o melhor dos

percursos individuais com momentos de aprendizagem em grupo [27]. Os métodos de

ensino e aprendizagem centrados nos alunos, torna-os protagonistas do processo, dando

forte ênfase nas suas interações colaborativas em grupo e na efetiva participação do

professor na implementação de estratégias para que eles entendam melhor os materiais

de estudo, assim como capacitá-los a trabalhar numa sinergia única para resolver

problemas, atribuições e criação de novos produtos [32]. A nova geração conectada

prefere o papel de protagonista do que o de espectador. É preciso que os cursos se

adequem a essa nova necessidade. Daí o uso de metodologias ativas de aprendizagem

(Censo EaD.Br 20171).

[46] já chamavam a atenção que, com o suporte à colaboração entre os

indivíduos, em contextos de aprendizagem virtual, o campo CSCL pode fornecer

relevantes contribuições, entretanto, ao mesmo tempo, traz alguns desafios para a área,

tais como: a) qual seria a mais adequada representação afetiva dos alunos para a

aprendizagem colaborativa? b) qual seria a melhor distribuição dos alunos em grupos,

de forma a potencializar a aprendizagem de grupo? e c) como modelar e implementar

computacionalmente as respostas para tais abordagens?

1.2 Motivação

Recentemente, tem sido enfatizada a verificação da influência dos traços de

personalidade dos alunos na formação de grupos e na criação de mecanismos para

automatizar e apoiar a formação dos grupos em ambientes CSCL, na expectativa de

1 Disponível em: http://www.abed.org.br/arquivos/CENSO_EAD_BR_2018_digital_portugues.pdf

http://www.abed.org.br/arquivos/CENSO_EAD_BR_2018_digital_portugues.pdf

contribuir para o design de cenários colaborativos mais efetivos e de melhor

desempenho [37].

[28] destacavam que diferentes abordagens vinham sido desenvolvidas para

ajudar os professores a distribuir os alunos em grupos com base em um conjunto de

restrições. No entanto, consideravam estes autores, que as ferramentas existentes muitas

vezes não conseguiam a atribuir alunos para determinados grupos, criando um problema

conhecido como “estudantes órfãos”. [10] pontua que formar grupos sem considerações

cuidadosas muitas vezes provoca problemas como a participação desproporcional de

indivíduos, desmotivação e resistência ao trabalho de grupo.

[18] enfatizavam que a formação de grupo é o primeiro passo para projetar

estratégias CSCL, onde os alunos podem aprender e participar de um grupo. Ainda para

estes autores, pode-se analisar e combinar características como formação cultural,

conhecimentos, habilidades, estilos, funções para criar uma sinergia positiva entre os

participantes que vai remeter a interações significativas e melhores situações de

aprendizagem.

[20] consideram que a aprendizagem colaborativa é amplamente aceita como

uma abordagem para promover a eficácia da aprendizagem e a satisfação do aluno. No

entanto, ainda para os autores, a qualidade e os resultados da colaboração dependem de

vários fatores, entre os quais a formação do grupo desempenha um papel importante, e

concluem que as abordagens existentes levam em consideração grupos formados por

meio de alocação aleatória ou com base em certos critérios, como desempenho

acadêmico, características e habilidades de comunicação.

[15] enfatizam que comunidades virtuais são usadas para diferentes grupos

sociais e profissionais, onde a comunicação entre os membros da comunidade muda de

um indivíduo para outro. Entretanto, pontuam ainda estes autores, as técnicas existentes

não conseguem agrupar as pessoas de comportamento semelhante para formar a

comunidade virtual. Para solucionar tais problemas, concluem os autores, as técnicas de

machine learning podem ser utilizadas para formar a comunidade virtual baseada em

comportamentos de influência, suspeita e confiança com melhor precisão de

classificação e menor consumo de tempo.

[29] relevam que enfrentar os desafios da formação de grupos eficientes tem

sido crucial para o sucesso dos sistemas modernos de trabalho e educação em rede de

computadores, e complementam que a formação de grupos tem sido estudada por

décadas em diferentes áreas como Psicologia, Sociologia e Educação e pode ser feita de

diferentes maneiras e considerando diferentes abordagens, critérios e características dos

indivíduos. Embora esta possa parecer uma tarefa simples, a formação de grupos torna-

se complexa e importante à medida que cresce o número de indivíduos e/ou os critérios

definidos para o agrupamento [28], [6], [38].

[4] frisam que as técnicas de aprendizado de máquina tornam possível deduzir

mais informações significativas dos dados processados pela mineração de dados, assim

como tais informações significativas ajudam as organizações a estabelecer suas políticas

futuras em uma base mais sólida e a obter vantagens importantes em termos de tempo e

custo. Em [17], tem-se que o aprendizado de máquina pode fornecer maneiras proativas

de vulnerabilidades de segurança previstas que podem ser reparadas antes que o dano

seja feito.

Diante do cenário, trazido através das Seções 1.1 e 1.2, esta pesquisa busca

contribuir na atenuação dos problemas derivados da má formação de grupos para

processos de ensino e aprendizagem colaborativa apoiada por computador (CSCL). Para

tal, o trabalho alicerça-se nas áreas de Psicologia Positiva, Educação, Estatística e

Ciência da Computação, de forma a fundamentar a modelagem, implementação e

validação do SAMFAR (Sistema Autônomo de Mensuração de Fitness de

Autorrelatos), um componente da arquitetura geral do sistema HERMES de apoio à

formação otimizada de grupos para a aprendizagem colaborativa. O HERMES é

composto por três componentes: os Sistemas Autônomos, as Bases de Dados e as

Interfaces de Visualização. A Figura 1 ilustra a arquitetura geral do sistema HERMES e

a Tabela 1 a descrição dos supracitados componentes.

Figura 1: Arquitetura geral do sistema HERMES [35]

Fonte: O autor (2020).

Tabela 1: Componentes estruturais da arquitetura de sistema HERMES.

Fonte: O autor (2020)

Componentes Descrição/Funcionalidades

de sistema

GAAln

Grupo de Agentes Alunos são um subsistema de relações sociais, de

interações entre alunos, que compartilham certas características,

interagem uns com os outros, aceitam direitos e obrigações. São

aqueles em que todos os membros compartilham as decisões tomadas

e são responsáveis pela qualidade do que é produzido em conjunto,

conforme suas possibilidades e interesses.

SAProf

Sistema Autônomo Professor é responsável pela formação do

agrupamento inicial de alunos, pelo planejamento e organização da

disciplina no ambiente virtual de ensino e aprendizagem (AVEA),

além da gestão de alunos (social e técnica). Conteúdos do curso –

materiais instrucionais digitais para apoiar a aprendizagem do aluno

(p.ex. softwares, jogos, videoaulas, docs, links, áudios, imagens, e-

books, blogs, pdfs, etc)

SAMAR

Sistema Autônomo de Mensuração de Autorrelatos: disponibiliza o

Termo de Consentimento Livre Esclarecido (TCLE) aos alunos, que

têm a opção de participar ou não da pesquisa. O aluno, ao aceitar

participar, são coletados dados básicos sobre o mesmo, como nome,

idade e sexo. Logo em seguida, ele é instruído a responder a um

questionário quantitativo referente às três escalas de autorrelatos2

esperança, autoestima e autoeficácia. Ao responder a todas às

escalas, é mostrado ao aluno o seu perfil de autorrelatos obtido,

considerando a relação PerfilDeAutorrelato Vs. Percentis.

SAMFAR

Sistema Autônomo de Mensuração de Fitness de Autorrelatos é

responsável pelo cálculo da probabilidade estimada do Potencial de

Colaboração do Aluno (PCAj). Essa estatística representa o fitness do

aluno, ou seja, o quão o aluno é capaz de colaborar em grupo. A base

de conhecimento (BC) do SAMFAR é baseado em modelos

matemáticos de regressão linear múltipla e regressão logística binária,

os quais são utilizados para treinar a máquina em seu aprendizado.

SAACG

Sistema Autônomo de Avaliação de Colaboração de Grupo. É

responsável em calcular o Potencial de Colaboração do Grupo

(PCGj).

Bases de Dados

Bases de Dados de Perfis de Autorrelatos do Aluno (BDPAA), Base

de Dados de Fitness de Autorrelatos do Aluno (BDFAA), Base de

Dados de Desempenho de Colaboração de Grupo (BDDCG) e Logs

do AVEA (LAVEA).

CMD

Componente de Mineração de Dados permite identificar se o Perfil de

Autorrelato do Aluno Vs. Papel no grupo e/ou fitness inicial do aluno,

definido inicialmente através de autorrelatos, se mantém ou se

modifica durante o processo de aprendizagem. Em caso de

modificação, é necessário redefinir novos grupos de aprendizagem

com objetivo de otimizar a aprendizagem colaborativa de cada grupo.

Interfaces de

Visualização

As Interfaces de Visualização têm a função de apresentar os dados

armazenados nas BDPAA, BDFAA, BDDCG e LAVEA sob a forma

de relatórios de tabelas e gráficos. Além disso, o componente também

oferece suporte para exibição de outras informações através de

formulários Web, como o TCLE e o questionário de autorrelatos,

quando solicitado pelos sistemas autônomos do HERMES.

O ramo hoje conhecido como Psicologia Positiva é a ciência da experiência

positiva subjetiva, dos traços individuais positivos e instituições positivas que procura

melhorar a qualidade de vida, vindo esta trazer para este novo século, contribuições para

o entendimento científico e para intervenções em indivíduos, famílias e comunidade

[43]. No que tange à Psicologia Positiva, a incursão desta tem por justificativa subsidiar

a investigação das características positivas do aluno esperança, autoestima e

autoeficácia que sejam as mais adequadas para as configurações de grupos, e desta

forma fomentar a potencialização da aprendizagem de grupos colaborativos. Para tal,

referências como [39], [45], [2], [43], [32] são exploradas.

Da Educação, os estudos de [40], [8][3], [7][14], [27], [34], dentre outros são

estudados. Na visão destes estudiosos da educação, estamos em uma etapa de profundas

mudanças na transição para a sociedade da informação, que afetam o processo de ensino

e aprendizagem, exigindo de organizações, professores e alunos a encontrarem novos

modelos de educação em todas as situações. Dos estudos de [14], em especial, a

pesquisa explora as teorias e modelos de colaboração, os quais fornecem uma visão

sobre como e por que as pessoas trabalham em grupo através da Teoria da Atividade, o

2 Disponível em [...]

Modelo 3C de Colaboração, Padrões de Colaboração e o Modelo de Tuckman, este

sobre o desenvolvimento de grupo. De acordo com [14], as teorias e modelos de

colaboração nos apoiam a analisar o trabalho em grupo para que possamos selecionar e

projetar sistemas colaborativos.

Da Estatística, a pesquisa se beneficia de seus métodos e técnicas, de forma a

apoiar a análise exploratória de dados, bem como a construção dos modelos

matemáticos lineares multivariados, de forma a auxiliar o aprendizado supervisionado

de máquina baseado nas técnicas de classificação e predição para a tomada de decisão

de formação otimizada de grupos para a aprendizagem colaborativa. Estudos de [22],

[1], [9], [11], [12], [50] e [5] são bem-vindos para essa fundamentação teórica.

Por fim, da área de Ciência da Computação, a pesquisa se beneficia da subárea

Inteligência Artificial, mais especificamente de Machine Learning (Aprendizado de

Máquina) baseado na abordagem simbólica. Citando Simon (1983), [24] define o

aprendizado como qualquer mudança em um sistema que melhore o seu desempenho na

segunda vez que ele repetir a mesma tarefa ou outra tarefa da mesma população. [17]

trazem que aprendizado de máquina é uma forma de IA que permite que um sistema

aprenda com os dados e não através de programação explícita, no entanto, o

aprendizado de máquina não é um processo simples.

[17] destacam que a vantagem do aprendizado de máquina é que é possível

utilizar algoritmos e modelos para prever resultados. Para os autores, isso é possível

garantindo que os cientistas de dados que fazem o trabalho estejam usando os

algoritmos certos, ingerindo os dados mais apropriados (que sejam precisos e limpos) e

usando os modelos de melhor desempenho, e concluem que, se todos esses elementos se

juntam, é possível treinar continuamente o modelo e aprender com os resultados,

aprendendo com os dados, assim como a automação desse processo de modelagem,

treinamento do modelo e teste leva a previsões precisas para dar suporte à tomada de

decisões nas diversas áreas de conhecimento.

[17] ressalta que ao treinar um sistema de aprendizado de máquina, conhece-se

as entradas (por exemplo, receita do cliente, histórico de compras, localização e assim

por diante) e se conhece sua meta desejada (prevendo a propensão de um cliente a se

desligar). No entanto, pondera este autor, a grande incógnita são as funções matemáticas

para transformar esses dados brutos em uma previsão de rotatividade de clientes. À

medida que o algoritmo de aprendizagem é exposto a mais e mais dados do cliente, o

sistema se torna mais preciso na previsão da probabilidade de rotatividade do cliente.

De acordo com [17], o treinamento de um algoritmo de aprendizado de máquina para

criar um modelo preciso pode ser dividido em três etapas, conforme apontados a seguir

e descritos logo em seguida: a) Representação, b) Avaliação e c) Otimização.

a) Representação: o algoritmo cria um modelo para transformar os dados

inseridos nos resultados desejados. À medida que o algoritmo de aprendizado é

exposto a mais dados, ele começa a aprender a relação entre os dados brutos e

quais pontos de dados são fortes preditores para o resultado desejado.

b) Avaliação: à medida que o algoritmo cria vários modelos, um ser humano ou o

algoritmo precisará avaliar e pontuar os modelos com base em qual modelo

produz as previsões mais precisas. É importante lembrar que após o modelo ser

operacionalizado, ele ficará exposto a dados desconhecidos.

c) Otimização: depois que o algoritmo cria e pontua vários modelos, seleciona-se

o algoritmo de melhor desempenho. À medida que se expõe o algoritmo a

conjuntos mais diversos de dados de entrada, seleciona-se o modelo mais

generalizado.

Conforme ilustrado na Figura 2, [17] destacam que existem quatro subconjuntos

principais de Inteligência Artificial (IA). No contexto desta pesquisa, é enfocado o

aprendizado de máquina. No entanto, para entender o aprendizado de máquina, é

importante colocá-lo em perspectiva.

Figura 2: IA é categoria geral que inclui Aprendizado de Máquina e

Processamento de Linguagem Natural (NLP).

Fonte: [17].

Da Figura 2, tem-se:

Reasoning (Raciocínio): O raciocínio da máquina permite que um sistema

faça inferências com base em dados. Em essência, o raciocínio ajuda a preencher as

lacunas quando há dados incompletos.

Processamento de Linguagem Natural (NLP): NLP é a capacidade de

treinar computadores para compreender tanto o texto escrito quanto a fala humana. As

técnicas de NLP são necessárias para capturar o significado de texto não estruturado de

documentos ou comunicação do usuário. Portanto, a NLP é a principal forma de os

sistemas interpretarem o texto e a linguagem falada. As ferramentas necessárias para

NLP incluem categorização, ontologias, escutas, catálogos, dicionários e modelo de

linguagem.

Planning (Planejamento): O planejamento automatizado é a capacidade de

um sistema inteligente atuar de forma autônoma e flexível para construir uma sequência

de ações para atingir um objetivo final.

[17] destacam que criar um aplicativo de aprendizado de máquina ou

operacionalizar um algoritmo de aprendizado de máquina é um processo iterativo. Não

pode-se simplesmente treinar um modelo uma vez e deixá-lo sozinho – mudanças de

dados, preferências evoluem e concorrentes surgem. Portanto, precisa-se manter o

modelo atualizado quando entrar em produção. Ainda para [17], o ciclo de aprendizado

de máquina é contínuo e a escolha do algoritmo de aprendizado de máquina correto é

apenas uma das etapas, e pontua que as etapas do ciclo de aprendizado de máquina são

as que seguem listadas: i) Identificação de dados, ii) Preparação de dados, iii) Escolha

do algoritmo de aprendizado de máquina, iv) Treinamento, v) Avaliação, vi)

Implementação, vii) Predição e viii) Avaliação das predições. Abaixo, são trazidas as

definições de cada etapa, segundo [17].

◙ Identificação de dados; Identificar as fontes de dados relevantes é a primeira

etapa do ciclo de aprendizado de máquina. Além disso, conforme é desenvolvido o

algoritmo de aprendizado de máquina, deve-se pensar em expandir os dados de destino

para melhorar o sistema.

◙ Preparação de dados: Certifique-se que os dados estejam limpos, protegidos

e controlados. Ao criar-se um aplicativo de aprendizado de máquina com base em dados

imprecisos, o aplicativo falhará.

◙ Escolha do algoritmo de aprendizado de máquina: Pode-se ter vários

algoritmos de aprendizado de máquina aplicáveis aos dados e desafios de negócios.

◙ Treinamento: Precisa-se treinar o algoritmo de aprendizado de máquina para

criar o modelo. Dependendo do tipo de dados e algoritmo, o processo de treinamento

pode ser Supervisionado, Não Supervisionado ou Aprendizado por Reforço.

◙ Avaliação: Avalie os modelos para encontrar o algoritmo de melhor

desempenho.

◙ Implementação: Algoritmos de aprendizado de máquina criam modelos que

podem ser implementados em aplicativos na nuvem e no local.

◙ Predição: Após a implementação, comece a fazer previsões com base em

novos dados de entrada.

◙ Avaliação das predições: Avalie a validade das previsões. As informações

que são coletadas na análise das previsões estão inseridas no ciclo de aprendizado de

máquina para ajudar a melhorar a precisão.

[17] destacam que depois que o modelo começar a fazer previsões, deve-se

repetir o processo avaliando os dados que estão sendo avaliados, assim como chamam a

atenção para questões do tipo: todos os dados são relevantes? Existem novos conjuntos

de dados que podem ajudar a melhorar a precisão das previsões?, e concluem que ao

aprimorar continuamente os modelos e avaliar novas abordagens, pode-se manter os

aplicativos baseados em aprendizado de máquina relevantes.

De acordo com [17], as técnicas de aprendizado de máquina são necessárias para

melhorar a precisão dos modelos preditivos. Dependendo da natureza do problema de

negócios que está sendo tratado, existem quatro diferentes abordagens com base no tipo

e volume de dados, a saber: a) Supervised Learning (Aprendizagem Supervisionada), b)

Unsupervised Learning (Aprendizagem Não Supervisionada), c) Reinforcement

Learning (Aprendizagem por Reforço) e d) Neural Networks and Deep Learning (Redes

Neurais e Aprendizagem Profunda). Considerando as características técnico-

metodológicas desta pesquisa, a abordagem de aprendizado de máquina mais adequada

a ser utilizada é a Supervised Learning, a qual é descrita a seguir.

■ Supervised Learning: A aprendizagem supervisionada (do inglês

Supervised Learning) geralmente começa com um conjunto estabelecido de dados e um

certo entendimento de como esses dados são classificados. A aprendizagem

supervisionada se destina a encontrar padrões em dados que podem ser aplicados a um

processo analítico. Esses dados possuem recursos rotulados que definem o significado

dos dados. Por exemplo, pode haver milhões de imagens de animais e incluir uma

explicação sobre o que cada animal é, e então pode-se criar um aplicativo de

aprendizado de máquina que distingue um animal do outro. Ao rotular esses dados

sobre tipos de animais, pode-se ter centenas de categorias de espécies diferentes. Como

atributos e os significados dos dados foram identificados, eles são bem compreendidos

pelos usuários que estão treinando os dados modelados para que se ajustem aos detalhes

dos rótulos. Quando o rótulo é contínuo, é uma regressão; quando os dados vêm de um

conjunto finito de valores, é conhecido como classificação. Em essência, a regressão

usada para aprendizagem supervisionada ajuda a entender a correlação entre as

variáveis. Um exemplo de aprendizagem supervisionada é a previsão do tempo. Ao usar

a análise de regressão, a previsão do tempo leva em consideração padrões

meteorológicos históricos e as condições atuais para fornecer uma previsão do tempo.

Os algoritmos são treinados usando exemplos pré-processados e, neste ponto, o

desempenho dos algoritmos é avaliado com dados de teste. Ocasionalmente, os padrões

identificados em um subconjunto dos não podem ser detectados na grande população de

dados. Se o modelo for ajustado para representar apenas os padrões que existem no

subconjunto de treinamento, pode ser criado um problema chamado “overfitting”.

Overfitting significa que o modelo é ajustado com precisão para os dados de

treinamento, mas pode não ser aplicável para grandes conjuntos de dados

desconhecidos. Usar dados imprevistos para o conjunto de teste pode ajudá-lo a avaliar

a precisão do modelo na precisão de resultados. Os modelos de treinamento

supervisionado têm ampla aplicabilidade a uma variedade de problemas de negócios,

incluindo detecção de fraudes, soluções de recomendação, reconhecimento de voz ou

análise de risco.

[17] ressaltam que as disciplinas de estatística, mineração de dados e

aprendizado de máquina têm uma função na compreensão dos dados, na descrição das

características de um conjunto de dados e na localização de relacionamentos e padrões

nesses dados para construir um modelo, e concluem que há muita sobreposição na

maneira como as técnicas e ferramentas dessas disciplinas são aplicadas para resolver

problemas de negócios. Ainda para [17], os modelos de aprendizado de máquina

alavancam algoritmos estatísticos e os aplicam para prever análises.

Tem-se em [17] que o aprendizado de máquina usa uma variedade de algoritmos

que aprendem iterativamente a partir dos dados para melhorar, descrever dados e prever

resultados. Ainda para estes autores, um modelo de aprendizado de máquina é a saída

gerada quando se treina seu algoritmo de aprendizado de máquina com dados. Após o

treinamento, ao fornecer uma entrada a um modelo, tem-se uma saída. Por exemplo, um

algoritmo preditivo cria um modelo preditivo. Então, ao fornecer dados ao modelo

preditivo, recebe-se uma previsão com base nos dados que treinaram o modelo [17].

[17] pontuam que o valor do aprendizado de máquina é que ele permite que se

aprenda continuamente com os dados e preveja o futuro, bem como destacam, também,

que esse poderoso conjunto de algoritmos e modelos está sendo usado em todos os

setores para melhorar e obter insights sobre padrões e anomalias nos dados. [17]

ressaltam que o aprendizado de máquina tornou-se um dos tópicos mais importantes nas

organizações de desenvolvimento que procuram maneiras inovadoras de aproveitar os

ativos de dados para ajudar a empresa a obter um novo nível de entendimento. Com os

modelos apropriados de aprendizado de máquina, as organizações têm a capacidade de

prever continuamente as mudanças nos negócios, para que possam prever melhor o que

virá a seguir. Como os dados são constantemente adicionados, os modelos de

aprendizado de máquina garantem que a solução seja atualizada constantemente.

1.3 A questão de pesquisa

Após a identificação das áreas de pesquisa e dos problemas e desafios

envolvendo a formação otimizada de grupos para contextos de aprendizagem

colaborativa apoiada por computador, a referente pesquisa se norteia pela seguinte

questão investigativa que segue:

“É possível o machine learning auxiliar a formação otimizada de grupos para

potencializar a aprendizagem colaborativa apoiada por computador quando

considera as características positivas do indivíduo esperança, autoestima e

autoeficácia?”

1.4 Objetivos

[44] pontuam que os objetivos de uma pesquisa são elaborados para caracterizar

o seu alcance e utilizados para delimitar o seu problema. Os objetivos estabelecidos

nesta pesquisa de pós-doutorado são apresentados na forma geral (forma genérica) e

objetivos específicos (forma exata), conforme seguem.

1.4.1 Objetivo geral

Treinar a máquina como ferramenta de apoio para a tomada de decisão na

formação otimizada de grupos para contextos CSCL considerando como atributos

preditores perfis de autorrelatos positivos do indivíduo.

1.4.2 Objetivos específicos

● descrever as variáveis positivas do indivíduo esperança, autoestima e

autoeficácia consideradas, bem como a importância das mesmas na formação otimizada

de grupos para contextos CSCL;

● mensurar as variáveis positivas do indivíduo esperança, autoestima e

autoeficácia consideradas importantes na formação otimizada de grupos para contextos

CSCL;

● definir as abordagens de formações de grupos baseadas nos perfis de

autorrelatos do indivíduo;

● construir os modelos matemáticos de aprendizado de máquina baseados em

perfis de autorrelatos positivos do indivíduo para o treinamento da máquina na

formação otimizada de grupos para contextos CSCL;

● implementar o treinamento do aprendizado de máquina baseado nos modelos

matemáticos construídos;

● avaliar o desempenho do aprendizado de máquina implementado;

● otimizar o desempenho do aprendizado de máquina implementado;

● publicar os resultados da pesquisa em periódicos da área.

1.5 Caracterização metodológica da pesquisa

[21] destaca que a ciência se apresenta como um processo de investigação que

procura atingir conhecimentos sistematizados e seguros. Para que se alcance esse

objetivo é necessário que se caracterize e planeje o processo de investigação. Ainda para

este autor, planejar significa, aqui, traçar o curso de ação que deve ser seguido no

processo de investigação científica. O planejamento de uma pesquisa depende tanto do

problema a ser investigado, da sua natureza e situação espaço-temporal em que se

encontra, quanto da natureza e nível de conhecimento do investigador, conclui [21].

Portanto, baseado nos estudos de [25], [44] e [21], acerca da metodologia da pesquisa

científica, a Figura 3 traz a caracterização geral metodológica da referente pesquisa.

Figura 3: Caracterização geral metodológica da pesquisa.

Fonte: [44].

1.6 Organização do texto da pesquisa

Além do Capítulo 1, já descrito, o texto da pesquisa é estruturado e organizado

em mais quatro capítulos, a saber: O Capítulo 2 é reservado para a Fundamentação

teórica. A Metodologia de pesquisa é descrita no Capítulo 3. No Capítulo 4 são

trazidos os Resultados esperados. Por fim, o Cronograma de execução é discriminado

no Capítulo 5. A Tabela 2 traz instâncias de cada capítulo supracitado.

Tabela 2: Instâncias dos capítulos da pesquisa

Fonte: O autor (2020).

Capítulos Instâncias

1

● Contextualização;

● Motivação;

● A questão de pesquisa;

● Objetivos;

● Caracterização metodológica da pesquisa;

● Organização do texto da pesquisa.

2

● Psicologia Positiva: conceitos, variáveis psicológicas positivas,

mensuração de variáveis positivas do indivíduo;

● Teorias e Modelos de Colaboração: conceitos de colaboração e de

aprendizagem colaborativa, teoria da atividade, modelo 3C de colaboração,

padrões de colaboração e o modelo de tuckman.

● A arquitetura de sistema HERMES: conceitos, concepção, modelagem,

implementação e validação;

● Estatística: conceitos, análise exploratória multivariada de dados,

construção e implementações dos modelos de regressões lineares e

logísticos binários e validações dos modelos matemáticos para aprendizado

de máquina;

● Machine Learning (ML): fundamentos, técnicas (métodos), algoritmos e

ferramentas de implementação, validação do aprendizado de máquina;

● Trabalhos relacionados: visão geral do estado da arte acerca de formação

otimizada de grupos para aprendizagem colaborativa (abordagens, critérios

de formações e técnicas computacionais de implementação).

3

Metodologia: instrumentos e métodos de implementação e validação da

pesquisa.

4

Resultados esperados: visão geral dos resultados esperados através do

desenvolvimento da pesquisa.

5

Cronograma de execução: conjunto de passos com suas respectivas datas

previstas de execução, que permitirão chegar alcançar os objetivos e à

resposta ao problema de pesquisa formulado.

2. FUNDAMENTAÇÃO TEÓRICA

[13] pontua que fundamentação teórica são os principais conceitos teóricos para

os estudos, análise e reflexões, sobre os dados e/ou informações coletadas. Ainda para o

autor, a fundamentação teórica não deve se constituir em um "resumo" de obras lidas,

mas sim, em uma apresentação das ideias presentes nas obras estudadas, mostrando a

relação que possuem com o tema e a questão de pesquisa escolhidos, caracterizando

assim o progresso para o estado da arte.

Portanto, baseado no conceito de [13], acerca de fundamentação teórica, essa

seção é reservada para a apresentação das subseções que descreverão o aporte teórico

que apoiam o desenvolvimento da investigação proposta. Desta forma, a referente seção

é constituída de seis subseções, conforme seguem discriminadas na Tabela 3.

Tabela 3: Subseções da fundamentação teórica

Fonte: O autor (2020)

Subseções Conteúdo Descrição Importância para a

pesquisa

Referências

Básicas

2.1 Psicologia

Positiva

Fundamentos,

conceitos da área e

objeto de estudo.

Métodos de

avaliação das

variáveis positivas

do indivíduo.

Modelagem do perfil

de autorrelato do

indivíduo. Definição

dos atributos

preditores dos

modelos matemáticos

para o aprendizado de

máquina.

[30], [31],

[49]

2.2

Teorias e

modelos de

colaboração

Teorias

psicopedagógicas

da aprendizagem

colaborativa, tais

como a Teoria da

Atividade, Modelo

Compreensão do

trabalho de grupo.

Construção de scripts

de atividades

colaborativas.

Avaliação da

[14], [42]

3C, Padrões de

Colaboração e

Modelo de

Tuckman.

colaboração de grupo,

Apoio à avaliação do

desempenho do

aprendizado de

máquina (calibração

dos algoritmos de

máquina.

2.3 O sistema

HERMES

Sistema autônomo

de apoio à

formação otimizada

de grupos para

contextos CSCL

Implementação do

componente

SAMFAR de

mensuração de fitness

de autorrelatos do

indivíduo. Módulo do

aprendizado de

máquina para a

formação otimizada

de grupos para

contextos CSCL.

[35]

2.4

Estatística

Multivariada

de Dados

Fundamentos,

tratamento e análise

de dados para a

descoberta de

conhecimento.

Construção dos

modelos matemáticos

de regressão linear

múltipla e de

regressão logística

binária aplicados ao

aprendizado de

máquina.

[12]

2.5

Machine

Learning

(ML)

Fundamentos,

técnicas e

ferramentas.

Modelagem e

implementações das

tarefas do

aprendizado de

máquina

Classificação e

Predição do PCGj

(Classe Especial).

[24], [17],

[41], [47]

2.6 Trabalhos

relacionados

Pesquisas no Brasil

e no Mundo

relacionadas à

temática proposta

na referente

investigação

científica

Permite enxergar

pesquisas já

desenvolvidas mais

próximas do trabalho

em questão, a nível

nacional e

internacional. Permite

destacar o que já foi

feito de importante e

resultados obtidos

sobre o problema em

questão. São trabalhos

que complementam

ou que são utilizados

para fins de

comparação, de forma

[16],

[48], [15],

[36], [23]

que sirvam para

enfatizar as diferenças

e contribuições da

referente pesquisa em

questão e assim

contribuir para o

avanço do estado da

arte.

3. METODOLOGIA

Para o desenvolvimento do referente projeto de pesquisa, métodos e

instrumentos são necessários, de forma a nortear, sistematicamente, através de etapas e

passos metodológicos, o alcance dos objetivos e resposta à questão de pesquisa

formulada. São eles: a) Planejamento estatístico, b) Planejamento de Machine Learning

e c) Avaliação da otimização de formação de grupos.

a) Planejamento estatístico: a.i) definição da amostra populacional, a.ii) coleta de

dados (mensuração das variáveis psicológicas positivas esperança, autoestima e

autoeficácia), a.iii) montagem do dataset “Autorrelatos” (estruturação,

transformação e carregamento) – contém os atributos preditores (variáveis

explicativas) e a classe especial (variável resposta), a.iv) análise exploratória de

dados multivariada, a.v) construção dos modelos matemáticos de regressão

linear múltipla e regressão logística binária (modelo linear generalizado – GLM

(Generalized Linear Model), a.vi) validação dos modelos de regressão linear

múltipla e regressão logística binária (uso de métricas de desempenho da

predição (acurácia) do modelo (análise da matriz de confusão, análise de

sensitividade, análise de especificidade, análise da curva ROC (do inglês

Receiver Operating Characteristic), análise de significância estatística do

modelo preditor (teste Qui-Quadrado e estatística z de Wald)

b) Planejamento de Machine Learning: b.i) definição do problema, b.ii)

preparação dos dados, b.iii) definição dos algoritmos3 de aprendizado de

máquina, b.iv) melhorando os resultados e b.v) apresentando os resultados.

Dentre os diversos algoritmos de aprendizado de máquina existentes, esta

pesquisa emprega os algoritmos de regressão. Os algoritmos de regressão são

comumente usados para análises estatísticas e são algoritmos chave para uso em

aprendizado de máquina. Os algoritmos de regressão ajudam os analistas a

modelar relacionamentos entre pontos de dados. Os algoritmos de regressão

podem quantificar a força da correlação entre as variáveis em um conjunto de

dados. Além disso, a análise de regressão pode ser útil para prever os valores

futuros dos dados com base nos valores históricos [17].

c) Validação da pesquisa: a pesquisa culmina com experimentos para validar a

eficácia do aprendizado de máquina na formação otimizada de grupos para

3 Os algoritmos de aprendizado de máquina são geralmente escritos em linguagens como Java, Python e R. Cada uma dessas linguagens inclui bibliotecas de aprendizado de máquina que oferecem suporte a uma variedade de algoritmos de aprendizado de máquina. Nesta pesquisa utiliza-se a linguagem R, principalmente por ser uma linguagem de código aberto (Open Source). A página oficial do projeto R.

https://www.r-project.org/

aprendizagem colaborativa. A realização de ações metodológicas, como

planejamento e execução de experimentos, apresentação e análise de resultados

são descritos nessa etapa, com objetivo de remeter às contribuições, conclusões

e perspectivas de trabalhos futuros. As supracitadas ações são descritas a seguir:

(i) Planejamento e execução de experimentos: nessa etapa se define onde

e como são realizados os experimentos da validação da eficácia do

aprendizado de máquina no auxílio à formação otimizada de grupos para

aprendizagem colaborativa. Para tal, são demandadas, planejadas e

executadas ações metodológicas, a saber: a) definição da população

(universo da pesquisa), b) definição das amostras populacionais (n), c)

instrumentos de coleta de dados utilizados (escalas de autorrelatos), d)

mensuração de autorrelatos esperança, autoestima e autoeficácia (perfil

de autorrelato do indivíduo), e) abordagens de formação de grupos

(aleatória – ou randômica, sistema – a partir da formação desejada pelo

professor ou sistema computacional, livre – os alunos escolhem seus

próprios pares de trabalho), f) critérios ou restrições de formação de

grupos (% de cada perfil de esperança, autoestima e autoeficácia em cada

grupo?), g) preparação do AVEA (Ambiente Virtual de Ensino e

Aprendizagem – criação dos grupos, disponibilização de conteúdos de

ensino e aprendizagem, avaliações de aprendizagem, ferramentas de

TICs – Tecnologias de Informação e Comunicação), h) script de

avaliação da colaboração de grupo, i) apresentação de resultados e j)

análise e discussões de resultados.

4. RESULTADOS ESPERADOS

Esta seção traz os resultados e impactos estimados pelo alcance desta pesquisa,

estes expressos através de suas principais contribuições e relevância. Desta forma, pode-

se pontuar os seguintes resultados esperados, conforme segue especificado abaixo.

◙ modelos matemáticos de regressões para predições da capacidade de

colaboração de grupos;

◙ aprendizado de máquina no auxílio à formação otimizada de grupos para

aprendizagem colaborativa;

◙ ferramenta de apoio à tomada de decisão para a implantação de políticas

públicas no processo ensino e aprendizagem baseado na Web;

◙ ferramenta de apoio para projetistas de ambientes de aprendizagem

colaborativa apoiada por computador.

5. CRONOGRAMA DE EXECUÇÃO

Atividades 2021 2022

mar abr mai jun jul ago set out nov dez jan fev

Planejamento

estatístico

Planejamento de

Machine Learning

Validação da

pesquisa

Escrita de artigo e/ou

capítulo de livro

Submissão de artigo

e/ou capítulo de livro

REFERÊNCIAS

[1] P. D. Allison. Multiple regression: a primer. Pine Forge Press, 1998.

[2] A. Bandura. (1997). “Self-efficacy: the exercise of control”. New York: W. H.

Freeman. A. 3. Ed. – São Paulo: Pearson Prentice Hall, 2007.

[3] K. Boehner, R. De Paula, P. Dourish and P. Sengers (2007). How emotion is made

and measured. International Journal of Human-Computer Studies, 65(4), 275-291.

[4] H. I. Bulbul; UNSAL, Özkan. Comparison of classification techniques used in

machine learning as applied on vocational guidance data. In: 2011 10th

International Conference on Machine Learning and Applications and Workshops.

IEEE, 2011. p. 298-301.

[5] W. O. Bussab e P. A. Morettin. Basic Statistics – 9. ed. – São Paulo: Saraiva, 2017.

[6] J. R. Citadin, A. Kemczinski and A. Matos. The formation of groups for

collaborative learning: a systematic mapping of the literature. In: XIX International

Conference on Informatics in Education, 2014, pp. 46-54.

[7] C. Coll e C. Monereo. "Psicologia da educação virtual: Aprender e Ensinar com as

Tecnologias da Informação e da Comunicação" Pré-Jornada: Caderno de Leitura II

(2008): 25. Ed. Artmed, 2010.

[8] A. R. Damásio. O mistério da consciência: do corpo e das emoções ao

conhecimento de si. São Paulo: Companhia das Letras, 2000, p. 474.

[9] J. L. Devore. Probability and statistics: for engineering and science. São Paulo:

Cengage Learning, 2012.

[10] P. Dillenbourg. Over-scripting CSCL: The risks of blending collaborative

learning with instructional desing. In: Three Worlds of CSCL. Can we support

CSCL?, pp. 61-91. Open University Nederland, Heerlen (2002).

[11] L. P. Fávero, P. Belfiore, F. L. Silva and B. L. Chan. Data Analysis: Multivariate

Modeling for Decision Making. Rio de Janeiro: Campus Elsevier, 2009.

[12] L. P. Fávero and P. Belfiore. Data Analysis Manual. Data Analysis Manual. 1.

ed. – Rio de Janeiro: Elsevier, 2017.

[13] U. Flick. Introdução à metodologia de pesquisa: um guia para iniciantes – Porto

Alegre: Penso, 2013.

[14] H. Fuks, A. B. Raposo, M. A. Gerosa, M. Pimentel, D. Filippo e C. J. P. de

Lucena. Teorias e modelos de colaboração. In: Sistemas Colaborativos/(Org.),

Mariano Pimentel e Hugo Fuks – Rio de Janeiro: Campus, 2011

[15] R. Gnanakumari and P. Vijayalakshmi. Investigation Study on Virtual

Community Formation in Social Networks. In: 2019 IEEE International Conference

on Electrical, Computer and Communication Technologies (ICECCT). IEEE, 2019.

p. 1-6.

[16] S. C. Harris and V. Kumar. Identifying student difficulty in a digital learning

environment. In: 2018 IEEE 18th International Conference on Advanced Learning

Technologies (ICALT). IEEE, 2018. p. 199-201.

[17] J. Hurwitz and D. Kirsch. Machine learning for dummies. IBM Limited Edition,

v. 75, 2018.

[18] S. Isoatani, A. Inaba, M. Ikeda e R. Mizoguchi. (2009). An ontology engineering

approach to the realization of theory-driven group formation. International Journal

of Computer-Supported Collaborative Learning, 4(4), 445-478.

[19] S. Jarvelã, P. A. Kirschner, A. Hadwin, H. Jãrvenoia, J. Malmberg, I. Kollar and

L. Lee. (2015). “Regulated learning”. In cscl: Theoretical progress for learning

success. Keynote from Nov, 26, 2015.

[20] N. Joseph, N. Pradeesh, S. Chatterjee and K. Bijlani. (2017, September). A novel

approach for group formation in collaborative learning using learner preferences. In

2017 International Conference on Advances in Computing, Communications and

Informatics (ICACCI) (pp. 1564-1568). IEEE.

[21] J. C. Koche. Fundamentos de Metodologia Científica: teoria da ciência e

iniciação à pesquisa. Petrópolis, RJ: Vozes, 2011.

[22] R. Larson and B. Farber. Applied statistics. 4. ed. – São Paulo: Pearson Prentice

Hall, 2010.

[23] M. R. C. Lima. Genetic Algorithms in the Formation of Groups for Computer

Supported Cooperative Learning. Masters dissertation. Electricity Engineering

Graduate Program. Federal University of Maranhão (UFMA) - Brazil, 2006. url.

[24] G. F. Luger. Inteligência Artificial – 6. ed. – São Paulo: Pearson Eduaction do

Brasil, 2013.

[25] M. de A. Marconi e E. M. Lakatos. Fundamentos de Metodologia Científica – 5.

ed. – São Paulo: Atlas, 2003.

[26] N. Miyake. Introduction to computer supported collaborative learning.

In: Proceedings of the 8th iternational conference on Computer supported

collaborative learning. International Society of the Learning Sciences, 2007. p. 827-

827.

[27] J. M. Moran. Distance education, more focused on research and collaboration.

Fernandes Selmar Rocha Fidaldo [et. al.] (org.). Distance education means, actors

and processes. Belo Horizonte: CAED-UFMG, 2013.

[28] A. Ounnas, H. Davis, and D. Millard. (2008). A framework for semantic group

formation. In Advanced Learning Technologies, 2008. ICALT’08. Eighth IEEE

International Conference on, pages 34–38. IEEE.

[29] D. A. Owens, E. A. Mannix and M. A. Neale. "Strategic formation of groups:

Issues in task performance and team member selection." Research on managing

groups and teams 1.1998 (1998): 149-165.

[30] J. C. Pacico e M. R. Bastianello. Instrumentos para avaliação da esperança

disposicional e escala de esperança cognitiva. In: Avaliação em Psicologia

Positiva/(Org.), Cláudio Simon Hutz - Porto Alegre: Artmed, 2014a.

[31] J. C. Pacico, S. B. Ferraz e C. S. Hutz. Autoeficácia - Yes We Can! In:

Avaliação em Psicologia Positiva/Organizador, Cláudio Simon Hutz - Porto Alegre:

Artmed, 2014b.

[32] S. S. Paludo and S. H. Koller. Positive Psychology: A New Approach to Old

Questions. PAIDEIA, 17 (36), 9-20, 2007.

[33] H. Pangestu; M. Karsen and U. Y. Chandra. Evaluation of Collaborative

Learning Tools Implementation to Improve Learning Quality in Higher Education.

In: 2019 International Conference on Information Management and Technology

(ICIMTech). IEEE, 2019. p. 477-481.

[34] F. Putze e T. Schultz "Adaptive cognitive technical systems." Journal of

neuroscience methods 234 (2014): 108-115.

[35] C. C. Quarto. “Towards the optimized formation of groups for collaborative

learning”. Thesis (doctorate degree). Federal University of Rio Grande do Sul,

Center for Interdisciplinary Studies in New Technologies in Education, Postgraduate

Program in Informatics in Education, Porto Alegre, BR-RS, 2016. url .

[36] S. Ray. (2019, February). A quick review of machine learning algorithms. In

2019 International conference on machine learning, big data, cloud and parallel

computing (COMITCon) (pp. 35-39). IEEE.

https://tedebc.ufma.br/jspui/handle/tede/tede/381

https://lume.ufrgs.br/handle/10183/156570

[37] R. C. D. Reis. Formation of groups in cscl environments using personality traits

associated with collaborative learning theories. 2019. Doctoral thesis. University of

Sao Paulo. url.

[38] H. M. Reis, B. de Oliveira, S. Isotani and I. Gasparini (2014). “Investigating

cultural aspects in the formation of collaborative learning groups: a review of the

literature”. Computer Books, 8(3), 25-29.

[39] M. Rosenberg. “Society and the adolescent self-image”. Revised edition.

Middle-town, CT: Wesleyan University Press, 1989.

[40] J. Roschelle e S. Teasley (1995). The construction of shared Knowledge in

collaborative problem solving. In C. O´Malley (Ed.), Computer-supported

collaborative learning (pp. 69-197). Berlin, Germany: Springer Verlag.

[41] S. Russel and P. Norvig Artificial intelligence: A modern approach, 3ed. [S.l.]:

Rio de Janeiro: Elsevier, 2013.

[42] M. E. Sardelich. Learning to assess learning. In: SILVA, Marco; SANTOS,

Edméa (Org.). Learning assessment in online education. São Paulo: Loyola, 2006. p.

211-226.

[43] M. Seligman and M. Csikszentmihalyi. (2000). Positive psychology: An

introduction. American Psychologist, 55, 5-14.

[44] E. L. da Silva e E. M. Menezes. Metodologia da Pesquisa e Elaboração de

Dissertações – 4. ed. – Florianópolis: UFSC, 2005.

[45] S. Staats. "Hope: A comparison of two self-report measures for adults."Journal

of Personality Assessment 53.2 (1989): 366-375.

[46] G. Stahl, Koschmann, T. Koschmanm and D. Suthers. (2006). Computer-

supported collaborative learning: An historical perspective. In R. K. Sawyer (Ed.),

Cambridge handbook of the learning sciences (pp. 409-426). Cambridge, UK:

Cambridge University Press. Available at

http://GerryStahl.net/cscl/CSCL_English.pdf in English,

[47] P. de Toledo, R. Pérez-Rodriguez, P. de Miguel, A. Sanchis and P. Serrano

(2019, July). Prediction of patient evolution in terms of Clinical Risk Groups form

routinely collected data using machine learning. In 2019 41st Annual International

Conference of the IEEE Engineering in Medicine and Biology Society (EMBC) (pp.

1721-1724). IEEE.

[48] R. Yadhunath, S. Srikanth, Sudheer, A. Sudheer and S. Palaniswamy (2019,

December). Identification of Criminal Activity Hotspots using Machine Learning to

Aid in Effective Utilization of Police Patrolling in Cities with High Crime Rates. In

2019 4th International Conference on Computational Systems and Information

Technology for Sustainable Solution (CSITSS) (Vol. 4, pp. 1-6). IEEE.

[49] C. Zanon e C. S. Hutz. Escala de Afetos Positivos e Afetos Negativos (PANAS).

In: Avaliação em Psicologia Positiva/Organizador, Cláudio Simon Hutz - Porto

Alegre: Artmed, 2014.

[50] Z. Zhang, Y. Li, Z. Li and S. Liu. (2019, May). Multiple Linear Regression for

High Efficiency Video Intra Coding. In ICASSP 2019-2019 IEEE International

Conference on Acoustics, Speech and Signal Processing (ICASSP) (pp. 1832-1836).

IEEE.

https://doi.org/10.11606/T.55.2019.tde-11062019-111943

projeto de investigaÇÃo do estÁgio pÓs-doc

Documents