mini testes

7
Mini testes A apresentar na aula da semana a seguir à data descrito em cada teste. As respostas não devem exceder mais do que duas páginas A4.

Upload: calida

Post on 23-Feb-2016

35 views

Category:

Documents


0 download

DESCRIPTION

Mini testes. A apresentar na aula da semana a seguir à data descrito em cada teste. As respostas não devem exceder mais do que duas páginas A4. Semana 1 (7/5/2010). - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Mini testes

Mini testes

A apresentar na aula da semana a seguir à data descrito em cada teste. As respostas

não devem exceder mais do que duas páginas A4.

Page 2: Mini testes

Semana 1 (7/5/2010)

1. Em naive Bayes típico, é assumido a independência entre os atributos dos dados de treino. Explique a razão para esta presunção e as implicações da mesma.

2. Recorrendo a exemplos, mostra o impacto na estratégia de escolha dos testes (atributos) nos nós de uma árvore de decisão. Use o WEKA para mostrar as diferenças entre entropia e gini.

Page 3: Mini testes

Semana 2 (21/5/2010)1. Considere o dataset iris. Apresente resultados de taxas de

acerto comparativo (para o algoritmo J48 do Weka) usando o dataset pré-discretizado com o algoritmo Fayyad-Irani e o dataset original. Apresente justificações para os resultados obtidos.

2. Considere o dataset labor. Usando os algoritmos J48 e simpleCart (Weka) apresente resultados (as diferentes árvores) que ilustram o uso das várias opções de pruning estudadas e.g. sub-tree rasing, replacement, laplace, minimal complexity pruning, etc. Apresente a justificação para os resultados obtidos com as avaliações por 10-xval e por training data.

Page 4: Mini testes

Semana 3 (28/5/2010)

1. Considere o dataset soybean. Apresente um estudo comparativo usando validação cruzada e os algoritmos NaiveBayes, SimpleCART e J48. Apresente conclusões sobre os melhores desempenhos para cada classe (das 19 existentes).

2. Considerando o valor de AUC para a classe “frog-eye-leaf-spot” obtido pelo J4.8, que tipo de curva ROC esperaria obter? Justifique.

Page 5: Mini testes

Semana 4 (4/6/2010)

1. Apresenta as diferentes características dos algoritmos de clustering k-means e EM. Ilustre com a execução de um exemplo.

2. Sugira uma estratégia para definir automaticamente o valor de k (número de partições) em algoritmos como o k-means, em que no algoritmo original k é fixado pelo utilizador.

Page 6: Mini testes

Semana 5 (11/6/2010)

1. Execute um 10-XVal para o dataset iris com o algoritmo J48 e com o AdaBoostM1 sobre J48. Apresente os resultados obtidos em termos de erro. Sugira uma explicação para a comparação dos erros obtidos.

2. Que tipo de benefícios esperaria da aplicação de Bagging sobre Naive Bayes num dataset específico, sabendo que o resultado do modelo individual Naive Bayes nesse dataset é bastante bom (erro = 0.005). Justifique.

Page 7: Mini testes

Semana 6 (18/6/2010)

1. Apresente os principais factores de complexidade de um algoritmo de geração de regras de associação. Ilustre a sua resposta com exemplos.

2. Descreva as principais fraquezas da medida de interessa confiança. Apresente exemplos de regras para ilustrar essas fraquezas. Sugira formas de ultrapassar os problemas levantados pelo usa da confiança.