Acetatos usados
nas aulas
Trabalhos,
Notas, e Avisos para o ano lectivo 2011/2012
Sites relevantes sobre Data Mining & Modelos Preditivos
Acetatos das aulas de Data Mining
II (Modelos Preditivos)
1º Trabalho: Enunciado, e dados
Exercícios: enunciado1
n
WEKA – Software livre para análise de
dados. Corre em Java, tem um bom interface com utilizador, e muitos dos
algoritmos usados nesta disciplina
n
MATLAB – Linguagem de programação para
computação científica, engenharia, e muito mais. É muito versátil, tem um bom
sistema de visualização e muitas bibliotecas de programas. Há dois clones
livres compatíveis com Matlab: OCTAVE (software GNU)e
SciLab (de origem francesa). Há também
outro sistema, que embora não seja compatível com Matlab
é parecido e muito usado pela comunidade estatística: o R.
·
SOMTOOLBOX (freeware) para MATLAB –
Conjunto de rotinas para treinar e visualisar SOM
(Self-Organizing Maps), bem
como fazer k-médias, projecções de Sammon, e outras
técnicas de clustering e
projecção de dados.
·
NETLAB (freeware) para MATLAB – Conjunto
de rotinas para implementar Redes Neuronais, Estimadores Bayesianos,
e outras técnicas para previsão e reconhecimento de padrões.
·
FastICA (freeware) para MATLAB - Conjunto de rotinas
para implementar ICA-Independant Component
Analysis
n
SAS Enterprise Miner – Sistema para datamining baseado no sistema para processamento de dados
SAS que é um dos líderes de mercado em Business Intelligence.
n
Intelligent Miner – Sofware
gratuito desenvolvido pela IBM.
n
Orange – Software “open source” para
datamining visual, com interface gráfico, scpripting, e muitas ferramentas.
Escrito pelo Laboratório de Inteligência Artificial da Universidade de
Ljubljana (disponível em http://orange.biolab.si/)
n
Muitos outros
fabricantes têm módulos para datamining, como a SPSS e a SAP.
n
Repositório de dados de Irvine (Machine Learning Repository, University of Califórnia at Irvine) - Um site com bases
de dados usadas como “benchmarks” para problemas de
análise de dados, reconhecimento de padrões, e aprendizagem automática.
n
Repositório
da Universidade de Edimburgo – Vários datasets
para Data Mining, incluindo vários dataset usados no concurso KDD.
n
Repositório
de sites da KD Nuggets –
Apontadores para vários repositórios de datasts (ver
abaixo a descrição da empresa)
n
Dados locais (usados nesta disciplina): Iris (XLS, TXT), Temperaturas (XLS,CSV), Sonar (XLS,TXT)
n
KBSI Knowlege Bases Systems, Inc - Site com informação sobre produtos e projectos de Business Intelligence e Datamining na área
da defesa.
n
KD_Nuggets – Um site
da empresa kdnuggets (do Prof. Gregory Piatetsky-Shapiro), com muitos links para fabricantes de
software, bases de dados, notícias de conferências, etc.