This repository has been used until 2025. Check the updated version: https://github.com/HLT-ISCTE/Text-Mining
- Introdução ao Python e ao Jupyter Notebook (opcional)
- Pré-processamento com vista à representação de documentos
- Tokenização - tokenização básica, tokenização com NLTK, tokenização de tweets
- NLP libraries for tokenization, sentence segmentation, stemming, part-of-speech, NER and sentiment analysis
- Representação de documentos
- Representação de documentos e cálculo de similaridade
- Gensim tutorial on corpora and vector spaces
- Intelligent word representations
- Embeddings: word2vec, glove, etc
- Classificação
- Análise de Sentimento
- Modelação de tópicos: exemplos com gensim, exemplos com scikit-learn