Execução no Google Colab Kaggle - aiboxlab/nlp GitHub Wiki
Essa página contém algumas informações para execução em ambientes como Google Colab ou Kaggle Noteboos.
Recomendações Gerais
- Tais ambientes costumam ter diversas bibliotecas pré-instaladas por padrão, dessa forma é crucial que durante a instalação da biblioteca argumentos como
force-reinstall
oureinstall
sejam utilizados; - Em alguns ambientes do Kaggle com GPU, o
conda
é utilizado internamente para resolução de dependências. Em caso de erros, o ideal é buscar instalar usando oconda
;
LanguageTool
e cogroo4py
Java: Para extração de algumas características em Português Brasileiro, é necessário que o Java Development Kit (JDK) ou Java Runtime Environment (JRE) esteja disponível no sistema. Tanto Kaggle como Colab costumam utilizar imagens baseadas no Ubuntu ou Debian, sendo possível instalar o JDK com tranquilidade.
Por exemplo, é possível instalar Java utilizando o !
do Jupyter/IPython:
# Atualizando a lista de pacotes
!apt update
# Instalando o JDK 17
!apt install -y openjdk-17-jdk
# Atualizando as variáveis de ambiente para utilizar o JDK 17
!update-java-alternatives -s java-1.17.0-openjdk-amd64
Exemplos
Kaggle
- AES for formal_register: Automatic Essay Scoring (AES) para redações narrativas em Português;
- Hate Speech Detection with Features and Embeddings: Detecção de discurso de ódio em Português;
- Sentiment Classification with Embeddings: classificação de sentimentos em Português;
- Fake News Classification with Embeddings: classificação de Fake News em Inglês;
- Transformers-based Emotion Classification: classificação de emoções/sentimentos em Inglês;
Colab
Checar os exemplos da biblioteca!