Document-Subjectivity

Document subjectivity classification using a small Italian newspapers articles dataset called SubjectivITA. The dataset is composed of 74 training documents containing 1614 sentences in total, and 29 testing documents, containing 227 sentences.

In order to deal with small data limitation, sBERT, a library containing pretrained, multi-language sentence embedding models can be employed.

Using these pretrained models, one can easily produce meaningful representations for individual sentences, which in their turn can be used as features for simpler classical machine learning models to predict the document class.

Additional info

This repository includes notebooks for three experiments described in the report file.

Name		Name	Last commit message	Last commit date
Latest commit History 11 Commits
media		media
results		results
.gitignore		.gitignore
Document_Subjectivity_Experiment_1.ipynb		Document_Subjectivity_Experiment_1.ipynb
Document_Subjectivity_Experiment_2.ipynb		Document_Subjectivity_Experiment_2.ipynb
Document_Subjectivity_Experiment_3.ipynb		Document_Subjectivity_Experiment_3.ipynb
Document_Subjectivity_Playground.ipynb		Document_Subjectivity_Playground.ipynb
README.md		README.md
process_logs.py		process_logs.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Document-Subjectivity

Additional info

About

Uh oh!

Releases

Packages

Languages

alex0dd/Document-Subjectivity

Folders and files

Latest commit

History

Repository files navigation

Document-Subjectivity

Additional info

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages