Proyecto de Procesamiento del Lenguaje Natural (NLP) orientado al análisis automático de reseñas de clientes para extraer insights de negocio a partir de texto no estructurado.
El objetivo del proyecto es transformar miles de opiniones escritas por usuarios en información útil mediante técnicas de limpieza de texto, análisis de sentimiento, modelado de temas (topic modeling) y visualización de resultados.
Este análisis se centra en cinco objetivos principales:
Se carga un conjunto de reseñas desde Hugging Face y se transforma en un DataFrame para facilitar su análisis.
Se realiza una normalización completa del texto:
Esto permite mejorar la calidad del análisis posterior.
Se aplica un modelo preentrenado de sentiment analysis basado en Transformers para clasificar cada reseña como:
Esto permite medir la percepción general de los clientes.
Para descubrir automáticamente los principales temas de conversación se utiliza:
Esto permite identificar patrones frecuentes en las reseñas.
Se generan visualizaciones para interpretar:
Los temas más frecuentes detectados en las reseñas están relacionados con:
El análisis de sentimiento permite identificar claramente los puntos de mejora y las áreas mejor valoradas por los clientes.
Proyecto-Master-DataScience-Evolve-IvanMartinez/
│
├── analisis_resenas_nlp.ipynb # Notebook principal
├── trustpilot-reviews-123k.csv # Dataset utilizado
└── README.md
git clone https://github.com/ivanmartiolme/Proyecto-Master-DataScience-Evolve-IvanMartinez.git
pip install pandas numpy scikit-learn transformers datasets matplotlib jupyter
jupyter notebook
Abrir:
analisis_resenas_nlp.ipynb