FashionSalesPrediction

Predicció de les tendències de vendes d’articles de moda sobre un dataset multimodal amb mètodes d'aprenentatge automàtic tradicionals

Aquest projecte explora la viabilitat de predir les tendències de vendes en la indústria de la moda utilitzant tècniques tradicionals d'aprenentatge automàtic. Amb dades provinents del dataset multimodal VISUALLE, el projecte analitza la relació entre les característiques d'articles de moda i les seves vendes. El dataset inclou informació visual, metadades textuals, dades de tendències de Google i registres de vendes de més de 5000 articles de roba.

L'objectiu principal és determinar si tècniques d'aprenentatge automàtic més simples poden substituir enfocaments més complexos, com el deep learning, per a tasques de predicció en dades multimodals. El projecte comença amb un enfocament de regressió per predir les vendes totals, però canvia a una classificació binària per identificar articles amb vendes destacades a causa de la distribució desbalancejada de les dades.

Les estratègies implementades inclouen:

Enginyeria de dades per simplificar i fer més interpretables les característiques, com ara les dades visuals i les tendències de Google.
Aplicació de tècniques de balanceig de classes com SMOTE i submostreig per abordar el desbalanceig de les dades.
Avaluació de diversos models d'aprenentatge automàtic com la regressió lineal, Random Forest i XGBoost.

Els resultats mostren que, tot i certs avenços, les tècniques tradicionals tenen limitacions importants per capturar la complexitat de les dades multimodals. Això destaca la necessitat d'explorar enfocaments més avançats, com l'ús de xarxes neuronals i arquitectures basades en transformers, especialment per a integrar millor les dades visuals amb altres característiques.

Aquest projecte posa en evidència els reptes de treballar amb dades desbalancejades i multimodals en la predicció de tendències de vendes. Alhora, proporciona una base sòlida per a futures investigacions en aquest camp, amb la idea de millorar la precisió i l'eficàcia dels models predictius per a la indústria de la moda.

Estructura del Repositori i d'execució

Dataset:
- Descarregar i extreure el Dataset a partir del següent enllaç: VISUELLE
- NOTA: a les notebooks següents s'ha de canviar la variable path per el lloc d'extracció del dataset. S'indica als fitxers.
Notebooks:
- create_CLIP_embeddings.ipynb: S'ha de correr aquest script primer per a generar els embeddings.
- first_approach_BoVW.ipynb: Aquest fitxer inclou el codi per a realitzar les features del BagOfVisualWords.
- model_notebook.ipynb: Aquesta és la notebook principal, on s'an d'incloure els fitxers generats amb les notebooks anteriors i el dataset, tal com està inclòs dins la notebook.
- NOTA: No estan totes les versions i iteracions que s'han mencionat a l'informe, si no només la majoria de versions finals.

Name		Name	Last commit message	Last commit date
Latest commit History 10 Commits
clean_notebooks		clean_notebooks
Predicció_de_les_tendències_de_vendes_d_articles_de_moda_sobre_un_dataset_multimodal.pdf		Predicció_de_les_tendències_de_vendes_d_articles_de_moda_sobre_un_dataset_multimodal.pdf
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

FashionSalesPrediction

Predicció de les tendències de vendes d’articles de moda sobre un dataset multimodal amb mètodes d'aprenentatge automàtic tradicionals

Estructura del Repositori i d'execució

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

FashionSalesPrediction

Predicció de les tendències de vendes d’articles de moda sobre un dataset multimodal amb mètodes d'aprenentatge automàtic tradicionals

Estructura del Repositori i d'execució

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages