Universitat Internacional de Catalunya

MÓDULO 3.2: Métodos Estadísticos y Data Mining

MÓDULO 3.2: Métodos Estadísticos y Data Mining
5
13946
1
Primer semestre
OB
Llengua d'impartició principal: català

Altres llengües d'impartició: anglès, castellà,

Professorat


Faculty:

Imanol Morata (imorata@uic.es)

José Antonio Esteban (jaesteban@uic.es)

David Roche (droche@uic.es)

Presentació

En el cas que les autoritats sanitàries decretin un nou període de confinament davant l'evolució de la crisi sanitària provocada per la COVID-19, el professorat comunicarà oportunament les afectacions possibles en les metodologies i activitats formatives, i també en els sistemes d'avaluació.


Aquesta assignatura es compon d'una part de repàs d'estadística bàsica i una altra part dedicada a aprendre alguna de les tècniques clàssiques relacionades amb l'obtenció de coneixement i la presa de decisions.

 L'estadística és un component essencial i bàsic per poder entendre tècniques més pròpies de la ciència de dades i l'extracció de patrons, regles i coneixement.

 En resum, en aquesta assignatura es reprendran aspectes estadístics bàsics juntament amb alguna tècnica més concreta relativa a la ciència de dades

Requisits previs

Per cursar aquesta assignatura se suposen certs coneixements d'estadística bàsica i programació en R i Python

Objectius

Els objectius d'aquesta assignatura es refereixen a l'ús de l'estadística i de certes tècniques algorítmiques per completar coneixements bàsics necessaris per a la formació en ciència de dades.

En resum, s'abordaran aspectes com test d'hipòtesi, regressió lineal, components principals i computació evolutiva. També es realitzarà alguna sessió sobre cicle de vida dels projectes de ciència de dades i sobre tècniques d'aprenentatge automàtic

Competències/Resultats d’aprenentatge de la titulació

 
  • 31 - Desenvolupar la capacitat per identificar i interpretar dades numèriques.
  • 36 - Ser capaç d'interpretar dades quantitatives i qualitatives i d'emprar eines matemàtiques i estadístiques aplicables a processos empresarials.
  • 64 - Capacitat de planificació i organització del treball.
  • 32 - Adquirir habilitats en la resolució de problemes a partir d'informació quantitativa i qualitativa.
  • 40 - Ser capaç de seleccionar el mètode estadístic adequat d'acord amb l'objecte d'anàlisi.
  • 43 - Adquirir habilitat en l'ús de programari estadístic.
  • 50 - Adquirir capacitat de relacionar conceptes i fer exercicis d'anàlisi i de síntesi.
  • 51 - Desenvolupar aptituds en la presa de decisions.
  • 53 - Adquirir habilitats per a l'aprenentatge autònom.
  • 54 - Ser capaç d'expressar idees i arguments de manera ordenada i coherent tant oralment com de forma escrita.
  • 56 - Ser capaç de fer argumentacions que afavoreixin el raonament crític i autocrític.
  • 65 - Adquirir la capacitat de posar en pràctica els coneixements.
  • 66 - Capacitat de recuperar i tractar informació.

Resultats d’aprenentatge de l’assignatura

A l'acabar aquesta assignatura l'alumne serà capaç de enfrontar-se a problemes quantitatius i qualitatius i a aplicar tècniques clàssiques d'estadística i alguns algoritmes propis de la ciència de dades per obtenir informació a partir de les dades per donar suport a la presa de decisions

Continguts

Continguts de l'assignatura:   1. Repàs elements de programació 2. Test d'hipòtesis per a la diferència de mitjanes a. Paramètrics dues mitges i més de dues mitjanes b. No Paramètrics dues mitges i més de dues mitjanes 3. Regressió lineal a. model simple b. model múltiple 4. Anàlisi de components principals 5. Computació evolutiva 6. Sessions d'empreses sobre ús de tècniques d'aprenentatge automàtic

Metodologia i activitats formatives

Modalitat totalment presencial a l'aula



La tècnica d'aprenentatge d'aquesta assignatura és "learning by doing" de manera que es realitzaran casos pràctics aplicats a cada concepte teòric que es desenvolupi en les diferents sessions i per als diferents llenguatges. L'objectiu sempre és apropar l'alumne a la realitat de la seva professió on haurà d'aplicar els coneixements teoricopràctics apresos al llarg de l'assignatura. 

La majoria de les sessions s'estructuren de la següent manera:   

1. Presentació del resum teòric per part de professorat 

2. Aplicació exemple per part de professorat 

3. Plantejament de problemes i solució per part de l'alumnat 

4. Solució de el problema de manera conjunta 

5. Cas pràctic simulat o amb dades reals 

6. Treball pràctic per fer a casa amb la intenció d'assimilar els conceptes apresos en la sessió

Sistemes i criteris d'avaluació

Modalitat totalment presencial a l'aula



L'avaluació d'aquesta assignatura s'obtindrà amb la ponderació equitativa de tots els lliuraments realitzats al llarg del curs. La nota final és la nota de l'avaluació continuada.

Bibliografia i recursos

-Statistics for Business and Economics, Global Edition. Paul Newbold, William Carlson, Betty Thorne. 2019

- An Introduction to Statistical Learning: with Applications in R. Gareth James, Daniela Witten, Trevor Hastie, and Robert Tibshirani. 2014. Springer Publishing Company, Incorporated.

- R Cookbook: Proven Recipes for Data Analysis, Statistics, and Graphics. J D Long y Paul Teetor. 2019