Datos para tarefas

O equivalente a asistencia este curso vai ser entregar unhas tarefas aplicadas a unha colección de datos.

De entre as seguintes coleccións debedes escoller unha coa que realizaredes algunha aplicacíón do que aprendades no seminario.

  1. cochesusadosindia.zipOrixeInformación

  2. final_cars_datasets.zipInformación

  3. supermarkets.zipOrixeInformaciónExemplo

  4. data.zipOrixeInformaciónExemplo

  5. Melbourne Housing MarketOrixeInformación

  6. Beauty and wages Obtéñense no paquete wooldrige de R — OrixeInformación

  7. Disney_Movies.zipOrixeInformación

  8. coffee_ratings Obtéñense usando o paquete tidytuesdayR de R, pero tamén se descargan directamente de github.com — OrixeInformación

A fonte da maioria destes datos é kaggle.com é unha compañía propiedade de google, que mantén unha comunidade online de “data scientists” and “machine learning practitioners”, ou sexa, xente relacionada coas modernas técnicas de análise e extracción de información de datos.

Outra fonte importante é github.com, unha compañía, propiedade de Microsoft, que ofrece aloxamento a proxectos de software, en algúns casos de maneira gratuita, o que a converte nun gran almacén de proxectos en moitas linguaxes de programación, entre elas R.

A terceira fonte é o propio R, que inclue como paquetes algunhas fontes de datos, elaborados e subidos ao CRAN (repositorio oficial de R) por algúns dos seus usuarios.