O equivalente a asistencia este curso vai ser entregar unhas tarefas aplicadas a unha colección de datos.
De entre as seguintes coleccións debedes escoller unha coa que realizaredes algunha aplicacíón do que aprendades no seminario.
data.zip — Orixe — Información — Exemplo
Beauty and wages Obtéñense no paquete wooldrige de R — Orixe — Información
coffee_ratings Obtéñense usando o paquete tidytuesdayR de R, pero tamén se descargan directamente de github.com — Orixe — Información
A fonte da maioria destes datos é kaggle.com é unha compañía propiedade de google, que mantén unha comunidade online de “data scientists” and “machine learning practitioners”, ou sexa, xente relacionada coas modernas técnicas de análise e extracción de información de datos.
Outra fonte importante é github.com, unha compañía, propiedade de Microsoft, que ofrece aloxamento a proxectos de software, en algúns casos de maneira gratuita, o que a converte nun gran almacén de proxectos en moitas linguaxes de programación, entre elas R.
A terceira fonte é o propio R, que inclue como paquetes algunhas fontes de datos, elaborados e subidos ao CRAN (repositorio oficial de R) por algúns dos seus usuarios.