Introdución á análise de datos con R (en preparación)

Se queredes preguntar dúbidas, no correo:


5º dia de seminario

O 5º día de seminario vai ser o XOVES 3 de novembro, ás 11:30 (aula 2.10), pola mañá e ás 16:30 pola tarde (aula 0.2, pero pendente de confirmar).

Pola mañá, ao non realizala nunha aula de informática, é necesario que traiades vós un ordenador. Pola tarde sería recomendable que o traiades en caso de que non me confirmen a aula.

EXAME

A maiores do diploma de asistencia, que se obtén asistindo e entregando as tarefas pódese obter un diploma de superación, precisamente superando un pequeno exame.

Vou propoñer tres periodos para facer o exame, que será online en Teams.

  • O primeiro na semana do 21 ao 25 de novembro
  • O segundo despois dos exames de primeira oportunidade
  • O terceiro despois dos exames de segunda oportunidade

Irei mandando avisos cando se achegue algún dos periodos. Se o queredes facer mandademe un aviso por correo, asi sabendo quen se presenta podo organizar un horario que lle veña ben a todo o mundo.

Exemplo de exame: AQUÍ

TAREFAS

Neste seminario, para recibir o diploma de existencia é necesario realizar 3 tarefas simples, de análise de datos con R.

3ª tarefa

Consistirá en mellorar a segunda tarefa, pero incluindo cousas feitas con dplyr e un gráfico con ggplot2. Xa sei que en algún caso cubrides isto co entregado na 2ª tarefa, nese caso simplemente ampliade algun calculo e gráfico máis ca o que xa entregastes.

  • DATOS,

  • O prazo para que enviedes por email esa proposta é ata o 13 de novembro.

2ª tarefa

A 2º tarefa consiste en realizar as cálculos que propuxestes na primeira tarefa.

  • DATOS,

  • O prazo para que enviedes por email esa proposta é flexible: podese entregar ata o 6 de novembro, ou esperar e facelo coa 3ª tarefa.

1ª tarefa

A 1º tarefa consiste simplemente en que vós propoñades a tarefa que ides facer.

Para iso propóñovos 8 coleccións de datos, nesta páxina web:

das cales debedes escoller unha delas e propoñerme que tarefa de análise de datos faríades con ela.

Non é necesario ningún cálculo. Só presentar unha idea simple. Por exemplo, se tivésemos os datos do paquete nycflights13 poderíades calcular o retraso medio na chegada para cada compañía e representalo graficamente. Sería suficiente con dicir iso.

  • O prazo para que enviedes por email esa proposta é o 17 de outubro.

Chuletario, para baixar:

  • AQUÍ: Esta colección cubre os comandos básicos para comezar a traballar con R, desde o comenzo ata a realización de gráficas con ggplot2.

Dia 5:

  • Dia 5: (Programación. Bucles e condicionais. Funcións. Comandos for,if, apply): MATERIAL

Días 1, 2, 3 e 4

  • Dia 4 25 e 26 de outubro : (Estruturas de datos - Regresión: Matrices e listas. Aplicación a unha regresión.) : MATERIAL

  • Dia 3: 19 e 20 outubro (ggplot2 - Rmarkdown: Graficas en R. Informes en R.): MATERIAL

  • Dia 2: 5 e 6 outubro (Dplyr:: Preparar datos.): MATERIAL—— Codigo realizado na aula

  • Dia 1: 3 outubro (Introdución: Abrir ficheiros de datos e primeiros pasos.):MATERIAL ——- Codigo realizado na aula


Información sobre o seminario

Este seminario ten o obxectivo de proporcionar a estudantes un nivel introductorio na analise de datos con R. Poderanse obter dous tipos de diplomas:

  • Asistencia: necesario asistir a un minimo de 3 sesións (entregando as tarefas na aula), ademais de facer un traballo final.
  • Superación: necesario o anterior e ademais superar unha proba práctica que demostre as competencias adquiridas. Esta proba poderá facerse en diferentes datas ao remate dos seminarios.

A quen vai dirixido?

Estudantes das nosas titulacións (ADE, Economía, Empresa e as dobres relacionadas, ademais dos diferentes master), que teñan superada a Estatística I.

Horarios (aula 0.2):

Faranse dúas sesións, unha de mañá e outra de tarde.

Mañá:

  • Sesión 1: (Luns)         3 Outubro 2022; de 11:30 a 13:30
  • Sesión 2: (Mércores)         5 Outubro 2022; de 11:30 a 13:30
  • Sesión 3: (Mércores)         19 Outubro 2022; de 11:30 a 13:30
  • Sesión 4: (Mércores)         26 Outubro 2022; de 11:30 a 13:30
  • Sesión 5: (—–)         Pendente 2022; de 11:30 a 13:30

Tarde:

  • Sesión 1: (Luns)         3 Outubro 2022; de 18:30 a 20:30
  • Sesión 2: (Xoves)         6 Outubro 2022; de 18:30 a 20:30
  • Sesión 3: (Xoves)         20 Outubro 2022; de 18:30 a 20:30
  • Sesión 4: (Xoves)         27 Outubro 2022; de 18:30 a 20:30
  • Sesión 5: (—–)         Pendente 2022; de 18:30 a 20:30

Sotware que se necesita.

Usaranse os ordenadores da aula de informática, pero se traes o teu propio ordenador portatil deberá ter instalados os seguintes programas:

R: www.r-project.org/

RStudio (Versión Desktop- Open Source Edition): www.rstudio.com

Vídeo con algo de información para baixar os programas

Que se aprenderá?

Programa provisional

Por exemplo o que se ve nestes videos:VIDEOS DE INTRODUCIÓN,

Son 2 sesións diferentes de introdución para estudantes de 1º de Economía, polo tanto é Estatística elemental.

Usanse comandos da seguinte colección de chuletas:

  • Chuletario: Esta colección cubre os comandos básicos para comezar a traballar con R, desde o comenzo ata a realización de gráficas con ggplot2.

Documentación xeral sobre R

Podedes atopar na páxina de DOCUMENTACIÓN diferentes lugares con información para preparar R. Desde os manuais oficiais (máis linguaxe ca Estatística) ata unha variedade de introducións e maneiras de aplicalo. Blogs, formatos seminario e libros libres.

  • Material con introdución a series de tempo: AQUÍ

  • Material con introdución á programación con R: AQUÍ

Codigos (e videos) das clases realizadas no 1º cuadrimestre do curso 19-20.