La ciencia de datos, o data science, es una nueva área de conocimiento que se ha vuelto cada vez más popular; se ha convertido en una habilidad necesaria en la actualidad. Para mejorar, o adquirir, competencias en data science y R, un lenguaje de programación, la Universidad Nacional Autónoma de México tiene disponible, a través de Coursera, el curso “Introducción a Data Science: Programación Estadística con R”. 

El objetivo del curso es introducir a los alumnos al lenguaje de programación estadística R, un lenguaje computacional diseñado para el análisis estadístico de datos. Está dirigido a personas que tengan interés en utilizar esta herramienta para la lectura, manipulación, análisis y gráfica de data. 



Este programa académico tiene una duración aproximada de 47 horas y está dividido en 4 semanas o módulos de estudio. Sin embargo, si en algún momento la carga se torna excesiva, los estudiantes podrán restablecer las fechas límite de entrega en función de sus horarios. 

Durante el primer módulo, los estudiantes instalarán los programas y herramientas (disponibles para Windows, MacOS o Linux) que necesitarán a lo largo del curso. Además, se revisará el temario del mismo. Los estudiantes también tendrán una introducción al lenguaje para entender qué son los objetos, las clases y los tipos de datos además de leer y escribir datos a distintas fuentes y tipos de archivo. 

Después, en la segunda etapa del programa, los alumnos aprenderán a usar R. Aprenderán a utilizar las estructuras de control para agilizar tareas repetitivas y a crear funciones para llevar a cabo tareas específicas o complejas. También estudiarán reglas de alcance, manejo de fechas y variables de las mismas además de la importancia de utilizar operaciones vectorizadas para acelerar el funcionamiento del código.



En la tercer semana, los estudiantes conocerán una familia de funciones vectorizadas para efectuar operaciones con un número reducido de líneas de código. Después tendrán un acercamiento al sistema de gráficos y las funciones que permiten modificarlo. En el módulo final, aprenderán qué son las expresiones regulares y cómo se deben utilizar con R; graficarán con el paquete ggplot2; aprenderán a identificar y reparar errores; y llevarán a cabo una simulación. 

Al término del curso los estudiantes serán capaces de utilizar R para la manipulación de datos, análisis estadístico y representación gráfica a través del procesamiento de datos cuantitativos.


SO

Google News

TEMAS RELACIONADOS

Noticias según tus intereses