Curso de Data Scientist con R - Online

Contacta sin compromiso con Universidad Tecnológica Nacional

Para enviar la solicitud debes aceptar la política de privacidad

Comentarios sobre Curso de Data Scientist con R - Online

  • Contenido
    Curso de Data Scientist con R.

    Gestiona información masiva de Big Data. Conoce la estructura, sintaxis y algoritmos de R para el diseño y uso de repositorios de datos.

    Modalidad: Online
    Duración: 6 semanas.
    25% de Descuento Socio del Club del Graduado

    R es un lenguaje y entorno de programación de software libre para análisis estadístico, cálculo numérico y representaciones gráficas (modelos lineales y no lineales, tests estadísticos, análisis de series temporales, algoritmos de clasificación y otros).

    Por su parte Big Data es el término que se utiliza para describir los grandes volúmenes de datos que componen Internet y la posibilidad de obtener información sobre ellos.

    Actualmente compañías como Google, Amazon, Facebook, Netflix, Walmart, GAP, IBM y General Electric, entre otras, están liderando procesos de gestión masiva de información y reclutando “Data Scientists” en la nueva era que deviene de Big Data.

    El trabajo de un buen Científico de Datos es hacer descubrimientos “buceando” en un océano de datos cada vez más masivos y complejos. Identifican potenciales fuentes ricas en datos valiosos y acercan la brecha entre los datos, la información y finalmente las decisiones de negocio.

    Este entrenamiento tiene como objetivo familiarizar a los participantes con R y sus principales algoritmos más difundidos.

    Se espera que los participantes incorporen criterios para diseñar y utilizar repositorios de datos.

    Objetivo general:

    Formar profesionales Científicos de Datos para los que se requiere que los participantes:

        Ubiquen a la ciencia de datos en el contexto de disciplinas al servicio de los negocios
        Entiendan la estructura de R
        Conozcan las convenciones utilizadas de sintaxis de R
        Sepan usar los algoritmos más difundidos
        Puedan diseñar un repositorio de datos
        Incorporen la necesidad de limpiar los datos antes de usarlos
        Usen sin dificultad las herramientas de inferencia estadística
        Complementen su formación y entrenamiento como Data Scientists

    Objetivo especifico:

    Unidad 1: Introducción a Big Data, Ciencia de Datos y R.

    Que los participantes:
        Dominen el concepto de ciencia de datos
        Entiendan la estructura general de R
        Manejen la sintaxis de comandos de R
        Ubiquen los principales repositorios de los que bajar algoritmos
        Incorporen el lugar que R va tomando como estándar de facto dentro de la ciencia de datos.

    Unidad 2: Diseño y Construcción de repositorios de datos.

    Que los participantes:
        Adquieran criterio propio para diseñar repositorios de datos
        Palpen las consecuencias nefastas de no realizar adecuadamente la limpieza de los datos
        Manejen la terminología relacionada con los repositorios de datos
        Comparen adecuadamente las herramientas que existen en el mercado para soportar repositorios de datos           

    Unidad 3: Algoritmos Descriptivos en R.
          
    Que los participantes:
        Identifiquen los principales algoritmos aplicados a la estadística descriptiva que vienen dentro de R
        Entiendan el significado de cada parámetro de la invocación de los algoritmos descriptivos desde R
        Puedan comparar las ventajas y desventajas de los distintos algoritmos que se ofrecen para las diferentes técnicas descriptivas cubiertas.      

    Unidad 4: Gráficos en R.

    Que los participantes:
        Identifiquen las principales herramientas gráficas que vienen dentro de R
        Comprendan como distintas visualizaciones sirven o no para transmitir diferentes conceptos.
        Manejen la sintaxis de R para generar los gráficos.

    Unidad 5: Algoritmos Predictivos básicos en R.

    Que los participantes:
        Identifiquen los algoritmos más simples aplicados a la inferencia estadística que vienen dentro de R
        Entiendan el significado de cada parámetro de la invocación de los algoritmos predictivos más simples desde R
        Puedan comparar las ventajas y desventajas de los distintos algoritmos que se ofrecen para las diferentes técnicas predictivas cubiertas.

    Unidad 6: Algoritmos Predictivos avanzados en R y perspectivas de Ciencia de Datos.

    Que los participantes:
        Identifiquen los principales algoritmos avanzados aplicados a la inferencia estadística que vienen dentro de R
        Entiendan el significado de cada parámetro de la invocación de los algoritmos predictivos avanzados desde R
        Puedan comparar las ventajas y desventajas de los distintos algoritmos avanzados que se ofrecen para las diferentes técnicas predictivas cubiertas.
        Conozcan las futuras tendencias de la disciplina de la ciencia de datos. 
     
    Destinatarios:

    Todos aquellos profesionales que quieran profundizar en el uso de R aplicado a la "Inteligencia de Negocios" (BI) ya sea para incorporarse en una posición de Analista de Business Intelligence como para mejorar sus posibilidades de crecimiento en este competitivo y creciente mercado.

    Junto con una formación previa en BI este curso complementa a los destinatarios en su formación como Data Scientists.

    Requisitos previos:

    Es conveniente que los participantes tengan un manejo general de las herramientas informáticas (ofimática, carpetas, archivos, etc.) así como los conceptos básicos de estadística descriptiva y probabilidad.

    Los participantes se beneficiarán de su experiencia previa en uno o más de los siguientes campos:

        Manejo de base de datos
        Programación
        Matemáticas
        Marketing
        Inteligencia de Negocios

    Aunque ninguno de los conocimientos resulta excluyente, dado que se trata de un curso específico, resultará muy conveniente que los participantes cuenten con formación previa de carácter general, idealmente tener formación en Inteligencia de Negocios (como por ejemplo la tener aprobada la Diplomatura en BI de esta institución).

    Metodología de enseñanza-aprendizaje:

    Lectura crítica del material didáctico por parte de los alumnos. Consultas e intercambios en los foros, dirigidos y coordinados por el profesor-tutor. Clases en tiempo real. Ejercicios prácticos  y evaluaciones sobre la base de análisis de situaciones y casos en contextos laborales y profesionales y, según el carácter de los temas y objetivos de la especialidad o curso, cuestionarios del tipo multiple choice.

    Modalidad Educativa:

    La modalidad es totalmente mediada por tecnologías a través del Campus Virtual FRBA. Las actividades que se realizarán serán:

        Foros de discusión semanal propuestos por el docente (un foro por unidad).
        Consulta al docente a través de e-mail o chat.
        Dictado de clases en tiempo real mediante un Aula Virtual Sincrónica (AVS)
        Material de lectura semanal y por unidad temática
        Actividades individuales y/o grupales de aplicación práctica semanal y por unidad temática.
        Evaluaciones semanales y por unidad temática sobre la base de trabajos prácticos de aplicación de los conocimientos adquiridos.

    Se trata de una modalidad básicamente asincrónica con el complemento del AVS, que supera la instancia de autoestudio por la implementación de foros proactivos coordinados por el profesor-tutor y dictado de clases en tiempo real. Los foros cumplen cuatro funciones pedagógico-didácticas fundamentales: 1) Son el lugar para la presentación de las dudas, consultas y opiniones críticas de los alumnos; 2) Son el principal espacio para la generación de retroalimentación (feed back) entre profesores-tutores y alumnos y alumnos entre sí; 3) Es el lugar específico para la discusión, coordinada por el profesor-tutor, de todos los temas tratados en los módulos de la especialidad o curso y 4) Es el lugar para el aprendizaje entre pares de los alumnos. A su vez, el AVS permite complementar todas aquellas instancias pedagógico-didácticas que le señalan límites a la modalidad puramente asincrónica.

    Modalidad de evaluación y acreditación:

    Tratándose de una modalidad mediada por tecnologías, la participación activa en los foros por parte de los alumnos, será una condición necesaria para su aprobación.

    Por lo tanto, para acreditar la aprobación de la especialidad o curso, los alumnos deberán rendir satisfactoriamente las evaluaciones que los profesores-tutores determinen como obligatorias y haber participado activamente en los foros.

    Finalmente deberá aprobarse una Evaluación Final Integradora Obligatoria del tipo multiple choice.

    Temario:

    El curso tendrá una duración de seis semanas y se dividirá en seis unidades.

    Cada una de las unidades tendrá una duración de una semana:

    Unidad 1: Introducción a BI, R y la Ciencia de los Datos.

        BI: La ciénaga conceptual:        
        ¿Qué es BI?
        ¿Qué es Big Data?
        ¿Qué es un Datawarehouse?
        ¿Qué es R?
        ¿Qué es la Ciencia de los Datos?
        El Rol del Científico de Datos
        Elementos de sintaxis de R
        Repositorios de Algoritmos
        Comunicación multinivel
     
    Unidad 2: Diseño y construcción de repositorios de datos.

        Criterios de arquitectura de datos
        Estrategias de limpieza de datos
        Técnicas para carga de datos
     
    Unidad 3: Algoritmos Descriptivos en R.

         Medidas estadísticas
        Análisis de Fourier
        Algoritmos de Agrupamiento
     
    Unidad 4: Herramientas de Graficación en R.

        Gráficos de densidad
        Gráficos de puntos
        Gráficos de barras
        Gráficos de líneas
        Gráficos circulares
        Gráficos de cajas
        Gráficos de dispersión
     
    Unidad 5: Algoritmos Predictivos básicos en R.

        Árboles de Decisión y Random Forest
        Redes Neuronales
        Reglas de asociación
     
    Unidad 6: Algoritmos Predictivos avanzados en R.

        Métodos Bayesianos
        Discriminante Lineal y Cuadrático
        Máquinas vectoriales de soporte
        Perspectivas futuras de BI y de la Ciencia de Datos

        Examen Final
     
    Duración:
    Duración: 6 semanas.
     
    Carga horaria:
    45  HS.
     
    Certificación:

    A todos los participantes que hayan aprobado el curso cumpliendo con todos los requisitos establecidos, se les extenderá un certificado de la Secretaría de Cultura y Extensión Universitaria, FRBA, UTN. Aquellos que aun habiendo participado activamente en los foros y realizado las actividades prácticas no cumplimentaran los requisitos de evaluación, recibirán un certificado de participación en el curso.

Otra formación relacionada con Data Mining

Este sitio utiliza cookies.
Si continua navegando, consideramos que acepta su uso.
Ver más  |