Jueves , febrero 21 2019

Suscribete gratis a nuestro boletin semanal

VISIONA . DESARROLLADORES . CONECTADOS .

Suscribete nuestro boletin semanal

PATROCINADORES
.
Home / Software Embebido / Qué lenguaje de programación es el caballo de guerra para un Científico de Datos

Qué lenguaje de programación es el caballo de guerra para un Científico de Datos

Entre lenguaje R y Python, ¿existen criterios de selección que todo ingeniero dedicado al análisis de datos debe tomar en cuenta? En este artículo lo analizaremos.

(Artículo contribuido / Dr. Humberto Valadez Rangel / Engineus Labs)

En este breve artículo analizaremos cuáles lenguajes de programación se han convertido a este 2019 en herramientas primordiales para el análisis de datos y sistemas basados en Machine Learning.

     

En un comienzo y como primer contacto en el camino es indispensable especializarse y distinguir con cierta claridad con qué tipo de herramientas se debe familiarizar en el procesamiento y cómputo de los datos. La oferta puede ser muy amplia, y en ocasiones la experiencia y el dominio del área ayudan a tomar esta decisión. Entonces, ¿qué herramientas debes elegir para tu trabajo considerando que apenas entras a este prometedor campo de la industria tecnológica? Veamos la siguiente tabla donde asociamos el tipo de lenguaje y la herramienta apropiada para su campo según se valora actualmente en profesiones como Científico de Datos, desarrollador de sistemas ML, analista de sistemas IA y otros especialistas relacionados con el mundo del Análisis de Datos.

Actualmente el lenguaje R es sumamente crítico para todo ingeniero que desea ingresar en la analítica de datos y Machine Learning.
     

En lo particular como científico de datos y en mi experiencia propia, los más importantes son Python y R. Me enfocaré en estos dos lenguajes. Ambos ofrecen una diversidad de potentes herramientas que permiten hacer análisis eficiente de datos e implementar diversos algoritmos de Inteligencia Artificial y Machine Learning. En mi aprendizaje primeramente opté por R. Es fundamental tener una sólida base de estadística y probabilidad para potenciar el uso de este lenguaje. La curva de aprendizaje no es tan lenta si se tiene experiencia programando. Si no se tiene mucha experiencia programando puedes optar por Python de forma primaria. En mi caso ha sido un reconfortante viaje integrarme poco a poco en el mundo de Python, posteriormente por mi gusto y pasión en los sistemas embebidos, por ejemplo, la famosa placa Raspberry Pi que puede programarse también en Python.

- PUBLICIDAD -

Especialistas y sus principales herramientas.
     

A continuación mostraré una comparativa entre Python y R que espero ayude a los Científicos de Datos a elegir uno u otro de acuerdo a su interés, necesidades y proyectos. Una pregunta frecuente en este campo es: ¿Cuál lenguaje de programación es mejor? Desde mi punto de vista es imposible contestar de manera absoluta a dicha pregunta. La elección de uno u otro lenguaje está en función de muchos aspectos tal como la naturaleza del proyecto, las fases del mismo, el tiempo de desarrollo, el equipo de trabajo así como el perfil del especialista.

Tabla de comparación R vs Python.
     

Como podemos observar, R posee características especiales que lo hacen especialmente versátil en la fase de depuración, limpieza y exploración de datos dentro del ciclo de trabajo de Machine Learning. También R ha representado en mi experiencia docente una herramienta muy bien aceptada en el ámbito académico incluso entre estudiantes que han tenido poca experiencia en análisis estadístico. Es posible integrarlo tanto en cursos básicos como a nivel avanzado. Por otro lado el lenguaje de programación Python a complementado muy bien mi actividad ya que me ha ofrecido un abanico amplio de aplicaciones tanto en el ámbito del Machine Learning como en los sistemas embebidos. También me ha permitido explorar el fascinante mundo del internet de las cosas (IoT). Python une el mundo de los datos y los sistemas embebidos de manera prometedora. Mi recomendación para el científico de datos es aprender los dos lenguajes. No se arrepentirá. Ambos se complementan y ofrecen una gama de utilidad muy amplia.

Acerca de Dr. Humberto Valadez Rangel El Dr. Humberto Valadez Rangel es profesor e investigador en el área de Control Automático, egresado del Centro de Investigación y de Estudios Avanzados del IPN (Cinvestav del IPN) y actualmente cofundador de la empresa Engineus Labs SA de CV (www.engineus.com.mx) dedicada a servicios de desarrollo e investigación de Big Data, Machine Learning y Sistemas Embebidos.

- PUBLICIDAD -

Revisa también ...

América Latina carece de cultura para el reciclaje electrónico: ONU

La Organización de las Naciones Unidas (ONU) afirmó que América Latina solo recicla el 10% …

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos necesarios están marcados *