¿Qué es machine learning y para qué sirve? Entrevista a nuestro ingeniero Guiem Bosch

Posted by media on 1/02/19 9:00

Qué es machine learning y para qué sirve Entrevista a nuestro ingeniero Guiem Bosch

¿Qué es machine learning y para qué sirve? Es una duda que muchos se preguntan pero que en Signaturit tenemos resuelta gracias a nuestro compañero Guiem, responsable de los servicios que estamos desarrollando basados en esta tecnología. 

En este post hemos querido entrevistarle para contaros qué es machine learning, para qué sirve y en qué consiste su trabajo en Signaturit.

 

¿Qué es machine learning y para qué sirve? Nos lo cuenta nuestro machine learning Engineer, Guiem Bosch

Guiem nació y creció en una preciosa isla: Menorca. Su infancia la recuerda como Mowgli, en el campo entre animales en la granja donde sus padres trabajaban y a los que ayudaba a fabricar queso artesano.

Más tarde le surgiría una duda: ¿cómo podía entender su mente si la herramienta que usaba para conocerla era su propia mente? Por aquel entonces era un niño idealista y decidió que la mejor manera de superar esa limitación era crear una mente artificial que le ayudara a entender la suya.

A los 14 años empezó a practicar yoga con el objetivo de descubrir más sobre su existencia y entender la mente humana. Ahora ya van 20 y todavía confiesa que no lo tiene muy claro, ¡pero sin duda el yoga le ha convertido en una persona mucho más amorosa!

Estudió Ingeniería Informática porque en el plan de estudios había una asignatura que se llamaba Inteligencia Artificial, pero también se graduó como Psicólogo para obtener otro punto de vista.

Aunque lleva más de 10 años trabajando en proyectos relacionados con la inteligencia artificial se asombra de que sea ahora una de las profesiones “hot” en el mundo tecnológico.

Averigüemos por qué todo el mundo habla de esta tecnología de la mano de uno de sus protagonistas.


«Algunas personas temen que la inteligencia artificial
nos haga sentir inferiores, pero entonces cualquiera de nosotros
tendría que sentir complejo de inferioridad al mirar una flor
”.

― Alan Kay, informático y escritor

Cita favortia de Guiem Bosch

 robot

 

1. ¿Qué es machine learning? Me puedes hacer una definición para dummies.

Machine learning engloba aquellos sistemas de computación que son capaces de mejorar sus resultados en una tarea determinada de manera automática. Esa mejora progresiva es lo que llamamos aprendizaje y generalmente es posible gracias a la presentación de grandes cantidades de datos/experiencias al sistema.

Para el ojo no entrenado, los algoritmos que construyen el modelo matemático de los datos pueden resultar complejos, e incluso intimidatorios, sin embargo la idea subyacente es sencilla.

Al igual que pasa con el ser humano y otros seres vivos, la habilidad y el conocimiento forman parte de un cúmulo de repetidas experiencias. Salvo algunas ocasiones en las que el aprendizaje sucede en un simple evento, por ejemplo no tocar fuego después de quemarse, el humano aprende y mejora ante la exposición a nuevos casos y experiencias repetidas.

Machine learning gira entorno a la misma idea, un clasificador de imágenes que distingue entre gatos y perros mejora a medida que observa más fotos, al igual que un sistema que aprende a jugar al ajedrez es capaz de ganar cada vez más partidas al acumular más experiencia jugando contra sí mismo.


2. ¿Cómo le explicarías los beneficios del machine learning a un usuario base que odia los ordenadores? ¿Cómo crees que el aprendizaje automático puede ayudar a la sociedad en general?

En primer lugar, a corto plazo la integración de soluciones de machine learning ha supuesto un cambio de paradigma en la manera de programar. Hay ciertos problemas que son inabordables si hay que codificarlos de la manera clásica y que requieren de la detección explícita de miles y miles de reglas. machine learning no necesita las normas, simplemente el suministro de datos para aprenderlas por sí mismo.

A largo plazo, el aprendizaje automático puede ayudar en casi cualquier ámbito que uno se plantee. En realidad ya lo está haciendo. Sin embargo, permíteme divergir un poco y recordar la responsabilidad que tenemos todos como creadores y consumidores de tecnología.

Especialmente en el campo del machine learning, es importante tener claro que las máquinas aprenden de los datos suministrados u obtenidos a través de interacciones con humanos. El potencial del aprendizaje automático para ayudar a la sociedad en general es enorme, pero a la par con asombrosas mejoras también aparecen chatbots racistas, algoritmos de recruiting sexistas, etc.

Como decía S. Polyak: “antes de trabajar en inteligencia artificial, ¿por qué no hacemos algo sobre la estupidez humana?” No creo que haga falta auto insultarnos, pero coincido en la necesidad de una base sólida como colectivo humano antes de delegar ciegamente según qué responsabilidades a las máquinas.

 guiem 2

Guiem concentrado mientras le hacíamos la fotografía. 


3. 
Parece una tecnología de futuro pero dime cómo se refleja ya en el presente. ¿Qué casos de uso podemos encontrar hoy?

Bueno, hay infinitas aplicaciones que están en el mercado hoy en día. Cada vez que alguien me pregunta por lo que se puede hacer hoy en día le recomiendo que visite kaggle.com, una plataforma donde los mejores machine learning/data scientists del mundo se reúnen para resolver retos con datos reales, y que explore los problemas que allí se están resolviendo.

Ejemplos actuales:

  • Quora: análisis de datos para predecir si una pregunta de un usuario en la red social de preguntas y respuestas es honesta o simplemente es trolleo.

  • Two Sigma: uso de noticias para predecir la evolución bursátil.

  • Predicción de terremotos.

  • Petfinder: predecir la cuán rápido una mascota será adoptada.

  • Google: predecir cuánto van a gastar sus consumidores.

  • Detección de fallos eléctricos en los postes.

  • Detección de ballenas en fotos para estudios de población.

  • Predicción de precios de vivienda.

  • Detección de cáncer.

  • Reducción de accidentes en vuelos comerciales.

Y un largo etc.

 

4. Cuéntanos cómo fueron tus inicios y cómo conociste a Signaturit.

Siempre que me preguntan, me siento como un abuelito contando sus batallitas. Cuando empecé en el mundo del machine learning, hace poco más de 10 años, el mapa de aplicaciones de machine learning era bastante reducido. ¡Nada que ver con la cantidad de datos que uno puede explorar hoy en día!

En realidad, la inteligencia artificial aplicada generalmente giraba entorno a lo militar. Aunque yo tuve la suerte de trabajar como investigador en la universidad en un proyecto europeo con tecnologías asistenciales. Participé en el desarrollo de un sistema de control compartido entre una persona con dificultades cognitivas y una silla de ruedas capaz de navegar autónomamente.

El truco estaba en conseguir que la silla ayudase en la navegación únicamente cuando una persona necesitaba ayuda (p.ej. alguien que sufre de hemiplejia espacial debido a un ictus y tiene dificultades en los giros a la izquierda).

Fue un proyecto muy gratificante porque en ese momento empezaba a estudiar también la carrera de psicología y eso me permitió entender con más precisión las necesidades reales de los usuarios.

giphy (4)


De vuelta al presente, creo que conocí Signaturit por primera vez como muchos otros: sin darme cuenta. Buscando nuevos retos profesionales di con la oferta de trabajo de machine learning Engineer. En ese momento me di cuenta de que reconocía el logo, y poco después recordé que alguien me había mandado un documento para firmar con la solución de Signaturit dos años atrás.

Me consta que no soy el primer trabajador de Signaturit que ya había usado la plataforma antes de trabajar aquí. Eso me encanta, el contraste: por una parte el proceso de firma digital fue tan natural e inmediato que pasó casi inadvertido, pero por otra parte uno se da cuenta del carácter rompedor de lo que acaba de suceder. Una solución legal que estará en todas partes.

Por eso casi subconscientemente recordaba haber usado Signaturit antes, me atrajo mucho esa especie de omnipresencia sutil de la tecnología desarrollada en Signaturit.

 

5. ¿Cuál es tu área de especialización respecto de machine learning?

Aunque he trabajado en disciplinas muy diversas, que van desde las más cercanas a la robótica y visión por computador, hasta trabajos sobre representación del conocimiento, en los últimos años he estado centrado en Procesamiento del Lenguaje Natural.

Justo antes de aterrizar en Signaturit estaba analizando millones de comentarios en redes sociales para observar tendencias que permitieran predecir dinámicas turísticas.

Intentar que las máquinas entiendan el lenguaje en el que los humanos se comunican es una disciplina que me apasiona. A parte del interés personal por el lenguaje, creo que en el futuro va a ser uno de los pilares de la inteligencia artificial.  

giphy (1)


6. ¿Cómo describirías tu trabajo? ¿Cuál es tu proyecto de machine learning en Signaturit?

A diario, a través de la plataforma de Signaturit pasan miles de documentos para ser firmados. Aunque a simple vista pueda parecer un imposible, hay muchas variables (momento del día, día de la semana, etc.) que permiten predecir si un documento será firmado o no. Los algoritmos de machine learning son especialmente eficaces a la hora de tratar con las cantidades ingentes de datos que se producen en el proceso de firma.

Entonces, mi primer objetivo es obtener un sistema robusto que haga predicciones fiables sobre si un documento será firmado o no. En una segunda fase, si se predice que hay riesgo de que el documento no se firme, trabajamos en un sistema que pueda ofrecer sugerencias al usuario para aumentar la probabilidad de firma.


EU_FLAG

Este proyecto ha recibido financiación del programa de investigación e innovación Horizon 2020 de la Unión Europea en virtud del acuerdo de subvención No 778550



7. ¿Cómo crees que habrán evolucionado las aplicaciones gracias al machine learning en, digamos, cinco años?

Bueno, creo que hay dos posibles escenarios. El primero y más conservativo implica seguir con el ritmo constante de evolución. Lo cual no es poco, porque constantemente van apareciendo nuevas soluciones, estrategias e implementaciones que mejoran los resultados previos en campos como la visión por computador, el procesamiento del lenguaje natural, etc.

Eso se traduce en una constante penetración del machine learning en nuestras vidas cotidianas, mejores asistentes virtuales, mejores y más justos sistemas de reconocimiento facial, mejores sistemas de conducción autónoma, mejores algoritmos de diagnóstico médico, etc.

El otro escenario contempla la posibilidad de que haya un avance que rompa con todo lo anterior. Si bien es cierto que las posibilidades que ofrecen los últimos avances en machine learning en tareas concretas ya han revolucionado el sector tecnológico, es cierto que aún estamos lejos de conseguir una habilidad de aprendizaje general similar a la humana.

De hecho, el mismo Geoffrey Hinton, considerado el padre del Deep Learning, en alguna ocasión ha sugerido descartar todo lo que se ha hecho hasta el momento y empezar de nuevo, “el futuro depende de algún estudiante graduado que sea profundamente escéptico con todo lo que yo he dicho”.

Si se produce algún descubrimiento rompedor que permite nuevas maneras de aprendizaje en las máquinas, podríamos entrar en un marco de evolución muy distinto en la que los cambios y mejoras se producen a una escala temporal muy distinta. Entonces en 5 años podrían pasar cosas que hasta el momento son inimaginables.    
        

guiem 3

Guiem durante una de nuestras reuniones de equipo.

 

8.  ¿Cuál es tu sueño dentro del machine learning?

Me encantaría vivir el momento en el que las máquinas realmente conecten las palabras con el significado. Hasta ahora, los sistemas de procesamiento del lenguaje natural se basan mayoritariamente en la concurrencia estadística. Es lo que se conoce como semántica distribucional y se basa en una hipótesis que establece que las palabras que se usan y aparecen en los mismos contextos comparten significado.

Seguramente las palabras “perro” y “gato” aparecen en contextos más similares que “tigre” y “león”, lo cual permite hacer agrupaciones por significado. Uno puede descargarse el texto de la Wikipedia, alimentar una red neuronal y crear representaciones de las palabras en función de su co-ocurrencia.

Eso ha permitido “jugar” con las palabras de una manera que antes era inimaginable, hasta el punto en el que uno puede hacer operaciones aritméticas con el lenguaje (un famoso ejemplo: “rey - hombre + mujer = reina”).

Sin embargo, todavía estamos lejos de generar un sistema que además de saber usar la palabra “rojo” en el contexto adecuado, entienda las sutilezas de significado que los humanos somos capaces de desplegar (p.ej. “calidez”, “pasión”, etc en el caso del color rojo).

¡Ver resuelto el problema de cómo las palabras (símbolos) se asocian a sus significados sería sin duda un sueño de mi infancia hecho realidad! Seguramente uno de esos cambios más revolucionarios en la historia de la humanidad, porque para que una máquina pueda comprender las sutilezas del lenguaje humano, se tendrán que haber destapado algunos de los misterios de la consciencia.

 giphy (3)



9. ¿Qué es lo que más valoras de trabajar en Signaturit?

Sin duda, la capacidad de crear algo tecnológicamente sólido e innovador desde un entorno tan fresco, ágil y dinámico. Es una gozada trabajar en un entorno así.

Al igual que sucede con el producto desarrollado, el respeto entre compañeros y sentido de pertenencia fluyen de manera tan natural que uno tiende a darlo por sentado. Sin embargo, detrás de ello hay un gran esfuerzo y meticulosidad para que así sea. Desde el minuto cero, uno se da cuenta del gran espíritu colaborativo de todo el equipo.

Relacionado con mi área de trabajo, valoro muchísimo el empeño y ambición que se ha puesto en la parte de innovación. El inconformismo, el tener un ojo siempre puesto en qué más podemos hacer para mejorar lo que ya tenemos.

El aprendizaje en machine learning se basa en la prueba y el error, en probar modelos y más modelos hasta encontrar el que mejor funciona. Esto se alinea perfectamente en Signaturit, donde siempre hay espacio para la experimentación.

10. ¿Cuáles son tus mayores retos en Signaturit?

Ronda por ahí una frase en el mundillo de machine learning aplicado que dice que “el aprendizaje automático en una empresa se compone de un 10% de Data Science y un 90% de otros retos”.

Sin entrar a discutir la veracidad de esos porcentajes, coincido en que una gran parte del trabajo no tiene que ver estrictamente con el uso/creación de algoritmos de aprendizaje. Tras años de experiencia, creo que el mayor reto fuera del ámbito académico siempre gira entorno a encontrar un balance entre la exploración y la explotación del conocimiento.

He visto equipos enteros trabajar investigando y mejorando modelos que cuando han estado listos ya no tenían ninguna utilidad porque el mercado había cambiado totalmente.

Por eso es importante ser siempre consciente de lo que necesita el cliente, estar en contacto con el desarrollo del producto y no desconectar en un mundo de cavilaciones que seguramente intelectualmente pueden ser muy gratificantes, pero poco útiles en el contexto del proyecto en la empresa.    

 

11. ¿Cuáles son para ti las características de un Signabuddy?

Permíteme mantener cierta aura de misterio… Invito a quien quiera conocernos que nos visite y descubra por sí mismo las características de un Signabuddy ;)

grupo

Kickoff de Signaturit el pasado mes de enero

12. ¿Qué recomendarías a los futuros Signabuddies y a los futuros profesionales de tu sector?

Les recomendaría que no dejen pasar esta oportunidad. Estamos en un momento de expansión, pero siempre teniendo en mente mantener la frescura y dinamismo que nos caracteriza. “Pasen y vean”.

Un consejo específico para los futuros profesionales del sector: intentad trabajar siempre en proyectos que os motiven. No os achiquéis ante la complejidad aparente, trabajar en algo que te apasiona siempre da sus frutos.

 

13. ¿Cómo funciona el cerebro de un ingeniero que quiere que las máquinas piensen?

Ni idea, en eso estamos… En mi caso me sirvo mucho de mi perfil un tanto ecléctico, combino una mente analítica cuasi computacional con toques de creatividad y pensamientos fuera de lo establecido.  

Lo bueno del machine learning es que los que estamos metidos en ello venimos de “backgrounds” muy distintos y de motivaciones muy dispares. Mi sesgo, como habréis podido observar roza lo metafísico, pero eso no me impide pasármelo bomba día tras día en el proyecto que aquí tenemos entre manos.

giphy

 


New Call-to-action

Tags: Sobre Signaturit

Subscríbete al blog

Últimos posts