<img height="1" width="1" src="https://www.facebook.com/tr?id=1601661033380488&amp;ev=PageView &amp;noscript=1">

Aprender Ciencia de Datos ¿Elección Competitiva o Mandato Ético?

Blog escrito por: José Hernández Orallo, profesor de la Universidad Politécnica de Valencia y especialista en ciencia de los datos.

¿Crees que Big Data es una milonga y que el volumen, la velocidad y la variabilidad de los datos siempre han estado al límite de lo que permite la tecnología del momento? ¿Piensas que de noche tu vecina está haciendo un curso de ciencia de datos y aprendizaje automático online simplemente porque lo hace todo el mundo? Si crees todo esto, enhorabuena porque estás en lo cierto.
Y estás en lo cierto precisamente porque con la información y el conocimiento se desequilibran batallas, se levantan empresas y se desmoronan patrañas. En todos estos juegos sociales, vence la estrategia. Si tu “adversario” —y permíteme usar este término— utiliza técnicas de aprendizaje automático para analizar la información que le rodea y tú no, estás en desventaja. Esto lo entienden los gigantes tecnológicos: Amazon, Apple, Facebook, Google, Microsoft, y sus semejantes en China.

Así pues, ¿por qué es importante conocer aprendizaje automático y ciencia de datos en el siglo XXI? Simplemente porque, si no lo haces, no comprenderás el mundo. No entenderás cómo se ganan elecciones, cómo se diseñan nuevos fármacos, cuánto sabe tu asistente digital, cómo se ganan y pierden clientes, cómo se crece en una red social, cuánto tarda en llegar tu taxi o cómo funciona el mercado de alquiler. Y, en definitiva, si no entiendes este mundo basado en datos, serás un ciudadano de segunda.

Ciertamente, las organizaciones, para ser competitivas, necesitarán algo más que entender los fundamentos de la ciencia de datos. En un entorno de inteligencia y aprendizaje “adversarios”, las soluciones generan datos sobre los cuales los competidores pueden aprender nuevos patrones, con los que inducir un cambio de dinámica. Pero tan pronto se genera evidencia sobre la nueva situación, puede ser explotada nuevamente y así sucesivamente. Por tanto, el volumen, la velocidad y la variabilidad se refieren al cambio; un cambio acelerado por el análisis adversario de los datos. Una organización, sin un equipo que extraiga conocimiento a partir de los datos que la rodean, fracasará al verse superada (“outsmarted”, diríamos en inglés) por otras que sí saquen partido de la ciencia de datos. Lo del Big Data es la manera que algunos tienen de decir que están a la última en este juego social, al límite de lo que la tecnología y la lógica de su rendimiento marquen en cada momento.

Disponer de un equipo de ciencia de datos o delegar esta tarea a otros puede permitir a una organización ser competitiva, pero no exime a los individuos de la responsabilidad principal de entender el mundo. En un reciente post, Francisco Mejía Uribe recuperaba al filósofo victoriano William Clifford para asegurar que es “una obligación moral el pensar responsablemente, es decir, creer sólo aquello de lo que tenemos suficiente evidencia, y lo que hemos investigado diligentemente”. Para Clifford, no hacerlo sería inmoral por tres razones: porque tomar decisiones erróneas tiene consecuencias negativas sobre uno mismo y sobre los demás; porque convertirnos en unos crédulos sin el necesario espíritu crítico nos reduce a bestias tragaderas; y porque no filtrar la información convenientemente contribuye a contaminar más el pozo del entendimiento colectivo, abarrotado ya de conocimiento mediocre, si no directamente falso. Y Mejía argumentaba que estas razones (y por tanto esta obligación moral) eran todavía más relevantes hoy en día, en un mundo rodeado de big data y fake news.

En total sintonía, hace unos días el Profesor Philip Howard, del Oxford Internet Institute y experto en propaganda computacional, nos daba su definición de lo que es la política: “elegir representantes para que tomen decisiones usando la evidencia”. Se refería a la buena política, porque la otra —que bien conocemos — suele hacer lo contrario: tergiversar la evidencia para que se ajuste a las decisiones políticas.

Tomar decisiones usando la evidencia es precisamente para lo que sirve la ciencia de datosque, al fin y al cabo, nace del método científico. Esta nueva ilustración del siglo XXI de la que habla Steven Pinker necesita de la ciencia de datos, y necesita democratizarla. La nueva ilustración no puede limitarse a que todos tengamos una educación crítica y que podamos acceder a Wikipedia gratuitamente. Requiere que el poder computacional y los datos de los gigantes tecnológicos sean accesibles a la población. Requiere que todos, colaborativamente, podamos descubrir nuestro conocimiento, escrutar diligentemente el de otros y así defendernos de aquellos que intentan superarnos, provocarnos y engatusarnos en todo momento por Alexa, Web y Twitter.
Así que intenta aprender más ciencia de datos, conocer qué es eso del aprendizaje automático y descubrir otras posibilidades de la inteligencia artificial. Si con ello puedes investigar la evidencia que te rodea diligentemente, no sólo harás lo oportuno; harás lo correcto. Pero más aún, preocúpate también de que tus representantes políticos, tus empleados, tus vecinos, tus familiares, tus amigos y tus hijos conozcan un poco sobre ciencia de datos. No es sólo una elección competitiva: es un mandato ético.

Aprende más sobre la ciencia de los datos en: Aprendizaje automático y ciencia de datos.