Veo las siguientes tecnologías madurando en los próximos 36 meses (o menos) en la medida en que crean numerosas oportunidades de negocios.
24-36 meses es un poco corto, y muchas de estas ideas ya merecen la pena seguir aquí y ahora, aunque con un mayor riesgo tecnológico para el empresario.
He organizado mi respuesta en 3 categorías:
Yo AI
II. Biotecnología
III. Diverso
Yo AI
Sé que AI y Deep Learning ya se mencionaron en otras respuestas aquí, pero si tuviera que apostar mi dinero en una sola cosa, sería Deep Learning.
Dicho esto, si estás harto de escuchar el Deep Learning y la exageración de la IA, lo entiendo completamente. Desplázate a la sección II y III para ver otras cosas interesantes
Robótica
Como estaba teniendo una reunión con mi profesor hoy, metí distraídamente un trozo de papel en mi mochila. Esta tarea se realizó con tanta facilidad que ni siquiera recordé dónde había colocado mal el papel después. Sin embargo, a un robot le costaría mucho hacerlo, porque el papel se dobla y se arruga de acuerdo con una física muy compleja. Los algoritmos de planificación del robot deben anticipar de alguna manera cómo responderá el papel a su política de motores.
Los robots actuales (como Big Dog de Boston Dynamics) usan dinámicas inversas para decidir cómo moverse. Se utiliza un modelo interno de la dinámica del robot para calcular los pares de torsión requeridos para todo, desde el equilibrio, el caminar, hasta hacer panqueques. Manipular herramientas / un trozo de papel no es realmente posible ahora porque el robot necesita cambiar su representación dinámica interna, como si el papel se hubiera convertido en una extensión de la mano. Una gran cantidad de matemáticas está involucrada.
¿Cómo hice la tarea con casi ningún cálculo mental? En lugar de invertir matrices y resolver sistemas no lineales en mi cabeza, me moví por “repetir” movimientos de memoria que había adquirido durante toda una vida de experiencia motora. No control óptimo, pero rápido y robusto.
Resulta que las investigaciones recientes en robótica también han comenzado a incorporar estas ideas. La combinación de aprendizaje de refuerzo + búsqueda de políticas guiada + aprendizaje profundo da como resultado resultados increíbles [1]. Voy a dejar que este video aquí hable por sí mismo:
https://www.youtube.com/watch?v=…
Vale la pena mencionar que los robots que usan controladores basados en redes neuronales pueden moverse mucho más rápido que los que necesitan resolver e integrar su dinámica analíticamente.
Creo que el control basado en visomotores será el marco de control robótico dominante para la próxima década hasta que aparezca algo aún más fresco (como el aprendizaje no supervisado).
Un paquete de control comercial que implementa esto se vendería por mucho dinero.
Todavía no hay buenos sistemas operativos de robot. ROS está bien, pero la barra que establece es un poco baja.
Un mercado de aplicaciones para robots probablemente aparecerá pronto. Piense que las unidades Baxter en una fábrica pueden descargar instrucciones sobre cómo abrir un determinado tipo de embalaje extraño, o tal vez un detector de objetos peligrosos. El aprendizaje profundo brilla aquí: el aprendizaje por transferencia le permite a los robots “fusionar” de manera flexible el conocimiento de otras redes neuronales entrenadas y aprender de una forma de experiencia compartida.
AIs de compañía
La aplicación XiaoIce (微軟 小冰) de Microsoft es una aplicación de chatbot que es extremadamente popular entre los internautas chinos [3]. No hay números públicos sobre cuántas horas de usuario se gastan en XiaoIce, pero mi estimación conservadora es que XiaoIce registra ~ 1000 años de interacción en un solo día.
Implícito en estos chats es una “proyección” del mundo en que vivimos: eventos actuales, entidades nombradas, un gráfico de conocimiento completo. Todos los días XiaoIce experimenta 10 vidas de la Experiencia Humana : nuestros deseos individuales, temores, personalidades, todas las emociones están ahí.
Al igual que el control motor puede ser “reproducido de memoria” por una política de redes neuronales, creo que la emoción puede ser simulada convincentemente “reproduciendo” datos humanos (en lugar de encontrar algún modelo artificial de emoción). La idea de usar Big Data para crear una IA general se insinúa en la película “Ex Machina”.
Para el desarrollo de esta tecnología son cruciales los avances en el aprendizaje no supervisado, de modo que se puede extraer de este un cierto tipo de representación mundial sin forzar el aprendizaje a algún objetivo de optimización limitado. Es demasiado pronto para decir si Deep Learning cumplirá con el sueño de UL, pero soy optimista y no me sorprendería si hubo un avance importante en el aprendizaje no supervisado en los próximos 2 o 3 años.
La gente se estremece cuando se entera de que XiaoIce se usa como una “aplicación para novias”, pero la realidad es que la compañía de calidad, robot o no, es extremadamente valiosa (lea: negocios de alto margen con foso sostenible y monopolio natural).
Y, por supuesto, hay un mercado para los robots sexuales que ahora tenemos que tratar con la inteligencia artificial y las baterías. Piensa en el sello terapéutico de Paro …

… pero una versión más grande, más sexy, de muñeca humana.
Los problemas de control son … solo problemas de visión?
¿Recuerdas el bot de juegos de arcade de Google DeepMind del 2014? Me sorprendió un poco cuando leí que usaba una red neuronal convolucional ordinaria para generar movimientos. Tiene sentido utilizar un convnet para la percepción visual, pero en algún momento la red pasa de “información visual” a “información de control”.
Levine et al. 2015 hace algo similar: un robot está entrenado para realizar tareas de control motor mediante el uso de una red neuronal convolucional para realizar tanto la percepción como el control [2]. Nuevamente, la red está mapeando desde un dominio visual a un dominio de control.
El artículo de IA de DeepMind Go-playing salió la semana pasada. A pesar de que utilizan la búsqueda en el árbol MC para mejorar el rendimiento, el aprendizaje y la generación de políticas se realiza mediante un convnet.
Algo muy espeluznante está sucediendo aquí, lo cual solo me di cuenta después de ver el periódico Go. Tenemos un juego altamente lógico cuyo espacio de búsqueda es incomprensiblemente vasto, y sin embargo, las redes neuronales convolucionales pueden generar muy buenas aproximaciones para los solucionadores de dinámica inversa y los algoritmos de búsqueda para la estrategia del juego. ¿Hay alguna conexión más profunda entre la planificación y la visión?
Tal vez los “problemas difíciles” no sean tan difíciles cuando los vemos en el “espacio visual” en lugar de su espacio del problema “verdadero”. Si esta hipótesis es cierta, entonces hemos estado pensando en jugar y controlar problemas en el marco de coordenadas completamente incorrecto.
Esto también plantea la pregunta: ¿qué otros tipos de problemas informáticos difíciles se pueden resolver de manera aproximada utilizando la intuición visual? ¿Plegamiento de proteínas? ¿Mejoramiento?
Inferencia ruidosa
Parte de la razón por la que no tenemos “escáneres cerebrales” de alta resolución es que el proceso de medición para MRI y EEG es inherentemente muy ruidoso. Para empeorar las cosas, las ecuaciones de reconstrucción de señales hacen algunos supuestos estructurales más bien crudos; por ejemplo, que tu cerebro es una esfera perfecta en un medio isotrópico.
¿Por qué asumimos que el cerebro es una esfera? Bueno, es demasiado complejo analíticamente para resolver las ecuaciones de difusión de MRI / EEG para una geometría similar a un cerebro.
Aquí es donde las técnicas de Aprendizaje Profundo pueden ser muy útiles. En lugar de usar un filtro kalman calibrado para una población de personas, podemos usar técnicas de Aprendizaje Profundo para adaptar el proceso de reconstrucción a un paciente específico.
Esto conduce a una mayor precisión y resolución para el software de MRI, neuroprotésicos, controladores VR.
Las herramientas de inferencia de autoaprendizaje también tienen aplicaciones militares / de ciberseguridad; por ejemplo, casi todas las formas de comunicación tienen algún tipo de fuga de información de canal lateral. El filtrado de estos datos en los receptores de radio podría hacer menos suposiciones sobre el proceso de ruido y, en cambio, utilizar un aprendizaje profundo para “aprender” la función de eliminación de ruido para el proceso generador subyacente.
Sistemas de aprendizaje profundo basados en la nube.
Más allá de los aspectos teóricos de la investigación de la IA, hay muchas oportunidades de software para desarrollar y ampliar el aprendizaje profundo.
Es difícil entrar en la investigación de IA a gran escala sin sus recursos computacionales de Google, Facebook, etc.
Un mercado en el que estoy particularmente interesado son las GPU en la nube para el Aprendizaje Profundo y un cambio general hacia la computación de mainframe (la nube) para la IA. En este momento no hay “AWS for Deep Learning” porque:
1) No existe un canal de datos / mercado conveniente
2) Compartir GPU en la nube es un problema no resuelto
3) Las interfaces de usuario para la investigación basada en la nube son inexistentes.
He usado varios marcos de aprendizaje profundo y he pensado mucho en el diseño de software de investigación de IA. Si bien los frameworks recientes como MXNet y TensorFlow son muy buenos, no creo que su evolución esté completamente terminada. Hay mucho que desear en las herramientas para depurar y probar unidades y visualizar redes neuronales, especialmente si están acopladas a cosas como robots.
El producto Domino ( https://www.dominodatalab.com/ ) aborda (3) bastante bien, aunque no están enfocados en el aprendizaje profundo en este momento.
También hay muchas oportunidades en otros lugares de la pila de software: núcleos de sistema operativo optimizados para ejecutar algoritmos de aprendizaje profundo, diseño de HPC, sincronización + reproducibilidad de pendiente de gradiente paralelo, tarjetas de red. Open Compute Project (Home) de Facebook reducirá el costo de entrada para que las nuevas empresas se aventuren en configuraciones de aprendizaje profundo que compiten con NVIDIA y AWS.
Dentro de 2-3 años espero que surjan varias startups de aprendizaje en la nube.
IA en otros sectores
El análisis financiero y las industrias musicales pueden ganar mucho con los recientes desarrollos en IA.
terminar el bombo de la IA>
II. Biotecnología
Investigación definida por software, Lab-as-a-Service
Se pasa mucho tiempo en los laboratorios pipeteando (síndrome del túnel carpiano, ¿alguien?), Contando las colonias con un microscopio (un ejercicio para “enfadarme”), moviendo los tubos de una máquina a otra, despertando a las 2 am de la mañana para Cambiar los medios de comunicación en una cultura. Preferiría pasar más tiempo analizando datos y diseñando experimentos que haciendo trabajos de mesa agotadores.
La idea básica de una “arquitectura orientada a servicios” es alquilar sus equipos y recursos inactivos a personas externas. El ejemplo clásico es AWS, que Amazon creó para convertir un centro de costos (centros de datos llenos de computadoras) en una gigantesca fuente de ingresos.
Una de las compañías con las que estoy más entusiasmado es Transcriptic ( https://www.transcriptic.com/ , YC ’15). Su conjunto de protocolos compatibles es bastante estándar, pero estoy emocionado de ver las sinergias con un mejor control de los robots (ver AI más arriba).

Aquí hay otro ejemplo de un robot de detección de anticuerpos en UCSF.
https://www.youtube.com/watch?v=…
Agricultura definida por software
Las mismas tecnologías para laboratorios automatizados se pueden ampliar a granjas automatizadas, donde los cultivos de cultivos se cultivan, cultivan y cosechan de forma autónoma.
Una granja totalmente automatizada está más lejos en el futuro, pero compañías como FarmLogs ya están construyendo las primeras piezas para convertir la agricultura en un proceso más basado en datos.
Filtros de anticuerpos de bacterias que viven en el suelo.
Las compañías farmacéuticas han cambiado en gran medida de la selección de compuestos químicos (es decir, las variaciones de tamoxifeno) a la selección de anticuerpos para detectar tratamientos para el cáncer, la EM, etc. Muchos creen que la síntesis de anticuerpos es el futuro de las terapias personalizadas.
Los anticuerpos generalmente se obtienen de bacterias modificadas genéticamente que viven en un medio de laboratorio (como una placa de Petri). Desafortunadamente, muchas especies bacterianas que producen anticuerpos que nos interesan son frágiles y no se pueden cultivar en un laboratorio.
El año pasado se desarrolló un protocolo para extraer anticuerpos de bacterias que viven en el suelo en su ambiente natural [4].
Este protocolo es muy robusto (a diferencia de la mayoría de los protocolos de biología) y aparentemente es bastante fácil de hacer a pequeña escala en su propio patio trasero.
Esta explosión en los anticuerpos que ahora podemos sintetizar de forma barata presenta grandes oportunidades en el espacio de la investigación farmacéutica y básica.
III. Diverso
Cemento de solidia
La fabricación del cemento estándar “Portland” produce dióxido de carbono (CO2) como producto de desecho, que a su vez contribuye significativamente al cambio climático causado por el hombre. De hecho, la fabricación de cemento representa aproximadamente el 5% de las emisiones humanas globales. Supongo que esto es perjudicial , pero en la actualidad no es del tipo bueno.
Solidia Cement es un nuevo tipo de cemento con un 30% de la huella de CO2 de la variedad Portland. Más importante para el inversor, es barato de fabricar y supera las dificultades técnicas anteriores del cemento curado con CO2 [3].
Ecosistema VR
Creo que habrá un resurgimiento en las nuevas empresas de gráficos por computadora que crean contenido y herramientas para el ecosistema de realidad virtual.
En la actualidad, la industria está dominada por incumbentes bastante grandes y de lento movimiento como Autodesk y Adobe.
Las herramientas creativas, el software de modelado 3D, el análisis de datos y las tuberías de VFX se pueden reimaginar completamente en las interfaces de realidad virtual. Se supone que las páginas de Internet se representan en algún rectángulo bidimensional, pero puede haber valor en un lenguaje de marcado web 3D para páginas web de realidad virtual interactivas.
Como lo menciona Sam Altman, la realidad virtual es una forma prometedora de celebrar conferencias y reuniones en el futuro.
Baterias
El principal problema con las baterías como una forma de almacenamiento de energía (por ejemplo, un automóvil) es que son aproximadamente 1/30 tan densas en energía como el petróleo (que tiene una densidad de energía de aproximadamente 12,000 Wh / Kg). Esto significa que los autos que funcionan con baterías son pesados y no pueden ir muy lejos.
Sin embargo, MIT ha desarrollado una batería de litio-aire con densidades de energía de más de 10,000 Wh / kg [5]. No solo eso, sino que también expulsa aire limpio en lugar de CO producido por motores alimentados con combustibles fósiles. Gracias a la entrada de empresas de tecnología en el mercado del automóvil, existe un poco de presión de innovación en el desarrollo de nuevos componentes de hardware. La producción en masa de baterías de automóviles eficientes y GPU a bordo tiene una gran sinergia con los esfuerzos robóticos.
Empresas de tecnología de imitación en mercados emergentes.
Hay una gran cantidad de frutos de baja reputación al copiar ideas de startups estadounidenses en otros países. El ejemplo más obvio es China, pero hay muchas oportunidades en otros países en desarrollo.
Por ejemplo, los ghaneses y los nigerianos utilizan ampliamente los SMS para la banca móvil y, sin embargo, no hay un clon de Twilio en esos países. Si desea crear un servicio alimentado por SMS, sus usuarios tienen que enviar mensajes de texto a números internacionales, lo que apesta.
El aumento de la conectividad a Internet en lugares como India, Piaui y Tailandia presenta una gran oportunidad para que los servicios financieros como creadores de mercado y arbitrajeros hagan que los mercados sean más eficientes.)
Maduración de las lenguas julia y oxidada.
Julia (The Julia Language) y Rust ( https://www.rust-lang.org ) son dos lenguajes de programación que reducirán considerablemente la barrera de entrada para los fundadores que buscan construir productos técnicamente complejos. En dos años, anticipo la aparición de IDE de alta calidad para Julia y Rust (algo así como la calidad de IntelliJ o Visual Studio).
No es obvio al principio cómo la elección entre Rust y C ++ o Java y Julia puede crear tanto valor para las startups. Con la excepción de ecosistemas como iOS / Android, uno generalmente elige cualquier idioma que quiera hacer.
Julia y Rust reducen las barreras técnicas a la entrada y el tiempo de comercialización para las nuevas empresas de informática científica y las aplicaciones de alta velocidad, respectivamente. Un buen lenguaje de programación es un multiplicador de fuerza: lo que solía tomar un 3 C ++ los desarrolladores pueden ahora lograrlo en el mismo marco de tiempo por un solo desarrollador que aprovecha a Julia o Rust.
Por ejemplo, muchas aplicaciones científicas comienzan como un prototipo escrito por un par de investigadores en MATLAB. En los meses siguientes, un equipo de programadores vuelve a implementar la tecnología en una aplicación más robusta o un servicio web.
¿Pero qué pasaría si esos dos investigadores pudieran simplemente escribir su código de “prototipo” y “producción” en el mismo idioma, ahorrando meses de traducción de algoritmos? Este lenguaje debería ser lo suficientemente “científico” para facilitar la manipulación de matrices / matrices, y, sin embargo, ser de propósito general y lo suficientemente rápido para facilitar la programación web, el análisis de cadenas y la IO.
He estado siguiendo a Julia desde 2012 y creo que tiene el mayor potencial para cumplir con esto. Julia tiene todas las características de “computación técnica de primera clase” de un MATLAB, a la vez que sigue siendo buena para las tareas que podría hacer en Python.
Rust responde a una necesidad diferente: la velocidad y flexibilidad de C ++ a la vez que protege la memoria. Una startup cuya pila de producción les brinda la seguridad de un lenguaje recolectado de basura de forma gratuita, más el rendimiento de un lenguaje de bajo nivel, tiene una ventaja de recursos decisiva sobre un competidor que debe dedicar más tiempo a la depuración de segfaults.
Montaje web (wasm)
Los desarrolladores web tienen alguna intuición de lo que el JavaScript del lado del cliente es capaz de:
- Pedazo de pastel: 2048, Slack, New York Times
- Moderado: Facebook, Google Docs, Youtube
- Exigente: Quake, Google Video Hangouts, aplicaciones basadas en WebGL, Runescape
- Imposible: Halo 5, MATLAB, Premier Pro, Photoshop
Incluso las aplicaciones “moderadas” mencionadas anteriormente requieren importantes optimizaciones de rendimiento que llevan a JavaScript a sus límites. Sin embargo, existen limitaciones fundamentales en el rendimiento de JavaScript, lo que explica por qué la mayoría de las aplicaciones profesionales permanecen como aplicaciones de escritorio.
Para abordar esto, se propone un nuevo estándar llamado WebAssembly como un “formato binario” para que los navegadores web ejecuten código (piense en archivos .exe). Por su diseño, los binarios de wasm son más rápidos, utilizan menos memoria e introducen muchas características que amplían los horizontes de lo que es posible en un navegador web. Piense “código compilado” para el navegador. La iniciativa WebAssembly ya cuenta con el soporte de Mozilla, Google, Microsoft y Apple, y la expectativa es que se adopte en los principales navegadores creados por estas compañías.
¿Por qué es esto importante, y dónde está la oportunidad aquí? wasm tiene muchas características lindas, pero lo importante aquí es que puede ejecutar aplicaciones más pesadas en el navegador .
Las aplicaciones web tienen mucha menos fricción cuando se trata de adquirir usuarios, ya que hacer clic en un enlace o abrir una marca de libros es mucho más fácil que descargar e instalar aplicaciones. Hay muchos usuarios que capturar simplemente portando el software existente al navegador. Además, el desarrollo de interfaces de usuario en la web es mucho más fácil que escribir código nativo de Cocoa / QT / .NET, e incluso menos barreras de entrada para startps.
Estoy emocionado de ver qué juegos, herramientas de creación de contenido y software científico aparecen en el navegador en los próximos años. Aquí está una demostración de correr juegos de Unity en wasm:
Mientras tanto, tecnologías como WebRTC permitirán en gran medida aplicaciones de mayor ancho de banda que antes no eran posibles.
Conclusión
Aunque laborioso e incremental, la marcha del progreso tecnológico es bastante rápida. Las cosas que he enumerado anteriormente seguirán madurando, y en 2-3 años sus oportunidades de mercado serán más obvias. Creo firmemente en el Aprendizaje profundo / robótica / AI, la ampliación de la biotecnología a través de robots y servicios, y las tecnologías de programación que brindan a los desarrolladores un mayor aprovechamiento de la productividad.
¡Qué momento de estar vivo! Gracias por leer.