¿Qué tan cerca estamos de desarrollar la IA como en la película Her? Truco de Vida y Tiempo Feliz Lifehacker

Este artículo da una idea aproximada de cuán difícil es solo el aspecto conversacional que sigue siendo un gran desafío: Inteligencia artificial: cómo convertir a Siri en Samantha – BBC News. Tenga en cuenta las 2 primeras oraciones en negrita en el artículo:

“Siri, ¿por qué luchas con las conversaciones?”
“No sé a qué te refieres, ¿qué tal una búsqueda en la web?”

No es muy prometedor, ¿no? La cuestión es que todos estos asistentes personales están conectando el reconocimiento del lenguaje con acciones simples que están predefinidas (aunque de una manera potencialmente muy flexible) sin necesidad de analizar el contexto de la conversación; A Cortana de Microsoft le está yendo un poco mejor en este caso, ya que realiza un seguimiento del historial de conversaciones, pero puede perder otras cosas, por ejemplo, no tiene pistas visuales que puedan desempeñar un papel muy importante en la forma en que interactuamos. Solo piense cómo puede reaccionar para “mirar esto” si no tiene forma de ver (que es el caso de todos los asistentes actuales) o simplemente cómo una respuesta simple de su amigo puede cambiar su significado dramáticamente si ve si él es sonriendo, frunciendo el ceño, … Podrías decir “oye, pero esta limitación se debe solo al hecho de que estos programas se limitan solo a la entrada de audio”, tienes razón, pero una vez más, fusionar toda esta información en una forma coalescente es una tarea muy difícil que todavía es ser demostrado de manera significativa. Tomemos como ejemplo nuevamente el “mira esto” cuando algo te dice que tú también tienes:

interpretar la oración (fácil)
correlaciona esto con algo que ves (hey, dijo esto bien)

el 2. comienza a ser problemático ¿cómo se me presenta “esta” cosa? ¿El dedo de mi conversador apunta hacia una dirección (quién es mi conversador por cierto? ¿Lo veo? ¿Este dedo está realmente unido a su cuerpo? …) o está poniendo algo bajo mi campo de visión? todo esto requiere mucho trabajo solo para reconocer imágenes, pero también la conexión de contextos, …
Bu espera: tal vez no quiso decirlo literalmente y solo va a decir más sobre lo que quiso decir. También es posible que lo haya dicho como reacción a un evento pasado (como cuando alguien dice muy estúpido en la televisión y yo digo justo después de “mira esto” aunque ya es demasiado tarde), …

Aaaargh, ¿cómo es que es tan fácil para nosotros hacer todas estas distinciones de situaciones muy diferentes de una manera tan natural?

así que incluso tener una conversación (aún más cuando se relaciona con aspectos filosóficos o sentimientos) no es algo que hagamos muy bien hoy. Por supuesto, tenemos una buena manera de entender palabras y oraciones e incluso producirlas (aunque la mayoría de la síntesis de voz, aunque es muy impresionante, sigue siendo muy monótona y no se acerca al rango de sentimientos que una actriz talentosa como Scarlett Johansson estaba infundiendo, lo que nuevamente son pistas importantes eso puede ayudar a reunir el contexto) pero luego, como el artículo menciona que una conversación no es “pregunta y te doy una respuesta”, es más como una danza intrincada donde el significado de lo que se dice actualmente se ve afectado por el contexto más amplio de lo que se dijo antes de.

Otro aspecto que hace “Ella” y que aún no he visto de manera significativa en un robot de conversación es su capacidad para interactuar de manera proactiva. ella no esperó a que Theodore pidiera algo o incluso comenzara la conversación, je fue proactiva y decidió de qué se trataba la conversación (ni siquiera la conversación, incluso decidió traer a una mujer a sus relaciones de la nada). No puedo imaginarme nada hecho hasta ahora (ya sea en un simple procesamiento de lenguaje / chat bot o AI) que se acerque a tales acciones u objetivos emergentes. Por supuesto, verá que el robot de chat se inserta cuando deja de hablarles un comentario pasivo como “¿estás ahí?” pero nada que realmente comience espontáneamente para conducir la interacción hacia una meta que surgió. De hecho, la emergencia de objetivos sigue siendo un problema que al menos un subgrupo de investigadores de IA intenta explorar y, por lo poco que he visto, sigue siendo muy filosófico, sin un enfoque significativo y / o dominante.

Luego viene el aspecto de que presenta empatía y tiene sentimientos (hasta el punto de que se enamora de su dueño), esto es algo por lo que el campo apenas rascó la superficie y queda por ver qué tan bien podría igualar a los humanos . Específicamente, la empatía es un aspecto difícil ya que nuestra empatía es, al menos parcialmente, dependiente de nuestra propia experiencia: puedo entender lo que siente este tipo porque, como humano, puedo relacionarlo con una experiencia o conjunto de experiencias que tuve. ¿Puede aplicarse a una entidad que no es humana y no está gobernada por la misma condición que nosotros? Tal vez, pero luego explique por qué mi empatía funciona tan mal con otros mamíferos. Por ejemplo, mientras me siento atraído por un elefante sonriente como el dumbo de Disney, también aprendí más tarde en mi vida que cuando un elefante hace esa expresión está a punto de cobrar … no es lo que esperaba 😀 pero una vez más alguien me ha hecho una broma al hacerlo El punto es que tengo dificultades para saber cómo se siente el elefante a pesar de que se los considera animales muy inteligentes.

En términos de tecnología actual, los enfoques actuales en los que puedo pensar están más cerca de tener en cuenta a los humanos sobre el por qué interactúas con ellos que realmente presentar empatía o emoción. Actualmente se ve mucho trabajo en Europa sobre los planes con conciencia humana, se trata más de acciones de producción que son fácilmente interpretables para los humanos (basadas en reglas predefinidas nuevamente muy flexibles, pero no se basan en la experiencia que se acaba de dar al sistema). También puede encontrar personas que trabajan con emociones o incluso cognición del desarrollo, inspiradas por lo que sabemos de nuestro propio desarrollo, pero estos campos permanecen en una etapa muy temprana.

Y esta lista de cosas que “todavía no existen” en términos de investigación de vanguardia (es decir, cosas que aún no se consideran para un producto y que pueden, o no, usarse en un tiempo que podría ser de 5 a 10 años en el futuro) solo está rascando la superficie de todas las otras cosas que “ella” presentaría. Tenga en cuenta que la mayoría de las cosas que discutí son solo sobre el aspecto de la conversación (incluso las diría todas) pero, sin embargo, en la película está haciendo muchas más cosas que van más allá de solo conversar, está tomando acciones que ni siquiera se hablan ( lo que significa que ella habría aprendido o identificado lo que Theodore o su cliente normalmente esperan mientras, por ejemplo, escribir una carta en términos de formato, …), su configuración para ajustarse a lo que se publicita como “asistente perfecto” se realiza en base a un interacción rápida con el usuario (una entrevista es más larga que eso y rara vez resulta en el empleado ideal), por supuesto, podría ser que tuvo suerte, pero una vez más, adaptar todo esto de una manera tan simple e inmediata es muy difícil, incluso teniendo en cuenta que de hecho somos “un copo de nieve único” y por “único” quiero decir que somos los únicos que realmente creemos que somos. Y la lista seguiría y seguiría con todas las cosas que ves que “ella” hace a la perfección y, sin embargo, están fuera de nuestro alcance en este momento (y no lo digo en serio).

No puedo dar ninguna escala de tiempo (ni quiero anclar una línea de tiempo a algo que no tenemos idea de cómo podría resolverse es tan estúpido como averiguar la fecha de nacimiento de una persona sin más información que su apariencia) pero sí, no estamos cerca de tener algo como “Ella” en el corto plazo. Por supuesto, siempre existe la posibilidad de una tormenta perfecta de descubrimiento, pero esto ocurre muy raramente (ni siquiera estoy seguro de que realmente ocurriera una vez en cualquier campo … muchas veces cuando miras más en profundidad, ves que los pocos representados tienen más que ver con visión romántica de “eureka” y tienden a ignorar que muchos otros estaban haciendo los progresos que conducen a la solución genial).