
ChatGPT y otros sistemas de IA se están preparando para lanzar el tercer paradigma de interfaz de usuario en la historia de la informática: el primer nuevo modelo de interacción en más de 60 años.


Contenido del Articulo
Los dos primeros paradigmas
Paradigma 1: procesamiento por lotes
Desde el nacimiento de las computadoras alrededor [1945[1945г, primer paradigma de interfaz de usuario fue el procesamiento por lotes. En este paradigma, los usuarios definían un flujo de trabajo completo para todo lo que querían que hiciera la computadora. Este lote de instrucciones se enviaba al centro de datos (a menudo en forma de una baraja de tarjetas perforadas) y se procesaba en un momento no especificado, a menudo durante la noche.
Más tarde, a menudo a la mañana siguiente, los usuarios recogían el resultado de su lote: normalmente un pliegue grueso de impresiones, pero también podía ser una nueva baraja de tarjetas perforadas. Si el lote original contenía el más mínimo error, no habría conclusión o el resultado no tendría sentido.
Desde el punto de vista de la interfaz de usuario, el procesamiento por lotes no requiere ningún intercambio de datos entre el usuario y la computadora. La interfaz de usuario era el único punto de contacto: este paquete de tarjetas perforadas. La facilidad de uso era terrible y, por lo general, tomaba varios días ajustar el paquete hasta el punto en que producía el resultado final deseado.
Paradigma 2: Diseño de interacción basado en comandos
Alrededor 1964el advenimiento del tiempo compartido (cuando varios usuarios compartían el mismo mainframe a través de terminales conectados) condujo a segundo paradigma de interfaz de usuario: interacción del equipo. En este paradigma, el usuario y la computadora se turnaban para ejecutar un comando a la vez. Este paradigma es tan fuerte que ha dominado la informática desde entonces, durante más de 60 años.
La interacción basada en comandos fue el enfoque principal durante tres generaciones tecnologías de interfaz de usuario: líneas de comando (como DOS y Unix), terminales de texto de pantalla completa (comunes a los mainframes de IBM) e interfaces gráficas de usuario (GUI: Macintosh, Windows y todas las plataformas modernas de teléfonos inteligentes). Realmente potente y duradero.
La ventaja de la comunicación basada en comandos sobre el procesamiento por lotes es obvia: después de ejecutar cada comando el usuario puede reevaluar la situación y cambiar futuros comandos avanzar hacia la meta deseada.
De hecho, los usuarios ni siquiera necesitan tener en mente un objetivo completamente definido, porque pueden ajustar su enfoque a un problema a medida que obtienen más información de la computadora y ven los resultados de sus comandos iniciales. (Al menos, este es el caso si el diseño sigue la primera de las 10 heurísticas de usabilidad: visibilidad del estado del sistema). Los primeros sistemas de línea de comandos a menudo no mostraban el estado actual del sistema, lo que resultaba en una usabilidad terrible. Por ejemplo, en Unix, ninguna noticia se consideraba una buena noticia porque solo recibía comentarios de la computadora si su comando generaba un mensaje de error. Sin errores significaba que no había información de la computadora sobre el nuevo estado, lo que dificultaba que los usuarios escribieran el siguiente comando.
La belleza de las interfaces gráficas de usuario es que muestran el estado después de cada comando, al menos si están bien diseñadas. Interfaz gráfica de usuario dominada por UX mundo desde el lanzamiento de Macintosh en 1984: alrededor de 40 años de excelencia hasta que quizás sea reemplazada por la próxima generación de tecnología de interfaz de usuario y, lo que es más importante, el próximo paradigma de interfaz de usuario en forma de inteligencia artificial.
El último paradigma
Paradigma 3: Especificación de resultados basada en la intención
Dudo que el conjunto actual de herramientas de IA generativa (como ChatGPT, Bard, etc.) represente las interfaces de usuario que usaremos en unos años, porque tienen problemas de usabilidad profundamente arraigados. Sus preocupaciones llevaron al desarrollo de un nuevo rol, el “Ingeniero Operacional”. Los ingenieros rápidos están ahí para hacer cosquillas a ChatGPT en el lugar correcto para que produzca los resultados correctos.
Este nuevo rol me recuerda cómo solíamos necesitar especialistas en consultas especialmente capacitados para buscar en vastas bases de datos de investigaciones médicas o casos judiciales. Luego apareció Google y cualquiera podía buscar. Se necesita el mismo nivel de usabilidad para estas nuevas herramientas: un mejor uso de la IA debería ser una ventaja competitiva significativa. (Y si planea convertirse en ingeniero de operaciones, no cuente con una carrera larga).
El estilo actual de interacción basado en el chat también adolece de requerir que los usuarios expresen sus preocupaciones en un texto prosaico. Según un estudio de alfabetización reciente, creo que es probable que la mitad de la población de los países ricos no sea lo suficientemente articulada como para obtener buenos resultados de uno de los bots de IA actuales.
Sin embargo, Interfaz de usuario de IA representa un paradigma diferente de la interacción humano-computadora, un paradigma que es muy prometedor.
Como mencioné, en la interacción basada en comandos, el usuario emite comandos a la computadora uno a la vez, lo que conduce gradualmente al resultado deseado (si el diseño es lo suficientemente fácil de usar para que las personas puedan descubrir qué comandos ejecutar en cada paso) . La computadora es completamente obediente y hace exactamente lo que se le dice. La desventaja es que la mala usabilidad a menudo lleva a los usuarios a ingresar comandos que hacen algo diferente a lo que realmente quieren.
Con nuevos sistemas de IAel usuario ya no le dice a la computadora qué hacer. hacer. más rápidoel usuario le dice a la computadora qué resultado quiere. De este modo, el tercer paradigma de interfaz de usuario representado por la IA generativa actual, especificación del resultado basado en la intención.
Un ejemplo simple de información sobre herramientas para un sistema de IA:
Hazme un dibujo adecuado para la portada de una popular revista de ciencia ficción, que muestre a un vaquero con un traje espacial en un planeta sin aire con dos lunas rojas en el cielo.
¡Intenta pedir Photoshop alrededor de 2021 para hacerlo! En ese momento, emitiría cientos de comandos para resaltar gradualmente la ilustración. Bing Image Creator me dio cuatro imágenes sugeridas en cuestión de segundos hoy.

Con este nuevo paradigma de interfaz de usuario introducido por la IA generativa moderna, el usuario le dice a la computadora el resultado deseado, pero no especifica cómo se logrará ese resultado. En comparación con la interacción de equipo tradicional, este paradigma cambia completamente el lugar de control. Dudo que debamos describir esta experiencia de usuario como “interacción” porque no hay cola ni progreso incremental.
Sin embargo, en mi ejemplo ilustrativo de ciencia ficción, no me siento cómodo con los trajes espaciales. Esto se puede solucionar con otra ronda de IA. Estas rondas de refinamiento incremental son una forma de interacción que actualmente tiene poco soporte, lo que brinda una amplia oportunidad para mejorar la usabilidad para aquellos que Proveedores de IA que se preocupan por la investigación de usuarios para encontrar mejores formas para que la gente común controle sus sistemas.
Haz lo que quiero decir, no lo que digo paradigma de interfaz de usuario seductora: como se mencionó, los usuarios a menudo le dicen a la computadora que haga lo incorrecto. Por otro lado, poner el locus de control completamente en la computadora tiene sus inconvenientes, especialmente con la IA actual, que propensión a incluir información errónea en sus resultados. Cuando los usuarios no saben cómo se hizo algo, puede resultarles más difícil identificar o solucionar el problema.
El paradigma basado en la intención no se eleva al nivel sistemas sin mando, que presenté en 1993. Un verdadero sistema sin comando no requiere que el usuario indique su intención porque la computadora actúa como un efecto secundario de las acciones normales del usuario.
Como ejemplo, considere desbloquear un automóvil tirando de la manija de la puerta: este es un desbloqueo no ordenado, ya que el usuario realizará la misma acción ya sea que el automóvil esté bloqueado o desbloqueado. (Por el contrario, un automóvil controlado por reconocimiento de voz podría abrir la puerta porque el usuario dijo: “Quiero que se desbloquee el automóvil”, lo que sería una especificación de resultado basada en la intención. Y un automóvil antiguo podría ser conducido por un comando explícito para abrir la puerta, insertando y girando la llave).
No está claro si los sistemas de IA pueden lograr una alta usabilidad dentro del paradigma de especificación de resultados de intención. Lo dudo porque soy un gran admirador de las interfaces gráficas de usuario. La información visual suele ser más fácil de entender y más rápida para interactuar que el texto. ¿Puede completar un formulario largo (como una solicitud de cuenta bancaria o una reserva de hotel) mientras chatea con un chatbot, incluso uno tan inteligente como las nuevas herramientas generativas de IA?
Hacer clic o tocar objetos La pantalla es un aspecto intuitivo e importante de la experiencia del usuario que no debe pasarse por alto. Por lo tanto, el segundo paradigma de la interfaz de usuario sobrevivirá, aunque con un papel menos dominante. Es probable que los futuros sistemas de IA tengan interfaz de usuario híbrida que combina elementos de interfaces basadas en intenciones y basadas en comandos al tiempo que conserva muchos elementos de la GUI.