Encuesta: El dilema ético detrás del copiloto de GitHub

El 29 de junio, GitHub anunció Copilot, un autocompletado impulsado por IA para programadores, lo que generó un debate sobre la ética del código prestado.

GitHub es uno de los repositorios de código más grandes de Internet. Contiene miles de millones de líneas de código, lo que crea un conjunto de datos sin precedentes con el que entrenar la codificación de IA. Esto es exactamente lo que OpenAI ha hecho a través de GitHub gracias a sus propietarios, Copilot capacitado por Microsoft que usa repositorios públicos.

Lo más probable es que aún no haya probado Copilot, porque todavía es solo por invitación a través del complemento VSCode. Las personas que informan que es una herramienta increíble con algunas limitaciones; convierte a los codificadores de escritores en editores porque cuando el código se pega, todavía necesita leerlo para asegurarse de que está en línea con sus intenciones.

Algunos desarrolladores han gritado “sucio” sobre lo que percibieron como extralimitación de una corporación sin temor a infringir los derechos de autor al ofrecer ganancias a largo plazo. También ha habido informes de que Copilot ha derramado datos personales como claves API. Sin embargo, si, como afirma GitHub, la herramienta ha sido entrenada en código fuente abierto, la verdadera pregunta es qué genio mantuvo la clave API en el repositorio público.

La defensa de GitHub fue que le enseñó a Copilot solo el código público y que entrenar a la IA en conjuntos de datos públicos se considera “uso justo” en la industria porque cualquier otro enfoque es prohibitivamente caro. Sin embargo, como informó The Verge, existe una pregunta cada vez mayor sobre qué constituye el “uso legítimo”; TL; DR es que si una aplicación es comercial, entonces cualquier producto de trabajo es potencialmente derivado.

Si un juez decide que el código Copilot es un derivado, entonces cualquier código generado con esa herramienta es, por definición, derivado. De esa manera, podríamos llegar al punto en que necesitamos un archivo people.txt para marcar a todos los que merecen crédito por el sitio o la aplicación. Suena descabellado, pero estamos hablando de un mundo en el que los restaurantes sirven café frío por temor a un litigio.

Hay muchos idealistas (un grupo al que fácilmente se me puede acusar de pertenecer) que tienen debilidad por la red de código abierto impulsada por la comunidad. Y, por supuesto, es justo decir que muchos de los que caminan por los pasillos (o al menos entran en Slack) Microsoft, OpenAI y GitHub comparten las mismas inclinaciones, contribuyendo generosamente a proyectos de código abierto, tutoría, blogs y ofreciendo un pie a otros. codificadores.

Cuando aprendí a codificar HTML, paso uno antes

¡Hola Mundo!

Era ver> desarrollador> ver fuente. Se alentó activamente a la mayoría de los desarrolladores humanos a estudiar el código de otras personas para descubrir la mejor manera de lograr algo; después de todo, así es como surgieron los estándares web.

A algunas personas se les puede deber por su trabajo. Un ejemplo es Robert Penner, cuyo trabajo en funciones de simplificación inspiró a una generación de programadores de ActionScript / JavaScript. Penner publicó sus funciones en Internet de forma gratuita bajo la licencia del MIT; También escribió un libro que me enseñó, entre otras cosas, que un bucle while es mejor que un bucle for, una lección que uso todos los días; me gustaría pensar que las regalías le compraron una pequeña isla caribeña (o al menos una vacaciones allí). uno).

Existe una diferencia importante entre publicar código en Internet y publicar ejemplos de código en un libro, es decir, que se espera que este último esté protegido. Si Copilot duda de que la IA no sea una base de datos de características de búsqueda, su código se deriva de problemas específicos. A primera vista, parece que todo lo que produce Copilot debe ser derivado.

No tengo un repositorio público de GitHub, por lo que OpenAI no aprendió nada de mí. Pero pongámoslo de esta manera. Digamos que publiqué una animación basada en JavaScript de la que Copilot tomó parte de su conocimiento. ¿Microsoft me debe algunas de sus ganancias? ¿Yo, a mi vez, le debo a Penner una parte de la mía? ¿Penner le debe a Adobe (que compró Macromedia)? ¿Adobe le debe a Brendan Eich (el creador de JavaScript)? ¿Le debe Eich a James Gosling (el creador de Java), si no la sintaxis, entonces un nombre? Y mientras estamos en lo que OS Gosling estaba usando a mediados de los 90 para compilar su código, dudo que se le haya puesto el nombre de la fruta.

Si suena a farsa, es porque lo es. Pero este es un problema real, creado por el hecho de que la tecnología avanza más rápido que la ley. Los derechos de propiedad intelectual, definidos antes de la llegada de los ordenadores domésticos, no pueden moldear el futuro basándose en la inteligencia artificial.

La imagen destacada utiliza imágenes de Max Chen y Michael Dzedzic.

Previous post Cómo calcula Google los factores de clasificación
Next post 3 pasos para mejores selectores de cantidad en tu tema de Shopify

Deja una respuesta