Los creadores de ChatGPT han expresado las preocupaciones de que los modelos de IA Deepseek de China, conocidos por su asequibilidad, pueden haberse desarrollado utilizando datos de OpenAI. Esta semana, el ex presidente Donald Trump etiquetó a Deepseek como una "llamada de atención" para el sector tecnológico de los Estados Unidos, especialmente después de que Nvidia experimentó una asombrosa caída de $ 600 mil millones en el valor de mercado.
El lanzamiento de Deepseek provocó una fuerte disminución en las acciones de empresas profundamente involucradas en la inteligencia artificial. NVIDIA, líder en el mercado de GPU esencial para las operaciones de IA, vio sus acciones desplegables en un 16,86%, marcando la mayor pérdida de un solo día en la historia de Wall Street. Otros gigantes tecnológicos como Microsoft, Meta Platforms y la empresa matriz de Google Alphabet experimentaron disminuciones que van del 2.1%al 4.2%, mientras que Dell Technologies, un fabricante de servidores de IA, cayó en un 8,7%.
Deepseek se jacta de que su modelo R1 ofrece una alternativa rentable a las soluciones de IA occidentales como ChatGPT. Construido en el Deepseek-V3 de código abierto, este modelo supuestamente utiliza una potencia significativamente menos computacional y, según los informes, fue entrenado por solo $ 6 millones. Aunque algunos expertos cuestionan estas afirmaciones, el surgimiento de Deepseek ha llevado a los inversores a analizar las inversiones masivas que las empresas tecnológicas estadounidenses están haciendo en IA. El modelo se convirtió rápidamente en la mejor aplicación gratuita en los Estados Unidos, alimentada por discusiones sobre su efectividad.
Bloomberg informa que Openai y Microsoft están investigando si Deepseek utilizó la API de OpenAI para incorporar los modelos de IA de OpenAI en su cuenta. Openai señaló a Bloomberg: "Sabemos que las empresas con sede en PRC (China), y otras, están constantemente tratando de destilar los modelos de las principales compañías de IA de EE. UU.". La destilación, un método utilizado para capacitar a la IA extrayendo datos de modelos más grandes, viola los términos de servicio de Openai.
OpenAI emphasized its efforts to safeguard its intellectual property, stating, "As the leading builder of AI, we engage in countermeasures to protect our IP, including a careful process for which frontier capabilities to include in released models, and believe as we go forward that it is critically important that we are working closely with the US government to best protect the most capable models from efforts by adversaries and competitors to take US technology."
David Sacks, el AI Czar de Donald Trump, dijo a Fox News: "Hay evidencia sustancial de que lo que hizo Deepseek aquí es que destilaron el conocimiento de las modelos OpenAI, y no creo que OpenAi esté muy contento con esto. Creo que una de las cosas que verá en los próximos meses es nuestras compañías principales de IA para tratar de evitar la destilación".
Los observadores han notado la ironía en las acusaciones de OpenAI, dado que la compañía misma ha sido criticada por usar contenido de Internet con derechos de autor para desarrollar CHATGPT. Tech PR y el escritor Ed Zitron tuitearon: "Lamento mucho que no pueda dejar de reír. OpenAi, la compañía construida en robar literalmente todo Internet, está llorando porque Deepseek puede haber entrenado en los resultados de Chatgpt. Están llorando los ojos. Qué grupo de bebés hipócritas".
En enero de 2024, Openai argumentó que era "imposible" crear herramientas de IA como ChatGPT sin usar materiales con derechos de autor. En una presentación al Comité de Comunicaciones y Seleccione Digital de la Cámara de Lores del Reino Unido, declaró OpenAi: "Debido a que los derechos de autor de hoy cubren prácticamente todo tipo de expresión humana, incluidas postes de blog, fotografías, publicaciones de foro, restos de código de software y documentos gubernamentales, sería imposible capacitar a los principales modelos de IA de hoy sin usar materiales con derechos de autor". Además explicaron que limitar los datos de capacitación a los trabajos de dominio público no satisfaría las necesidades de los sistemas de IA modernos.
El uso de materiales con derechos de autor en la capacitación de IA se ha convertido en un tema polémico ya que las tecnologías generativas de IA han aumentado en popularidad. En diciembre de 2023, el New York Times presentó una demanda contra Openai y Microsoft, alegando "uso ilegal" de su contenido. Operai respondió, alegando que la capacitación de IA en dichos materiales constituye "uso justo" y desestimó la demanda como sin fundamento. Esto siguió a una demanda en septiembre de 2023 por 17 autores, incluido George RR Martin, quien acusó a OpenAi de "robo sistemático a escala masiva".
En agosto del año anterior, el juez de distrito Beryl Howell confirmó una decisión de la Oficina de Derechos de Autor de los Estados Unidos a partir de 2018 de que el arte generado por IA no puede tener derechos de autor, enfatizando la necesidad de un "nexo entre la mente humana y la expresión creativa" para la protección de los derechos de autor.