China da un gran paso adelante en la carrera armamentista de la inteligencia artificial, ya que Alibaba lanza un nuevo chatbot que puede ‘leer’ imágenes

China avanza en la carrera armamentista de la inteligencia artificial con el nuevo chatbot de Alibaba que puede 'leer' imágenes

Los modelos de código abierto, llamados Qwen-VL y Qwen-VL-Chat, son modelos de visión de lenguaje, lo que significa que “leen” imágenes en lugar de texto, a diferencia de los competidores Chat-GPT y Google Bard. Qwen-VL-Chat promete características complejas como proporcionar direcciones escaneando señales de calle, resolver ecuaciones matemáticas basadas en una foto y tejer una narrativa basada en varias imágenes. Por ejemplo, puede escanear una imagen de un letrero en un hospital escrito en mandarín y luego traducirlo al inglés, o ayudar a una organización de noticias a escribir un título para una foto, según afirma la empresa.

Qwen-VL, el otro lanzamiento del viernes, es una versión actualizada de su chatbot de lectura de imágenes existente que ahora puede leer imágenes en alta resolución.

Alibaba se negó a hacer comentarios a ANBLE más allá de su anuncio público.

Estas nuevas iteraciones de A.I. son los últimos disparos en la carrera armamentista entre los desarrolladores para crear herramientas cada vez más sofisticadas, a medida que la tecnología pasa de ser un truco a un cambio real en el juego. Por ejemplo, Alibaba dice que su nueva tecnología de escaneo de imágenes tiene oportunidades significativas para ayudar a las personas con discapacidad visual a comprar, permitiéndoles, por ejemplo, escanear un artículo y hacer que el chatbot les recite la etiqueta.

Ambos modelos estarán disponibles en la plataforma Modelscope de Alibaba Cloud y en Hugging Face, la popular startup que tiene una biblioteca de modelos de A.I.

El lanzamiento de Alibaba se produce justo un día después de que Meta lanzara un modelo de A.I. ajustado para escribir código, construido sobre el modelo de código abierto Llama 2 lanzado en julio. Alibaba ha estado tratando de mantenerse al día con los lanzamientos de A.I. de Meta durante los últimos meses. A principios de este mes, Alibaba presentó sus dos primeros modelos de lenguaje grande de código abierto, Qwen-7B y Qwen-7B-Chat, los mismos que forman la base de los lanzamientos del viernes. En julio, las dos compañías llegaron a un acuerdo para poner el modelo Llama 2 de Meta a disposición del mercado chino a través de la división de nube de Alibaba.

Al hacer que estos nuevos modelos sean de código abierto, Alibaba permite a los usuarios ajustar las herramientas para desarrollar sus propias aplicaciones o realizar investigaciones. La mayoría de las compañías de A.I. esperan que los usuarios adapten los modelos de código abierto en herramientas para casos de uso altamente específicos, sin tener que emprender la ardua tarea de construir un gran modelo de lenguaje desde cero. Junto con las ofertas de código abierto, las compañías ofrecen sus modelos propietarios como servicio, con la esperanza de capturar cuota de mercado en la floreciente industria.

El desarrollo de A.I. es una prioridad para el gobierno chino

El mes pasado, el gobierno chino se convirtió en uno de los primeros países en emitir regulaciones exhaustivas para la A.I., un desarrollo que los expertos dicen que dio luz verde a Alibaba y otras compañías de tecnología chinas para hacer públicos sus productos.

Alibaba también se está preparando para una reestructuración completa que separaría a Alibaba Cloud, la división de computación en la nube que alberga su investigación de A.I., en una división independiente, un movimiento que los inversores reciben con agrado. Dado que la tecnología de A.I. requiere una gran potencia de cálculo que solo puede ser atendida adecuadamente con una red en la nube, tener ambas en la misma división aumentaría la eficiencia de A.I. El actual CEO y presidente de Alibaba Cloud, Daniel Zhang, se retirará en septiembre, y será reemplazado por dos de los cofundadores de Alibaba: Eddie Wu como CEO y Joseph Tsai como presidente.

El gobierno chino ha indicado en más de una ocasión que considera que la A.I. es fundamental para su futuro tecnológico, lo que ha dado lugar a una carrera armamentista con los EE.UU. Incluso herramientas aparentemente inocuas como las lanzadas por Alibaba el viernes podrían estar implicadas debido a su tecnología subyacente y cómo otros desarrolladores podrían usarlas. La A.I. “se ha convertido en un sustituto en la batalla por la primacía entre China y los EE.UU.,” dijo Kerry Brown, director del Lau China Institute en el King’s College London, a ANBLE a principios de este mes.

Hasta ahora, parece que las compañías tecnológicas chinas están un poco rezagadas con respecto a sus contrapartes estadounidenses. La versión de código abierto del modelo Llama 2 de Meta se basa en aproximadamente 70 mil millones de variables (llamadas parámetros en la jerga de A.I.), alrededor de 10 veces más grande que los nuevos lanzamientos de Alibaba (Alibaba dice que tiene modelos más grandes que no son de código abierto). A pesar de la ventaja de los EE.UU., los funcionarios del gobierno están preocupados de que el gobierno chino finalmente se apropie de alguna tecnología de A.I. desarrollada por empresas privadas para fines militares o de vigilancia, según Axios.