https://latamnews.lat/20210122/una-silla-en-forma-de-aguacate-puede-cambiar-nuestra-relacion-con-la-ia-1094199095.html

Una silla en forma de aguacate puede cambiar nuestra relación con la IA

Sputnik Mundo

Desde hace tiempo los informáticos están trabajando en perfeccionar la Inteligencia Artificial (IA) que generan imágenes a partir de texto. Quieren que la IA... 22.01.2021, Sputnik Mundo

2021-01-22T16:51+0000

2023-04-04T12:17+0000

tecnología

ciencia

noticias

algoritmos

aprendizaje

inteligencia artificial

https://cdn.img.latamnews.lat/img/07e5/01/16/1094199025_0:36:1920:1116_1920x0_80_0_0_04f855cf1fcbe45cf2246de7e84018a7.jpg

El pronóstico es claro: la Inteligencia Artificial va a poder entender tanto texto como imágenes. Para ello, los investigadores están intentando que los sistemas lingüísticos de IA comprendan mejor los conceptos cotidianos que los humanos utilizamos para dar sentido a las cosas. Ahora se lanzaron dos nuevos modelos de aprendizaje profundo —algoritmos que emulan el enfoque de aprendizaje que los seres humanos utilizan para obtener ciertos tipos de conocimiento— que están a punto de lograrlo."Lo que más me ha sorprendido es que el modelo puede tomar dos conceptos no relacionados y juntarlos de forma que resulte en algo más o menos funcional", dijo a la revista Technology Review del Instituto de Tecnología de Massachussets (MIT, por sus siglas en inglés), Aditya Ramesh, que trabajó en uno de los nuevos modelos. Los investigadores aseguran que la verdadera prueba es ver hasta dónde se puede empujar a la IA fuera de su zona de confort. ¿Cómo entiende las palabras e imágenes la Inteligencia Artificial?En 2020 la empresa estadounidense de investigación de IA OpenAI presentó el modelo de aprendizaje profundo GPT-3, que podía ser entrenado para utilizar el lenguaje de diversas maneras, simplemente lanzándole grandes cantidades de texto. Poco después, demostró que cambiando el texto por píxeles, podía utilizarse para completar imágenes a medio terminar. GPT-3 imita la forma en que los humanos utilizan las palabras; Image GPT-3 predice lo que vemos. Ahora OpenAI amplió el GPT-3 para que comprenda mejor los conceptos cotidianos, sus dos nuevas tecnologías se llaman DALL-E y CLIP (Contrastive Language-Image Pre-training), según publicó Technology Review. ¿Cómo funciona CLIP?Aprende a reconocer imágenes no a partir de ejemplos etiquetados en un conjunto de datos —como hacen la mayoría de los modelos de IA—, sino a partir de imágenes y sus subtítulos tomados de Internet. Es decir, esta IA aprende a identificar qué hay en una imagen a partir de una descripción —"el gato está comiendo un plátano"—, y no de una etiqueta de una sola palabra —como "gato" o "plátano"—.Lo asombroso de CLIP es que aprende a relacionar una gran variedad de objetos con sus nombres y con palabras que los describen, lo que le permite identificar objetos en imágenes que no le fueron dadas durante su entrenamiento. ¿Cómo funciona DALL-E?En lugar de reconocer imágenes, DALL-E "las dibuja". Este modelo es una versión más pequeña de GPT-3 que también se ha entrenado con texto-imagen tomados de Internet. En Techonology Review explican que si se le da un título corto, como "un cuadro de un carpincho sentado en un campo al amanecer" o "una vista transversal de una nuez", DALL-E genera muchas imágenes que coinciden con la descripción: docenas de carpinchos de todas las formas y tamaños delante de fondos naranjas y amarillos; fila tras fila de nueces (aunque no todas en sección transversal). Aunque las tecnologías no son perfectas y cometen errores, estos desarrollos significan un avance en un campo que desde hace tiempo tiene el reto de convertir texto en imágenes.

https://latamnews.lat/20210121/tres-tecnologias-del-futuro-que-la-ia-volvio-realidad-en-el-presente-y-prometen-crecer-1094188954.html

Sputnik Mundo

contacto@sputniknews.com

+74956456601

MIA „Rosiya Segodnya“

252

2021

Sputnik Mundo

contacto@sputniknews.com

+74956456601

MIA „Rosiya Segodnya“

252

Noticias

es_ES

Sputnik Mundo

contacto@sputniknews.com

+74956456601

MIA „Rosiya Segodnya“

252

1920

1080

true

1920

1440

true

https://cdn.img.latamnews.lat/img/07e5/01/16/1094199025_213:0:1920:1280_1920x0_80_0_0_948be7c4fafe5a6c9609a739bf477cc2.jpg

1920

true

Sputnik Mundo

contacto@sputniknews.com

+74956456601

MIA „Rosiya Segodnya“

252

Sputnik Mundo

noticias, algoritmos, aprendizaje, inteligencia artificial

Una silla en forma de aguacate puede cambiar nuestra relación con la IA

16:51 GMT 22.01.2021 (actualizado: 12:17 GMT 04.04.2023)

Desde hace tiempo los informáticos están trabajando en perfeccionar la Inteligencia Artificial (IA) que generan imágenes a partir de texto. Quieren que la IA entienda mejor el lenguaje humano, y para ello le están enseñando a "ver" qué significan las palabras y las frases. Pero, ¿qué tiene que ver una silla en forma de aguacate?

Tecnología

Tres tecnologías del futuro que la IA volvió realidad en el presente y prometen crecer

21 de enero 2021, 22:19 GMT

"Lo que más me ha sorprendido es que el modelo puede tomar dos conceptos no relacionados y juntarlos de forma que resulte en algo más o menos funcional", dijo a la revista Technology Review del Instituto de Tecnología de Massachussets (MIT, por sus siglas en inglés), Aditya Ramesh, que trabajó en uno de los nuevos modelos.

Los investigadores aseguran que la verdadera prueba es ver hasta dónde se puede empujar a la IA fuera de su zona de confort.

¿Cómo entiende las palabras e imágenes la Inteligencia Artificial?

En 2020 la empresa estadounidense de investigación de IA OpenAI presentó el modelo de aprendizaje profundo GPT-3, que podía ser entrenado para utilizar el lenguaje de diversas maneras, simplemente lanzándole grandes cantidades de texto. Poco después, demostró que cambiando el texto por píxeles, podía utilizarse para completar imágenes a medio terminar. GPT-3 imita la forma en que los humanos utilizan las palabras; Image GPT-3 predice lo que vemos.

😮🤖 Los nuevos aviones estadounidenses vendrán equipados con un copiloto de inteligencia artificial al mejor estilo R2-D2 para asistir a los pilotos.

👇 https://t.co/Vwhl0n7iJT
— Sputnik Mundo (@SputnikMundo) December 27, 2020

Ahora OpenAI amplió el GPT-3 para que comprenda mejor los conceptos cotidianos, sus dos nuevas tecnologías se llaman DALL-E y CLIP (Contrastive Language-Image Pre-training), según publicó Technology Review.

¿Cómo funciona CLIP?

Aprende a reconocer imágenes no a partir de ejemplos etiquetados en un conjunto de datos —como hacen la mayoría de los modelos de IA—, sino a partir de imágenes y sus subtítulos tomados de Internet. Es decir, esta IA aprende a identificar qué hay en una imagen a partir de una descripción —"el gato está comiendo un plátano"—, y no de una etiqueta de una sola palabra —como "gato" o "plátano"—.

🔬 La inteligencia artificial ha descifrado el 'problema del plegamiento de la proteína', una pregunta que no tuvo respuesta durante medio siglo

👉 https://t.co/HHfUIcAhoF #InteligenciaArtificial
— Sputnik Mundo (@SputnikMundo) December 1, 2020

Lo asombroso de CLIP es que aprende a relacionar una gran variedad de objetos con sus nombres y con palabras que los describen, lo que le permite identificar objetos en imágenes que no le fueron dadas durante su entrenamiento.

¿Cómo funciona DALL-E?

En lugar de reconocer imágenes, DALL-E "las dibuja". Este modelo es una versión más pequeña de GPT-3 que también se ha entrenado con texto-imagen tomados de Internet. En Techonology Review explican que si se le da un título corto, como "un cuadro de un carpincho sentado en un campo al amanecer" o "una vista transversal de una nuez", DALL-E genera muchas imágenes que coinciden con la descripción: docenas de carpinchos de todas las formas y tamaños delante de fondos naranjas y amarillos; fila tras fila de nueces (aunque no todas en sección transversal).

Te contamos que uso le dio China a la inteligencia artificial y como esta ayudó al país asiático en la lucha contra el COVID-19 🇨🇳

👇 https://t.co/M6dBGryzeJ
— Sputnik Mundo (@SputnikMundo) November 24, 2020

Aunque las tecnologías no son perfectas y cometen errores, estos desarrollos significan un avance en un campo que desde hace tiempo tiene el reto de convertir texto en imágenes.