top of page

Nueva tecnología de inteligencia artificial de NVIDIA NeRF convierte fotos 2D en objetos 3D



Una nueva tecnología llamada (Campo de Radiación Neural) NeRF consiste en entrenar algoritmos de IA (inteligencia artificial) para permitir la creación de objetos 3D a partir de fotos bidimensionales. NeRF tiene la capacidad de rellenar los espacios en blanco, por así decirlo, interpolando lo que las fotos 2D no captaron. Es un truco muy interesante que podría dar lugar a avances en diversos campos, como los videojuegos y la conducción autónoma. Ahora, NVIDIA ha desarrollado una nueva técnica NeRF -la más rápida hasta la fecha, según la compañía- que sólo necesita segundos para entrenarse y generar una escena 3D.

Sólo se necesitan segundos para entrenar el modelo, llamado Instant NeRF, utilizando docenas de fotos fijas y los ángulos de cámara desde los que fueron tomadas. Después, es capaz de generar una escena en 3D en sólo "decenas de milisegundos". Al igual que otras técnicas NeRF, requiere imágenes tomadas desde múltiples posiciones. Y en el caso de las fotos con varios sujetos, es preferible que las imágenes se tomen sin demasiado movimiento, ya que, de lo contrario, el resultado sería borroso.

NVIDIA explica que los primeros modelos de NeRF tampoco tardan demasiado en producir resultados. Sólo tardan unos minutos en renderizar una escena 3D, aunque el sujeto de algunas de las imágenes esté obstruido por cosas, como pilares y muebles. Sin embargo, entrenarlas lleva horas. La versión de NVIDIA sólo tarda unos segundos en entrenarse, ya que se basa en una técnica desarrollada por la compañía denominada codificación de cuadrículas de múltiples resoluciones que está optimizada para ejecutarse de forma eficiente en sus GPU. Incluso puede ejecutarse en una sola GPU, aunque es más rápido en tarjetas con núcleos tensoriales que proporcionan un aumento de rendimiento para la inteligencia artificial.

La compañía cree que Instant NeRF podría utilizarse para entrenar robots y ayudar a los sistemas de conducción autónoma a entender los tamaños y las formas de los objetos del mundo real. NVIDIA también ve un futuro para esta técnica en el ámbito del entretenimiento y la arquitectura, donde puede utilizarse como forma de generar modelos 3D de entornos reales que los creadores pueden modificar durante el proceso de planificación.

bottom of page