FYI.

This story is over 5 years old.

diseño

Un algoritmo crea vídeos a partir de imágenes de Street View

Éste parece un vídeo corriente, pero está hecho completamente gracias a Google Street View y la ayuda de un algoritmo.

Este artículo fue publicado originalmente en nuestra web hermana Motherboard, vía.

Esto de aquí arriba parece un vídeo corriente, pero está hecho completamente gracias a Google Street View y ciertas habilidades.

Investigadores de Google lo crearon tras construir un algoritmo capaz de sintetizar nuevas escenas a partir de imágenes existentes. Si cogemos dos imágenes consecutivas, como dos creadas a un paso diferente en la misma calle, el algoritmo llenará el vacío que hay entre ellas para eliminar cualquier efecto entrecortado típico del estilo stop motion.

Publicidad

Su herramienta, que llaman DeepStereo, la presentan en un artículo publicado en Arxiv.

La dificultad de crear una nueva imagen de este modo está en que el sistema no sabe predecir lo que hay en la imagen que no ve, lo cual resulta incluso más problemático cuando hay objetos que se interponen sobre otros en los marcos existentes, lo que puede llevar a un efecto discordante o partes de la imagen que parecen distorsionadas.

Sin embargo, como podemos ver en el vídeo, la nueva solución consigue un efecto bastante fluido.

“Cuando no puede escapar de la incertidumbre, nuestro método prefiere difuminar los detalles, lo que lleva a resultados visualmente mucho más agradables que si recortamos o repetimos, especialmente con imágenes animadas”, escriben los investigadores. Como resultado, puede que las nuevas imágenes no tengan una resolución muy alta, pero la transición es muy acertada.

La revista del MIT “Technology Review”explica el proceso de forma sucinta: el ordenador determina la profundidad y el color de cada píxel de la nueva escena de acuerdo con la profundidad y el color del mismo píxel de las imágenes que tiene justo antes y después.

Los investigadores probaron su modelo haciendo que creara nuevas imágenes de una escena cuya imagen ya tenían en Street View, pero que el ordenador no había visto. “Ante todo, nuestro modelo produce resultados plausibles que resultan difíciles de diferenciar inmediatamente de las imágenes originales”, escriben.

Concluyen que su trabajo demuestra que es posible conseguir que una red profunda sintetice nuevas vistas, aunque admiten que su método actualmente presenta un par de obstáculos, concretamente que es lento y requiere un número determinado de imágenes de entrada.

Aun así, predicen que en el futuro podría tener aplicaciones en el cine, la realidad virtual y las teleconferencias.