¿Pixel tiene un ojo pero dos cámaras? Google realmente esconde un monstruo de 5 cámaras

En el círculo de la telefonía móvil, la serie Pixel de Google siempre ha sido poco convencional. Además de la apariencia excéntrica (cada vez más sesgada), el sistema de cámara del Pixel está en una liga propia. Aunque ha sido de "cámara única" durante tres generaciones, todavía supera a muchos de los expertos en cámaras de sus pares.

Desde el año pasado, los fabricantes de teléfonos móviles han utilizado principalmente las puntuaciones de DxOmark para competir en la fotografía con teléfonos móviles. ¿Sabías que Pixel 2, lanzado en octubre del año pasado, todavía ocupa el décimo lugar en la lista general? En comparación con los teléfonos móviles con doble cámara lanzados el mismo año, aunque son conocidos como la "Perla de Oriente" y "Los próximos diez años", no pueden competir con este monstruo de un solo ojo. El Pixel 2 ya es muy bueno tomando fotografías y es evidente lo natural que es el Pixel 3.

El hardware no es suficiente, por lo que los algoritmos marcan la diferencia

La excelencia de la fotografía de la serie Pixel se encuentra principalmente en la toma de escenas nocturnas y retratos. Especialmente en entornos con luz extremadamente oscura, las imágenes producidas por los teléfonos móviles normales con doble cámara ya son completamente negras, pero el último Pixel 3 puede retener muchos detalles de la imagen mientras toma fotografías visibles. No puedo evitar pensar en esa noche en el templo Yaowang, cuando Linghu Chong enseñó a ocho ladrones dieciséis ojos a quedarse ciegos con solo un movimiento de Dugu Nine Swords...

En cuanto a la fotografía de retratos, el fondo Las capacidades de desenfoque de la serie Pixel también son relativamente buenas. Sabemos que al tomar retratos con algunos teléfonos móviles con doble cámara, el desenfoque de profundidad de campo inevitablemente no está en su lugar. Los cinco dedos de una persona aparecen borrosos sin motivo alguno, y las ramas y hojas de los árboles en la distancia deberían aparecer. ser borrosos son visibles. Aunque esta situación también se da en el Pixel 3, las posibilidades de que suceda son menores, sin mencionar que solo tiene una cámara.

De hecho, ya sea que se trate de escenas nocturnas o retratos, la razón por la que la fotografía con píxeles puede ser "uno contra muchos" no es solo el uso de módulos de cámara con buena reputación en la industria, sino más Más importante aún, las capacidades de algoritmo extremadamente sólidas detrás de esto. En un entorno de escena nocturna, ya sea con una sola cámara o con varias cámaras, el principio de funcionamiento es básicamente el mismo: active HDR y utilice síntesis de múltiples fotogramas para crear imágenes. Cuántos fotogramas tomar, cómo configurar los parámetros de cada fotograma y cómo sintetizar y optimizar varios fotogramas después de disparar, todo depende del algoritmo detrás de esto. Por eso todos usan la misma cámara, pero la calidad de la imagen es diferente.

Hoy en día, la fotografía con doble cámara es el método más popular para la fotografía de retratos. La razón por la que es popular es que es forzada y relativamente simple. Aunque la apertura máxima de los teléfonos móviles alcanza ahora f/1,3, debido al tamaño del sensor del teléfono móvil, la información óptica que se puede registrar es limitada y el efecto real no es evidente, y mucho menos comparable al objetivo de una cámara con El mismo tamaño de apertura, por lo que por ahora, no es realista utilizar una apertura grande para lograr un fondo borroso en los teléfonos móviles a menos que se pueda mejorar aún más el tamaño del sensor. Y este es sólo uno de los requisitos previos. (ByUncleZhang)

Entonces, si desea obtener un mejor efecto de desenfoque del fondo al tomar fotografías con un teléfono móvil, solo puede enfocar el enfoque. La solución de cámara dual más común es una cámara gran angular (principal) y una cámara de teleobjetivo (secundaria). La cámara principal es responsable de registrar la información de la imagen y la cámara secundaria es responsable de registrar la información de la profundidad de campo. El sujeto a través de varios parámetros, difumina el fondo y forma una imagen borrosa. Efectos para fotografías de retrato.

Google, que nunca ha seguido a la multitud, es desdeñoso. Lo que otros requieren dos cámaras para lograrlo, nosotros podemos hacerlo con una. Sin una cámara secundaria para medir la profundidad de campo, ¿de dónde vienen estos datos faltantes?

Sí, viene del algoritmo. Después de todo, el hardware no es suficiente, por lo que tenemos que utilizar algoritmos para compensarlo.

Antes de Pixel 3, Google utilizaba principalmente la estimación de profundidad (DepthEstimation) para completar la toma de retratos, que incluye dos partes: segmentación semántica (Semantic Segmentation) y algoritmo estéreo (StereoAlgorithm). En el modo de disparo de retrato, la cámara primero usa HDR para tomar fotografías de alta calidad y utiliza una red neuronal convolucional (red neuronal convolucional) para identificar el sujeto y el fondo en la imagen y segmentarlos. Esta es la segmentación semántica mencionada anteriormente. .

A continuación, a diferencia de los teléfonos con doble cámara que utilizan teleobjetivos para obtener datos de profundidad de campo, Pixel utiliza tecnología de enfoque automático de doble píxel para obtener información de profundidad de campo y realizar cálculos (es decir, algoritmos estereoscópicos) para formar una mapa de profundidad. Finalmente, el sujeto claro y el mapa de profundidad se combinan para completar la representación del desenfoque de la foto.

Enfoque automático de doble píxel (DPAF): Divide cada píxel en partes izquierda y derecha. El lado derecho del píxel ve el mundo a través del lado izquierdo de la cámara, y el lado izquierdo del píxel ve el mundo. mundo a través del lado derecho de la cámara Hay una diferencia (es decir, diferencia de posición) en la observación, lo que equivale a tomar la misma imagen dos veces desde diferentes ángulos. Comparando los dos tiempos, se obtiene la diferencia de posición y la profundidad de campo. se calcula.

Lo anterior puede entenderse simplemente como el uso de dos algoritmos para completar el recorte del retrato y el desenfoque del fondo, respectivamente. En términos de desenfoque del fondo, Pixel se parece más a simular el método de cálculo de las cámaras profesionales, pero es más difícil que las cámaras profesionales. Por un lado, la disparidad generada por el enfoque automático de doble píxel es bastante débil, lo que supone un gran desafío para las cámaras de los teléfonos móviles. Por otro lado, el enfoque automático de doble píxel no puede evitar el problema de la apertura (El problema de la apertura) y es casi imposible juzgar la diferencia de posición de los objetos horizontales o verticales. Por lo tanto, Pixel también tendrá problemas al tomar retratos porque no se puede reconocer como fondo y no se puede desenfocar.

Para mejorar, Google creó un monstruo de 5 cámaras

Hablando de esto, Sony sabe que ya has pensado en el recientemente lanzado Samsung A9s (el primer cuatro trasero del mundo). cámara), o el Nokia 9, que aún se está preparando para su lanzamiento (se dice que es el primer modelo del mundo con cinco cámaras traseras).

Lamento decepcionarlos a todos, el monstruo de 5 cámaras creado por Google en realidad se ve así (mira las fotos para perder seguidores).

No te mentí, has leído bien, Pixel 3 5 en 1, un auténtico monstruo de 5 cámaras al que nadie engaña...

Esto Google eligió el monstruo de 5 cámaras. El ingeniero de inteligencia artificial se llama "Frankenphone" (yo también soy un teléfono). Además de estar equipado con 5 unidades Pixel3, también está equipado con una solución de disparo basada en WiFi. A través de Frankenphone, los ingenieros pueden capturar fotografías de todos los teléfonos móviles al mismo tiempo (con un rango de tolerancia de 2 ms) y superponer todas las fotografías para formar un efecto visual tridimensional (segundo desde la izquierda).

La obtención de estas fotografías es muy adecuada para entrenar el algoritmo de estimación de profundidad mencionado anteriormente. La razón es muy simple:

1. Los cinco puntos de vista aseguran que haya disparidades en múltiples direcciones, por lo que no hay problemas de apertura

2. La disposición de la cámara asegura que la Los puntos en la foto suelen ser al menos Como se puede ver en otras fotos, hay menos puntos que no tienen una relación correspondiente

3 La distancia entre las cámaras produce una diferencia de posición mayor que el PDAF de una sola. cámara y la estimación de profundidad será más precisa

En otras palabras, Google reconoce las ventajas de la multicámara, pero prefiere utilizar los datos obtenidos de la multicámara para entrenar su propio algoritmo de inteligencia artificial. tratando de usar una cámara para lograr capacidades multicámara. Hacer esto es en realidad mostrar tus habilidades hasta cierto punto. Respaldada por algoritmos de inteligencia artificial y big data, la cámara de Google, después de haber sido capacitada completa y adecuadamente, tiene el potencial de lograr efectos de imagen que pueden igualar o incluso superar los de las cámaras de disparo múltiple. A juzgar por el desarrollo de las capacidades de la cámara de la tercera generación de Pixel, este día se acerca.

Desde la perspectiva del teléfono móvil en sí, el espacio interno del teléfono móvil en sí es muy valioso. ¿Quién está dispuesto a devanarse los sesos para apilar cámaras en el cuerpo cuando lo que se puede lograr con una sola cámara? ? Los problemas que se pueden resolver con algoritmos, naturalmente, no requieren apilamiento de hardware. Sin embargo, ¿cuántas empresas pueden rivalizar con Google en inteligencia artificial y big data? ¿Cuántos fabricantes de teléfonos móviles hay entre ellos? En el caso de capacidades de algoritmo insuficientes, hay cámaras duales, tres cámaras o incluso cinco cámaras y seis cámaras. Visto desde otra perspectiva, significa que "el algoritmo no es suficiente, el hardware lo compensará".

Finalmente, aquí surge la pregunta a los usuarios: Si con una sola cámara se puede lograr lo mismo, ¿todavía es necesario comprar una multicámara?

Al final, solo queda una frase: una operación es tan feroz como un tigre, y Pixel luchará a muerte contra cinco.