jueves, junio 11, 2009

Project NaTal Y Cual

Leo tanto flipao por Internet acerca del Project Natal de Microsoft, que le he cogido manía al proyecto. Al principio, me pareció muy interesante, desde el punto de vista de investigación. Sobre todo porque mi especialidad es la visión por computador. Pero el videomontaje que hizo el departamento de marketing en Microsoft es un engañabobos... Y este tipo de CNET se deja engañar a gusto:

How M$ stole the show at E3

Vamos, que dice que M$ triunfó. En un mail entre colegas intenté desmontar lo que dice el chaval (periodista?). Me repito aquí para ver si consigo desensimismar a alguno:

* WOW! el 51.9 % de encuestados dijo que el mejor show lo dio M$ .... en la tierra de los xboxers, me parece incluso bajo el porcentaje. Así que no me parece muy representativo, pero bueno...

* WOW! The Xbox 360 will also sport Facebook and Twitter integration....
Pero si la xbox no tiene ni browser.... por qué no empiezan por ahí? la PS3 tiene navegador: puedo abrir gmail, facebook, youtube....

* WOW! Microsoft will be offering full-game downloads on Xbox Live. Game downloads are the future! (wake up Sony!)
ejem.... Sony tiene unos cuantos juegos, como el Siren, GT5 Prologue, que puedes comprar y bajar enteros del PS Store. Incluso se preocupan de la gente que no le acaba de convencer la compra online, o con poco ancho de banda, y hay juegos en principio exclusivos online que han visto la luz en versión disco (como el The Last Guy).

* Hideo Kojima took the stage, announcing that he is bringing his wildly popular Metal Gear Solid series to the Xbox 360 with Metal Gear Solid Rising.
ejem... pero también saldrá en PS3 (lo hacemos nosotros en Konami....). Y Metal Gear Solid Peace Walker es exclusivo de PSP....

* Sony unveiled a new motion controller that uses Sony's Eye technology to provide in-game motion control. It's cool, but it's no Project Natal.
.....
IT'S COOL, BUT IT'S NOT PROJECT NATAL ...........!!!!

Qué argumento tan fantástico!!! El tal project natal y las aplicaciones que muestran funcionando tan bien en el video es sólo
vaporware. Es muy bonito como R&D pero habrá que ver donde lleva la cosa. La mesa aquella multitouch de M$ (surface? olvidé hasta el nombre) también iba a estar implantada ya en todas partes..... Acerca del mando de Sony yo diria, IT'S COOL, AND IT WORKS! (más detalles abajo)

* M$ made the competition look foolish.
Clarísimamente, vamos....

* Wake up, Nintendo and Sony. Microsoft has.
El que tiene que despertar es el que ha escrito este artículo....

A ver, M$ pretende hacer "full body motion capture" con una cámara (o parece que son dos, para hacer "stereovision"). Es muy interesante, pero es imposible que funcione al 100% (qué es muy importante, y luego explico por qué). Motivos por los que en tu casa no funciona:

1. Calibración: Hay que calibrar el trasto para que empiece a funcionar más o menos bien. Exactamente a qué altura y a qué distancia hay que poner la cámara para que te pueda ver los pies? (según parece en el videomontaje, te reconoce hasta los pies...). Qué tipo de iluminación es suficiente para que te vea? Se puede jugar a oscuras? Puedes ser negro y jugar con poca luz? Qué pasa si tu perro anda correteando por el suelo? Vamos, que tu salón va a llenar el sistema de "false positives" y "false negatives", y el juego hará lo que le dá la gana. Y esto lleva al segundo punto:

2. Precisión: te gustaría apretar el 5 en el mando de la tele y que a lo mejor te cambiara al canal 5, pero a lo mejor te cambie al 6? O a lo mejor te cambie al 5 sin haber pulsado nada? Pues esto es lo que va a pasar. El sistema de reconocimiento de voz peca de lo mismo. Si estás jugando a un Quiz game, prefiero apretar las teclas A, B, C o D, sabiendo que si fallo la respuesta es culpa mía, que haber acertado pero que el sistema no me entienda, o justo se ponga a ladrar el perro, y no me reconozca la respuesta. El motivo por el cual seguimos usando teclados en el ordenador es porque funcionan al 100% de precisión, mientras que ponernos a dictar al ordenador no nos hace gracia porque cuando algo sale mal, no sabemos el motivo. Dices "A" y sale "E"... En el teclado, apretas "A" y sale "A". Además, muchos estudios muestras que a los humanos nos encanta aprender a usar nuevas herramientas e interficies, si sabemos que esas herramientas funcionan al 100%.

3. Software: con tanto cálculo (cualquiera que haya estudiado visión, sabe de lo que hablo), la CPU de la Xbox 360 no va a tener para hacer juegos decentes. No creo que lleguen ni al nivel de la Wii (monigotes sin piernas). Y por los problemas que he dicho antes, en el caso de que salga a la venta, yo creo que no habrá más que juegos de limpiar ventanas, como en el Eye Toy de PS2. Todo lo que sale en el famoso video no creo que salga a la luz....

Y bueno, sólo tenemos que mirar el caso del PS Eye de Sony,

1. hace 2 años que puede identificar caras. Qué juegos lo usan? Ningun que yo sepa
2. tiene un array de micrófonos estupendo que eliminan el ruido de fondo y va genial para hablar online (habrá que ver la calidad del famoso array de Microsoft,... y el precio), pero cuantos juegos han metido algo de reconocimiento de voz?
3. en conferencias como GDC09 Sony ha mostrado tracking completo en 3D a base de "markers" que funcionan muy bien, con poca luz, en el suelo, etc, pero que usan practicamente toda la CPU (las 5 SPU del procesador Cell) de la PS3. La Xbox 360 tiene una CPU bastante más lenta... Como no te metan una CPU en la cámara y te vendan el cacharro al precio de una PS3, no sé como van a procesar nada....

Me parece mucho más realista el controlador que presentó Sony en la misma feria (E3). Es un híbrido entre su actual SIXAXIS, o el Wiimote de Nintendo, y los sistemas de visión. Al llevar un mando al menos sabes que tú eres el que tienes el control, y no tu perro saltando por ahí. Además, puede jugar más de uno a la vez, y el "tracking" (seguimiento) es mucho más preciso que no intentar seguir una de las muchas manos que aparecen frente a la tele.... Los que vistéis el E3, ya vistéis que la presentación de Sony fue EN DIRECTO, en un entorno NO CONTROLADO (o sea, sin necesidad de calibrar luces, distancia, etc) y que funcionaba a la perfección.

Lo dicho. Como la visión por computador es mi campo, me parece interesantísimo el proyecto de M$ y los de R&D se merecen un par de aplausos. Pero me parece poco realista para controlar un videojuego. Los de marketing se merecen 100 gallifantes por lo menos porque han conseguido embaucar a todo quisqui...

Y encima los "perrodistas" superconvencidos de que M$ triunfó.... En lenguaje pijo, "peripatético".

Edit:
En los comentarios me comentan que la cámara de M$ usa infrarrojos. Según yo tenía entendido, esto es para detectar la profundidad incluso a oscuras, pero he encontrado un artículo en el que dicen que incluso se puede usar para reconocer caras: Seeing People in the Dark: Face Recognition in Infrared Images. Pero hay que tener en cuenta que los resultados del artículo son en un entorno controlado. Volviendo a tu salón, más razón para crear "false positives" si usas infrarrojos: cualquier bicho viviente, bicho caliente, u objeto incandescente va a volver a la cámara loca. Va a ver caras por todas partes. En fin, que sigo imaginándome sólo 4 juegos de limpiar ventanas que puedan funcionar bien... Espero que M$ me sorprenda gratamente (y que publique algún artículo científico si es que realmente funciona tan bien), porque me gusta el tema. Este "post" lo escribí en contra de los artículos de tanto flipado que leo por ahí, o contra el marketing de M$ en todo caso, pero no en contra de Microsoft Research, que creo que alguno me confunde ;)

Edit2:
Por lo que he estado leyendo, si llevas algo negro, es más que probable que el detector de infrarrojos falle porque absorbe la radiación que emite la cámara. La solución es llevar pantalones blancos, jejeje.

8 comentarios:

Kabuto dijo...

Me uno a tu opinión, de momento todo me pareció "vaporware". Cada vez que nombrabas al perro pasar delante de la tele, pensaba en el mío.

UnGatoNipón dijo...

Cualquier cosa que no se haya 'publicado' comercialmente, es vaporware hasta que se demuestre lo contrario, pero en cualquier caso, me gustaría matizar algunos puntos; Si funciona a "oscuras" al ojo humano (utiliza un emisor de luz infrarroja para ver). Con dos emisores, calcula la profundidad también. Así que si, puedes ser negro y jugar con poca luz. Si eres transparente o reflectante, no :)

Las reviews que has leído en inglés parecen untadas por M$, a mi tampoco me parecen muy objetivas, sin embargo a esta le veo un poco más de sentido;

http://navegante2.elmundo.es/navegante/2009/06/05/gadgetoblog/1244221104.html

Es de alguien que lo probó en persona, y que conozco personalmente. Su opinión me parece bastante realista y honesta, aunque de nuevo, estaba en un entorno controlado, sí. Pero no creo que ni siquiera M$ le diera tanto bombo a algo y tan a lo grande sin tener la intención de comercializarlo y que funcionara como ha mostrado - eso sería un suicidio empresarial incluso para una empresa tan enorme como M$.

Estoy de acuerdo contigo en que habría que ver cómo harán para que el reconocimiento de voz y todo lo demás funcionen al mismo tiempo que un videojuego, y por eso quiero verlo en persona, pero de la misma manera que los comentarios de muchos blogs anglosajones me parecen exagerados, yo prefiero ser cauto y escéptico, como tú, pero sin opinar más hasta que lo haya probado con mis propios... ojos, no, cuerpo... ;)

Un saludote! :)

cotaku dijo...

* Para reconocer caras es mejor la banda visible que la banda infrarroja
* El Eye Toy de PS2 ya tenía banda infraroja.
* Tu colega mismo dice que petardea sólo por llevar chaqueta. No quiero ni pensar cuando la gente se lo instale en su casa.... Lo de no necesita calibración, no me lo creo
* El artículo de tu colega está mucho mejor que el resto, cierto, pero también mete la gamba. "Sony podría añadir reconocimiento facial"... Como dije en mi post, hace ya dos años que la PS3 detecta caras (Sony tiene la tecnología que permite reconocer caras en tiempo real en una diminuta cybershot, como no iba a ocurrirseles ponerla en PS3???). Otra cosa es que los desarrolladores le saquemos provecho.... Pero es precisamente a lo que me refería también con lo de vaporware: esas aplicaciones que muestran ahí ya veremos si salen a la luz o al final solo salé un M$ Tennis...

M$ claro que tiene intención de comercializarlo, pero también comercializó la Xbox 360, con más de un 30% de fallos de hardware en los tests (o sea, ya sabían que estaban destinadas al RROD - Red Ring Of Death), y las vendió igual. Suicidio empresarial? Dos co*ones que tienen...

Además, no hace falta que funcione bien para que la gente se lo crea. El Wiimote de la Wii también es una engañifa en cierto modo, porque la gente se cree que girando la muñeca, la raqueta del Wii tennis se va a girar también, y que el movimiento que haces con el brazo lo va a hacer igual.... Aun sabiendo que no es así, la gente percive como si fuera motion capture. Y seguro que muchos se preguntan ahora para qué necesitan el Wii Motion Plus si el Wiimote ya les reconoce los movimientos...

Lo dicho, que me huelo que saldrá un M$ Tennis, moverás los brazos, y la gente flipará y todos contentos...

Otra vez digo que espero equivocarme y que funcione realmente bien, porque me parece interesantísimo todo lo que tenga que ver con visión.

Jnanaki dijo...

Yo, sinceramente, me cansan estas cosas.

Llamadme carroza, pero prefiero estirarme en el sofá y jugar tranquilamente de la forma tradicional, de entre otras cosas porque en todas las televisiones que tengo en casa, hay una mesa justo en medio.

Ya me diréis cómo coño puedo dar muñecazos, saltos y otras cosas, la mesa me provocaría moratones a lo bestia, eso si no provoca accidentes peores.

Creo que al final todo esto es para lo de siempre, atraer al público de Wii (al nuevo, claro, al que compra Wii Fit). A mí, al menos no me la colarán, que ya probé la Wii y francamente, me quedo con lo que había antes.

Roy Ramker dijo...

Sinceramente, es la mejor entrada sobre el Project Natal que he leido, más o menos lo comparto todo. Empezando con que de momento todo lo mostrado habra que demostrarlo después, pero vaya, también es verdad que ami no me gustaría jugar a muchos así, haced la prueba del juego de coches, ¿sois capaces de aguantar meda hora jugando con los brazos de esa forma? xD
Por cierto, es una pregunta tonta, pero sobre el reconocimiento facial...¿si me dejo perilla ya no me reconocerá posteriormente?

cotaku dijo...

jejej, bueno, la perilla no creo que influya mucho. El sistema de reconocimiento más extendido es precisamente basado en un paper de M$, en el que usan invariantes centrados en ojos, nariz y labios. Va muy rápido, lo que no sé si este método se puede usar con luz infraroja...
Yo muchas veces juego con máscara, por la alergia. Eso sí que debe ser un problema... Pero bueno, lo de reconocerte la cara es una cosa puntual. Al final, si sólo hay 3 personas viviendo en una misma casa, sólo tiene que "adivinar" quien de las 3 está jugando. Con que se le vea un ojo ya debe ser suficiente para distinguir uno de otro, jejeje.

UnGatoNipón dijo...

Si no recuerdo mal, este sistema lleva dos cámaras, una de infrarrojos y otra de 'espectro visible', no sé si usa una o ambas para el tema del reconocimiento facial y de hecho yo también soy escéptico pero hasta que la pruebe prefiero no enterrar la idea. El punto por donde más cojea desde mi punto de vista es en la velocidad de proceso que haría falta para que todo el sistema funcione (es decir, el procesamiento de la imagen, los movimientos, cómo se trata la tasa de errores, el reconocimiento de voz, etc - todo esto sin contar con le juego en si mismo) pero tampoco me parecería ciencia ficción que funcionase como en los videos, el tiempo dirá cual de los dos tiene una opinión más acertada :)

En cuanto al EyeToy no sabía que tenía también infrarrojos. El reconocimiento de caras, puede que esté implementado para muchas cosas, no sólo para dar una identidad a alguien, si no como está escrito en otro comentario, para detectar el movimiento de las cejas, ojos, boca etc - y con eso, hacer monadas del tipo de 'muevo una cara 3D moviendo mi cara delante de una cámara' y cosas así. Esto, ya se usa en muchos móviles japoneses, cuando en una video llamada no quieres aparecer tú, pones un 'carácter' 3D que se mueve según mueves la cara, enfrente de la cámara frontal del móvil, que en este caso se utiliza para seguir los movimientos de ciertos puntos de la cara altamente contrastados y que (casi) todos tenemos, y no para recoger la imagen que enviar tras ser compresa. Cuando lo vi, fue en Oki, pero no sé si es un desarrollo licenciado de otra empresa o si lo que tiene la EyeToy es eso, o algo más sofisticado. En cualquier caso, lo que he dicho antes, el tiempo dirá si Natal realmente dice funcionar como pone el video. M$ los tendrá bien puesto pero si lo que venden no es lo que han mostrado exáctamente en ese video tan futurista, se me caería la quijada al suelo :D

cotaku dijo...

Yo no digo que no sea factible, sino que lo que sale en el video es simplemente un concepto. Porque si realmente funcionara YA así de bien, ya estaría a la venta, digo yo. Y como repito mil veces, mi intención es desmitificar todo el bombo que le dan por ahí a la dichosa presentación de M$. En el post no sólo hablo de Project Natal ;) Les ponen de revolucionarios hasta por las descargas online.... v_v