Funcionamiento del sensor de movimiento en Kinect

Publicado en Cienciacon fecha 10 - noviembre - 2010

 

Kinect para Xbox 360, inicialmente conocido por el code name Project Natal es un periférico para videojuegos que prescinde de mandos gracias a un sensor de detección de movimientos, creado por Microsoft y está previsto que sea utilizable en ordenadores con el sistema operativo Windows 8. Está basado en una cámara periférica que se conecta a la videoconsola Xbox 360 reconociendo los gestos del jugador, su rostro, voz, así como sus movimientos y los objetos estáticos dentro un campo visual. Fue creado específicamente para competir entre las consolas de última generación con sensor de movimiento para videojuegos multijugador, como Wii Remote y Wii MotionPlus así como PlayStation Move, de las consolas Nintendo Wii y Playstation 3 respectivamente.

Kinect para Xbox 360

El sensor de Kinect es una barra horizontal conectado a un pivote, diseñado para estar en una posición longitudinal. El dispositivo tiene una cámara RGB, sensor de profundidad y un micrófono multi-array bidireccional que conjuntamente capturan el movimiento de los cuerpos en 3D, además de ofrecer reconocimiento facial y aceptar comandos de voz.

El sensor de Kinect reproduce video a una frecuencia de 30 Hz, en colores RGB 32-bit y resolución VGA de 640×480 pixels, el canal de video monocromo es de 16-bit, resolución QVGA de 320×240 pixels con hasta 65,536 niveles de sensibilidad. El límite del rango visual del sensor de Kinect está entre 1.2 y 3.5 metros de distancia, con un ángulo de vista de 57° horizontalmente y un ángulo de 43° verticalmente, mientras que el pivote puede orientarse hacia arriba o abajo ampliando hasta 27°. El array del micrófono tiene cuatro cápsulas, y opera con cada canal procesando 16-bit de audio con un ratio de frecuencia de 16 kHz.

funcionamiento Kinect

Al parecer el prototipo de Kinect con cámara y micrófono, creado por la empresa PrimeSense, costó $30,000, mientras cada unidad se comercializará un precio de $150. La cámara de Kinect funciona con hardware y software de serie para el reconocimiento de imagen. La cámara tiene dos funcionalidades principales, genera un mapa en 3D de la imagen que tiene en su campo visual y reconoce humanos en movimiento entre los objetos de la imagen a partir de diferentes segmentos de las articulaciones del cuerpo y un esquema en escala de grises del rostro.

funcionamiento Kinect

Antiguos programas de software utilizaban las diferencias en color y textura para distinguir los objetos del fondo. PrimeSense, la compañia que desarrolló Kinect, y la compañia recientemente adquirida por Microsoft, Canesta, utilizan un modelo diferente. La cámara transmite luz invisible para nosotros, cercana en el espectro a los infrarrojos y puede conocer el tiempo que tarda la luz en volver al sensor tras reflejarse en los objetos. Canesta es una empresa localizada en Sunnyvale, California, un fabricante de chips que hacen que los dispositivos electrónicos reaccionen a los movimientos del usuario, creando interfaces que no necesitan periféricos con botones que sean sujetados con la mano y conectados por cable.

funcionamiento Kinect

El sensor actúa como un sonar, la operación no es teoricamente complicada, si se conoce el tiempo de cada salida y llegada de la luz tras reflejarse en un objeto, sabiendo la velocidad absoluta de la luz, se puede tener la distancia a la cual se encuentra ese objeto. En un amplio campo visual con objetos, la cámara Kinect trata de reconocer a qué distancia están los objetos, distinguiendo el movimiento en tiempo real. Kinect puede llegar a distinguir la profundidad de cada objeto con diferencias de 1 centimetro y su altura y anchura con diferencias de 3 milimetros. El hardware de Kinect está compuesto por la cámara y el proyector de luz infrarroja, añadido al firmware y a un procesador que utiliza algoritmos para procesar las imágenes tridimensionales.

El procesador es capaz de interpretar los movimientos que se registran en los objetos capturados por la cámara de Kinect en eventos con significado que aparecen en pantalla. Los movimientos buscados por el algoritmo son contextualizados, si nos encontramos en un juego como Kinect Adventures, donde una balsa desciende por la corriente del río, si este juego requiere movimientos como agacharse o tumbarse, entonces se buscará la identificación de estos movimientos en tiempo real para producir eventos en pantalla. Si el usuario navega por el menú con interfaz gráfica de Netflix entonces se buscarán movimientos con la mano horizontales y verticales que serán registrados en los fenómenos de pantalla.

funcionamiento Kinect

Aunque hay diferencias de opinión entre Microsoft y los creadores de los videojuegos compatibles con Kinect parece que los jugadores tendrán que estar erguidos en una zona despejada para jugar y que no será posible utilizar la interfaz con sensor detector del movimiento si estamos sentados en el sofá, no es apto para vagos que se tiraban horas sentados creando un hueco caliente en el sofá mientras daban a los botones del mando, para usar Kinect hay que mantenerse de pie.

Kinect tiene un micrófono stereo que funciona para chatear en videollamadas y para efectuar comandos de voz. La tecnología del audio es diferente de los micrófonos integrados en las webcam de los ordenadores portátiles o de sobremesa, no tiene una cancelación de ruido sino que funciona con una captura cónica de la acústica en la sala. No se trata de capturar sonidos cercanos como en un teléfono móvil o webcam de equipo sino del habla de una o varias personas en una sala a pocos metros de distancia.

Kinect busca un nuevo tipo de interfaz gráfica que según Microsoft va a ser lo que se impondrá en el futuro para ordenadores, televisión, no sólo para videoconsolas de juegos cooperativos o familiares. Natural User Interface (NUI) más que la clásica Graphic User Interface (GUI).

Artículo en inglés en Wired Gadget Lab.

publicidad



Puedes compartir la entrada en algunas redes sociales:

 

Si te parece interesante la entrada, puedes considerar suscribirte de forma totalmente gratuita, por feed o por email, para recibir nuevos contenidos cuando sean publicados. Puedes consultar debajo otras entradas relacionadas.

1 comentario

  1. Francisco Jesús comenta:

    Referente al funcionamiento de la toma de datos de Kinect donde cito:

    “El sensor actúa como un sonar, la operación no es teóricamente complicada, si se conoce el tiempo de cada salida y llegada de la luz tras reflejarse en un objeto, sabiendo la velocidad absoluta de la luz, se puede tener la distancia a la cual se encuentra ese objeto”

    Se debe tener en cuenta que si es cierto, que lo es, que la Kinect tiene una cámara tipo CMOS, ésta no será capaz de medir las distancias, pues no es capaz de muestrear tiempos de llegada de luz. Esta cámara de rango toma el patrón emitido por el emisor IR captura la imagen por la cámara de infrarrojos, y calcula la imagen 3D con un proceso similar a una cámara estereoscópica.

    Escrito con fecha julio 22nd, 2017 a las 11:18

Escribir comentario




;-) :wikipedia: :tears: :supermario: :shutupandtakemymoney: :sad: :rubor: :rolleyes: :rock: :razz: :pacman: :omg: :odd: :nice: :nibble: :mrgreen: :lol: :linux: :linkzelda: :like: :here: :google: :github: :firefox: :evil: :enojado: :devianart: :chrome: :bomberman: :bender: :apple: :android: :ajedrez: :-S :-O :-D :-8