gestur

Gestur is an innovative software solution that enables 3D navigation and interaction using only a camera and hand gestures, eliminating the need for traditional input devices.

https://github.com/xavi-burgos99/gestur

Science Score: 26.0%

This score indicates how likely this project is to be science-related based on various indicators:

○
CITATION.cff file
✓
codemeta.json file
Found codemeta.json file
✓
.zenodo.json file
Found .zenodo.json file
○
DOI references
○
Academic publication links
○
Academic email domains
○
Institutional organization owner
○
JOSS paper metadata
○
Scientific vocabulary similarity
Low similarity (2.9%) to scientific vocabulary

Last synced: 10 months ago · JSON representation

Repository

Gestur is an innovative software solution that enables 3D navigation and interaction using only a camera and hand gestures, eliminating the need for traditional input devices.

Basic Info

Host: GitHub
Owner: xavi-burgos99
Language: Python
Default Branch: main
Homepage:
Size: 36.3 MB

Statistics

Stars: 0
Watchers: 1
Forks: 0
Open Issues: 0
Releases: 0

Created over 1 year ago · Last pushed 12 months ago

Metadata Files

Readme License Citation

Gestur: Control de interfaces 3D por gestos y pose

Sistema de interacción con entornos digitales mediante visión artificial, eliminando la necesidad de hardware especializado para exploración inmersiva de contenidos virtuales

Introducción
Características
Estructura del proyecto
Instalación
- Requisitos previos
- Instalación desde código fuente
Uso
- Ejecución básica
- Configuración personalizada
Componentes
Configuración
Ejemplos
Especificaciones técnicas
Bugs y solicitudes de características
Creadores
Licencia

Introducción

Gestur es un sistema de control de interfaces 3D mediante gestos y pose corporal desarrollado específicamente para museos y exposiciones interactivas. Utiliza tecnologías avanzadas de detección de gestos y seguimiento corporal en tiempo real, permitiendo una exploración inmersiva y natural de contenidos virtuales sin necesidad de hardware especializado.

El proyecto aprovecha la cámara web integrada en la mayoría de ordenadores y combina los avances en visión por computador —especialmente en el reconocimiento de poses mediante redes neuronales— para transformar gestos naturales en un sistema de control 3D completamente basado en software.

Características

Control sin contacto: Interacción completamente hands-free mediante movimientos naturales de cabeza y torso
Hardware mínimo: Funciona únicamente con una cámara RGB estándar, sin sensores especializados
Tiempo real: Procesamiento fluido a 17-24 FPS en Raspberry Pi 5
Gestos intuitivos: Sistema de aprendizaje implícito que no requiere instrucciones
Arquitectura modular: Componentes intercambiables y configurables
Multiplataforma: Compatible con Windows, macOS y Linux
Optimizado para museos: Diseñado específicamente para espacios culturales y educativos

Estructura del proyecto

text gestur/ ├── controller.py # Controlador principal y orquestador ├── pose_detector.py # Detección de pose con MediaPipe ├── visualizer.py # Visualizador 3D con Panda3D ├── control_system.py # Sistema de mapeo de gestos ├── requirements.txt # Dependencias del proyecto └── README.md # Documentación

Instalación

Requisitos previos

Asegúrate de tener los siguientes componentes instalados en tu sistema:

Python 3.9 o superior
Cámara RGB (webcam integrada o USB)
OpenCV para procesamiento de video
MediaPipe para detección de pose
Panda3D para renderizado 3D

Instalación desde código fuente

Clona el repositorio: bash git clone https://github.com/gestur/gestur.git cd gestur
Instala las dependencias: bash pip install -r requirements.txt
Verifica la instalación: bash python controller.py --help

Uso

Ejecución básica

Para ejecutar Gestur con un modelo 3D:

bash python controller.py modelo.obj

Configuración personalizada

Ejecutar con modo debug activado:

bash python controller.py modelo.obj --verbose

Especificar preset de control:

bash python controller.py modelo.obj --control-preset continuous --verbose

Gestos de control

El sistema reconoce los siguientes gestos naturales:

Zona neutra (25%-75%): Sin rotación, modelo estático
Cabeza > 75%: Rotación continua hacia la derecha
Cabeza < 25%: Rotación continua hacia la izquierda
Acercarse: Ampliación del modelo (escala 1:1.75)
Alejarse: Modelo en tamaño normal (escala 1:1)

Componentes

PoseDetector

El componente PoseHandTracker es responsable de la detección en tiempo real de la posición y orientación de la cabeza, torso y manos2].

Características principales

MediaPipe Integration: Utiliza MediaPipe Pose 2D para detección robusta2]
Suavizado temporal: Filtrado exponencial para eliminar ruido
Múltiples fuentes: Detección simultánea de cabeza, torso y manos
Configuración flexible: Parámetros ajustables de respuesta y suavizado

Configuración

python tracker = PoseHandTracker( response_time_ms=10, # Tiempo de respuesta smoothing_time_ms=50, # Tiempo de suavizado use_pose=True, # Activar detección de pose use_hands=False, # Desactivar manos en Pi mirror=True, # Efecto espejo verbose=False # Modo debug )

ControlSystem

El sistema de control traduce las poses detectadas en comandos 3D mediante mapeos configurables.

Tipos de mapeo

Rotación híbrida: Combinación de control proporcional y continuo
Mapeo estándar: Relación directa entre pose y transformación
Suavizado exponencial: Filtros temporales para estabilidad

Controlador híbrido

python hybrid_controller = HybridRotationController( max_degrees=30.0, # Rotación máxima left_threshold=0.25, # Umbral izquierdo right_threshold=0.75, # Umbral derecho continuous_speed_degrees_per_second=100.0, # Velocidad continua center=0.5, # Centro neutral invert=True # Invertir dirección )

Visualizer

El componente ControlledObjViewer maneja el renderizado 3D usando Panda3D.

Características

Múltiples formatos: Soporte para OBJ y GLTF
Texturas: Carga automática de materiales
60 FPS: Renderizado independiente del detector
Pantalla completa: Optimizado para instalaciones

Métodos principales

```python

Actualizar modelo con múltiples propiedades

visualizer.update_model( position=[x, y, z], # Posición rotation=[yaw, pitch, roll], # Rotación scale=factor # Escala )

Estado actual

currentstate = visualizer.getcurrent_state() ```

Controller

El controlador principal PoseController actúa como orquestador entre todos los componentes.

Funciones principales

Inicialización: Configuración automática de componentes
Callbacks: Manejo de eventos de pose
Cleanup: Liberación de recursos
Debug: Información detallada en modo verbose

Configuración

Suavizado exponencial

python smoother_config = { 'alpha': 0.3, # Factor de suavizado (0-1) 'decay_rate': 0.1, # Velocidad de decaimiento 'center_x': 0.5, # Centro horizontal 'center_y': 0.5 # Centro vertical }

Sistema de control por defecto

El sistema incluye mapeos preconfigurados:

headxhybrid_roll: Control híbrido de rotación en roll
headxto_yaw: Mapeo de cabeza a rotación yaw
headyto_pitch: Mapeo de cabeza a rotación pitch
headscaletomodelscale: Control de escala por proximidad

Ejemplos

Ejemplo básico

```python from posedetector import PoseHandTracker from visualizer import ControlledObjViewer from controlsystem import createdefaultcontrol_system from controller import PoseController

Crear controlador

controller = PoseController( objpath="modelo.obj", controlsystem=createdefaultcontrol_system(), verbose=True )

Ejecutar sistema

controller.run() ```

Configuración personalizada

```python

Sistema de control personalizado

control_system = ControlSystem()

Agregar mapeos específicos

controlsystem.addmapping(ControlMapping( name="customrotation", inputextractor=extractors['headx'], outputapplier=appliers'rotation_yaw', smoother=ExponentialSmoother(alpha=0.5) )) ```

Especificaciones técnicas

Rendimiento

| Plataforma | FPS Promedio | Detección Manos | Uso CPU | |------------|--------------|-----------------|---------| | Mac M2 Pro | 22-24 FPS | 49.5% | Medio | | Raspberry Pi 5 | 17-24 FPS | < 15% | Alto |

Requisitos mínimos

CPU: Dual-core 1.5 GHz (Raspberry Pi 5 o superior)
RAM: 4 GB
Cámara: RGB 720p mínimo, 1080p recomendado
Almacenamiento: 2 GB para dependencias

Latencia

Detección: < 50ms
Renderizado: 16ms (60 FPS)
Total: < 100ms para respuesta perceptible

Bugs y solicitudes de características

¿Tienes un bug o una solicitud de característica? Por favor busca en los issues existentes y cerrados. Si tu problema o idea no está contemplada, abre un nuevo issue.

Creadores

Este proyecto fue desarrollado como Trabajo de Fin de Grado en la Escola d'Enginyeria de la Universitat Autònoma de Barcelona (UAB).

Xavier Burgos

Email: xavi@dzin.es
Profesor: Prof. Fernando Vilariño
Centro: Computer Vision Center - Dep. Computer Science UAB
Curso: 2024/2025

Agradecimientos

Prof. Fernando Vilariño: Director del TFG y guía constante
Centro de Visión por Computador (CVC): Cesión de hardware y servidor de cálculo
Fran Iglesias y Fundación Épica – La Fura dels Baus: Facilitar pantalla 4K para prototipo
Cátedra UAB–Cruïlla (TSI-100929-2023-2): Apoyo institucional

Licencia

Este proyecto está desarrollado como trabajo académico en la Universitat Autònoma de Barcelona. Para información sobre uso y distribución, consulta los términos específicos del proyecto académico.

Owner

Login: xavi-burgos99
Kind: user

Repositories: 1
Profile: https://github.com/xavi-burgos99

GitHub Events

Total

Watch event: 1
Push event: 7
Public event: 1

Last Year

Watch event: 1
Push event: 7
Public event: 1

Dependencies

.circleci/docker/Dockerfile docker

pytorch/pytorch ${PYTORCH}-cuda${CUDA}-cudnn${CUDNN}-devel build

docker/Dockerfile docker

pytorch/pytorch ${PYTORCH}-cuda${CUDA}-cudnn${CUDNN}-devel build

docker/serve/Dockerfile docker

pytorch/pytorch ${PYTORCH}-cuda${CUDA}-cudnn${CUDNN}-devel build

projects/rtmpose/examples/onnxruntime/requirements.txt pypi

loguru ==0.6.0
numpy ==1.21.6
onnxruntime ==1.14.1
onnxruntime-gpu ==1.8.1

requirements/albu.txt pypi

albumentations >=0.3.2

requirements/build.txt pypi

numpy *
torch >=1.8

requirements/docs.txt pypi

docutils ==0.16.0
markdown *
myst-parser *
sphinx ==4.5.0
sphinx_copybutton *
sphinx_markdown_tables *
urllib3 <2.0.0

requirements/mminstall.txt pypi

mmcv >=2.0.0,<3.0.0
mmdet >=3.0.0,<3.3.0
mmengine >=0.4.0,<1.0.0

requirements/optional.txt pypi

requests *

requirements/poseval.txt pypi

shapely ==1.8.4

requirements/readthedocs.txt pypi

mmcv >=2.0.0rc4
mmengine >=0.6.0,<1.0.0
munkres *
regex *
scipy *
titlecase *
torch >1.6
torchvision *
xtcocotools >=1.13

requirements/runtime.txt pypi

chumpy *
json_tricks *
matplotlib *
munkres *
numpy *
opencv-python *
pillow *
scipy *
torchvision *
xtcocotools >=1.12

requirements/tests.txt pypi

coverage * test
flake8 * test
interrogate * test
isort ==4.3.21 test
parameterized * test
pytest * test
pytest-runner * test
xdoctest >=0.10.0 test
yapf * test

requirements.txt pypi

setup.py pypi

gestur

Science Score: 26.0%

Repository

Basic Info

Statistics

Metadata Files

README.md

Gestur: Control de interfaces 3D por gestos y pose

Table of contents

Introducción

Características

Estructura del proyecto

Instalación

Requisitos previos

Instalación desde código fuente

Uso

Ejecución básica

Configuración personalizada

Gestos de control

Componentes

PoseDetector

Características principales

Configuración

ControlSystem

Tipos de mapeo

Controlador híbrido

Visualizer

Características

Métodos principales

Actualizar modelo con múltiples propiedades

Estado actual

Controller

Funciones principales

Configuración

Suavizado exponencial

Sistema de control por defecto

Ejemplos

Ejemplo básico

Crear controlador

Ejecutar sistema

Configuración personalizada

Sistema de control personalizado

Agregar mapeos específicos

Especificaciones técnicas

Rendimiento

Requisitos mínimos

Latencia

Bugs y solicitudes de características

Creadores

Xavier Burgos

Agradecimientos

Licencia

Owner

GitHub Events

Total

Last Year

Dependencies