Basado en el gran modelo de IA, cree interacciones emocionales delicadas que puedan ser percibidas por los consumidores.
A través de los sensores táctiles, micrófonos, cámaras y sensores de detección de infrarrojos que cubren la cabeza. y viceversa, puede percibir el entorno circundante e interactuar con el entorno circundante.
Fusión de entrada de voz y entrada visual (centrándose en fotogramas estáticos), utilizando un "multimodal texto-imagen
modelo grande" para generar conversaciones
Los sensores y micrófonos de detección de infrarrojos detectan actividades biológicas e interactúan activamente con
usuarios
Salida de expresión emocional multimodal a través de motores paso a paso para el cuerpo y la mano, pantalla LCD (ojos) y altavoces
Escritorio, mesita de noche, abrazo
Ubicación relativamente fija, requisitos de movilidad débiles, conexión prolongada al cargador
| ASR + Maestría en Derecho Comprensión de imágenes visuales. Eventos táctiles Temporizador de infrarrojos Memoria de diálogo Configuración de personajes |
| Plataforma de modelos a gran escala basada en la nube en red (Percepción multimodal, modelo de lenguaje grande, memoria conversacional, consulta de red) |
| Capa de sistema de control y percepción multimodal | |||
| Comprensión de la escena Control de disparo | Control de iluminación | Control de motores | Control de pantalla |
| Capa de incrustación de hardware (cuerpo del robot) | ||||
escena
comprensiónControl de activación |
Iluminación
controlar |
Control de motores |
Pantalla
controlar |
Pantalla
controlar |
| Dispositivo | Especificaciones/Características |
| Micrófono | Admite reconocimiento de voz de campo lejano (alcance de 5 metros) y captación de sonido direccional para recibir comandos de voz. |
| Cámara | Se utiliza para el reconocimiento de entornos y objetos. |
| sensor de infrarrojos | Se utiliza para despertar de baja potencia activado por el cuerpo humano/mascota. |
| Sensor táctil | Los módulos táctiles distribuidos (cabeza, espalda, abdomen) se utilizan para detectar caricias y palmaditas (como "tocar la cabeza" y "hacer cosquillas"). |
| Sensor de gravedad | Detecta el estado de movimiento del cuerpo y activa una "señal de socorro" (como un mensaje de voz "Me caí y duele") cuando el producto cae. |
| Dispositivo | Especificaciones/Características |
| Pantalla de expresión LCD | Pantalla LCD de 4,28 pulgadas (ojos), admite visualización de expresión dinámica y visualización binocular (como retroalimentación visual al "hacerse el muerto" o "actuar lindo"). |
| Vocero | Altavoz mono/4Ω, 5W de rango completo (como salida de voz al "cantar una canción" o "contar un chiste"). |
| Tiras de luz LED a todo color | Tiras de luz de colores que reproducen efectos de iluminación relevantes para el "estado emocional" o que pueden usarse como luces indicadoras. |
| Dispositivo | Especificaciones/Características |
| motor paso a paso | Motores duales para agitar y girar la cabeza (cintura) |
| Dispositivo | Especificaciones/Características |
| chip de control principal | V821: control de funciones básicas, procesamiento de voz, visualización asincrónica binocular |
| Wi-Fi/Bluetooth | Wi-Fi 2,4G + Bluetooth |
| Unidad de almacenamiento | NAND FLASH 256 MB, 64 MB de RAM |
| Dispositivo | Especificaciones/Características |
| batería de litio | Capacidad de 3000 mAh/7,2 V, admite carga rápida, 2 horas de duración de la batería y 2 días de espera integral; Equipado con un chip de detección de energía. |
| Cargar | Micrófono |
| Módulos accesorios | Se pueden cambiar diferentes estilos de ropa y accesorios. |
| enojado | pone los ojos en blanco | débil | actúa genial |
| entusiasmo | triste | extraño | tímido |
| riendo a carcajadas | sonrisa | ojos del corazon | apoyar |
| dormir | lindo | explotado | Sun Wu Kong |
| aturdimiento | curioso | bizco | demonio |