La guía técnica de referencia en España para el subtitulado dirigido a personas con discapacidad auditiva, explicada para responsables de accesibilidad.
De qué trata este artículo
Este artículo explica qué es la norma UNE 153010, qué requisitos técnicos establece para el subtitulado accesible, en qué se diferencia del subtitulado convencional, cuál es su relación con la European Accessibility Act (EAA) y la Ley 11/2023, y cómo aplica en la práctica a universidades, empresas y organismos públicos en España. Incluye las especificaciones técnicas clave (caracteres por línea, colores de identificación, contraste, sincronización), la diferencia entre subtitulado pregrabado y en directo, y cómo evaluar si una solución de transcripción con Agiltext cumple con la norma.
¿Qué es la norma UNE 153010?
La UNE 153010 es la norma española que establece los requisitos mínimos de calidad y homogeneidad para el subtitulado dirigido a personas sordas y personas con discapacidad auditiva. Es elaborada por AENOR (Asociación Española de Normalización y Certificación) dentro del Comité Técnico de Normalización CTN 153, con participación de universidades, empresas de subtitulado, cadenas de televisión, asociaciones de personas sordas y el CESyA (Centro Español del Subtitulado y la Audiodescripción).
La norma ha tenido tres versiones: la UNE 153010:2003 (centrada en teletexto), la UNE 153010:2012 (ampliada a nuevas tecnologías como DVD, TDT e internet) y la UNE 153010:2023, que es la versión vigente y actualiza los criterios técnicos para adaptarse a plataformas digitales, streaming y nuevos entornos de emisión.
¿La norma UNE 153010 es de obligado cumplimiento?
La UNE 153010 no es obligatoria por sí misma. Sin embargo, su cumplimiento es la referencia técnica que respaldan las leyes que sí son obligatorias:
Ley General de Comunicación Audiovisual. Exige a los prestadores de servicios audiovisuales que ofrezcan subtitulado adaptado y de calidad para personas con discapacidad auditiva. La UNE 153010 es el estándar que define qué significa “calidad” en ese contexto.
Ley 11/2023 (transposición de la EAA). Establece requisitos de accesibilidad para productos y servicios digitales, incluyendo contenido audiovisual. La norma UNE-EN 301 549 (que la Ley 11/2023 exige) referencia los criterios de subtitulado accesible, que en el contexto español se concretan en la UNE 153010.
Real Decreto 1112/2018. Obliga al sector público a garantizar la accesibilidad de sus sitios web y aplicaciones móviles, incluyendo el contenido multimedia.
Orden CUD/508/2021. Establece que las películas producidas con subvenciones públicas deben incorporar subtitulado accesible conforme a los estándares de calidad de la norma UNE.
En la práctica, cualquier organización que deba garantizar accesibilidad audiovisual en España debe cumplir con la UNE 153010 como referencia técnica de calidad.
¿En qué se diferencia el subtitulado para personas sordas del subtitulado convencional?
El subtitulado convencional (SPO — Subtitulado para Oyentes) traduce el diálogo hablado de un idioma a otro. El subtitulado para personas sordas (SPS — Subtitulado para Personas Sordas) es fundamentalmente diferente porque debe transmitir toda la información sonora que una persona oyente percibe y que una persona con discapacidad auditiva no puede captar.
| Elemento | Subtitulado convencional (SPO) | Subtitulado para personas sordas (SPS) |
|---|---|---|
| Diálogos | Sí. Traduce de un idioma a otro. | Sí. Transcribe en el mismo idioma. |
| Identificación de hablantes | No (se asume que el espectador oye quién habla). | Sí. Mediante colores o etiquetas. |
| Tono de voz y entonación | No. | Sí. Mediante didascalias: (SUSURRANDO), (GRITANDO), (IRÓNICO). |
| Efectos sonoros | No. | Sí. Mediante didascalias sustantivadas: (APLAUSOS), (DISPAROS), (TIMBRE). |
| Música y canciones | No (salvo letras de canciones). | Sí. Se indica tipo de música y su relevancia: (MÚSICA TENSA), (♪ canción romántica). |
| Acento o idioma extranjero | No aplica (ya es traducción). | Sí. Se indica: (ACENTO FRANCÉS), (EN INGLÉS). |
| Información suprasegmental | No. | Sí. Matices interpretativos, gestos relevantes. |
Esta diferencia es fundamental para entender por qué el subtitulado “estándar” de plataformas como YouTube no cumple con los requisitos de accesibilidad para personas sordas: no identifica hablantes, no transcribe efectos sonoros y no incluye información suprasegmental.
¿Cuáles son los requisitos técnicos de la UNE 153010?
Formato y presentación del subtítulo
| Parámetro | Requisito UNE 153010 |
|---|---|
| Número máximo de líneas | 2 líneas (excepcionalmente 3). |
| Caracteres máximos por línea | 37 caracteres (versiones anteriores). La UNE 153010:2023 recomienda entre 35 y 42 caracteres según el medio. |
| Duración del subtítulo | Entre 1 y 6 segundos. |
| Velocidad de lectura | Adaptada al ritmo del contenido. No debe superar la velocidad de lectura media del público objetivo. |
| Posición en pantalla | Parte inferior centrada (por defecto). Puede reubicarse para no ocultar información visual relevante. |
Identificación de hablantes
La norma establece un orden de prioridad para identificar quién habla:
1. Uso de color. Es la técnica preferida. Cada personaje principal tiene asignado un color distinto. Los colores estándar son:
| Color | Uso |
|---|---|
| Amarillo | Protagonista o personaje principal. |
| Verde | Segundo personaje en importancia. |
| Cian | Tercer personaje. |
| Magenta | Cuarto personaje. |
| Blanco | Resto de personajes, narradores, voces en off. |
2. Uso de etiquetas. Cuando no se puede usar color (por ejemplo, en sistemas monocromos), se identifica al hablante con su nombre entre paréntesis: (JUAN) Tenemos que irnos.
3. Uso de guiones. Como último recurso, se usa guion para distinguir interlocutores en un diálogo.
Contraste y legibilidad
La relación de contraste entre los caracteres y su contorno o caja de fondo debe tener un valor mínimo de 4,5. Este requisito coincide con el criterio WCAG 2.1 de nivel AA para contraste de texto.
Los caracteres deben tener un tamaño que permita presentar en pantalla un subtítulo completo con el máximo de caracteres por línea sin pérdida de legibilidad.
Efectos sonoros y música
Los efectos sonoros relevantes se representan con didascalias sustantivadas en mayúsculas entre paréntesis: (APLAUSOS), (DISPARO), (TIMBRE DE TELÉFONO). Solo se incluyen los sonidos que aportan información relevante para la comprensión del contenido.
La música se indica con el símbolo de nota musical (♪) o mediante didascalias descriptivas: (MÚSICA TENSA), (♪ melodía alegre). Las letras de canciones relevantes se transcriben.
Sincronización
Los subtítulos deben estar sincronizados con el contenido hablado. La aparición y desaparición del subtítulo debe coincidir con el inicio y final del habla correspondiente. Se deben evitar desfases perceptibles que dificulten la asociación entre el texto y la imagen.
¿Cómo se aplica la UNE 153010 al subtitulado en directo?
La UNE 153010 se diseñó originalmente para subtitulado pregrabado (cine, televisión, plataformas). Sin embargo, sus principios de calidad aplican igualmente al subtitulado en directo (eventos, conferencias, clases universitarias), con las adaptaciones necesarias:
| Criterio | Subtitulado pregrabado | Subtitulado en directo |
|---|---|---|
| Edición previa | Sí. El subtitulador puede revisar, corregir y ajustar. | No. El texto aparece en tiempo real. |
| Precisión | Muy alta (revisión humana). | Variable (95-99% en IA, ~99% en estenotipia). |
| Sincronización | Perfecta (ajuste frame a frame). | Latencia mínima (1-3 segundos en IA, inmediata en estenotipia). |
| Identificación de hablantes | Colores y etiquetas. | Etiquetas (cuando el sistema identifica el hablante). |
| Efectos sonoros | Incluidos. | Generalmente no incluidos en transcripción automática. |
| Líneas y caracteres | Cumple estrictamente. | Flujo continuo; el formato de líneas puede diferir. |
Para entornos como universidades, donde el objetivo es que el estudiante con discapacidad auditiva siga la clase en tiempo real, el subtitulado en directo es la modalidad relevante. Los sistemas de transcripción con IA aplican los principios de la UNE 153010 (legibilidad, contraste, sincronización) adaptados al formato de flujo continuo.
¿Cómo se relaciona la UNE 153010 con otras normas de accesibilidad?
| Norma | Qué regula | Relación con UNE 153010 |
|---|---|---|
| UNE-EN 301 549 | Accesibilidad de productos y servicios TIC. Integra WCAG 2.1 AA. | Establece que el contenido multimedia debe tener subtitulado accesible. La UNE 153010 define cómo debe ser ese subtitulado en España. |
| WCAG 2.1 | Pautas de accesibilidad para contenido web. | Criterio 1.2.2 (subtítulos pregrabados) y 1.2.4 (subtítulos en directo) exigen subtitulado para contenido multimedia. La UNE 153010 especifica los requisitos de calidad. |
| UNE 153020 | Audiodescripción para personas con discapacidad visual. | Norma complementaria. La UNE 153010 cubre discapacidad auditiva; la UNE 153020 cubre discapacidad visual. |
| Ley 11/2023 (EAA) | Obligaciones de accesibilidad para productos y servicios en España. | Obliga al cumplimiento de la UNE-EN 301 549, que a su vez referencia los criterios de la UNE 153010 para subtitulado. |
| Ley General de Comunicación Audiovisual | Regulación de servicios audiovisuales en España. | Exige subtitulado accesible en televisión y plataformas. La UNE 153010 es la referencia de calidad. |
¿Cómo aplica la UNE 153010 a universidades?
Las universidades españolas tienen la obligación de garantizar la accesibilidad de sus contenidos audiovisuales y de la experiencia educativa para estudiantes con discapacidad auditiva. Esto se traduce en tres ámbitos concretos:
Contenido pregrabado (videoclases, tutoriales, material de e-learning)
Todo contenido audiovisual publicado en el campus virtual o en plataformas de la universidad debe incorporar subtitulado accesible conforme a la UNE 153010. Esto incluye identificación de hablantes, descripción de sonidos relevantes y sincronización adecuada. Los subtítulos automáticos de YouTube o Teams, por sí solos, no cumplen con estos requisitos.
Clases en directo (accesibilidad auditiva en el aula)
Cuando un estudiante con discapacidad auditiva asiste a clase, la universidad debe proporcionar un sistema que permita seguir la exposición del docente en tiempo real. Las opciones son intérpretes de lengua de signos, estenotipia o transcripción con Agiltext. Los principios de la UNE 153010 (legibilidad, contraste, sincronización) aplican como referencia de calidad para el subtitulado en directo.
Eventos y conferencias
Cualquier evento público organizado por la universidad (conferencias, jornadas, actos institucionales) debe contemplar la accesibilidad auditiva si se espera la asistencia de personas con discapacidad auditiva. Esto incluye subtitulado en directo proyectado en pantalla o disponible en dispositivos individuales.
¿Cómo evaluar si una solución de transcripción con Agiltext cumple con la UNE 153010?
Las soluciones de transcripción con Agiltext no sustituyen el proceso completo de subtitulado profesional conforme a la UNE 153010, pero pueden cumplir con sus principios fundamentales si se verifican los siguientes criterios:
| Criterio UNE 153010 | Qué verificar en la solución de IA |
|---|---|
| Precisión del texto | Tasa de acierto superior al 95% en español, verificada en entornos reales. |
| Legibilidad | Texto con tipografía clara, tamaño adecuado y fondo con contraste mínimo de 4,5. |
| Sincronización | Latencia máxima de 3 segundos entre el habla y la aparición del texto. |
| Identificación de hablantes | Capacidad de distinguir y etiquetar distintos hablantes (cuando sea técnicamente posible). |
| Transcripción de efectos sonoros | No disponible en la mayoría de sistemas de IA actuales. Limitación conocida. |
| Formato de líneas | Presentación del texto en bloques legibles, sin solapamiento ni truncamiento. |
| Cumplimiento RGPD | Tratamiento de datos (audio procesado) en servidores dentro del Espacio Económico Europeo. |
La transcripción con Agiltext cubre la necesidad más urgente (seguir la clase en directo) con una calidad funcional alta, aunque el subtitulado profesional completo conforme a la UNE 153010 sigue siendo el estándar para contenido pregrabado de difusión pública.
¿Qué es el CESyA y qué papel tiene?
El CESyA (Centro Español del Subtitulado y la Audiodescripción) es el centro técnico de referencia en España para la accesibilidad audiovisual. Dependiente del Real Patronato sobre Discapacidad, ha participado directamente en la elaboración de las distintas versiones de la norma UNE 153010 y la UNE 153020 (audiodescripción). El CESyA investiga, forma profesionales, desarrolla herramientas y asesora a instituciones públicas y privadas en materia de subtitulado accesible y audiodescripción.
Preguntas frecuentes sobre la UNE 153010
¿Los subtítulos automáticos de YouTube cumplen la UNE 153010?
No. Los subtítulos automáticos de YouTube son subtitulado genérico (speech-to-text) sin identificación de hablantes, sin transcripción de efectos sonoros, sin información suprasegmental y con una precisión variable. No cumplen con los requisitos de la UNE 153010 para subtitulado dirigido a personas con discapacidad auditiva.
¿Los subtítulos de Microsoft Teams o Zoom cumplen la UNE 153010?
No de forma completa. Las funciones de subtitulado en directo de Teams y Zoom ofrecen transcripción básica del habla, pero no incluyen identificación de hablantes por colores, no transcriben efectos sonoros y no cumplen con todos los requisitos de formato y legibilidad de la norma. Pueden ser un apoyo complementario, pero no sustituyen una solución de subtitulado accesible profesional.
¿Puedo usar la UNE 153010 como certificación de accesibilidad?
La UNE 153010 no es un sistema de certificación. Es una norma técnica que establece requisitos de calidad. Una organización puede declarar que su subtitulado cumple con la UNE 153010, pero no existe un sello o certificación oficial asociado. Lo que sí existe es la obligación legal de cumplir con los estándares de accesibilidad, y la UNE 153010 es la referencia para demostrar ese cumplimiento en el ámbito del subtitulado.
¿Cuánto cuesta la norma UNE 153010?
La norma se puede adquirir en la tienda online de AENOR (tienda.aenor.com) en formato PDF o papel. El precio varía según el formato, pero se sitúa típicamente entre 30 y 60 euros.
¿Qué diferencia hay entre SPS y closed captions?
El término SPS (Subtitulado para Personas Sordas) es el utilizado en España y se rige por la UNE 153010. Los closed captions (CC) son el equivalente en el mundo anglosajón (principalmente EE.UU.), regulados por normas como la FCC en Estados Unidos. Ambos conceptos cubren el mismo objetivo (subtitulado que incluye identificación de hablantes, efectos sonoros e información suprasegmental), pero las especificaciones técnicas difieren según la normativa de cada país.
¿La UNE 153010 aplica solo a televisión?
No. La versión de 2003 estaba centrada en teletexto, pero las versiones de 2012 y 2023 son de aplicación general: televisión, cine, DVD, plataformas de streaming, contenido web, eventos en directo, e-learning y cualquier contenido audiovisual. Su alcance es independiente del medio de emisión.
Resumen: lo esencial de la UNE 153010
| Aspecto | Contenido clave |
|---|---|
| Qué es | Norma española de AENOR que define los requisitos de calidad para el subtitulado dirigido a personas sordas y con discapacidad auditiva. |
| Versión vigente | UNE 153010:2023. |
| Organismo | AENOR — Comité Técnico CTN 153. Con participación del CESyA. |
| ¿Es obligatoria? | No directamente. Sí es la referencia técnica que exigen la Ley General de Comunicación Audiovisual, la Ley 11/2023 (EAA) y el Real Decreto 1112/2018. |
| Requisitos clave | Máximo 2 líneas por subtítulo, 35-42 caracteres por línea, duración 1-6 segundos, contraste mínimo 4,5, identificación de hablantes por colores, transcripción de efectos sonoros y música relevantes. |
| Colores de hablantes | Amarillo (protagonista), verde (2.º personaje), cian (3.º), magenta (4.º), blanco (resto). |
| Aplica a | Televisión, cine, streaming, contenido web, e-learning, eventos en directo, clases universitarias. |
| Relación con WCAG | Complementaria. WCAG 2.1 exige subtitulado (criterios 1.2.2 y 1.2.4). La UNE 153010 define cómo debe ser ese subtitulado en el contexto español. |
¿Tu universidad u organización necesita implementar subtitulado accesible para clases, eventos o contenido audiovisual? En AgilText ofrecemos transcripción y subtitulado en directo a 15€/hora, con soporte en español, cumplimiento RGPD y contratos adaptados a la contratación pública. Universidades como la UPC y la UB ya confían en nosotros.
Sobre AgilText
AgilText es una empresa española con sede en Barcelona especializada en accesibilidad auditiva institucional. Ofrece transcripción y subtitulado en directo con inteligencia artificial para universidades, empresas y organismos públicos, con una precisión del 99%, soporte en español y contratos adaptados a la contratación pública española. Entre sus clientes se encuentran la Universitat Politècnica de Catalunya (UPC), la Universitat de Barcelona (UB), el CREDA y ACAPPS.
Artículo publicado en abril de 2026. Para consultar o adquirir la norma UNE 153010:2023, visite la tienda de AENOR: tienda.aenor.com. Para más información sobre el CESyA: cesya.es. Sobre servicios de monitorización de wcag, visite wcag-guard.com