This article has multiple issues. Please help improve it or discuss these issues on the talk page. (Learn how and when to remove these messages)
|
Sistemas de comunicaciones multimedia basados en paquetes | |
Estado | En vigor |
---|---|
Año iniciado | 1996 (1996) |
Última versión | 8 de marzo de 2022 (2022-03) |
Organización | UIT-T |
Normas relacionadas | Q.931 |
Sitio web | www.itu.int/rec/T-REC-H.323 |
H.323 es una recomendación del Sector de Normalización de las Telecomunicaciones de la UIT (UIT-T) que define los protocolos para proporcionar sesiones de comunicación audiovisual en cualquier red de paquetes . [1] El estándar H.323 aborda la señalización y el control de llamadas, el transporte y el control multimedia y el control del ancho de banda para conferencias punto a punto y multipunto. [2]
Es ampliamente implementado [3] por fabricantes de equipos de voz y videoconferencia , se utiliza en varias aplicaciones de Internet en tiempo real como GnuGK y NetMeeting y es ampliamente implementado en todo el mundo por proveedores de servicios y empresas para servicios de voz y video sobre redes IP .
Es parte de la serie de protocolos ITU-T H.32x, que también abordan las comunicaciones multimedia a través de ISDN , PSTN o SS7 y redes móviles 3G .
La señalización de llamadas H.323 se basa en el protocolo de la Recomendación Q.931 de la UIT-T y es adecuada para transmitir llamadas a través de redes que utilizan una combinación de IP, PSTN, ISDN y QSIG sobre ISDN. Un modelo de llamada, similar al modelo de llamada ISDN, facilita la introducción de la telefonía IP en las redes existentes de sistemas PBX basados en ISDN , incluidas las transiciones a PBX basados en IP.
En el contexto de H.323, una centralita IP puede ser un portero u otro elemento de control de llamadas que proporcione servicio a teléfonos o videoteléfonos . Un dispositivo de este tipo puede proporcionar o facilitar tanto servicios básicos como servicios complementarios, como transferencia de llamadas , estacionamiento , captura y retención de llamadas .
La primera versión de H.323 fue publicada por la UIT en noviembre de 1996 [4] con énfasis en permitir capacidades de videoconferencia a través de una red de área local (LAN), pero fue rápidamente adoptada por la industria como un medio para transmitir comunicaciones de voz a través de una variedad de redes IP, incluidas WAN e Internet (ver VoIP ).
A lo largo de los años, H.323 se ha revisado y vuelto a publicar con las mejoras necesarias para permitir una mejor funcionalidad de voz y video en redes de conmutación de paquetes , y cada versión es compatible con la versión anterior. [5] Reconociendo que H.323 se estaba utilizando para la comunicación no solo en redes LAN, sino también en redes WAN y dentro de grandes redes de operadores, el título de H.323 se cambió cuando se publicó en 1998. [6] El título, que desde entonces no ha cambiado, es "Sistemas de comunicaciones multimedia basados en paquetes". La versión actual de H.323 se aprobó en 2009. [7]
Una de las ventajas de H.323 fue la disponibilidad relativamente temprana de un conjunto de estándares que no sólo definían el modelo básico de llamada, sino también los servicios complementarios necesarios para abordar las expectativas de comunicación empresarial. [ cita requerida ]
H.323 fue el primer estándar VoIP en adoptar el protocolo de transporte en tiempo real (RTP) del estándar Internet Engineering Task Force (IETF) para transportar audio y video a través de redes IP. [ cita requerida ]
H.323 es una especificación de sistema que describe el uso de varios protocolos de la ITU-T y la IETF. Los protocolos que constituyen el núcleo de casi cualquier sistema H.323 son: [8]
Muchos sistemas H.323 también implementan otros protocolos que se definen en varias Recomendaciones de la UIT-T para brindar soporte de servicios complementarios o entregar otras funciones al usuario. Algunas de esas Recomendaciones son: [ cita requerida ]
Además de esas recomendaciones UIT-T, H.323 implementa varias solicitudes de comentarios (RFC) del IETF para el transporte de medios y la paquetización de medios, incluido el Protocolo de transporte en tiempo real (RTP).
H.323 utiliza tanto códecs definidos por la UIT como códecs definidos fuera de la UIT. Los códecs que se implementan ampliamente en los equipos H.323 incluyen:
Todos los terminales H.323 que proporcionen comunicaciones de vídeo deberán ser capaces de codificar y decodificar vídeo de acuerdo con H.261 QCIF . Todos los terminales H.323 deberán tener un códec de audio y deberán ser capaces de codificar y decodificar voz de acuerdo con la Rec. UIT-T G.711. Todos los terminales deberán ser capaces de transmitir y recibir A-law y μ-law . La compatibilidad con otros códecs de audio y vídeo es opcional. [7]
El sistema H.323 define varios elementos de red que trabajan juntos para ofrecer capacidades de comunicación multimedia avanzadas. Esos elementos son terminales, unidades de control multipunto (MCU), puertas de enlace , guardianes y elementos de borde. En conjunto, los terminales, las unidades de control multipunto y las puertas de enlace suelen denominarse puntos finales . H.323 utiliza el puerto TCP número 1720.
Si bien no se requieren todos los elementos, se requieren al menos dos terminales para permitir la comunicación entre dos personas. En la mayoría de las implementaciones H.323, se utiliza un controlador de acceso para, entre otras cosas, facilitar la resolución de direcciones.
Los terminales de una red H.323 son los elementos más fundamentales de cualquier sistema H.323, ya que son los dispositivos con los que los usuarios se encontrarían normalmente. Pueden existir en forma de un simple teléfono IP o un potente sistema de videoconferencia de alta definición.
Dentro de un terminal H.323 hay algo denominado pila de protocolos , que implementa la funcionalidad definida por el sistema H.323. La pila de protocolos incluiría una implementación del protocolo básico definido en las recomendaciones H.225.0 y H.245 de la UIT-T, así como RTP u otros protocolos descritos anteriormente.
El diagrama, figura 1, muestra una pila completa y sofisticada que brinda soporte para voz, video y varias formas de comunicación de datos. En realidad, la mayoría de los sistemas H.323 no implementan una gama tan amplia de capacidades, pero la disposición lógica resulta útil para comprender las relaciones.
Una unidad de control multipunto (MCU) es responsable de gestionar conferencias multipunto y está compuesta por dos entidades lógicas denominadas controlador multipunto (MC) y procesador multipunto (MP). En términos más prácticos, una MCU es un puente de conferencia similar a los puentes de conferencia que se utilizan en la PSTN actual. Sin embargo, la diferencia más significativa es que las MCU H.323 pueden mezclar o conmutar vídeo, además de la mezcla de audio normal que realiza un puente de conferencia tradicional. Algunas MCU también proporcionan capacidades de colaboración de datos multipunto. Lo que esto significa para el usuario final es que, al realizar una llamada de vídeo en una MCU H.323, el usuario puede ver a todos los demás participantes de la conferencia, no solo escuchar sus voces.
Las puertas de enlace son dispositivos que permiten la comunicación entre redes H.323 y otras redes, como redes PSTN o ISDN. Si una de las partes de una conversación utiliza un terminal que no es H.323, la llamada debe pasar por una puerta de enlace para que ambas partes puedan comunicarse.
En la actualidad, los gateways se utilizan ampliamente para permitir que los teléfonos PSTN tradicionales se interconecten con las grandes redes H.323 internacionales que actualmente implementan los proveedores de servicios. Los gateways también se utilizan dentro de la empresa para permitir que los teléfonos IP empresariales se comuniquen a través del proveedor de servicios con los usuarios de la PSTN.
Las pasarelas también se utilizan para permitir que los dispositivos de videoconferencia basados en H.320 y H.324 se comuniquen con sistemas H.323. La mayoría de las redes móviles de tercera generación (3G) implementadas en la actualidad utilizan el protocolo H.324 y pueden comunicarse con terminales basados en H.323 en redes corporativas a través de estos dispositivos de pasarela.
Un gatekeeper es un componente opcional de la red H.323 que proporciona una serie de servicios a terminales, puertas de enlace y dispositivos MCU. Estos servicios incluyen el registro de puntos finales, la resolución de direcciones, el control de admisión, la autenticación de usuarios, etc. De las diversas funciones que realiza el gatekeeper, la resolución de direcciones es la más importante, ya que permite que dos puntos finales se comuniquen entre sí sin que ninguno de ellos tenga que conocer la dirección IP del otro.
Los controladores de acceso pueden estar diseñados para funcionar en uno de dos modos de señalización, a saber, el modo "enrutado directo" y el modo "enrutado por el controlador de acceso". El modo enrutado directo es el más eficiente y el más utilizado. En este modo, los puntos finales utilizan el protocolo RAS para conocer la dirección IP del punto final remoto y se establece una llamada directamente con el dispositivo remoto. En el modo enrutado por el controlador de acceso, la señalización de la llamada siempre pasa por el controlador de acceso. Si bien este último modo requiere que el controlador de acceso tenga más capacidad de procesamiento, también le otorga un control total sobre la llamada y la capacidad de proporcionar servicios complementarios en nombre de los puntos finales.
Los puntos finales H.323 utilizan el protocolo RAS para comunicarse con un controlador de acceso. Asimismo, los controladores de acceso utilizan RAS para comunicarse con otros controladores de acceso.
Una colección de puntos finales que están registrados en un único controlador de acceso en H.323 se denomina “zona”. Esta colección de dispositivos no necesariamente tiene que tener una topología física asociada. Más bien, una zona puede ser completamente lógica y estar definida arbitrariamente por el administrador de red .
Los controladores de acceso tienen la capacidad de comunicarse entre sí para que la resolución de llamadas pueda ocurrir entre zonas. La comunicación entre zonas facilita el uso de planes de marcado como el Esquema de marcado global . Los planes de marcado facilitan la marcación "entre zonas" para que dos puntos finales en zonas separadas puedan seguir comunicándose entre sí.
Los elementos de borde y los elementos de pares son entidades opcionales similares a un portero, pero que no administran puntos finales directamente y brindan algunos servicios que no se describen en el protocolo RAS. La función de un elemento de borde o de pares se entiende a través de la definición de un " dominio administrativo ".
Un dominio administrativo es el conjunto de todas las zonas que están bajo el control de una sola persona u organización, como un proveedor de servicios. Dentro de la red de un proveedor de servicios puede haber cientos o miles de dispositivos de puerta de enlace, teléfonos, terminales de vídeo u otros elementos de red H.323. El proveedor de servicios puede organizar los dispositivos en "zonas" que le permitan gestionar mejor todos los dispositivos bajo su control, como una disposición lógica por ciudad. En conjunto, todas las zonas dentro de la red del proveedor de servicios aparecerían ante otro proveedor de servicios como un "dominio administrativo".
El elemento de borde es una entidad de señalización que generalmente se ubica en el borde del dominio administrativo y se comunica con otro dominio administrativo. Esta comunicación puede incluir elementos como información de autorización de acceso, información de precios de llamadas u otros datos importantes necesarios para permitir la comunicación entre los dos dominios administrativos.
Los elementos de pares son entidades dentro del dominio administrativo que, en mayor o menor medida, ayudan a propagar la información obtenida de los elementos fronterizos a lo largo del dominio administrativo. Esta arquitectura tiene como objetivo permitir implementaciones a gran escala dentro de las redes de operadores y habilitar servicios como centros de intercambio de información.
El diagrama, figura 2, proporciona una ilustración de un dominio administrativo con elementos fronterizos, elementos pares y guardianes.
H.323 se define como un protocolo binario que permite un procesamiento eficiente de mensajes en elementos de red. La sintaxis del protocolo se define en ASN.1 y utiliza la forma PER ( Packed Encoding Rules ) de codificación de mensajes para una codificación eficiente de los mensajes en la red. A continuación se presenta una descripción general de los diversos flujos de comunicación en los sistemas H.323.
Una vez resuelta la dirección del punto final remoto, el punto final utilizará la señalización de llamadas H.225.0 para establecer la comunicación con la entidad remota. Los mensajes H.225.0 son: [9]
En su forma más simple, una llamada H.323 se puede establecer de la siguiente manera (figura 3).
En este ejemplo, el punto final (EP) de la izquierda inició la comunicación con el gateway de la derecha y el gateway conectó la llamada con la parte llamada. En realidad, los flujos de llamadas suelen ser más complejos que el que se muestra, pero la mayoría de las llamadas que utilizan los procedimientos de Fast Connect definidos en H.323 se pueden establecer con tan solo 2 o 3 mensajes. Los puntos finales deben notificar a su gatekeeper (si se utilizan gatekeepers) que están en una llamada.
Una vez finalizada la llamada, un dispositivo enviará un mensaje de finalización de la llamada. A continuación, los puntos finales deben notificar a su controlador (si se utilizan controladores) que la llamada ha finalizado.
Los puntos finales utilizan el protocolo RAS para comunicarse con un portero. Del mismo modo, los porteros utilizan RAS para comunicarse con los porteros pares. RAS es un protocolo bastante simple compuesto por unos pocos mensajes. A saber:
Cuando se enciende un punto final, generalmente enviará un mensaje de solicitud de gatekeeper (GRQ) para "descubrir" gatekeepers que estén dispuestos a proporcionar servicio. Los gatekeepers responderán con una confirmación de gatekeeper (GCF) y el punto final seleccionará un gatekeeper con el que trabajar. Alternativamente, es posible que se haya predefinido un gatekeeper en la configuración administrativa del sistema, por lo que no es necesario que el punto final descubra uno.
Una vez que el punto final determina con qué controlador trabajará, intentará registrarse con él enviando una solicitud de registro (RRQ), a la que el controlador responde con una confirmación de registro (RCF). En este punto, la red conoce el punto final y puede realizar y ubicar llamadas.
Cuando un punto final desea realizar una llamada, enviará una solicitud de admisión (ARQ) al controlador de acceso. El controlador de acceso resolverá la dirección (ya sea localmente, consultando a otro controlador de acceso o consultando a algún otro servicio de red) y devolverá la dirección del punto final remoto en el mensaje de confirmación de admisión (ACF). El punto final puede entonces realizar la llamada.
Al recibir una llamada, un punto final remoto también enviará un ARQ y recibirá un ACF para obtener permiso para aceptar la llamada entrante. Esto es necesario, por ejemplo, para autenticar el dispositivo que llama o para garantizar que haya ancho de banda disponible para la llamada.
La figura 4 muestra un intercambio de comunicación de alto nivel entre dos puntos finales (EP) y dos guardianes (GK).
Una vez que se ha iniciado una llamada (pero no necesariamente se ha conectado por completo), los puntos finales pueden iniciar la señalización de control de llamada H.245 para proporcionar un control más amplio sobre la conferencia. H.245 es una especificación bastante voluminosa con muchos procedimientos que habilitan completamente la comunicación multipunto, aunque en la práctica la mayoría de las implementaciones solo implementan el mínimo necesario para habilitar la comunicación de voz y video punto a punto .
H.245 ofrece capacidades como negociación de capacidades, determinación maestro/esclavo , apertura y cierre de "canales lógicos" (es decir, flujos de audio y video), control de flujo y control de conferencia. Admite comunicación unicast y multicast , lo que permite que el tamaño de una conferencia crezca teóricamente sin límites.
De las funciones que ofrece H.245, la negociación de capacidades es posiblemente la más importante, ya que permite que los dispositivos se comuniquen sin tener conocimiento previo de las capacidades de la entidad remota. H.245 permite capacidades multimedia enriquecidas, que incluyen comunicación de audio, video, texto y datos. Para la transmisión de audio, video o texto, los dispositivos H.323 utilizan tanto códecs definidos por la UIT como códecs definidos fuera de la UIT. Los códecs que se implementan ampliamente en los equipos H.323 incluyen:
H.245 también permite la capacidad de realizar conferencias de datos en tiempo real a través de protocolos como T.120 . Las aplicaciones basadas en T.120 generalmente funcionan en paralelo con el sistema H.323, pero se integran para brindar al usuario una experiencia multimedia perfecta. T.120 proporciona capacidades como uso compartido de aplicaciones T.128 , pizarra electrónica T.126 , transferencia de archivos T.127 y chat de texto T.134 dentro del contexto de la conferencia.
Cuando un dispositivo H.323 inicia la comunicación con un dispositivo H.323 remoto y cuando se establece la comunicación H.245 entre las dos entidades, el mensaje Terminal Capability Set (TCS) es el primer mensaje que se transmite al otro lado.
Después de enviar un mensaje TCS, las entidades H.323 (a través de intercambios H.245) intentarán determinar qué dispositivo es el "maestro" y cuál es el "esclavo". Este proceso, conocido como Determinación maestro/esclavo (MSD), es importante, ya que el maestro en una llamada resuelve todas las "disputas" entre los dos dispositivos. Por ejemplo, si ambos puntos finales intentan abrir flujos de medios incompatibles, es el maestro quien toma la acción de rechazar el flujo incompatible.
Una vez que se intercambian las capacidades y se completan los pasos de determinación maestro/esclavo, los dispositivos pueden abrir "canales lógicos" o flujos de medios. Esto se hace simplemente enviando un mensaje de canal lógico abierto (OLC) y recibiendo un mensaje de confirmación. Al recibir el mensaje de confirmación, un punto final puede transmitir audio o video al punto final remoto.
Un intercambio H.245 típico se parece a la figura 5:
Después de este intercambio de mensajes, los dos puntos finales (EP) de esta figura estarían transmitiendo audio en cada dirección. El número de intercambios de mensajes es numeroso, cada uno tiene un propósito importante, pero aun así lleva tiempo.
Por este motivo, la versión 2 de H.323 (publicada en 1998) introdujo un concepto llamado Fast Connect, que permite a un dispositivo establecer flujos de medios bidireccionales como parte de los procedimientos de establecimiento de llamadas H.225.0. Con Fast Connect, es posible establecer una llamada con flujos de medios bidireccionales con no más de dos mensajes, como en la figura 3.
Fast Connect tiene un amplio respaldo en la industria. Aun así, la mayoría de los dispositivos aún implementan el intercambio H.245 completo como se muestra arriba y realizan ese intercambio de mensajes en paralelo con otras actividades, por lo que no hay demoras perceptibles para la parte que llama o la parte a la que se llama.
El protocolo de voz sobre Internet (VoIP) describe la transmisión de voz a través de Internet u otras redes de conmutación de paquetes. La recomendación H.323 de la UIT-T es una de las normas utilizadas en VoIP. VoIP requiere una conexión a Internet u otra red de conmutación de paquetes, una suscripción a un proveedor de servicios VoIP y un cliente (un adaptador telefónico analógico (ATA), un teléfono VoIP o un " softphone "). El proveedor de servicios ofrece la conexión a otros servicios VoIP o a la PSTN. La mayoría de los proveedores de servicios cobran una tarifa mensual y luego se aplican costos adicionales cuando se realizan llamadas. [ cita requerida ] El uso de VoIP entre dos ubicaciones de la empresa no necesariamente requeriría un proveedor de servicios VoIP, por ejemplo. H.323 ha sido ampliamente implementado por empresas que desean interconectar ubicaciones remotas a través de IP utilizando varias tecnologías cableadas e inalámbricas.
Una videoconferencia, o videoteleconferencia (VTC), es un conjunto de tecnologías de telecomunicaciones que permiten que dos o más ubicaciones interactúen mediante transmisiones de audio y video bidireccionales simultáneamente. Básicamente, existen dos tipos de videoconferencia: los sistemas VTC dedicados tienen todos los componentes necesarios empaquetados en una sola pieza de equipo, mientras que los sistemas VTC de escritorio son complementos de las PC normales , transformándolas en dispositivos VTC. La videoconferencia simultánea entre tres o más puntos remotos es posible por medio de una unidad de control multipunto (MCU). Existen puentes MCU para videoconferencias basadas en IP e ISDN. Debido al precio y la proliferación de Internet, y de la banda ancha en particular, ha habido un fuerte aumento en el crecimiento y uso de la videoconferencia IP basada en H.323. H.323 es accesible para cualquier persona con una conexión a Internet de alta velocidad, como DSL . La videoconferencia se utiliza en diversas situaciones, por ejemplo; educación a distancia , telemedicina , servicio de retransmisión de video y negocios. [ cita necesaria ] [ necesita actualización ]
{{cite web}}
: CS1 maint: unfit URL (link)