loading...

29 de mayo de 2013

GSM Códec de audio / Vocoder

Audio / códecs de voz y vocoders convertir la voz de señales requerida para ser transmitida a través de un enlace de GSM en un formato digital compacta.Tecnologías de codificación de voz utilizado en GSM incluyen LPC-RPE, EFR, Full Rate, Half Rate, AMR codec y AMR-WB y codec CELP, ACELP, VSELP, tecnologías de codificación del habla.

Los códecs de audio o vocoders se utilizan universalmente dentro del sistema GSM. Reducen la tasa de bits de la palabra que se ha convertido a partir de su análogo para en un formato digital para que pueda llevarse dentro del ancho de banda disponible para el canal. Sin el uso de un códec de voz, la voz digitalizada se ocupan un ancho de banda mucho más ancha que estaría disponible. En consecuencia códecs GSM son un elemento particularmente importante en el sistema global.

Una variedad de diferentes formas de códec de audio o codificador de voz están disponibles para el uso general, y el sistema GSM soporta un número de códecs de audio específicos.Estos incluyen la, media tasa de RPE-LPC y códecs AMR. El rendimiento de cada códec de voz es diferente y que puede ser utilizado en diferentes condiciones, aunque el códec AMR es ahora el más ampliamente utilizado. También la banda ancha codec AMR reciente (AMR-WB) se está introduciendo en muchas áreas, incluyendo GSM

Tecnología de codec de voz ha avanzado a un grado considerable en los últimos años como consecuencia del aumento de la potencia de procesamiento disponible. Esto ha significado que los códecs de voz utilizados en el sistema GSM tienen grandes mejoras desde que se introdujeron los primeros teléfonos GSM.


Vocoder / codec básico

Vocoders o códecs de voz se utilizan en muchas áreas de las comunicaciones de voz. Es evidente que la atención se centra en los códecs de audio GSM o vocoders, pero los mismos principios se aplican a cualquier tipo de codec.

Si el habla se digitaliza en una forma lineal que requeriría una alta tasa de datos que ocuparía un gran ancho de banda. Como el ancho de banda se limita normalmente en cualquier sistema de comunicaciones, es necesario comprimir los datos para enviar a través del canal disponible.Una vez a través del canal, entonces se puede ampliar para regenerar el audio de una manera que es lo más cerca a la original como sea posible.

Para cumplir con los requisitos del sistema de códec, el discurso debe ser capturado en una alta frecuencia de muestreo y resolución suficiente para permitir la reproducción clara del sonido original. A continuación, debe ser comprimido de tal manera que se mantenga la fidelidad del audio a través de una tasa de bits limitada, canal de transmisión inalámbrica propenso a errores.

Los códecs de audio o vocoders pueden utilizar una variedad de técnicas, pero muchos códecs de audio modernos utilizan una técnica conocida como predicción lineal. En muchos sentidos, esto puede ser comparado con un modelo matemático del tracto vocal humano. Para conseguir esto, el envolvente espectral de la señal se estima utilizando una técnica de filtro. Incluso cuando se utilizan señales con muchas señales no relacionadas armónicamente es posible que los códecs de voz para dar muy grandes niveles de compresión.

Una variedad de diferentes metodologías de códec se utilizan para códecs GSM:

  • CELP:   El CELP o Código Excited Linear Prediction códec es un algoritmo de codificador de voz que se propuso originalmente en 1985 y dio una mejora significativa sobre otros códecs de voz del día. El principio básico de la códec CELP ha sido desarrollado y utilizado como la base de otros códecs de voz incluyendo ACELP, RCELP, VSELP, etc Como tal, la metodología códec CELP es ahora el discurso más ampliamente utilizado algoritmo de codificación. En consecuencia CELP ahora se utiliza como un término genérico para una clase particular de vocoders o códecs de voz y no un códec determinado. El principio fundamental detrás del codec CELP es que se utiliza un principio conocido como "Análisis por Síntesis". En este proceso, la codificación se lleva a cabo por perceptualmente la optimización de la señal decodificada en un sistema de bucle cerrado. Una forma en que esto se podría lograr es comparar una variedad de flujos de bits generados y elegir el que produce la mejor señal de resonancia. 

  • ACELP codec:   El ACELP o código algebraico Excited Linear Prediction codec. El codec ACELP o algoritmo de codificador de voz es un desarrollo del modelo CELP. Sin embargo, los libros de códigos de codec ACELP tienen una estructura algebraica específica como se indica por el nombre.
  • VSELP codec:   El VSELP o Vector Sum excitación codec predicción lineal. Uno de los principales inconvenientes de la códec VSELP es su limitada capacidad de codificar sonidos no vocales. Esto significa que no da buenos resultados en presencia de ruido.Como resultado, este códec de voz no es ahora tan ampliamente utilizado, otros códecs de voz nuevos prefiriéndose y que ofrece un rendimiento muy superior.

GSM / vocoders codecs de audio

Se apoyan una variedad de códecs de audio GSM / vocoders. Estos se han introducido en momentos diferentes, y tienen diferentes niveles de rendimiento .. Aunque algunos de los códecs de audio primeros no se utilizan ampliamente como estos días, todavía se describen aquí, ya que forman parte del sistema GSM.


NOMBRE DEL CÓDEC VELOCIDAD DE BITS 
(KBPS)
LA TECNOLOGÍA DE COMPRESIÓN
Tarifa normal 13 RTE-LPC
EFR 12.2 ACELP
Tasa mitad 5.6 VSELP
AMR 12,2-4,75 ACELP
AMR-WB 23,85 a 6,60 ACELP

GSM Full Rate / códec RPE-LPC

El pulso RPE-LPC o regular Excited - Linear Predictive Coder. Esta forma de códec de voz fue el primer códec de voz utilizado con GSM y elegido después se llevaron a cabo pruebas para compararlo con otros sistemas de codec del día. El códec de voz se basa en el pulso regular de excitación LPC con la predicción a largo plazo. El esquema básico se relaciona con dos codecs anteriores discurso, a saber: RELP, residual de predicción lineal excitada ya la MPE-LPC, Multi Pulse LPC excitado. Las ventajas de RELP son la relativamente baja complejidad resultante de la utilización de la codificación de banda base, pero su rendimiento está limitado por el ruido tonal producida por el sistema. El MPE-LPC es más complejo, pero ofrece un mayor nivel de rendimiento. El códec RPE-LPC proporciona un compromiso entre los dos, el equilibrio de rendimiento y la complejidad de la tecnología de la época.

A pesar del trabajo que se llevó a cabo para proporcionar el rendimiento óptimo, ya que la tecnología desarrollando, el códec RPE-LPC fue visto como ofreciendo un bajo nivel de calidad de voz. A medida que se dispone de otros codecs de audio de velocidad completa, éstos se incorporaron al sistema.


GSM EFR - Enhanced Full Rate codec

Más tarde, otro vocoder llamado Enhanced Full Rate (EFR) vocoder se añadió en respuesta a la mala calidad percibida por los usuarios del original códec RPE-LPC. Este nuevo codec dio mucha mejor calidad de sonido y fue adoptado por GSM. Usando la tecnología de compresión de ACELP se dio una mejora significativa en la calidad sobre el original codificador LPC-RPE. Se hizo posible como la potencia de procesamiento que estaba disponible en los teléfonos móviles se incrementó como resultado de niveles más altos de potencia de procesamiento junto con su menor consumo de corriente.


GSM Half Rate codec

El estándar GSM permite la división de un único canal de voz de velocidad completa en dos sub-canales que pueden mantener llamadas separadas. De esta manera, los operadores de red pueden duplicar el número de las llamadas de voz que pueden ser manejados por la red, con muy poca inversión adicional.

Para habilitar este servicio a utilizar un codec tasa media debe ser utilizado. El codec tasa media fue introducido a principios de los años de GSM, pero dio una calidad de voz muy inferior en comparación con otros códecs de voz. Sin embargo, dio ventajas cuando la demanda es alta y la capacidad de la red es un bien escaso.

El GSM Half Rate codec utiliza un algoritmo de códec VSELP. Codifica los datos de alrededor de 20 cuadros ms cada uno con 112 bits para dar una velocidad de datos de 5,6 kbps. Esto incluye una tasa de 100 bps de datos para un indicador de modo que detalla si el sistema considera que las tramas contienen datos de voz o no. Esto permite que el códec de voz para operar de una manera que proporciona la calidad óptima.

El sistema de codec Tasa Media se introdujo en la década de 1990, pero en vista de la mala calidad percibida, no se utiliza mucho.


GSM AMR codec

La AMR, adaptable codec Multi-tasa es ahora el codec GSM más utilizado. El códec AMR fue adoptado por el 3GPP en octubre de 1988 y se utiliza tanto para GSM y conmutación de UMTS / WCDMA llamadas de voz de circuitos.

El códec AMR proporciona una variedad de opciones para uno de los ocho velocidades de bits diferentes como se describe en la tabla a continuación. Las velocidades de bits se basan en los marcos que son 20 millisceonds largo y contienen 160 muestras. El códec AMR utiliza una variedad de diferentes técnicas para proporcionar la compresión de datos. El codec ACELP se utiliza como la base de la códec del habla en general, pero se utilizan otras técnicas, además de esto. La transmisión discontinua se emplea de modo que cuando no hay actividad de voz de la transmisión se corta. Además de voz Detección de actividad (VAD) se utiliza para indicar cuando sólo hay ruido de fondo y ningún discurso. Además de proporcionar la retroalimentación para el usuario que la conexión todavía está presente, un generador de ruido de confort (CNG) se utiliza para proporcionar un poco de ruido de fondo, incluso cuando no se están transmitiendo los datos del habla. Esto se añade a nivel local en el receptor.

El uso del códec AMR también requiere que la adaptación del enlace optimizado se utiliza de manera que se selecciona la velocidad de datos óptima para cumplir con los requisitos de las condiciones actuales del canal de radio, incluyendo su relación señal a ruido y la capacidad.Esto se logra mediante la reducción de la codificación de la fuente y el aumento de la codificación de canal. Aunque hay una reducción en la claridad de voz, la conexión de red es más robusto y el enlace se mantiene sin abandono. Mejora los niveles de entre 4 y 6 dB puede ser experimentado. Sin embargo, los operadores de redes son capaces de priorizar cada estación, ya sea para la calidad o capacidad.

El codec AMR cuenta con un total de ocho tipos: ocho están disponibles a velocidad completa (FR), mientras que seis están disponibles a una tasa media (HR). Esto da un total de catorce modos diferentes.


MODO VELOCIDAD DE BITS 
(KBPS)
FULL RATE (FR) /
TASA MEDIA (HR)
AMR 12.2 12.2 FR
AMR 10.2 10.2 FR
AMR 7.95 7.95 FR / AR
AMR 7.40 7.40 FR / AR
AMR 6.70 6.70 FR / AR
AMR 5.90 5.90 FR / AR
AMR 5.15 5.15 FR / AR
AMR 4.75 4.75 FR / AR

Velocidades de datos de códec AMR


AMR-WB codec

Adaptive Multi-Rate Wideband, AMR-WB codec, también conocido bajo la designación de ITU G.722.2, se basa en la anterior populares Multi-Rate Adaptive AMR codec. AMR-WB también utiliza una base ACELP para su funcionamiento, pero se ha desarrollado aún más y AMR-WB proporciona una mejor calidad de la voz como resultado de la anchura de banda más ancha del habla que codifica. AMR-WB tiene un ancho de banda que se extiende desde 50 hasta 7000 Hz, lo que es significativamente más ancha que la 300-3400 Hz anchos de banda utilizados por los teléfonos estándar. Sin embargo, esto es a costa de un proceso adicional, pero con los avances en la tecnología de IC en los últimos años, esto es perfectamente aceptable.

El códec AMR-WB contiene un número de áreas funcionales: incluye principalmente un conjunto de voz de velocidad fija y modos de códec de canal. También incluye otras funciones códec que incluyen: un detector de actividad de voz (VAD), transmisión discontinua (DTX) en los sistemas GSM y Cambio funcionalidad controlada Fuente (SCR) para aplicaciones UMTS. Aún más la funcionalidad incluye la señalización dentro de banda para la transmisión de modo de códec, y la adaptación del enlace para el control de la selección de modo.

El códec AMR-WB tiene una velocidad de muestreo de 16 kHz y la codificación se lleva a cabo en bloques de 20 ms. Hay dos bandas de frecuencias que se utilizan: 50 a 6400 Hz y 6400 a 7000 Hz. Estos se codifican por separado para reducir la complejidad códec. Esta división también sirve para centrar la asignación de bits en el rango de frecuencia subjetivamente más importante.

La banda de baja frecuencia utiliza un algoritmo codec ACELP, aunque se han incluido una serie de características adicionales para mejorar la calidad subjetiva del sonido. Análisis de predicción lineal se lleva a cabo una vez por trama de 20 ms. También, libros de códigos fijos de excitación y de adaptación se buscan cada 5 ms para los valores de los parámetros de codec óptimos.

La banda de frecuencia más alta añade algunas de las características naturalidad y personalidad a la voz. El audio se reconstruye utilizando los parámetros de la banda inferior, así como el uso de excitación aleatoria. A medida que el nivel de potencia en esta banda es menor que la de la banda inferior, la ganancia se ajusta con relación a la banda inferior, pero basa en expresar información. El contenido de la señal de la banda superior se reconstruye mediante el uso de un filtro de predicción lineal que genera información desde el filtro de banda inferior.


VELOCIDAD DE BITS 
(KBPS)
NOTAS
6.60 Esta es la tarifa más baja para AMR-WB. Se utiliza para la conmutación de circuitos para conexiones GSM y UMTS y está destinado a ser utilizado sólo temporalmente durante las condiciones del canal de radio graves o durante la congestión de la red.
8.85 Esto le da una mejor calidad sobre la velocidad 6,6 kbps, pero una vez más, su uso sólo se recomienda para su uso en periodos de congestión o cuando en las condiciones del canal de radio graves.
12.65 Esta es la velocidad de bits principal utilizado para conmutación de circuitos GSM y UMTS, que ofrece un rendimiento superior a la original de codec AMR.
14.25 Tasa de bits más alta utilizada para dar discurso más limpia y es particularmente útil cuando los niveles de ruido de audio ambiente es elevada.
15.85 Tasa de bits más alta utilizada para dar discurso más limpia y es particularmente útil cuando los niveles de ruido de audio ambiente es elevada.
18.25 Tasa de bits más alta utilizada para dar discurso más limpia y es particularmente útil cuando los niveles de ruido de audio ambiente es elevada.
19.85 Tasa de bits más alta utilizada para dar discurso más limpia y es particularmente útil cuando los niveles de ruido de audio ambiente es elevada.
23.05 No recomendado para canales GSM de velocidad completa.
23.85 No se ha sugerido para los canales GSM de velocidad completa, y proporciona calidad de voz similar a la de G.722 a 64 kbps.

No todos los teléfonos equipados con AMR-WB podrán acceder a todos los tipos de datos - las diferentes funciones del teléfono no pueden requerir a todos a estar activo, por ejemplo.Como resultado, es necesario informar a la red sobre el que las tasas están disponibles y por lo tanto simplificar la negociación entre el terminal inalámbrico y la red. Para lograr esto, hay tres diferencia AMR-WB configuraciones que están disponibles:

  • Configuración A:   6,6, 8,85, y 12,65 kbit / s
  • Configuración B:   6,6, 8,85, 12,65, y 15,85 kbit / s
  • Configuración C:   6,6, 8,85, 12,65 y 23,85 kbit / s

Se puede observar que sólo se utilizan los modos kbit / s 23,85, 15,85, 12,65, 8,85 y 6,60.Basándose en pruebas de escucha, se consideró que estos cinco modos eran suficientes para un servicio de telefonía de voz de alta calidad. Las otras velocidades de datos se conservan y pueden ser utilizados para otros propósitos, incluyendo mensajes multimedia, la transmisión de audio, etc