“Shaping” dos Impulsos / Critério de Nyquist {PhysicalOverview.doc} A questão que tem vindo a ser abordada é: como traduzir uma sucessão de 0s e 1s em impulsos rectangulares? É hora de aprofundar melhor o resultado no mundo real – em que os canais têm uma banda limitada, {0, …, W}. Seja a transmissão de 0s e 1s sob a forma de uma sequência de impulsos rectangulares – por um canal assim.. Posto que o espectro de cada impulso se espalha até +∞, não custa prever a ineficiência que daí advém: uma parcela da energia gasta na transmissão volve-se em desperdício: as componentes de frequência superior a W irão ser suprimidas: não farão mais que aquecer o meio de transmissão... Estando elas ausentes nos impulsos à chegada ao receptor, os sinais aí já não serão perfeitamente rectangulares, os “saltos” entre 0s e 1s estarão “arredondados”! Pelo que, na prática convirá transmitir sinais a que se subtraíram já aquelas componentes: não impulsos rectangulares, mas uns assim designados impulsos moldados (shaped pulses), com os flancos 0↔1 arredondados Uma primeira sugestão para um sinal assim será um cujo espectro esteja confinado ao intervalo {0, …, W}, vidé figura ao lado – em que, por simplicidade de fórmulas adiante, a amplitude do espectro em f=0 Hz se fixou em A/2W. Certamente se logrará uma melhor eficiência no uso da energia: um sinal assim não tem frequências que um canal de banda passante {0, …, W} não possa transportar... Resta saber: qual o sinal com esse espectro? Manipulações algébricas triviais permitem concluir que o sinal que tem esse espectro vem a ser dado por s(t) = A/(2πWt) sen (2πWt) Conclusão: doravante, quando for hora de enviar um impulso rectangular, o que há que enviar é, isso sim, um impulso com essa forma sen(2πWt)/2πWt – que na gíria matemática é designada de sinc(2Wt)... Sucede que o sinc se estende até t=+∞... Para aferir as consequências, considere-se o envio de 0100101110 com o que no 2º, 5º, etc, intervalos de tempo, irão ser enviados impulsos sinc... Designem-se eles de I2, I5... Algo depois, I2 chegará ao receptor; mais precisamente, ele irá detectar uma subida da potência, depois um abaixamento, um incremento, uma descida, etc.: uma cauda de oscilações - de amplitude decrescente, porém continuando per omnia saecula... Então, quando ao receptor chegar o impulso seguinte, I5, ainda ele não acabou de receber I2 na sua totalidade: o receptor estará recebendo I5 – porém contaminado pela cauda de I2... Na gíria a propósito, terá havido isi: interferência-intersímbólica. Asserções análogas valem para qualquer impulso posterior: quando o receptor o receber, estará recebendo também as caudas de todos os impulsos que o precederam! A não ser que... O sinc(2Wt) tem uma propriedade notável: anula-se sempre que 2Wt for inteiro (excepto 0)! Ou seja: quando 2Wt=n, ou t=n*1/2W, a cauda de s(t) advém zero! Imagine-se então o envio de I5 exactamente após ter decorrido um intervalo de tempo múltiplo de 1/2W após o envio de I2 – no caso, 3*1/2W; é pacífico que, quando o receptor receber I5, a cauda de I2 estará assumindo o valor 0, ou seja: não terá havido contaminação de I2 sobre I5! Ressalve-se que, para que não haja isi, se requere um sincronismo perfeito: o receptor deve tomar decisões em instantes espaçados de 1/2W – mais precisamente quando as caudas dos sinc se anulam; se se atrasar ou adiantar a fazê-lo, irá haver isi – e portanto alguma probabilidade de errar: decidir que chegou ‘0’ – porém tendo-se enviado ‘1’ - ou vice-versa. Esse sincronismo perfeito é irrealizável – pelo que na prática se prefere usar um outro impulso, como é o raised-cosine: para 0<f, o espectro volve-se, em torno de f=W, em 1/2(1+cos[π(f-W(1-r))/2rW])): - em termos de espectro, a transição em W não é abrupta, existe um roll-off, r (valor típico de r=0,25), tal que a largura de banda do canal necessária vem a ser, de facto, W(1+r); - em termos de evolução no tempo, o impulso – 2Wsinc(2Wt)cos(2πrWt)/(1-r2W2t2)) - decai mais rapidamente que o sinc, de modo que os valores vizinhos dos instantes n*1/2W são menores: a haver isi, ela é bem menor... Há então que transmitir símbolos: sinc, raised-cosine... Seja TSymb o menor intervalo de tempo entre dois deles; o ritmo de sinalização – expresso em baud – será o recíproco, fSymb=1/TSymb. Visando o maior ritmo no envio dos símbolos – para um maior ritmo binário (em bps)! – convirá que TSymb seja o menor possível... Quanto, no mínimo? Um critério devido a Nyquist, dedutível da discussão anterior, é: dado um canal de banda passante {0 – W}, é possível transmitir símbolos sem isi a um ritmo de, quando muito, 2 W baud (que corresponde a um intervalo entre símbolos, de TSymb=1/2W); inversamente, para transmitir símbolos a um ritmo de fSymb baud é necessária uma largura de banda de, pelo menos, W=fSymb/2. Por exemplo, se for W=4 kHz, o ritmo máximo possível será de fSymb=8 kBaud (e, na prática, em que se usa um roll-off não nulo, será algo menor). Abra-se um posfácio para rever fórmulas devidas a Nyquist, a saber: Teorema: fsampling ≥ 2 B; Critério: fSymb ≤ 2W baud. Há que não confundir as duas fórmulas, até porque dizem respeito a contexto diferentes: - o Teorema tem a ver com a amostragem de um sinal analógico de largura de banda B; indica o ritmo mínimo a que deve ser amostrado de forma que possa ser recuperado a partir das amostras: deve ser pelo menos o dobro de B; - já o Critério tem a ver com a transmissão de símbolos em banda de base por um canal de largura W; indica o ritmo máximo a que podem ser transmitidos símbolos sem interferência intersimbólica: será, quando muito, o dobro de W. Teorema de Shannon {PhysicalOverview.doc} O critério de Nyquist subentende uma filosofia a realçar: o importante é que, nos momentos de amostragem da linha pelo receptor, ele não produza decisões incorrectas. Como evolui o sinal entre esses momentos – isso é, de certo modo, irrelevante! Essa filosofia é distinta daquela seguida em transmissão analógica ou de impulsos... Veja-se, nomeadamente, o caso da transmissão da voz pela rede telefónica analógica: os dados em causa são originalmente analógicos, consistem na tensão induzida nos terminais do microfone do telefone do orador; o objectivo em vista é reproduzir remotamente essa tensão – tal qual ela é! Já quando a rede telefónica é digital, o objectivo é outro: a voz é digitalizada (em PCM), os dados volvem-se numa sequência de bits; agora, o objectivo é reproduzir remotamente esses bits – tais quais são! O trabalho do receptor é decidir se foi enviado um ‘0’ ou um ‘1’. E para o efeito, o desafio é determinar qual a forma/shape dos impulsos que representarão esses bits a transmitir – que apoie o melhor possível o receptor nas suas decisões. Visto de outra maneira: recorde o leitor o espectro do impulso rectangular isolado. Usando a notação agora em vigor, é patente que a maioria da energia se estende até f=1/TSymb; pelo que: para o recuperar no receptor, o canal deverá deixar passar frequências para lá de f=1/TSymb. Ora, o que o critério de Nyquist diz é outra coisa: sendo possível transmitir símbolos sem isi a 2 W baud, bastará, para enviar ‘0’ e ‘1’s a intervalos de TSymb, que o canal deixe passar frequências até metade de 1/TSymb! Parece uma contradição... mas não o é: se o objectivo fora o de reconstituir fielmente o impulso rectangular, então, sim, o canal deveria ter uma banda passante superior a W=1/TSymb. Mas em transmissão digital o objectivo é outro: é decidir se foi ou não enviado o impulso – e para isso é suficiente uma banda de W=1/(2 TSymb); menos é que não, que se tornaria difícil identificar o bit enviado… Pressuposto que a forma dos impulsos é a raised-cosine – no que se segue abreviadamente simbolizada por cos↑ – então um trem de ‘0’ e ‘1’ volve-se numa sequência de cos↑ e cos↑-invertidos: em particular, usando bipolar-NRZ, o que se enviará será cos↑ multiplicado por +1 ou -1 – o que se volve num total de dois símbolos diferentes. Recordando uma discussão acima, poder-se-á, em alternativa, recorrer a sinalização Multi-nível/M-ária: aquele trem de bits é repartido em grupos de n (2, ou 3, ou mais) bits – a cada um fazendo-se corresponder um cos↑ de amplitude específica. O transmissor fica enviando M=2n símbolos diferentes, o ritmo binário resultante sendo: C = 2 W log2 M bit/s = fSymb n bps Repare-se: isto é válido para transmissão em banda de base, num canal perfeito sem isi nem ruído, de largura de banda W: usar M símbolos diferentes, todos eles cos↑, não altera a largura de banda necessária para os enviar! E se, em vez de transmissão em banda de base, fora o caso de transmissão sobre portadora, nomeadamente por PSK de M=2n fases? Designando de ritmo de sinalização/modulação o ritmo, fsign baud, a que se enviam as “fases” que representam os grupos de n-bits, constatou-se já que o binário resultante vem a ser C = n fsign bps. As fórmulas são análogas – mas subentendem canais não ruidosos! Na vida real, em que os canais são mesmo ruidosos, há alguma probabilidade de, na sua peregrinação até ao receptor, um símbolo vir a ser corrompido por ruído; pelo que será possível que o receptor, analisando-o, cometer um erro: decidir que ele é outro... Shannon chegou, em 1949, à resposta para um canal de largura de banda W afectado apenas por ruído aditivo branco gaussiano (por consegunte, ignorando distorções – lineares ou não –, ruído impulsivo e as demais imperfeições do canal): provou que, se for S/N a relação sinal/ruído, a capacidade máxima desse canal (isto é: o maior número de bits completamente imprevisíveis que pode ser transmitido sem erros, por segundo) será C = W log2 (1+S/N) bps Não para o demonstrar, mas quiçá a fórmula advenha plausível, representam-se ao lado esquemas: usando dibits, tribits... suportados por símbolos de amplitudes diferentes. Em particular, naquele mais à direita, a tensão total no receptor – de valor médio denotado por VT – oscila entre 0 e 2 VT. Entre estes extremos, ela pode assumir M=8 valores nominais equidistantes – a que se fez corresponder os 3-bits 000, 001, ..., 100. O ruído forçado pelo canal é suposto aditivo: nos momentos de decisão, a tensão total é a soma de um desses nominais com uma tensão de ruído denotada por VN. Quando o símbolo associado a ‘111’ (por ex.) chega ao receptor, a sua amplitude real não será o correspondente nominal: haverá uma diferença... Intui-se que o receptor a arredondará para o nominal mais próximo – e só depois decidirá... Para que não erre, dois nominais adjacentes deverão distar de, ao menos, 2VN. O que implica M*2VN ≤ 2VT, → M*≤ VT / VN. Quadrando, virá M2 * ≤ VT 2/ VN 2 – ou, em termos de potência, M2 * ≤ PT / N; em termos da potência do sinal e do ruído, será PT = S + N, e, portanto, M2 * ≤ 1 + S / N. Substituindo na fórmula de Nyquist, C = 2 W log2 M bit/s, vem C = W log2 M2 bit/s ≤ W log2 (1 + S / N) bit/s.