C a d e r n o s L i n k Casos de sucesso 118 Q uando se pede a uma operadora do serviço 118 da Portugal Telecom (PT) um determinado número de telefone ou morada, a resposta surge breve e numa voz bem modulada. De intervenção humana existe apenas o primeiro contacto com a operadora. A voz de resposta foi gravada e a articulação das palavras ou números é feita por via informática. O lado audível do 118 «esconde» uma base de dados com mais de quatro milhões de registos, para suporte de cerca de 70 milhões de chamadas por ano. Nos períodos de maior tráfego, atinge-se um «pico» horário de 25 mil chamadas. O tempo de reposta após o contacto com a operadora é inferior a um segundo e o sistema permite mais de 500 operadores em simultâneo. Os tempos de resposta e a velocidade de pesquisa e de troca de informação transportam-nos para um domínio que, sem exagero, pode ser comparado a um Fórmula 1. A «espinha dorsal» do serviço 118 é um projecto que começou a ser desenvolvido há cerca de 9 anos por uma equipa do INESC, hoje integrada na Link, em parceria com a PT. Manuel Mira Responsável na Link pelo projecto 32 N1 - Novembro de 1999 Um Fórmula 1 na resposta ao seu pedido «O nosso sistema é a ‘caixa’ entre a base de dados da empresa que presta o serviço e a operadora, de forma a que esta tenha o melhor desempenho possível», explica Manuel Mira, o responsável na Link pelo SID - Sistema de Informação para Directórios. «Configurámos o hardware e um sistema de gestão de base de dados, desenvolvemos também um motor de pesquisa – um servidor aplicacional que faz a interface das aplicações e a base de dados; tudo com base em equipamentos standard», acrescenta o nosso interlocutor. Aliás, foi a própria PT que exigiu que os equipamentos utilizados estivessem acessíveis no mercado. A arquitectura do sistema Com base em hardware standard, o SID utiliza servidores em Unix, está dotado de uma base de dados relacional e utiliza como linguagem de programação C e C++. A nível de tecnologia genérica, o sistema utiliza ainda interfaces alfanuméricos e Windows, IVR (integrated voice response) (Dialogic e RDIS), para a informação dos números e dos nomes, e CTI – integração de telefonia. Neste campo, surgem também a Internet, X.25, TCP/IP, Java e LAN/WAN. Na arquitectura do sistema desenvolvido pela Link poderão ser identificados três níveis distintos: servidores de base de dados, servidores aplicacionais e clientes/interfaces. O sistema possui dois ou mais servidores de bases de dados em localizações distintas, para prevenção de falhas num centro de processamento, explica Manuel Mira. Do mesmo modo, existem dois ou mais servidores aplicacionais que garantem a gestão optimizada dos recursos dos servidores de bases de dados, com capacidade de detecção da disponibilidade dos mesmos. O sistema de hardware tem também uma configuração para distribuição de carga entre os vários servidores – suportando falhas de vários equipamentos – quer por configuração nos clientes quer por configuração nos servidores aplicacionais. A nível da gestão de base de dados, o sistema desenvolvido gere a replicação de dados entre os vários servidores para manter a coerência. A par da realização de backups on-line – com o sistema a funcionar –, o software desenvolvido permite também a realização de actualizações on-line em simultâneo com a pesquisa. A dimensão total da base de dados, incluindo índice, quase quintuplica a dimensão dos dados-base. C a d e r n o s L i n k Casos de sucesso Arara Reconhecimento de voz em português Um motor de pesquisa de raíz Para Manuel Mira, o motor de pesquisa foi o campo mais trabalhoso de todo o projecto. «Dado que o desempenho dos motores de pesquisa disponíveis não era suficiente a nível de codificação e mapeamento da informação, foi desenvolvido de raíz um motor específico para este tipo de serviço», sublinha. O motor permite a pesquisa por parâmetros com equivalência de valores para campos, por exemplo, no caso de remissivos de morada. Neste âmbito, está também contemplada a associação de tabelas externas à principal, como a designação de códigos de actividades profissionais e económicas, bem como a definição de áreas geográficas de pesquisa. O motor de pesquisa caracteriza-se também por integrar sinónimos e fonética, rotação de palavras com ou sem truncagem para cada campo e uma combinação livre de vários campos de várias tabelas numa única pesquisa, sem qualquer dependência obrigatória da ordem de introdução dos valores para a pesquisa. Esta não é perturbada pela utilização de Por detrás da operadora que nos recebe «esconde-se» uma colossal base de dados A nível de engenharia da fala, a Portugal Telecom (PT) está a desenvolver em conjunto com a Link o projecto Arara. «Trata-se de um projecto de reconhecimento vocal que visa lançar mundialmente a possibilidade de reconhecimento de fala em português», explica o director da PT, Rui Chaves. O Arara terá aplicações a todos os níveis, cobrindo necessariamente o 118, e acarreta a possibilidade de aplicar a qualquer computador o reconhecimento de fala, permitindo operar sem recurso ao teclado ou ao rato. As possibilidades abertas pelo reconhecimento de fala não se esgotam na sua aplicação em sistemas informáticos. Accionar um pisca-pisca num automóvel, ligar ou desligar um aparelho de ar condicionado, abrir ou fechar portas, são algumas das muitas aplicações que um sistema de reconhecimento de fala poderá ter, acrescenta aquele responsável da PT. O projecto Arara surge relacionado com o desenvolvimento do sistema de base de dados 118 a que nos referimos. Manuel Mira, da Link, salienta, por seu turno, que no ano 2000 o sistema do serviço 118 poderá admitir reconhecimento de fala, «tornando-se capaz de reduzir o tempo médio de atendimento do cliente de 40 para menos de 20 segundos». «Gravámos com voz humana não só os dez sons para números mas também cerca de 12 mil palavras para as moradas», adianta o responsável na Link pelo projecto. Esta vertente, desenvolvida pelo grupo de fala do INESC, permite uma taxa de sucesso de 80% no reconhecimento. O sistema admite também publicidade integrada, ou seja, se se pedir, por exemplo, o número de telefone do Jardim Zoológico, poderá ser ouvida uma resposta com mais elementos do que o número de telefone. «O serviço de base de dados conhecido como 118 é dos serviços mais fundamentais oferecidos pela Portugal Telecom. Sem o conhecimento dos números de telefone não há comunicações», afirma, por seu lado, Rui Chaves. Como aspectos centrais do 118, este responsável destaca a fiabilidade e a rapidez com que é disponibilizada a informação pedida. «Por proposta do INESC, passámos para um sistema de gestão de base de dados mais ‘performante’, mudámos do Ingres para o Informix», acrescenta. «Em função de factores como o número de chamadas e de operadoras, um segundo de atraso no tempo de atendimento poderá valer cerca de 150 mil contos por ano», diz Manuel Mira. Quanto ao investimento feito pela PT na base de dados do 118, Rui Chaves prefere adiantar que o projecto representa «centenas de milhares de contos» para o grupo de telecomunicações. maiúsculas/minúsculas e acentos, e é possível aceder a informação de modo interactivo, após a entrada de cada parâmetro. A nível das interfaces, o responsável do SID salienta a pesquisa de operadores com CTI. A utilização do protocolo de comunicações E 115 permite o suporte de consulta a bases de dados de outros operadores de telecomunicações, como a AT&T, MCI, BT, Mercury, entre outros. As interfaces estão também dotadas de acessos externos genéricos de pesquisa e em particular através da Internet ou directamente – com ou sem modem/RDIS –, entre outras características. Pela dimensão da sua base de dados, pelo número de acessos simultâneos, pela distribuição das bases de dados e operadoras e, sobretudo, pela sua integração com a voz e call cen ter, o SID é um sistema de informação tão sofisticado como os melhores sistemas de informação Web. ¶ N1 - Novembro de 1999 33