Capa OpenOffice.org e MS Office Salada de formatos Conversão entre os formatos do OpenOffice.org e do MS Office Não importa se a migração do Microsoft Office para o OpenOffice.org é iminente ou se a necessidade imediata é apenas abrir um documento do Word que aquele cliente importante enviou: com a organização e o planejamento certos, o trabalho concomitante com os dois conjuntos de aplicativos para escritório ocorre quase sem problemas. Por Frank Wieduwilt É fato consumado: por mais que ninguém goste deles, os formatos dos arquivos dos aplicativos do Microsoft Office são muito comuns. Constantemente cruzamos com documentos de extensão .doc e .xls que devem ser abertos e, freqüentemente, editados. Se observarmos certas regras, é possível fazer ambos com o mínimo de esforço. A migração do Microsoft Office para o OpenOffice.org também é um objetivo completamente factível, desde que seja feito com um planejamento adequado. Na página web do projeto OpenOffice.org há um guia de migração em língua inglesa [1] que dá dicas a respeito de problemas que podem surgir durante uma mudança de MS Office para OpenOffice.org. O documento se baseia na atual versão estável do conjunto de aplicativos para escritório (até o fechamento desta edição, a 1.1.5), mas indica no texto quando haverá mudanças expressivas na próxima versão do programa – que deve chegar até o fi nal deste ano, embora uma data defi nitiva ainda não tenha sido fi xada. A versão 1.1.5 trouxe como maior novidade o suporte à leitura de documentos nos formatos defi nidos pela OASIS (Organization for the Advancement of Structured Information Standards), que são baseados em XML e que serão usados por padrão também no KOffice e no OpenOffice.org 2.0, o que, em breve, deverá facilitar muito o intercâmbio de arquivos entre as mais importantes ferramentas de escritório no Linux. 22 novembro 2005 edição 14 www.linuxmagazine.com.br Os diferentes formatos de arquivo Os formatos dos arquivos do OpenOffice.org/StarOffice e do Microsoft Office têm como diferença mais marcante o fato de que os primeiros se baseiam em um padrão XML aberto, enquanto os segundos usam um formato binário fechado. Esse formato secreto da Microsoft torna difícil aos desenvolvedores do OpenOffice.org criar fi ltros de importação e exportação que funcionem em 100% dos casos. Todos os aplicativos do projeto OpenOffice.org são capazes de ler os documentos gerados pelos programas correspondentes da Microsoft. O contrário, entretanto, não é verdade: o MS Office não lê nenhum dos documentos do OpenOffice.org. Assim, se desejarmos enviar um documento a um cliente ou a um colega que use o MS Office, deveremos primeiro gravá-lo no formato do OpenOffice.org e em seguida salvá-lo novamente Tabela 1: Formatos suportados pelo Writer Formato Modelo do Microsoft Word 97/2000/XP Documento do Microsoft Word 97/2000/XP Documento do Microsoft Word 6/95 Modelo do Microsoft Word 95 Documento do Microsoft WinWord 5 RTF Importa x x x x x x Exporta x x x x x x OpenOffice.org e Microsoft Office® no formato da Microsoft. Desta forma, o documento original permanece disponível, mesmo que os recursos de exportação não funcionem perfeitamente. As tabelas 1 e 2 dão uma visão geral dos formatos de arquivo que o Writer e o Calc são capazes de ler e gravar. Uma informação interessante é que tanto o Writer quanto o Calc processam documentos em formatos antigos da Microsoft melhor que o próprio MS Office, que deixa os seus usuários na mão (agora o leitor pode entender a razão da nova campanha publicitária dos dinossauros da gigante de Redmond). Da mesma forma que a Microsoft não oferece suporte ao formato original do OpenOffice.org e do StarOffice, a empresa nem quer saber do formato aberto OASIS, preferindo trabalhar, como de costume, em um formato de arquivo baseado em XML próprio, que deverá ser aberto, em contraste com o que acontece hoje. Conversão automática O conversor de documentos do OpenOffice.org é uma ferramenta com a qual vários documentos do MS Office podem ser convertidos de uma vez só. Antes de converter uma grande quantidade de documentos, devemos sempre ponderar quais documentos e modelos são realmente necessários no novo formato. Freqüentemente, em um processo de migração, é suficiente converter somente os modelos de documento mais importantes, deixando o restante no formato original ou arquivando-os em um formato “universal” como o PDF. O conversor de documentos pode ser acionado através do menu Arquivo | Assistente | Conversor de Documentos.... Ao ser chamado, o conversor pergunta ao usuário quais documentos do MS Office ou do StarOffice devem ser convertidos. No passo seguinte, o usuário deve defi nir os diretórios fonte e destino do processo de conversão que, dependendo da quantidade de arquivos e da complexidade dos documentos, pode durar de poucos minutos a algumas horas. Após a conversão é indicado dar uma olhada no arquivo de registro gerado durante o processo. Ele está disponível como documento do OpenOffice.org e contrapõe os documentos fonte Tabela 2: Formatos suportados pelo Calc Formato Modelo do Microsoft Excel 97/2000/XP Documento do Microsoft Excel 97/2000/XP Modelo do Microsoft Excel 4.x-5.0/95 Documento do Microsoft Excel 4.x-5.0/95 Importa Exporta x x x x x x x x Capa Figura 1: O conversor de documentos transforma de uma só vez vários documentos do MS Office em documentos do OpenOffice.org. e destino, vinculados aos arquivos reais, que podem ser abertos com um clique de mouse. O conversor de documentos deve ser usado preferencialmente apenas em documentos simples de converter. Para arquivos mais complexos e de layout rebuscado, é melhor converter à mão. Apertem os cintos: a macro sumiu Macros em documentos do Word são solenemente ignoradas pelo OpenOffice.org. O programa simplesmente as converte em comentários e as deixa no formato do Word ao salvar o arquivo. Se o usuário quiser realmente editar as macros do Word no OpenOffice.org, precisa chamar o janela de confi guração do aplicativo em Ferramentas | Opções... e, nela, escolher Carregar/Salvar | Propriedades do VBA | Carregar código Basic para edição. Assim, os códigos de macro vão aparecer no editor de macros do programa. Devido às diferenças gritantes no modelo de objetos usado pelo OpenOffice.org e pelo MS Office, a conversão de macros exige bons conhecimentos de programação e bastante trabalho manual, que deve ser levado em conta antes da migração. Pedras no caminho Como no Linux o método de embarcar objetos do Windows® não funciona, objetos de outros aplicativos embutidos em documentos do MS Office não irão aparecer no Linux. A única coisa que o usuário vai ver é uma moldura vazia no lugar do objeto. Já com o texto não há, via de regra, problemas, uma vez que o fi ltro de importação do Writer funciona muito bem. Os problemas aparecem sempre nos detalhes: o Writer interpreta o tamanho e o tipo das fontes de modo ligeiramente diferente do Word. As fontes ficam um pouquinho maiores, assim como os espaços entre as letras. Por isso é comum que as novembro 2005 www.linuxmagazine.com.br edição 14 23 Capa OpenOffice.org e Microsoft Office® Figura 2: Tabelas podem ser indefinidamente aninhadas dentro de outras tabelas no Word. linhas sejam quebradas em outros locais e que os documentos “cresçam” um pouco após a importação. A posição dos tabuladores padrão também é calculada de modo um pouco diferente pelo OpenOffice.org Writer, de modo que o texto acaba em outro lugar quando é fixado em uma posição usando tabuladores. Problemas com acentos Vez por outra ocorrem problemas com a representação de acentos, quando por exemplo o Writer lança mão de uma fonte inapropriada para substituir uma fonte do Windows® não disponível no Linux. Esse tipo de erro costuma ocorrer com mais freqüência em distribuições Linux baseadas no Debian GNU/ Linux, como o Knoppix, o Kanotix e, no Brasil, o Kurumin. Figuras em documentos normalmente estão no lugar correto depois do procedimento de importação do documento para o Writer. Somente para gráficos no formato bitmap do Windows® acontecem às vezes imprevisíveis alterações de cor. Uma dica para todos que trabalham com gráficos em texto corrido: figuras “ancoradas” a parágrafos se comportam mal quando precisam ser reposicionadas, por exemplo, fora do parágrafo. Depois de exportadas para o formato do Word elas se posicionam junto às bordas do parágrafo. Assim, é preferível ancorar figuras à página. A figura 2 ilustra uma tabela aninhada simples no Word e a figura 3 mostra o resultado do procedimento de importação no Writer. À exceção do largura da coluna, que fica um pouquinho maior no Writer, não houve grandes problemas com a formatação da tabela: as tabela aninhadas e o texto na vertical foram carregados – muito embora este último tenha ficado na horizontal. Um assunto “espinhoso” são as tabelas com quebra de página dentro de uma célula: a importação desse tipo de documento leva a um documento no Writer que mostra apenas a parte da linha da tabela que cabe na página. O resto do texto se perde no processo de importação. Documentos formatados desse modo devem ser modificados à mão ou esperar pelo OpenOffice.org 2.0, que deve resolver o problema. Texto na vertical dentro de tabelas também é tabu para o Writer e aparecerá na horizontal após a importação. Na direção inversa os problemas são piores: o Word trava quando tenta abrir um arquivo .doc gerado pelo Writer que contenha tabelas com texto vertical. Campos de planilhas de cálculo dentro do Word perdem as fórmulas quando importadas pelo Writer: somente o texto das células fica disponível. Isso também vale para campos de formulário – nesse caso é freqüente aparecer um ponto-e-vírgula no lugar do campo. Formulários O Writer é capaz de ler formulários gerados no Word com todos os seus elementos, mas a importação dos elementos varia de acordo com o seu tipo. Um formulário “protegido” é freqüentemente aberto pelo aplicativo no modo desprotegido. Campos de formatos definidos no Word são interpretados pelo Writer como campos de texto, de modo que é possível inserir nele qualquer caractere. Algo semelhante ocorre com campos de data/horário e com campos contendo fórmulas, que são importados pelo editor Caindo pelas tabelas Triste constatação: os recursos de tabelas do MS Word (ainda) são mais poderosos que os do Writer. Uma tabela do Word pode ter, em cada célula, um número diferente (e grande) de colunas e outras células, que se estendem por diversas linhas. Ao importar esse tipo de tabela pode acontecer que o Writer se confunda e “esculhambe” completamente com o layout do documento. Tabelas com formatação simples – mesmo aquelas com molduras e cores de fundo diferentes – são importadas sem percalços pelo editor de textos de código aberto. 24 novembro 2005 edição 14 www.linuxmagazine.com.br Figura 3: O Writer importa a tabela da figura 2, porém com pequenos erros de formatação. Capa OpenOffice.org e Microsoft Office® como campos de texto simples, contendo apenas a data/horário ou o resultado da aplicação da fórmula. Textos científicos contêm, em sua maioria, índices complexos, remissivos ou de figuras, que vão necessitar de edição após a importação no Writer. Já a paginação, as notas de rodapés e de fim de documento devem permanecer no mesmo lugar – o Writer trabalha com maestria com esses elementos. Notas de rodapé e de fim de documento são importadas nas duas direções, mas notas finais freqüentemente vão parar no final do documento – no Word essas notas podem ser colocadas em qualquer lugar. Dados bibliográficos do Writer são transformados em texto simples durante uma exportação para o formato do Word, uma vez que esse aplicativo da Microsoft não dispõe de recursos para edição de referências bibliográficas. Problemático: RTF Via de regra, documentos no formato padrão Rich Text Format (RTF), muito comum para troca de arquivos entre aplicativos de edição de texto diferentes, podem ser lidos sem problemas no OpenOffice.org. Somente quando tabelas aparecem nesses documentos é que surgem as primeiras dificuldades: elas são solenemente destruídas pelo Writer. Especialmente difícil fica quando as tabelas estão intensamente aninhadas e o seu conteúdo apresenta texto com diferentes tipos de fontes. Documentos RTF não oferecem suporte nem de longe a todas as opções de formatação de texto oferecidas pelo Writer. Em nossos testes nem sempre ficou claro se os problemas de importação eram do Writer ou se foi o Word quem não gerou os arquivos corretamente, uma vez que os problemas mencionados acima aconteceram também durante a importação dos arquivos gerados no TextMaker [2] . Outra coisa que também é “espinhosa” no formato RTF são as figuras embarcadas no texto. Durante a geração do documento no formato RTF as figuras não são referenciadas corretamente (o que configura um erro de implementação no Writer) e o Word não é capaz de abrir o arquivo gerado. Assim, se for necessário trocar documentos com gráficos integrados ao texto, é melhor fazê-lo usando o formato do Word. Evitar quebras de linhas para criar espaço entre os parágrafos. O melhor é definir o espaçamento entre os parágrafos nos modelos de parágrafo. P Não usar múltiplos tabuladores ou caracteres em branco para posicionar texto. Um tabulador basta nesses casos. P Evitar usar fontes excêntricas. P Calc A troca de dados entre o OpenOffice.org Calc e o Excel é segura. Planilhas, fórmulas e dados são importados completamente pelo editor de planilhas de código aberto. Problemas só aparecem quando o tamanho máximo das planilhas é superado e na representação de diagramas. A utilização na área científica também apresenta algumas diferenças. Não podemos deixar de observar que o Calc dispõe de muito mais funções pré-definidas que o Excel. O Calc não é capaz de abrir documentos do Excel protegidos por senha – mesmo que a senha seja conhecida. Assim, se quisermos trocar dados em planilhas, temos que abrir mão dos recursos de segurança oferecidos pelos aplicativos. Uma vez que a proteção das senhas do conjunto de pacotes para escritório da Microsoft não é das mais fortes, indicamos para o caso de dados confidenciais o uso de um programa específico de criptografia. O GnuPG [3] é uma boa pedida para isso, uma vez que é uma aplicativo testado e aprovado pela comunidade. O tamanho das planilhas da série 1.1 do OpenOffice.org é limitado a cerca de 32.000 linhas, enquanto no Excel elas podem chegar a 65.536 linhas. Essa limitação deixará de existir com o lançamento do OpenOffice.org 2.0, que vai poder editar planilhas com a mesma quantidade de linhas da planilha eletrônica da Microsoft. Resumindo Em resumo, pode-se dizer que a troca de dados entre o MS Word e o OpenOffice.org Writer ocorre quase sem problemas, se os seguintes pontos forem observados: P Não usar tabelas que contenham quebras de página dentro de uma linha. P Usar formatação de caractere e parágrafo, ao invés de usar formatação direta. O melhor é usar os modelos padrão do OpenOffice.org e nenhum modelo definido alhures. 26 novembro 2005 edição 14 www.linuxmagazine.com.br Figura 4: A importação de apresentações longas do PowerPoint dificulta a vida dos usuários do Impress. OpenOffice.org e Microsoft Office® Capa Parâmetros e conteúdo de célula O Excel só interpreta o conteúdo numérico de uma célula como número quando ele é formatado como texto. O Calc é mais conseqüente nesse particular: se uma célula for formatada como texto, seu valor é sempre zero, mesmo quando há um número dentro dela. Uma outra diferença importante entre o Excel e o Calc é a maneira como parâmetros de funções e áreas de dados são separados. O Calc separa parâmetros com ponto-e-vírgula e áreas de dados com vírgulas. O Excel faz exatamente o contrário. O Excel permite omitir parâmetros opcionais de funções, bem como a entrada de parâmetros adicionais. Isso não funciona no Calc, onde é necessário, via de regra, informar todos os parâmetros de uma função. Funções estatísticas levam a resultados levemente diferentes se calculadas com o Calc, pois o programa usa menos posições depois da vírgula nos cálculos. Os resultados são iguais para as primeiras cinco casas após a vírgula, se diferenciando a partir daí. Isso também acaba com o advento da segunda versão do OpenOffice.org. Gráficos podem ser lidos com segurança pelo Calc, mas ainda há alguns problemas: P Não há uma opção para inverter o eixo Y, ou seja, para que os valores negativos estejam em cima e os positivos embaixo da origem desse eixo. P Nas primeiras linhas ou colunas não pode haver lacunas, o que o Excel permite. P Gráficos são criados de modo mais lento, uma vez que o Calc os recalcula constantemente. O OpenOffice.org 2.0 traz algumas melhorias também nesse particular. Impress O Impress apresenta dificuldades para importar apresentações complexas do MS PowerPoint. Mesmo para conteúdos simples sem multimídia ocorre freqüentemente a falta de uma figura (ver figura 4) e o processo de importação leva muito tempo. Na minha máquina de 1,2 GHz a importação de um arquivo do PowerPoint com 135 slides levou redondos 25 minutos. Pequenos problemas acontecem com o uso de algumas opções de formatação do PowerPoint: o Impress não suporta gradientes com três cores, molduras duplas ou triplas em torno de objetos ou cantos arredondados. Caso uma dessas formatações esteja presente no arquivo original, precisaremos retirá-la antes de importar o arquivo. Conteúdo multimídia também é outro complicador do processo de importação. É o caso de sons emitidos durante a troca de um slide para outro. Como o Impress não domina esse tipo de efeito, ele simplesmente desaparece durante a conversão. Figura 5: O Impress não redimensiona texto em campos de texto corretamente. Campos se transformam em texto quando importados. O Impress não permite disparar ações quando o ponteiro do mouse passa sobre um objeto durante uma apresentação: durante a conversão do arquivo o evento MouseOver é convertido em um MouseClick. Há diferenças adicionais entre o PowerPoint e o Impress, por exemplo no modo como ambos trabalham com textos que saiam de dentro de um quadro: o aplicativo de Redmond redimensiona a fonte do texto de modo que ele caiba no quadro, ao passo que o Impress redimensiona o texto como se fosse um gráfico, o que leva a uma imagem de baixa qualidade (figura 5). A troca de arquivos entre o Impress e o PowerPoint funciona, desde que nos limitemos ao uso de formatação simples e não usemos efeitos excêntricos na troca de slides ou conteúdo multimídia como filmes e sons. É indicado importar apenas uma cópia do arquivo original, para verificar como o Impress se comporta durante o processo de importação e como a formatação vai ficar. Conclusão O intercâmbio de documentos entre o MS Office e o OpenOffice.org ou StarOffice não é, via de regra, problemático. Os filtros de importação e exportação para os formatos da Microsoft, que já eram bons, estão mais refinados na versão 2.0 do OpenOffice.org, ainda em fase de testes. Especialmente os problemas para a importação de tabelas no Writer não acontecem mais e as planilhas do Calc podem ser tão grandes quanto as do Excel. A única coisa que ainda continua exigindo bastante trabalho manual é a conversão de documentos que contenham macros longas e complexas. ■ Informações [1] Guia de migração para o OpenOffice.org: documentation.openoffice.org/manuals/oooauthors/MigrationGuide.pdf [2] Página web do TextMaker: www.softmaker.com/brasil/tm_br.htm [3] Página web do GnuPG: www.gnupg.org novembro 2005 www.linuxmagazine.com.br edição 14 27