ARTIGO CIENTÍFICO CULTURA DO EMPREENDEDORISMO E INOVAÇÃO (CEI) LOCUS ISSN -1981-6790 - versão impressa CIENTÍFICO ISSN -1981-6804 - versão digital PlaNInt!: Uma ferramenta Web inteligente de auxílio à escrita de planos de negócios em português PlaNInt!: Intelligent Web toll to writing support of business plans Caio Cezar Pimentel Ferraz Júnior*1, , Eduardo Pinto Vilas Boas1, Marcelo Adriano Amancio2, Eliane Raymundo2, Sandra Maria Aluísio2, Valéria Feltrim3, José Dornelas1 1 Empreende - Avenida Angélica 1761, cj 43. 01227-200 São Paulo-SP – Brasil Núcleo Interinstitucional de Lingüística Computacional - Instituto de Ciências Matemáticas e de Computação – USP - Avenida Trabalhador São-carlense, 400 - Centro. Caixa Postal: 668 – 13560-970 - São Carlos – SP – Brasil 2 3 Departamento de Informática - Universidade Estadual de Maringá Avenida Colombo, 5790 – Zona 07 - 87020-900 – Maringá – PR e-mail: [email protected]* *Autor de contato / corresponding author Artigo submetido em 28 de fevereiro de 2007, revisado em 15 de maio de 2007, aceito em 04 de junho de 2007. RESUMO O plano de negócios é um documento que foca o planejamento das atividades de uma empresa, principalmente em fase inicial de constituição. Por isso, é extremamente útil e tem sido bastante difundido junto aos interessados na criação de um negócio próprio. Geralmente, os empresários iniciam um negócio próprio sem planejamento ou com planejamento precário, pois não entendem como fazê-lo ou não despendem de tempo suficiente para estruturar seus planos de negócios. Fica evidente, então, a necessidade de se apresentar soluções tecnológicas que auxiliem estes empresários no desenvolvimento de planejamentos melhor estruturados, o que não vem ocorrendo de forma efetiva, apesar dos avanços ocorridos nos últimos anos na área de empreendedorismo. Este artigo apresenta um sistema inteligente de auxílio à elaboração e escrita de planos de negócios baseado na Web, no qual são empregados métodos implementados em ferramentas de auxílio à escrita científica, que foram desenvolvidas ao longo de vários anos no Núcleo Interinstitucional de Lingüística Computacional na USP de São Carlos/SP. São métodos da área de Inteligência Artificial estendidos para o domínio de empreendedorismo, mais especificamente, para planos de negócios. O sistema será incorporado ao portal www.planodenegocios.com.br, apoiando usuários de maneira interativa, em várias etapas da elaboração de um plano. ABSTRACT The business plan is a document for planning the activities of a company mostly in its start-up phase. It is extremely useful and it has been widely known by who is involved in starting-up a new business. It is common an entrepreneur create his own business without or with a poor planning, since he doesn’t know how to do it or doesn’t have enough time to do it. It is clear that there is a necessity of technological innovations for helping entrepreneurs develop well structured business plans, what hasn’t been happening in last years, even though the huge advance of research and development in the area of entrepreneurship. This paper presents an intelligent web based system for helping to elaborate and write business plans. The system uses methods implemented in tools for helping scientific writing which have been developed for many years at The Interinstitutional Center for Research and Development in Computational Linguistics, USP/São Carlos. These methods are based in artificial intelligence and now applied to entrepreneurship and business plans area. The system will be included at portal www.planodenegocios.com.br, helping users in an interactive way, guiding them in the many steps of a business plan elaboration. KEYWORDS: PALAVRAS-CHAVE: • • • 48 Planos de Negócios, Ferramentas inteligentes, Suporte à escrita • • • Business plan Intelligent tools Writing support Ferraz Júnior, C. et al., Locus Científico vol. 1, n. 3 (2007) pp. 48-57 1. INTRODUÇÃO O plano de negócios pode ser considerado a principal ferramenta de gestão dos empreendedores. Por se tratar de um documento que foca o planejamento das atividades de uma empresa, principalmente em sua fase inicial, é extremamente útil e tem sido bastante difundido junto aos interessados na criação de um negócio próprio [Dornelas, 2005]. Além disso, vem ao encontro da necessidade evidente de se aumentar as possibilidades de sucesso das iniciativas de criação de empresas no Brasil e também no exterior. Segundo pesquisas mundiais [GEM, 2001; 2004], o Brasil é apontado como um dos países com maior iniciativa empreendedora no mundo. Do ponto de vista brasileiro, estatísticas apresentadas em pesquisas efetuadas pelo Serviço Brasileiro de Apoio às Micro e Pequenas Empresas (Sebrae) mostram que menos de 40% das empresas criadas no país chegam ao final do primeiro ano de vida (Sebrae, 2003). A principal causa apontada é a falta de planejamento. Nesses casos, os empresários, candidatos a empreendedores de sucesso, iniciam um negócio próprio, na maioria dos casos, sem planejamento ou com planejamento precário, pois não despendem de tempo suficiente para estruturar seus próprios planos de negócios, que geralmente demandam em média dois meses de desenvolvimento. Diante desse cenário, é evidente a necessidade de se apresentar soluções tecnológicas que auxiliem os empresários no desenvolvimento de planos bem estruturados, o que não vem ocorrendo de forma efetiva, apesar dos avanços ocorridos nos últimos anos na área de empreendedorismo. Entre esses avanços, podem ser citados o suporte aos empreendedores brasileiros no desenvolvimento de planos de negócios promovido nos últimos anos por ações por parte do Sebrae, o crescimento do ensino de empreendedorismo nas universidades e ensino médio, as publicações que têm focado o assunto, bem como a criação de sites na Internet especializados em empreendedorismo. Um site em particular, o www.planodenegocios.com.br, pode ser considerado uma das principais referências nacionais no assunto. Contém inúmeras funcionalidades disponíveis aos empreendedores e estudantes, tais como artigos, material de suporte, apresentações, links para outros sites, cursos online, dinâmicas de criatividade, exemplos de plano de negócios, jogos de empreendedorismo, testes de perfil empreendedor, entre outras. O acesso ao site tem crescido substancialmente, desde sua criação em 1999. Atualmente, o site possui cerca de 50.000 pessoas cadastradas que utilizam seus recursos e pagam por este uso, o que mostra o sucesso do site junto ao seu público-alvo. Uma média de 2.000 a 5.000 pessoas acessam o site diariamente, com picos eventuais de 7.000 pessoas/dia. Ao se cadastrar no site Plano de Negócios, o usuário responde a um questionário com indagações sobre seu principal interesse. Mais de 70% das pessoas buscam exemplos de como desenvolver um plano de negócios ou ferramentas de software que auxiliem nesta tarefa. Outro tipo de suporte à criação de planos de negócios são os softwares. No mercado americano, por exemplo, existem diversos produtos destinados ao desenvolvimento de plano de negócios, com vendas acima de 1 milhão de cópias, como é o caso do Business Plan Pro (www.paloaltosoftware.com), líder nos EUA. No Brasil, existe um produto desenvolvido há alguns anos e utilizado por estudantes, o Make Money (www.doctorsys.com.br) e, mais recentemente, um outro produto desenvolvido pelo Sebrae (SPPlan). No entanto, estes produtos apresentam apenas estruturas de plano de negócios e templates com a seqüência de passos que se deve seguir até a obtenção do plano de negócios. O processo de construção de um plano de negócios não deve limitar-se a seguir passos pré-estabelecidos e preencher templates, devendo ser encarado como um processo de aprendizado e interação do empreendedor com a oportunidade. Para Timmons, Zacharakis e Spinelli [2004, p.4], “ao articular no plano de negócios a natureza da oportunidade e a forma pela qual o empreendedor irá explorá-la, o mesmo terá que responder muitas questões que enfrentará, de fato, quando lançar-se no negócio”. Nesse sentido, mesmo seguindo os passos sugeridos nos softwares convencionais de elaboração de planos de negócios, o usuário não consegue obter um plano de negócios adequado, devido à sua falta de experiência no desenvolvimento desse tipo de documento, e, principalmente, por não saber estruturar e escrever de forma adequada a sua idéia, estratégia, mercado-alvo, ou seja, seu conceito de negócio. De fato, os candidatos a empreendedor e alunos, em muitos casos, carecem de habilidade de escrita, isto é, possuem problemas na escrita de um texto que apresente mecanismos de coesão entre as suas partes culminando com um todo coerente para a tarefa e público alvo em questão [Koch, 1998; Koch e Travaglia, 2002], o que inviabiliza a obtenção de um bom plano de negócios. Isso ocorre, pois há diferenças entre conhecer bem o mercado, a proposta de negócio, etc. e transmiti-la de forma vendável, com clareza e objetividade aos diferentes públicos do plano de negócios. Siegel, Ford e Bornstein [1987, p.1] reforçam essa tese afirmando que os “empreendedores normalmente são melhores executores do que escritores de propostas”, e que “muitos empreendedores têm dificuldades em articular os conceitos do negócio” em um documento. Dornelas [2005, p.95] ressalta, ainda, que “a maioria dos planos de negócios resume-se a textos editados sobre um modelo predeterminado, que não convencem ao próprio empreendedor”, falhando, portanto, como ferramenta de venda da idéia e conceito de negócio proposto. Este artigo tem como objetivo apresentar uma ferramenta inteligente de auxílio à escrita e elaboração de plano de negócios, baseada na Web, chamada PlaNInt!. PlaNInt!, que ainda está em fase de desenvolvimento, possui várias inovações: i) é um software para plano de negócios dedicado à língua portuguesa; ii) incorpora no software o conhe- Ferraz Júnior, C. et al., Locus Científico vol. 1, n. 3 (2007) pp. 48-57 49 cimento - know how - da empresa Empreende, importante consultoria brasileira especializada no assunto e que gerencia o Portal Plano de Negócios; iii) emprega PLN (Processamento de Língua Natural) em software para planos de negócios; iv) transfere tecnologia e conhecimento acumulado em muitos anos no Núcleo Interinstitucional de Lingüística Computacional (NILC: http://www.nilc.icmc.usp.br/) para textos científicos, para o domínio de planos de negócios; e v) conduz o autor à escrita de um plano de negócios completo, flexível e bem escrito, evitando que o mesmo cometa erros comuns como números fora da realidade e constatações sem parâmetros objetivos e desprovidas de fonte. Este documento está organizado da seguinte maneira: na Seção 2, apresentamos um breve resumo das ferramentas de auxílio à escrita desenvolvidas no NILC que utilizam a mesma metodologia de desenvolvimento de PlaNInt!; na Seção 3 descrevemos os recursos e métodos utilizados para a implementação do auxílio à escrita do Sumário Executivo (SE) de um plano de negócios – a seção do ambiente que está em construção e que já apresenta os primeiros resultados; na Seção 4 apresentamos um caso de uso da escrita de um SE usando PlaNInt!; e finalmente, a Seção 5 conclui o artigo e apresenta os trabalhos futuros. 2. FERRAMENTAS DE AUXÍLIO À ESCRITA Em 1991, iniciou-se um projeto para a criação de um ambiente computacional com ferramentas de auxílio à escrita, específicas para a elaboração de artigos científicos, que culminou com a implementação do sistema AMADEUS (AMiable Article DEvelopment for User Support) com suas ferramentas de Referência, Suporte e de Crítica [Caldeira et al., 1992; De Oliveira et al., 1992; Aluisio e Oliveira, 1995; Aluisio e Oliveira, 1996; Aluisio e Gantenbein, 1997a; Aluisio e Gantenbein, 1997b; Aluisio et al., 2001]. Com a criação do NILC, em 1993, ao longo dos anos foram acrescentadas novas ferramentas ao AMADEUS e sistemas correlatos foram derivados. A estratégia central do sistema AMADEUS é o reuso de expressões lingüísticas, extraídas de textos reais e bem escritos, categorizadas de acordo com as metas retóricas dos diferentes componentes textuais de um dado tipo de texto. O objetivo inicial de fornecer tais expressões contextualizadas era o de melhorar a produção escrita de textos científicos em inglês, de autores que não possuíam o Inglês como língua nativa, diminuindo com isso a interferência negativa da língua materna. Essa interferência pode se dar em vários níveis: 1) No nível léxico pelo mau uso de falsos cognatos e palavras homófonas; falta ou mau uso de expressões idiomáticas e outras colocações empregadas em textos científicos; 2) No nível sintático, com o uso de construções gramaticais da língua materna; tradução palavra por palavra; orações muito longas ou complexas; e 3) No nível textual, pelo uso de estruturas retóricas ou estratégias de escrita da língua materna; mau uso de relações lógicas entre orações e falta de referências. Além de diminuir essa interferência, o 50 uso das expressões contextualizadas ajuda o usuário a se familiarizar com construções sintáticas e semântico-sintáticas incomuns na língua nativa, a reusar os marcadores de discurso [Paizan, 2001], verbos e tempos verbais, e a inserção de material bem escrito no texto a ser redigido, para tornar mais fluente1 o novo texto. Ao longo dos últimos anos novos sistemas foram desenvolvidos no NILC, introduzindo inovações como um sistema de auxílio à escrita em português de teses e dissertações na área de computação, o SciPo2 - Scientific Portuguese [Feltrim et al., 2004; Feltrim et al., 2005]. Este último sistema foi construído nos moldes da ferramenta de Crítica do AMADEUS, com reconhecimento automático da estrutura de resumos escritos por estudantes para posterior avaliação desta pelo sistema. Também foi desenvolvida um ferramenta para o domínio da Farmácia que possui a mesma interface (look-and-feel) do SciPo, a funcionalidade da ferramenta de Suporte do AMADEUS e trata de artigos científicos em inglês [Schuster et al., 2005; Aluísio et al., 2005]. O SciPoFarmácia3 foi utilizado e avaliado em dois cursos de Escrita Técnica em nível de pós-graduação da Faculdade de Farmácia da USP, em um curso de pós-graduação do IFSC da USP São Carlos e em um curso de Difusão, modalidade Educação continuada do ICMC-USP São Carlos. A título de ilustração do funcionamento de algumas das estratégias de auxílio à escrita, mostramos nas Figuras 1 e 2 telas do sistema SciPo, indicando como são fornecidas informações sobre a estrutura contida em um resumo de um texto científico, e como aparecem as recomendações na interação com um usuário. Figura 1: Tela do Sistema SciPo, indicando os componentes e sub-componentes de um resumo para teses e dissertações em computação. O usuário pode selecionar componentes, obter exemplos específicos de cada um – a partir da base de casos, e receber ajuda com a explicação sobre o que se espera de cada componente e sub-componente. Na janela menor aparecem escolhas feitas por um usuário. 1 2 3 Entendemos fluência como o resultado da aplicação efetiva de várias fontes de conhecimento , como o conhecimento léxico , sintático, e retórico (organizacional). http://www.nilc.icmc.usp.br/~scipo/ http://www.nilc.icmc.usp.br/scipo-farmacia/ Ferraz Júnior, C. et al., Locus Científico vol. 1, n. 3 (2007) pp. 48-57 Figura 2: As escolhas de componentes de um usuário – mostradas na janela menor – são comentadas na janela da esquerda. Tais recomendações são fornecidas pelo sistema a partir de conhecimento sobre o domínio específico, embutido na ferramenta. As críticas são apontadas em vermelho e as sugestões em verde. 3. RECURSOS E MÉTODOS UTILIZADOS POR PLANINT! A criação de uma ferramenta de auxílio à escrita de cada seção de um texto, seja ele uma tese, como mostra a Figura 1, ou um SE de um plano de negócios, envolve várias etapas. Segundo a metodologia utilizada no AMADEUS, para o domínio de planos de negócios, seriam necessárias as etapas mostradas no Quadro 1. 2. 3. 4. 5. Tabela 1. Distribuição do corpus entre diferentes áreas de negócios. Área Internet Manufatura Serviços Comércio Quadro 1: Passos para a criação dos recursos utilizados na PlaNInt! 1. dos pela empresa Empreende, que não só conta com especialistas na elaboração de tais planos, como possui um grande conjunto de planos de negócios, coligidos ao longo de vários anos de atuação, já que essa é a especialidade da empresa. Dessa forma, assumimos que os SEs do corpus constituem bons exemplos de escrita para esse gênero. Os SEs coletados são parte de planos de negócios para diferentes áreas. Assim, o corpus foi dividido em quatro áreas de negócios, a saber: Internet, Manufatura, Serviços, e Comércio. A Tabela 1 mostra o número de SEs separados por área de negócio, juntamente com dados sobre o tamanho, em palavras, dos SEs em cada área. Pela figura é possível notar que o maior número de SEs disponíveis no corpus são das áreas de Serviços e Manufatura, respectivamente. Vale destacar também que a média de palavras nos SEs não varia muito entre as diferentes áreas, embora apresentem, dentro de uma mesma área, um alto desvio padrão, indicando que tamanho de um SE pode variar significativamente. Compilação e organização de um corpus para a área de planos de negócios de diferentes setores; Estabelecimento de estruturas esquemáticas para cada seção do plano de negócios; Análise do corpus feita por especialistas em lingüística, realizando a classificação das sentenças em componentes das estruturas esquemáticas de cada seção de um plano de negócios, de acordo com as estruturas estabelecidas no item 2; Análise do corpus para anotação das estratégias retóricas, que refinam os componentes das estruturas esquemáticas, e das expressões lingüísticas padrões, isto é, aquelas que poderão ser reusadas na escrita de novos planos pelos usuários da ferramenta. Implementação computacional do protótipo por analistas de sistema, que acoplam os recursos lingüísticos elencados nos itens 2, 3 e 4 na ferramenta computacional. Desta forma, a nova ferramenta utilizará uma base de textos analisados para mostrar aos usuários exemplos selecionados de planos de negócios reais. Segundo Dornelas [2005], o Sumário Executivo (SE) é a principal seção do Plano de Negócios e deve expressar uma síntese do que será apresentado na seqüência, preparando e atraindo o leitor para uma posição de maior atenção e interesse sobre o documento. Dirigida a um público-alvo específico e abarcando as informações–chave do Plano de Negócios de forma sintética, clara e concisa, tem como objetivo enfatizar e explicitar as intenções do empreendedor. Como piloto para a criação da ferramenta PlaNInt!, escolhemos a seção SE para iniciar a coleta e análise do corpus. O corpus possui 73 Sumários Executivos (SEs) forneci- Número de SEs Soma Número de Palavras Média Desvio Padrão 21 10289 489,95 4 41 7 1980 18638 3181 495,00 306,11 454,59 190,20 454,43 211,25 234,31 Embora seja consenso entre os especialistas do corpus que a estrutura esquemática do SE varia de acordo com o tipo de negócio e objetivo a ser alcançado, é possível estabelecer uma estrutura básica que sirva aos propósitos de vários empreendimentos (Indústria, Comércio e Empresas em Operação). Tal estrutura básica, composta de nove seções, foi baseada em Dornelas [2005] e elaborada por um processo bastante utilizado em trabalhos de PLN [Feltrim et al., 2004; Feltrim et al., 2005; Teufel, 1999]: via manual de anotação, com fases de treinamento da anotação, avaliação da anotação realizada por um grupo de pessoas, e anotação real do corpus. Um manual de anotação dos elementos da estrutura esquemática foi previamente preparado para apoiar a anotação de 5 SEs (fase de treinamento). Esta fase foi realizada por um grupo de especialistas da área de negócios da empresa Empreende, por pesquisadores especialistas em escrita científica do NILC (com experiência em anotação retórica de corpus) e por uma lingüista e um aluno da área de computação que trabalham no projeto PlanInt!. Após discussão dos pontos divergentes da anotação dos SEs, a estrutura esquemática foi aprimorada. A anotação final do corpus, com base na nova estrutura e no manual revisado, foi realizada por um especialista da Empreende, sendo tal anotação revisada pela lingüista do projeto. Ressalta-se que essa estrutura não é fixa, podendo apresentar variações. As nove seções previstas na estrutura bá- Ferraz Júnior, C. et al., Locus Científico vol. 1, n. 3 (2007) pp. 48-57 51 sica são apresentadas na Tabela 2, com exemplos ilustrativos de cada uma das seções. Tabela 3. Número de componentes por SE. Tabela 2 Estrutura esquemática básica de um SE e descrição da cada seção. Siglas das seções CNO MC MMPV • • O mercado de cartões de crédito vem crescendo exponencialmente na última década, tendo apresentado crescimento de 1348% em volume de transações e 303% no número de cartões emitidos. Marketing, Market-share, Projeção e Vendas • A NewBusiness Media busca, através de sua estratégia de marketing, crescer nos 2 primeiros anos no estado de São Paulo e nos próximos 3 anos, em toda a região Sudeste do país. No futuro produtos como Cartão Salário e Cartão Private Label deverão ser utilizados para expandir o portfólio da empresa. Os diferenciais do cartão serão, a facilidade de acesso e a ausência de custo fixo para sua utilização (anuidade). Equipe (Time Gerencial) • A equipe de gestão é composta por profissionais com grande experiência técnica e administrativa em empresas dos segmentos de tecnologia e telecomunicações e em agências de publicidade, possuindo excelente formação e relacionamento com pessoas, estando motivados para tornar a NewBusiness Media uma empresa de sucesso. Estrutura e Operações • A NewBusiness Media possui uma estrutura enxuta, dinâmica e competente, sendo composta pelo CEO suportado por 4 diretorias – vendas e marketing, parcerias e relacionamentos, engenharia e tecnologia, administrativo e financeiro. Índices e Projeções Financeiras IPF • ONAR O projeto traz um payback em 21 meses e uma taxa interna de retorno de 140% ao ano, com um valuation de R$ 3,7 milhões para o negócio. Oferta/Necessidade de Aporte de Recursos A necessidade de aporte será de R$ 1,4 milhões, e a estrutura de funding se dará com capital próprio do acionista fundador e da captação de recursos via Angel Investors e Family&Friends A Tabela 3 apresenta os dados sobre a ocorrência dos componentes previstos na estrutura esquemática da Tabela 2 nos SEs. Poucos SEs estão nos extremos, isto é, apenas um dos 73 SEs apresenta um único componente, assim como apenas 2 SEs apresentam os 9 componentes previstos na estrutura esquemática. Na sua maioria (82,2%), os SEs analisados apresentam de 5 a 8 componentes. Vale ressaltar que várias sentenças em um mesmo SE podem caracterizar um mesmo componente e que tais componentes podem ocorrer de forma repetitiva e intercalada na estrutura do SE. 52 1,37 3 1 1,37 4 A NewBusiness Café foi inspirada nos modelos internacionais de negócio como as redes americanas Starbuck’s Coffee e The Coffee Bean. Vantagem Competitiva do Negócio EO 1 2 2 7 2,74 9,59 5 11 15,07 7 12 16,44 6 8 Mercados e Competidores • EQU % Conceito do Negócio e a Oportunidade • VC Número de SEs Descrição das siglas e exemplo de uma sentença Descrição do Produto/Serviços PS Número de componentes 1 9 Soma 24 13 2 73 32,88 17,81 2,74 100% A freqüência de cada componente da estrutura esquemática nos SEs analisados é mostrada na Tabela 4. Nota-se que o componente de maior ocorrência é o CNO (Conceito do Negócio e a Oportunidade), presente em 94% dos SEs, seguido pelos componentes MC (Mercados e Competidores – 89%) e MMPV (Marketing, Market-share, Projeção e Vendas – 84%), respectivamente. Podemos considerar estes componentes como essenciais a um plano. O componente de menor ocorrência é o VC (Vantagem Competitiva do Negócio), presente em 23% dos SEs. Essa distribuição dos componentes evidencia os aspectos considerados mais importantes pelos escritores no momento da estruturação de um SE, bem como os componentes considerados opcionais dentro da estrutura esquemática proposta. Tabela 4. Distribuição dos componentes do corpus. Etiqueta CNO MC MMPV IPF EQU EO Ocorrência % 69 94,00 62 84,00 65 52 47 44 89,00 71,00 64,00 60,00 ONAR 43 58,00 VC 17 23,00 PS 42 57,00 Em textos científicos, é relativamente comum que uma única sentença tenha características de diferentes componentes. Nos SEs de planos de negócios não é diferente. A Tabela 5 mostra que foi observada a ocorrência de 2 ou mais componentes combinados em uma mesma sentença, indicando que uma sentença pode apresentar atributos (tais como marcas lexicais) que caracterizam mais de um componente. Vale ressaltar que esse tipo de ocorrência pode ser atribuído tanto à escrita de sentenças longas (que tendem a agrupar componentes), a falta de clareza da escrita e, ainda, a ambigüidades presentes no processo de anotação (seja pela definição pouco específica das etiquetas, seja pela falta de treinamento do anotador). De qualquer maneira, nota-se na Tabela 5 que a maior parte das 1265 sentenças caracteriza um único componente. Nessa figura, a Freqüência Total demonstra a porcentagem da ocorrência da etiqueta/conjunto de etiquetas sobre o total de sentenças anotadas, enquanto a Freqüência Ferraz Júnior, C. et al., Locus Científico vol. 1, n. 3 (2007) pp. 48-57 Local mostra a porcentagem da ocorrência de cada etiqueta/ conjunto de etiquetas sobre total de sentenças anotadas dentro de um grupo representando um determinado componente. Embora tenhamos anotado esta variedade, na base de textos da ferramenta computacional somente o componente mais importante irá permanecer. Por exemplo, as sentenças anotadas com mais de uma etiqueta dentro do grupo relativo ao componente CNO, na ferramenta computacional apresentarão apenas a etiqueta CNO, por esta ser considerada a característica mais forte de tais sentenças. Tabela 5: Freqüência de componentes agrupados no corpus. Freq Total % 16,05 0,63 0,08 0,16 2,13 0,55 0,08 1,34 0,24 0,87 22,13 6,88 0,24 0,32 0,08 0,40 0,08 0,08 0,47 8,54 6,72 0,08 0,08 0,47 7,35 8,38 0,08 0,32 8,77 18,66 0,40 0,16 0,40 0,16 0,16 19,92 16,36 0,40 0,16 0,08 0,24 0,47 17,71 5,06 0,71 5,77 5,93 0,16 0,63 1,42 8,14 1,42 0,08 0,16 1,66 100% Freq Local % 72,50 2,86 0,36 0,71 9,64 2,50 0,36 6,05 1,07 3,93 280 80,56 2,78 3,70 0,93 4,63 0,93 0,93 5,56 108 91,40 1,08 1,08 6,45 93 95,50 0,90 3,60 111 93,65 1,98 0,79 1,98 0,79 0,79 252 92,41 2,23 0,89 0,45 1,34 2,68 224 87,67 12,33 73 72,82 1,94 7,77 17,48 103 85,71 4,76 9,52 21 1265 Ocorrências 203 8 1 2 27 7 1 17 3 11 87 3 4 1 5 1 1 6 85 1 1 6 106 1 4 236 5 2 5 2 2 207 5 2 1 3 6 64 9 75 2 8 18 18 1 2 Etiquetas CNO CNO/EO CNO/EO/MMPV CNO/EQU CNO/MC CNO/MMPV CNO/MMPV/VC CNO/PS CNO/PS/VC CNO/VC Subtotal CNO EO EO/CNO EO/EQU EO/IPF EO/MMPV EO/ONAR EO/PS EO/VC Subtotal EO EQU EQU/EO EQU/IPF EQU/VC Subtotal EQU IPF IPF/MMPV IPF/ONAR Subtotal IPF MC MC/CNO MC/IPF MC/MMPV MC/PS MC/VC Subtotal MC MMPV MMPV/EO MMPV/IPF MMPV/MC MMPV/PS MMPV/VC Subtotal MMPV ONAR ONAR/IPF Subtotal ONAR PS PS/CNO PS/MMPV PS/VC Subtotal PS VC VC/EO VC/PS Subtotal VC TOTAL 4. USANDO PLANINT! – A ESCRITA DE UM SUMÁRIO EXECUTIVO COM A FERRAMENTA O Sistema Web de auxílio à escrita e elaboração de plano de negócios, quando totalmente implementado, deverá possibilitar ao usuário conhecer estruturas e exemplos de plano de negócios, assim como guiá-lo, passo a passo, na obtenção de seu plano de negócios, sempre com suporte inteligente proporcionado pela ferramenta de escrita a ser desenvolvida. A intenção é que o usuário possa interagir com o sistema e, assim, escolher a melhor estrutura e conteúdo para escrever seu plano de negócios. O sistema também prevê o acesso a uma base de dados computacional com estruturas de linguagem, termos, frases, exemplos de planos de negócios, setores etc. Além disso, deverá prever um sistema de correção ou validação de termos utilizados para verificar a consistência da escrita com o propósito do plano de negócios que se quer desenvolver. Neste contexto, será uma ferramenta nos mesmos moldes da ferramenta de Crítica do AMADEUS, mencionada na Seção 2, com a funcionalidade de reconhecimento automático da estrutura das partes mais críticas do plano seguindo as abordagens utilizadas na área por Teufel [1999] para o inglês e por Feltrim et al [2004], Feltrim et al [2005] para o português. A vantagem de o sistema ser baseado na Internet é a de o usuário poder desenvolver seu plano de negócios on-line e gravar versões intermediárias no banco de dados do sistema, podendo acessá-las via Internet de qualquer computador. Para um usuário que deseja redigir e estruturar o Sumário Executivo de seu Plano de Negócios com o auxílio da ferramenta é necessário acessar a página inicial do PlaNInt!, disponível em http://www.nilc.icmc.usp.br/planint/., e clicar na opção “Sumário Executivo”, conforme indica a Figura 3. Figura 3: Página inicial da ferramenta PlaNInt! Selecionada a opção “Sumário Executivo”, uma nova página referente à seleção da estrutura será carregada no navegador do usuário. Nessa etapa, o autor deverá planejar a estratégia de elaboração do texto, selecionando no menu Ferraz Júnior, C. et al., Locus Científico vol. 1, n. 3 (2007) pp. 48-57 53 localizado à esquerda da tela os componentes que estarão presentes em seu documento. A Figura 4 ilustra a tela de seleção da estrutura esquemática de um Sumário Executivo, com sete estratégias retóricas: Identificar e avaliar a oportunidade; Indicar experiências e habilidades profissionais; Apresentar dados e tendências do mercado; Apresentar estratégia do composto de marketing; Apresentar estratégia e projeção de vendas; Apresentar estratégia de crescimento; e Apresentar a viabilidade do negócio, respectivamente pertencentes aos componentes: O Conceito de Negócio e a Oportunidade, Equipe, Mercado e Competidores, Marketing e Vendas (3 vezes), e Plano Financeiro. Exemplo”, logo acima de cada caixa de texto. Ao selecionar essa opção, surgirá no navegador uma nova tela com exemplos de escrita anotados a partir do corpus. Esses exemplos podem ser copiados para a caixa de texto, clicando-se no símbolo “[>]”, que segue após cada exemplo. A Figura 6 ilustra um recorte da página de redação, com caixas de texto para algumas estratégias retóricas selecionadas, e a Figura 7 mostra a caixa de diálogo aberta com exemplos da estratégia retórica selecionada: Figura 6: Recorte da página de redação. Figura 4: Tela de seleção da estrutura do Sumário Executivo. Caso o usuário tenha dúvidas quanto a quais componentes escolher, a ferramenta de escrita disponibiliza um mecanismo de ajuda que pode ser acessado selecionandose com o mouse o ponto de interrogação ao lado de cada componente principal da estrutura. Esse mecanismo de ajuda apresenta o conceito e conteúdo de cada componente da estrutura, conforme ilustra a Figura 5. Figura 5: Mecanismo de ajuda (Help) da ferramenta de escrita para o componente “ O Conceito do Negócio e a Oportunidade”. Após a seleção dos componentes e estratégias retóricas desejadas, a redação do Sumário Executivo pode ser iniciada, selecionando-se a opção “Iniciar Redação”, localizada na parte inferior direita da tela. Em seguida, uma nova página será carregada no navegador do usuário, contendo caixas de texto para cada estratégia retórica selecionada na etapa anterior. Cada caixa de texto estará identificada com o referido componente e estratégia retórica a ser preenchida. Para iniciar a escrita, o autor pode consultar exemplos de estratégias retóricas cadastrados na ferramenta, clicando em “Ver 54 Figura 7: Exemplos de escrita que podem ser copiados para a caixa de texto. Depois de copiado para a caixa de texto, o usuário pode alterar e adaptar o exemplo escolhido conforme seu desejo, garantindo, assim, um texto bem estruturado, elaborado e adaptado ao seu negócio e mercado. A vantagem de se aproveitar os exemplos fornecidos pela ferramenta existe uma vez que os mesmos representam modelos reais adaptados e corrigidos por especialistas em planos de negócios, respaldando, portanto, sua qualidade técnica. Além disso, os exemplos contidos na ferramenta evitam que o empreendedor caia em armadilhas comuns da escrita de planos de negócios, como otimismo excessivo, falta de objetividade e escassez de dados reais para constatações como tamanho do mercado, previsão de vendas, etc. Nesse sentido, os modelos apresentados conduzem o autor ao estudo do mercado, do modelo de negócio proposto e o leva a maior objetividade no estabelecimento de metas e projeções. A Figura 8 apresenta a cópia legítima do exemplo fornecido pela ferramenta, sem alterações. A Figura 9 apresenta o mesmo exemplo já adaptado às necessidades do usuário. Ferraz Júnior, C. et al., Locus Científico vol. 1, n. 3 (2007) pp. 48-57 Figura 8: Transcrição de exemplos fornecidos pela ferramenta para a estratégia retórica “Apresentar dados e tendências do mercado”, no componente “Mercado e Competidores”. Figura 9: Modelo de adaptação dos exemplos fornecidos pela ferramenta para o mercado de construção civil. O processo de escrita para os demais componentes segue as mesmas regras, permitindo ao usuário escolher exemplos de boa redação e adaptá-los conforme seu desejo e necessidade. Procedendo dessa maneira, não só empreende- dores iniciantes, mas qualquer usuário poderá fazer uso da ferramenta, aprimorando o conhecimento da oportunidade e do negócio e construindo um documento com qualidade na escrita. Até o momento, os resultados obtidos no projeto compreendem as funções de escolha da estrutura esquemática e estratégia de escrita para Sumários Executivos, consulta a exemplos de diversos setores para cada estratégia retórica, adaptação dos exemplos selecionados para seu próprio SE e conversão do material escrito para os formatos HTML e Word (editor de texto da Microsoft). Os próximos passos do projeto consistem em estabelecer a função de critica e sugestão de estrutura ao Sumário Executivo, ou seja, um instrumento que propiciará uma espécie de “alerta” que indica a ausência de estratégias fundamentais e sugere a inclusão ou exclusão das mesmas, visando explicitar com sucesso o desejo de seu autor. No Quadro 2, um modelo completo de Sumário Executivo construído a partir da ferramenta PlaNInt! é apresentado. Os dados fornecidos são meramente ilustrativos, de modo que o intuito principal é demonstrar o resultado da elaboração de um texto informativo e de acordo com as normas de uma boa redação. Quadro 2: Sumário Executivo construído a partir da ferramenta PlaNInt! O Conceito do Negócio e a Oportunidade O NB Laboratório de Ensaios Ltda. surgiu da oportunidade de atuar no mercado de construção através da prestação de serviços de controle tecnológico de obras. Equipe A equipe de gestão é composta por profissionais com grande experiência em empresas de construção, possuindo excelente formação acadêmica e bom relacionamento com pessoas do setor. Mercado e Competidores O setor de obras de construção civil vem se destacando pelo seu crescimento, sendo considerado uma das grandes tendências de investimento no país, devido aos diversos programas de incentivo e financiamento oriundos do governo para essa área. Em paralelo, a intensificação da fiscalização das obras que até a década de 1990 representavam menos de 50% dos casos, a partir de 2000 passou a representar cerca de 80%, totalizando um mercado aproximado de R$ 2 bilhões/ano. Marketing e Vendas Os fundamentos de marketing foram considerados: Produto (ensaios tecnológicos de argamassa, cimento, concreto e solo); Preço (adotado a partir da mídia de mercado, considerando-se tratar de um serviço de compra comparada); Praça (a distribuição do serviço se dará na região noroeste do estado de São Paulo, por meio da venda direta às construtoras e órgãos públicos fiscalizadores); e Promoção (a comunicação será feita por meio de revistas e eventos especializados, além de visitas técnicas junto aos órgãos de fiscalização de obras). Inicialmente, será realizado um levantamento detalhado das principais construtoras e órgãos fiscalizadores da região e a partir disso será coordenada a atuação da força de vendas. As estimativas indicam a possibilidade de se alcançar cerca de 1.500 contratos de ensaios de materiais da construção civil no primeiro ano, crescendo para 3.000 ensaios a partir do quinto ano de operação. O NB Laboratório de Ensaios dará foco no estado de SP nos 2 primeiros anos, prevendo expansão para o sul de Minas Gerais e norte do Paraná ao final do 3º ano. Plano Financeiro A análise de viabilidade mostra que o projeto é bem sensível ao preço, o que significa que o poder de negociação com os clientes será fundamental para garantir a rentabilidade do negócio. O Valor Presente Líquido (VPL) do negócio é estimado em R$850.000, com Taxa Interna de Retorno (TIR) de 41% ao ano. A expectativa é de que o negócio alcance o pay-back em 33 meses, recuperando o investimento inicial de R$195.000. 5. CONCLUSÃO Neste artigo, apresentamos a ferramenta PlaNInt!, destinada inicialmente para o mercado brasileiro, mas com perspectiva de evolução para versões desse produto em outras línguas como o Inglês, podendo em um segundo momento gerar versões do produto para outros mercados internacionais, além do americano. A ferramenta atualmente contém na sua base de textos um conjunto de SEs anotados segundo uma estrutura es- quemática e estratégias retóricas construídas também no âmbito deste projeto. Para terminar o suporte à construção de SEs faltam ainda serem programadas críticas às estruturas propostas pelos usuários para a escrita de seus SEs. As próximas etapas utilizarão o mesmo método usado na seção SE para construir seus recursos lingüísticos, isto é, uma base de textos de cada seção, anotada segundo as suas estruturas esquemáticas e as estratégias, além da anotação dos trechos reusáveis das seções. Ferraz Júnior, C. et al., Locus Científico vol. 1, n. 3 (2007) pp. 48-57 55 Quando totalmente implementada, ela: 1) Fornecerá estrutura adequada para um plano de negócios, com exemplos reais e contextualizados, coligidos ao longo dos anos pela empresa e estendidos no presente projeto. 2) Apresentará informações específicas para cada item da estrutura, a partir de uma base de conhecimento que será continuamente estendida com a interação e feedback dos usuários. 3) Fornecerá checklist para os autores verificarem adequação da estrutura escolhida, com explicações para cada item da estrutura. 4) Analisará estruturas propostas pelo usuário, apresentando críticas com base no conhecimento embutido no sistema inteligente. 5) Analisará a estrutura dos planos de negócios propostos pelo usuário, reconhecendo automaticamente seus componentes principais/críticos com a ajuda de algoritmos de aprendizado de máquina e apresentando críticas baseadas no conhecimento de partes padrões dos planos, seqüências esperadas e mais adequadas das partes e dependências entre as partes - mesmo conhecimento que será usado para o item 4). Trata-se, portanto, de um projeto de transferência de tecnologia da Universidade para uma empresa, que já é especializada no domínio da aplicação. O projeto tem duração de 2 anos, sendo prevista para outubro de 2008 a finalização e disponibilização da ferramenta de suporte à escrita PlanInt!. AGRADECIMENTOS Os autores agradecem ao CNPq/RHAE pelo suporte financeiro ao projeto. REFERÊNCIAS BIBLIOGRÁFICAS ALUÍSIO, S.M.; SCHUSTER, E.; FELTRIM, V.D.; PESSOA Jr, A.; OLIVEIRA Jr, O.N. Evaluating Scientific Abstracts with a Genrespecific Rubric. Proceedings of AIED, Amsterdam, IOS Press, 2005, p 738-740. ALUÍSIO, S.M. Ferramentas de Auxílio à Escrita de Artigos Científicos em Inglês como Língua Estrangeira. PhD Thesis, IFSQ-USP, 228p., Agosto de 1995. ALUÍSIO, S.M.; OLIVEIRA Jr. O.N. A case-based approach for developing writing tools aimed at non-native English users. Lectures Notes in Artificial Intelligence 1010. p. 121-132, 1995. ALUÍSIO, S.M.; OLIVEIRA Jr,. O.N. A detailed schematic structure of research papers introductions: an application in supportwriting tools. Revista de la Sociedad Espanyola para el Procesamiento del Lenguaje Natural 19, 141-147, 1996. ALUÍSIO, S.M.; GANTENBEIN, R.E. Towards the application of systemic functional linguistics in writing tools. Proceedings of the International Conference on Computers and their Applications, p.181-185, 1997. ALUÍSIO, S.M.; GANTENBEIN, R.E. Educational tools for writing scientific papers. VIII Simpósio Brasileiro de Informática na Educação. ITA, p.239-253, 1997b. ALUÍSIO, S. M.; BARCELOS, I.; SAMPAIO, J. & OLIVEIRA Jr, O. N. (2001). How to learn the many unwritten “Rules of the Game” of the Academic Discourse: A hybrid Approach based on Critiques and Cases, In: Okamoto T., Hartley R., Kinshuk & Klus J. (Eds.) (2001). Advanced Learning Technology: Issues, Achievements and Challenges, Los Alamitos, CA: IEEE Computer Soc., 257-260. ALUÍSIO, S.M.; AQUINO, V.T.; PIZZIRANI, R.; OLIVEIRA JR, O. N. High Order Skills with Partial Knowledge Evaluation: Lessons learned from using a Computer-based Proficiency Test of English for Academic Purposes. Journal of Information Technology Education, California, USA, v. 2, n. 1, p. 185-201, 2003. ALUÍSIO, S.M., DE OLIVEIRA, M.C.F.; FONTANA, N.; NACAMATSU,C.Y. & OLIVEIRA Jr. O.N. Writing tools for non-native users of English. Proceedings of the XVIII Conference LatinoAmericana de Informatica, p.224-231. 1992. DE OLIVEIRA, M.C.F., (Caldeira) ALUÍSIO, S.M, MASIERO, P.C. ; OLIVEIRA Jr., O.N. A discussion on human computer interfaces for writing support tools. Proceedings of the XII International Conference of The Chilean Computer Science Society, Chile, 223-233. 1992. DORNELAS, J.C.A. Empreendedorismo, transformando idéias em negócios. Rio de Janeiro: Campus, 2005. 2ª. Edição. FELTRIM, V.; PELIZZONI, J.M.; TEUFEL, S.; NUNES, M.G.V.; ALUÍSIO, S.M. Applying Argumentative Zoning in an Automatic Critiquer of Academic Writing. In: 17th Braziliam Simposium on Artificial Inteligence, 2004, São Luis, Maranhão. Proceedings of the 17th Brazilian Symposium on Artificial Inteligence. 2004. v. 1, p. 1-10. FELTRIM, V.; TEUFEL, S.; NUNES, M.G.V.; ALUÍSIO, S.M. Argumentative Zoning Applied to Critiquing Novices’ Scientific Abstracts. In “Computing Attitude and Affect in Text: Theory and Applications” James G. Shanahan, Yan Qu, Janyce Wiebe (Eds.) Springer, Dordrecht, The Netherlands, 2005. p. 233-245. FONTANA, N., (Caldeira), ALUÍSIO, S.M., DE OLIVEIRA, M.C.F.; OLIVEIRA Jr., O.N. Computer assisted writing - applications to English as a foreign language. CALL (Computer Assisted Language Learning Journal), 6 n.2. 145-161. 1993. GEM-Global Entrepreneurship Monitor. Executive Report, 1999 to 2003. GEM-Global Entrepreneurship Monitor. Executive Report, 2004. 56 Ferraz Júnior, C. et al., Locus Científico vol. 1, n. 3 (2007) pp. 48-57 GONÇALVES, J.P.; ALUÍSIO, S. M.; OLIVEIRA, L.H.M.; OLIVEIRA Jr, O.N. A Learning Environment for English for Academic Purposes based on Adaptive Tests and Task-based Systems. In: 7TH INTERNATIONAL CONFERENCE ON INTELLIGENT TUTORING SYSTEMS, 2004, Maceió. Proceedings of the 7th International Conference on Intelligent Tutoring Systems. 2004. v. 1, p. 1-11. KOCH, I.V. A Coesão Textual. São Paulo: Editora Contexto. 1998. KOCH, I.V.; TRAVAGLIA, L.C. A Coerência Textual. Editora Contexto. 2002. PAIZAN, D.C. O uso da linguagem da Internet na produção de um módulo de leitura de inglês instrumental. Dissertação de Mestrado. Unesp, Araraquara, p.177, 2001. SCHUSTER, E.; ALUÍSIO, S.M.; FELTRIM, V.D.; PESSOA Jr, A.; OLIVEIRA Jr, O.N. Enhancing the Writing of Scientific Abstracts:A Two-phased Process Using Software Tools and Human Evaluation. Anais ENIA, Porto Alegre, p.962-971,2005. SEBRAE. Sobrevivência e mortalidade das empresas paulistas de 1 a 5 anos. Pesquisas Econômicas, São Paulo: dezembro de 2003. SIEGEL, E., FORD, B.; BORNSTEIN, J. The Ernst &Young Business Plan Guide. New York: John Wiley & Sons, Inc. 1987. 2ª Edição. TEUFEL, S. Argumentative Zoning: Information Extraction from Scientific Text., University of Edinburgh, Inglaterra. Ph.D thesis, 352 p. 1999. TIMMONS, J. A., ZACHARAKIS, A.; SPINELLI, S. Business Plans that works: a guide for small business. New York: McGraw-Hill. 2004. Ferraz Júnior, C. et al., Locus Científico vol. 1, n. 3 (2007) pp. 48-57 57