C&T13.book Page 111 Thursday, September 11, 2003 2:25 PM Projeto para Construção de Aplicativo Estatístico para Análises Descritivas: Sistema de Análises Descritivas – SIAD Project for Estatistical Aplicative Construction to Descriptives Analysis: Descripitives Analysis System – SIAD ANGELA M. C. JORGE CORRÊA ALEX DE ALMEIDA NEVES Faculdade de Ciência e Tecnologia da Informação – UNIMEP [email protected] Faculdade de Ciência e Tecnologia da Informação – UNIMEP [email protected] FRANCISCO BACCARIN MARIANGELA DE CAMPOS Faculdade de Ciência e Tecnologia da Informação – UNIMEP [email protected] Faculdade de Ciência e Tecnologia da Informação – UNIMEP [email protected] VALÉRIA M. D’AREZZO ZÍLIO MILENE CRISTINA RUGAI Faculdade de Ciência e Tecnologia da Informação – UNIMEP [email protected] Faculdade de Ciência e Tecnologia da Informação – UNIMEP [email protected] RESUMO – Em função da integração da Informática com a Estatística, é possível tornar várias análises empíricas de dados mais ágeis e seguras, de tal forma que essa integração colabore, qualitativamente, para o desenvolvimento de pesquisas em diferentes áreas do saber. Este estudo tem por objetivo detalhar a documentação de um projeto para construção de um Sistema de Análises Descritivas, denominado SIAD, que fornece a usuários leigos em informática recursos para o desenvolvimento de pesquisas científicas que necessitem de metodologias estatísticas descritivas. Para a definição e documentação desse projeto utilizou-se a metodologia estruturada. Com a finalidade de facilitar a compreensão e identificação de cada processo, foram construídos diagramas de fluxo de dados e processos em vários níveis de detalhamento, além de miniespecificações, definições de layout de arquivos e outras ferramentas necessárias para a construção do aplicativo. O principal resultado deste estudo é a elaboração de documentação do SIAD, com todas as especificações e detalhamentos necessários. Palavras-chave: estatística descritiva – aplicativo estatístico – análise de sistemas – projeto de sistemas – documentação. ABSTRACT – Computing and Statistics integration allows to make the empirics analysis of data more agile and safe, collaborating qualitatively, for the research development in different knowledge areas. This study aims to elaborate the documentation of a project for the construction of a Descriptive Analysis System, called SIAD, that offers to lay users who need descriptive statistics methods, computing resources for the development of scientific researches. For the definition and documentation of the project it was made use of the Structure Method. Diagrams of data flow and processes in several detail levels were built, with the purpose of faciliting the comprehension and identification of each process, apart from little specifications, files layout definition and others necessaries tools for the aplicative construction. The principal result of this study is the documentation of SIAD, with all the specifications and details. Keywords: descriptive statistic – statistical aplicative – systems analysis – systems project – documentation. REVISTA DE CIÊNCIA & TECNOLOGIA • 13 111 C&T13.book Page 112 Thursday, September 11, 2003 2:25 PM Introdução M uitas pesquisas científicas necessitam de uma fundamentação metodológica que envolva a análise empírica de dados, a qual pode ser realizada com o apoio de métodos e técnicas estatísticas descritivas. Em função da integração da Informática com a Estatística, é possível tornar essas análises mais ágeis e seguras, de tal forma que essa integração colabore, qualitativamente, para o desenvolvimento de pesquisas em diferentes áreas do saber, inclusive naquelas voltadas a dar subsídios à construção dos projetos pedagógicos dos cursos na UNIMEP ou mesmo ao processo de inovação curricular. Registre-se que vários cursos da instituição estão ou estarão atuando nesse processo, no bojo da Política Acadêmica da Universidade, buscando o aprimoramento do processo de ensino. Ressalte-se que a Política Acadêmica da UNIMEP, aprovada em 1992, é a atual peça normativa das práticas acadêmico-administrativas da Instituição e que, no momento atual vivenciado pela Universidade, são construídos os Projetos Pedagógicos dos cursos, estabelecidas as bases para os Processos de Inovação Curricular e concretizada a prática de pesquisa científica, que apresenta um crescimento quantitativo e qualitativo. Nesse contexto, este estudo se destina a elaborar um projeto para a construção de um aplicativo estatístico, denominado Sistema de Análises Descritivas (SIAD), por constituir ferramenta para apoiar pesquisas e estudos em diferentes áreas do conhecimento que, em sua construção metodológica, necessitem de coleta de informações e elaboração de Análises Estatísticas Descritivas e Inferências Não-paramétricas, bem como por facilitar o processo de sistematização de informações para a avaliação dos cursos e Inovação Curricular na UNIMEP. Dessa forma, o SIAD é o embasamento teórico conceitual necessário para a construção de um software que permita análises estatísticas descritivas e que seja amigável e de fácil utilização por um usuário leigo. Metodologia A construção do projeto se deu em várias fases. Inicialmente realizou-se revisão bibliográfica de conceitos de Estatística,1 com o intuito de identificar os métodos necessários para estudo dos estimadores e distribuições que compõem o SIAD. A seguir foram feitos estudos bibliográficos de Análise de Sistemas,2 que permitiram selecionar a metodologia adequada para a elaboração de tal projeto. Efetuou-se, então, a avaliação dos softwares estatísticos disponíveis no Núcleo de Computação da UNIMEP (Microsoft Excel 5.0 for Windows e Statgraphics 5.0 for DOS), com o propósito de identificar os seus recursos de Estatística Descritiva e Não-paramétrica. Realizou-se também a avaliação desses softwares quanto à forma de utilização e apresentação para o usuário, com o objetivo de verificar sua amigabilidade. Para finalizar a fase de levantamento de dados do sistema, buscando definir melhor suas características, peculiaridades e abrangência, realizaram-se entrevistas com futuros usuários do SIAD, durante as quais foram registradas e incorporadas sugestões ao projeto. A principal delas é a inclusão, além dos módulos já previstos inicialmente, de um módulo para a geração de amostragem estratificada. A metodologia adotada para definição e documentação de todas as etapas do projeto foi a metodologia estruturada, constituída de técnicas estruturadas orientadas a dados e a processos que representam a integração dos dados com os procedimentos do sistema (Yourdon, 1992). Dessa forma, combinando abordagens e técnicas, definiu-se a metodologia do ambiente do software com a construção dos diagramas de fluxos de dados e processos, em vários níveis de detalhamento, visando melhor compreensão e identificação de cada processo necessário para a especificação do ambiente de desenvolvimento do SIAD. Para a construção dos diagramas foi utilizada a ferramenta CASE3-System Architect, disponível no Núcleo de Computação da UNIMEP, que garante a integridade entre os vários diagramas gerados. 1 Ver, entre outros, BUSSAB & MORETTIN (1991), COCHRAN (1965), DE FRANCISCO (1993) e FONSECA & MARTINS (1993). 2 Conforme GANE & SARSON (1983), YOURDON (1992), MARTIN & MAcCLURE (1991) e outros. 3 Computing aided software engineering (engenharia de software auxiliada por computador). 112 Junho • 1999 C&T13.book Page 113 Thursday, September 11, 2003 2:25 PM Resultados e discussões Os levantamentos teóricos efetuados na fase inicial deste estudo geraram material de consulta relevante para apoio ao ensino. Trata-se de um texto que apresenta revisões de conceitos básicos da Estatística Descritiva, Não-paramétrica e Análise de Sistemas, o qual está sendo utilizado para consulta pelos alunos dos cursos de graduação da UNIMEP. O principal resultado desta pesquisa foi o desenvolvimento de um conjunto de atividades relacionadas ao projeto do sistema-SIAD, desde a sua concepção até a sua implantação. Observa-se que essas atividades constituem a documentação detalhada do ciclo de vida do sistema. Utilizando-se a metodologia estruturada, cada uma das fases do sistema foi amplamente discutida e documentada, sendo representada na forma de diagramas, miniespecificações, layouts e outras técnicas para compreensão e construção do SIAD. O primeiro diagrama desenvolvido foi o Macro Fluxo (ver fig. 1), utilizado com o objetivo de apresentar uma visão geral do sistema no que diz respeito às entradas de dados, procedimentos a serem executados, arquivos necessários para o armazenamento das informações e a saída dos resultados desejados, apresentando, como o próprio nome sugere, uma visão macro do sistema Fig. 1. Macro Fluxo do SIAD. O segundo diagrama construído foi o Diagrama de Fluxo de Dados (DFD), responsável pelo detalhamento das relações entre processos e fluxo de dados, descrevendo a transformação de entradas em saídas (ver fig. 2). É a principal ferramenta de modelagem da análise estruturada, sendo usada para dividir o sistema em uma hierarquia de processos. REVISTA DE CIÊNCIA & TECNOLOGIA • 13 O detalhamento dos diagramas foi realizado segundo a técnica top-down, para mostrar os detalhes de cada processo do sistema. Nos níveis inferiores, os processos de níveis mais elevados são explodidos de modo a mostrar que processos mais detalhados e fluxo de dados estão envolvidos em um único processo (Pressman, 1987). 113 114 USUÁRIO D5 a D9 P1 Dados amostrais Código da pesquisa Nº da amostra e demais campos Atualizar dados de amostras P3 D1 Lista de amostra Código da pesquisa Tabela c2 Pesquisa Dados amostrais Código da pesquisa, tipo de consulta e dados p/ consulta Código da pesquisa, tipo de cálculo e variáveis p/ cálculo D1 Valores do c2 Propriedades da pesquisa Realizar Cálculos P4 Código da pesquisa Nome das variáveis D3 Dados amostrais D4 Código da pesquisa Nome do arquivo de amostras Nº da amostra e demais campos Dados amostrais Pesquisa Tipo Amostra Código da pesquisa Característica da amostra D2 Nome do arquivo de amostras Gerar e gravar amostras e estrutura de arquivo P2 Dados da amostra Exclusão do registro Exclusão do registro Dados da pesquisa/pesquisador Resultados de Cálculos Valor do percentil Valores de teste do c2 Valores de regressão Tabela/Gráficos Valores de medidas D9 D8 D7 D6 D5 Percentil Teste c2 Regressão Tabela/Gráfico Índices Valores de teste do c2 Valor do percentil Valores de regressão Tabela/Gráficos Valores de medidas P5 Consultar Dados Para melhor entendimento, apresenta-se o DFD nível 0 elaborado para o SIAD, conforme Listagem da amostra Dados da Estrutura da amostra e Código da Pesquisa Confirmação de listagem D3 Dados amostrais Exclusão do arq. de amostras Manter pesquisa/tipo Exclusão da pesquisa e/ou tipo de amostra de amostra Dados da amostra, pesquisa e pesquisador D Exclusão dos registros relacionados Resultados de Consultas C&T13.book Page 114 Thursday, September 11, 2003 2:25 PM figura 2, e, em seqüência, alguns exemplos dos DFDs níveis 1 e 2 (ver fig. 3 e 4). Fig. 2. DFD – nível 0 do SIAD. Junho • 1999 C&T13.book Page 115 Thursday, September 11, 2003 2:25 PM 2. Gerar e gravar amostras e estrutura de arquivo Código da pesquisa Características da amostra Código da pesquisa D2 Tipo Amostra D1 Pesquisa Nome do arquivo de amostras USUÁRIO Dados da Estrutura da Amostra e Código da Pesquisa Código da Pesquisa P2.1 D3 P2.3 Gerar amostras Criar Estruturas de arquivo Estrutura do arquivo P2.2 Código da Pesquisa Emitir listagem de amostras Lista de amostra Nº das amostras Dados amostrais Confirmação de listagem Listagem de amostras Fig. 3. DFD nível 1 do processo 2 – Gerar e gravar amostras e estrutura de arquivo. 2.2. Gerar amostra Confirmação de listagem USUÁRIO Tipo e demais características da amostra P2.1 Criar Estruturas de arquivo Código da pesquisa Código da pesquisa D2 Número das amostras Lista de amostras D3 Dados amostrais P2.2.1 Verificar tipo da amostra Tipo Amostra P2.2.2 Gerar amostra aleatória Tipo e demais características da amostra Tipo e demais características de amostra P2.2.3 Gerar amostra sistemática Lista de amostras Confirmação de listagem P2.3 Número das amostra Emitir listagem de amostra Fig. 4. DEF nível 2 do processo 2.2 – Gerar amostras. O DFD apresenta de forma clara e objetiva a seqüência de ações e procedimentos, porém não contém o detalhamento do relacionamento entre os vários depósitos de dados (arquivos), necessários ao projeto do banco de dados essencial para a implemen- REVISTA DE CIÊNCIA & TECNOLOGIA • 13 tação do sistema. Assim, embora o DFD seja ferramenta útil para a modelagem do sistema, ele enfatiza somente um aspecto fundamental: as funções do sistema. Como decorrência, para a representação dos dados é necessário utilizar outro diagrama, o Diagrama 115 C&T13.book Page 116 Thursday, September 11, 2003 2:25 PM Entidade Relacionamento (DER). Responsável pelo detalhamento das relações entre os vários arquivos do sistema, esse DER possui dois importantes componentes: entidades que representam os agrupamentos de dados com as mesmas características (arquivos) e relacionamentos que representam os elos de ligações entre os grupos de dados. O DER construído para o SIAD está na figura 5. Fig. 5. DER do SIAD. Ressalte-se que a especificação de um sistema deve ser cuidadosamente elaborada, para evitar atrasos e erros dispendiosos na fase de seu desenvolvimento. Dessa forma, além da descrição gráfica, que evidencia a decomposição lógica de modelo top-down, a análise estruturada prevê a elaboração de miniespecificações e layout de arquivos. Com o objetivo de auxiliar o entendimento do DFD, as miniespecificações que estão na documentação do SIAD descrevem detalhadamente todos os processos do sistema. Trata-se de descrições seqüenciais de todas as etapas de cada processo, que complementam a representação gráfica, registrada de forma geral, no DFD. Os layouts de arquivos elaborados para o SIAD descrevem em detalhes os atributos de todos os arquivos que constituem o DER quanto à descrição, ao tipo de dado, tamanho, relacionamento e obrigatoriedade de preenchimento. O presente estudo em sua fase final apresentou, além da documentação do projeto, a indicação do software de desenvolvimento e o ambiente operacio- 116 nal para a fase de implementação, teste e validação do SIAD. A linguagem de programação sugerida foi Microsoft Visual Basic, por possuir bons recursos visuais e gráficos através das várias Bibliotecas de Ligação Dinâmica, as chamadas Dynamic Link Libraries (DLLs), úteis no desenvolvimento do software. Além disso, o Microsoft Visual Basic apresenta melhor compatibilidade/portabilidade com outros softwares utilizados no ambiente Microsoft Windows, possibilitando ao usuário gerar tabelas ou gráficos no software estatístico e posteriormente transferi-los para outros softwares no mesmo ambiente. Assim, o SIAD deverá utilizar o ambiente Microsoft Windows, por este ser amigável e de fácil utilização, além de dispor de várias ferramentas de apoio para o desenvolvimento do sistema. Já o banco de dados a ser utilizado poderá ser o Microsoft Access ou o dBASE, visto que o Microsoft Visual Basic pode armazenar e acessar dados nesses dois formatos e que a quantidade de dados a serem gerados e manipulados pelo software será relativamente pequena. Não será necessário, portanto, utilizar um Junho • 1999 C&T13.book Page 117 Thursday, September 11, 2003 2:25 PM sistema gerenciador de banco de dados (SGBD) mais abrangente. Conclusão O principal resultado deste estudo é a documentação detalhada do Sistema de Análises Descritivas, que tem por objetivo subsidiar análises estatísticas descritivas, de forma segura e amigável. Essa documentação, além de seus aspectos técnicos, inclui indicação quanto à forma de implementação e operacionalização do sistema. Registre-se que este estudo e a sua documentação estão subsidiando a construção do SIAD, através de projeto aprovado pelo FAPIC-UNIMEP/PIBIC-CNPq, para 1998/99, específico para as fases de implementação, teste e validação do sistema, envolvendo quatro estudantes do curso de Análise de Sistemas-UNIMEP em atividades de iniciação científica. É possível concluir que este estudo permitiu aos alunos a iniciação em pesquisas científicas e um melhor aprendizado e integração em conteúdos relacionados à Análise de Sistemas e Estatística. Além desse aspecto, este trabalho está contribuindo para a efetiva integração ensino-pesquisa no Curso de Análise de Sistemas da UNIMEP, tanto no decorrer da fase de elaboração do projeto do SIAD aqui relatado, como na fase posterior de implementação, teste e validação do sistema. Referências Bibliográficas BUSSAB, Wilton O. & MORETTIN, Pedro. A. Estatística Básica. 4ª ed., São Paulo: Atual, 1991. COCHRAN, William G. Técnicas de Amostragem. Trad. Fernando A.M. Barbosa, Rio de Janeiro: Fundo de Cultura, 1965. DE FRANCISCO, Walter. Estatística: síntese da teoria. São Paulo: Atlas, 1982. ______________. Estatística Básica. Piracicaba: Editora UNIMEP, 1993. FONSECA, Jairo S. & MARTINS, Gilberto A. Curso de Estatística. 4ª ed., São Paulo: Atlas, 1993. GANE, Chris & SARSON, Trish. Análise Estruturada de Sistemas. Trad. Gerry E. Tompkins. Rio de Janeiro: LTC, 1983. GIL, Antônio C. Técnicas de Pesquisa em Economia. 2ª ed. São Paulo: Atlas, 1995. MARTIN, James & MAcCLURE, Carma. Técnicas Estruturadas e Case. Trad. Lúcia F. Silva, São Paulo: Makron Books, 1991. PRESSMAN, Roger S. Software Engineering – A Practitioner’s Approach. 2nd edition, Singapore: MacGrawHill International Editions, 1987. TOLEDO, Gilberto M. & OVALLE, Ivens. Estatística Básica. 2ª ed., São Paulo: Atlas, 1982. VIEIRA, Sônia & HOFFMANN, Rodolfo. Elementos de Estatística. São Paulo: Atlas, 1986. VIEIRA, Sônia & WADA, Ronaldo. O que é Estatística. 3ª ed., São Paulo: Brasiliense, 1991. YOURDON, Edward. Análise Estruturada Moderna. Trad. Dalton C. de Alencar. 3ª ed., Rio de Janeiro: Campus, 1992. REVISTA DE CIÊNCIA & TECNOLOGIA • 13 117 C&T13.book Page 118 Thursday, September 11, 2003 2:25 PM 118 Junho • 1999