Research Methods for Information Systems and Technology, namely in, Free and Open Source Software (FOSS) vs. Proprietary and Comercial Software (PCS) Total Cost of Ownership (TCO), “...the million dollar question”! António Paulo Santos Universidade do Minho Escola de Engenharia Departamento de Sistemas de Informação Programa Doutoral 4800-058 Guimarães, Portugal [email protected] key words: research methods, open source software, prorietary ans comercial software, tco Abstract: The aim of these paper is to give some directions about the best research methods in Information Systems Technology (IST) Research . For that prupose we have done a literature review in an IST topic: FOSS vs, PCS Total Cost of Ownership (TCO), “... the Million Dollar Question”. After the reading of several scientific and technical papers, two dimensions have emerged: qualitative and quantitative, driving us for (only) two research methods “Cases Study” and “Surveys”. 1. Introdução Contexto A defesa, com sucesso, de uma tese de doutoramento é um “longo caminho”, sendo por isso dividida em varias etapas que implicam a tomada de decisões. Uma dessas decisões é a selecção do Método de Pesquisa, isto é, o “modus operandis” que será adoptado na recolha de dados que sustentará a defesa da tese, sendo por isso de capital importância a sua correcta selecção. Objectivos Assim “O” objectivo deste artigo é o de enumerar os métodos de pesquisa cientifica mais usados nas Tecnologias e Sistemas de Informação (TSI) e dentro destes, tentar identificar qual é o mais apropriado, tendo em conta a especificidade da temática: Windows Vs Linux TCO: “...the million dollar question”!, para efectuar uma pesquisa científica que possa conduzir à defesa de uma tese de doutoramento. Relevância O relevo que damos a esta temática, “the million dollar question”, deve-se à importância da correcta quantificação do TCO. Esta é fundamental para a escolha da implementação e/ou substituição de uma plataforma, Windows ou Linux, aquando da definição da estratégia empresarial, na vertente das TSI, por parte dos CEO ou TSI Managers das organizações. Nível de Analise Sendo os universos do FOSS e PCS constituído por milhares de aplicações, programas e Sistemas Operativos o que torna impossível calcular o TCO “global” optamos por nos centrar nos dois produtos mais representativos desses universos, o GNU/Linux e o Windows. Esta opção permitiu fazer uma pesquisa que contemplasse duas dimensões: a quantitativa e a qualitativa, dimensões que nos conduziram para categorias distintas de artigos, a técnica e a cientifica respectivamente. 2. Fundamentos Teóricos A necessidade de fazer uma fundamentada selecção do método de pesquisa torna necessário um levantamento do estado da arte em duas dimensões; os Métodos de pesquisa e a Área de pesquisa. Métodos de Pesquisa Casos de Estudo Este método de pesquisa tem um carácter exploratório, tendo por principal objectivo partir da experiência prática que traduz o modo de pensar empírico-indutivo, na construção de teorias. Consiste essencialmente em imergir-se numa situação-problema real, acompanhando-a, sentindo-a, pensando-a, analisando-a, e finalmente apresentar uma teoria que a descreva e a explique. Este método não se presta a generalizações estatísticas (isto é, generalizações objectivas para uma população da qual o caso é uma amostra), podendo ser usado apenas para generalizações analíticas (intuições subjectivas a partir do caso para leis e teorias de validade mais geral do que apenas o caso em estudo) [Oliveira, M., UFLA, 2006]. Definição O uso de “estudos de caso” como método de pesquisa tem sido explicado de várias formas, porem, a definição de YIN (1990) parece ser a mais apropriada: “O estudo de caso é uma forma de se fazer pesquisa social empírica ao investigar-se um fenómeno actual dentro do seu (próprio) contexto de vida real, onde as fronteiras entre o fenómeno e o contexto não são claramente definidas e na situação em que múltiplas fontes de evidência são usadas.” Yin (1990) continua definindo casos de estudo como uma lógica de método de pesquisa empírica que : ( i ) Investiga um fenómeno contemporâneo em seu contexto real, especialmente quando... ( ii ) os limites entre fenómeno e contexto não são claramente evidentes (um experimento, por exemplo, divorcia do fenómeno seu contexto; também uma história não é contemporânea, e surveys não investigam bem o contexto de um fenómeno). ( iii ) Trata com pesquisas em que há mais variáveis de interesse do que dados, e, por isso... ( iv ) confia e usa múltiplas fontes de evidências, tanto quantitativas quanto qualitativas, para convergir para uma conclusão, conjugando-as, usando inclusive pressupostos e visões de mundo e vida pessoais para completar a quantidade de informações faltantes, de tal modo que... ( v ) utiliza, depende e beneficia-se de pressupostos teóricos para guiar a coleta e análise dos dados. Fraquesas Os estudos de caso normalmente são efectuados por várias pessoas, e por isso, são introduzidas subjectividades inerentes a cada pessoa, o que leva a que “pormenores” subjectivos possam ser marginalizados ou sobrevalorizados. Outra preocupação aquando do uso deste método depreende-se com o factor “memória”, pois tratando-se da recolha de dados, que muitas vezes são dilatadas no tempo, podem ser imprecisos se não forem de imediato anotados [www.mcli.dist.maricopa.edu/proj/res_meth, 2010]. Surveys Survey é uma palavra inglesa traduzida para o português como amostragem. Podemos denominá-la adequadamente em português como amostra. O survey é o processo de se recolher informações nãocontroladas sobre alguns dos individuais que constituem uma dada população real. A legitimidade das análises e interpretações dos dados provindos do survey somente pode ser conferida pela Estatística. A recolha de dados para a amostra dá-se normalmente através de inquéritos, entrevistas e chek-lists. É necessário ter cuidados especiais na criação dos inquéritos, tais como: 1. Optar sempre que possível por questões de escolha múltipla (alternativas pré-definidas), restringindo assim o leque das respostas. 2. Tentar obter o máximo de informação possível, tendo no entanto particular atenção sobre como e quais são as questões relevantes a abordar, evitando constrangimentos aos entrevistados. 3. Número mínimo de elementos para amostra entre 30 á 50. Os Surveys são de particular relevância aquando da necessidade de efectuar pesquisas em que seja difícil a observação directa de fenómenos. Fraquezas A maior limitação deste método prende-se com o facto ser o próprio pesquisador a fazer a recolha de dados, podendo por isso “contaminar” os mesmos, por dolo involuntário, má memória ou malentendidos [www.mcli.dist.maricopa.edu/proj/res_meth, 2010] . Outros métodos de pesquisa No seguimento da analise dos resultados emergiram os métodos de pesquisa “Surveys” e “Caso de Estudo”. E por essa razão foram aqui aprofundados. No entanto, existem outros métodos de pesquisa tais como Benchmarking, Proof of Concept e Laboratory, que não tendo emergido na analise não foram aqui aprofundados. Podemos todavia adiantar que dos três métodos não aprofundados, os que nos parecem não ter fundamentos para efectuar uma pesquisa em Tecnologias e Sistemas de Informação são o Proof of concept e o Laboratory. No que se refere ao Benchmarking, este poderá ser usado em pesquisa em TSI, em determinadas circunstâncias, nomeadamente para a comparação de software Área de Pesquisa Free and Open Source Software As raízes do Software Livre provêem da filosofia da livre troca de conhecimentos e ideias que tradicionalmente definem a área do conhecimento científico. Tal como as ideias, os programas e as aplicações não são tangíveis e por isso podem ser copiados sem perda de genuinidade. A sua dissiminação é a base de um processo de evolução que alimenta o desenvolvimento do pensamento. No inicio dos anos 80, Richard M. Stallman foi o primeiro a formalizar esta forma de pensamento, para o software, concretizando-a em quatro princípios: 1. A liberdade de usar qualquer software, para qualquer fim. 2. A liberdade de estudar o funcionamento de um programa e de o adaptar às suas necessidades. 3. A liberdade de redistribuir cópias. 4. A liberdade de melhorar o programa e (obrigatoriedade) de tornar as modificações públicas de modo a que a comunidade possa beneficiar das melhoria. O software que tem por base estes quatro princípios é normalmente referido como sendo "Software Livre" (ou Free Software). Para operacionalizar este projecto, Richard M. Stallman criou a "Free Software Foundation" em 1984 e lançou o projecto GNU (Gnu is Not Unix). A licença do projecto GNU, a Licença Pública Geral GNU (GNU General Public License, GNU GPL ou simplesmente GPL quando não existem quaisquer dúvidas), não só concede as quatro liberdades fundamentais ao software, como também o protege, sendo por isso a GPL hoje em dia a licença mais utilizada para o Software Livre. Ao lado da GPL coexistem também outras licenças que concedem as mesmas liberdades existentes no software livre. Uma delas, é a “Licença FreeBSD”, que enumera os princípios do Sistema Operativo livre FreeBSD da familia dos Unix, descendente do Sistema Operativo BSD, desenvolvido pela Universidade de Berkeley. A diferença principal pode ser expressa da seguinte forma: “BSD projects are free, but GPL projects stay free” [Free BSD, http://www.freebsdnews.net/2008/07/18/bsd-license-vs-gpl-license, 2010]. Uma confusão frequente, quando se fala em software livre é o de pensar que esse software tem ser gratuito [1] . É de salientar que na sua esmagadora maioria os criadores e programadores de software livre, provêm de empresas e instituições que se dedicam à criação e desenvolvimento de Software Livre mas comercial, isto é, com fins lucrativos. Em 1998, a "Definição do Open Source" (Open Source Definition) foi conceptualizada por Bruce Perens, tendo por objectivo descrever as propriedades técnicas do Software Livre e ser utilizada como princípios orientadores para o movimento "Open Source" (Open Source Movement) [Open Source Iniciative, http://www.opensource.org/docs/definition.php, 2010]. A "Definição do Open Source" é ela mesma derivada das "Linhas Directoras do Software Livre Debian", percursor na área dos Sistemas Operativos livres, que derivam dos quatro princípios fundamentais do software livre. Consequentemente, as três definições descrevem as mesmas licenças; a "Licença Pública Geral GNU" (GPL) é a licença de base de todas as definições. O movimento "Open Source" tem por objectivo ser um meio transmissor e simultaneamente defensor do Software Livre, ignorando deliberadamente todos os aspectos filosóficos ou políticos, que poderiam ser contra producente relativamente ao seu propósito. Sistema Operativo GNU/Linux OS Sistemas Operativos GNU/Linux são Sistemas Operativos “Unix-like”[2] , compostos por dois componentes principais: as ferramentas e o kernel: 1. As ferramentas criadas e desenvolvidas a partir de colecções de bibliotecas, de programas e aplicações, e de ferramentas para programadores [GNU, http://www.gnu.org, 2010]. [1] [2] Esta confusão é devida ao facto de em inglês Free significar livre e também significar grátis. Operativo UNIX. Tendo por filosofia conceptual a “imitação” do Sistema 2. O kernel é o “elo” de ligação e coordenação de todos os programas e aplicações que compõem as ferramentas referidas em 1. Em virtude do seu nível de estabilidade ainda não ser o pretendido, para uma correcta utilização, O kernel (Hurd, GNU's kernel) é normalmente substituído pelo kernel criado e desenvolvido por Linus Torvalds em 1991 [Linux.com, 2010], isto é, o “Linux”. Proprietary and Comercial Software (PCS) Software Proprietário Software proprietário ou não livre é aquele cuja cópia, redistribuição ou modificação são em alguma medida restritos pelo seu criador ou distribuidor. A expressão foi desenvolvida em contra ponto ao conceito de software livre. Normalmente, para que se possa utilizar, copiar, ter acesso ao código-fonte ou redistribuir, deve-se solicitar permissão ao proprietário, ou pagar para poder fazê-lo sendo necessário, portanto, adquirir uma licença, para poder proceder a cada uma destas acções. Alguns dos mais conhecidos softwares proprietários são o Microsoft Windows, o RealPlayer, o Adobe Photoshop, o Mac OS, o WinZip, algumas versões do UNIX, entre outros [Wikipedia, 2010]. Software Comercial Software comercial é o software desenvolvido por uma empresa com o objetivo de lucrar com sua utilização. Devemos alertar para o facto de software comercial e software proprietário se referirem a situações distintas. O software comercial é quase na sua totalidade software proprietário, mas existe software livre que é comercial, e existe software não-livre que é não-comercial. As características "Livre" e "proprietário" não representam atributos do produto software. São modalidades de relações jurídicas que se podem estabelecer entre um particular e o fornecedor. No caso do "Software Proprietário" significa que a distribuição é realizada por comercialização com base no regime jurídico clássico comercial no qual a relação é baseada em restrições e permissões onerosas ou não, tutelando-se tanto a propriedade quanto a autoria. No caso do "Software Livre", a distribuição é realizada com base num regime jurídico de colaboração não compulsória, no qual a relação se baseia, ao contrário, em liberdades, tutelando-se tão somente a autoria e a permanência desse mesmo regime nas distribuições subsequentes do software [I.T.I. Governo Federal , http://www.iti.gov.br/twiki/pub/Main/Dta/Estudo_FGV.pdf, 2010]. MS Windows O Windows representa um conjunto de sistemas operativos e ambientes gráficos criados e desenvolvidos pela Microsoft. A Microsoft lançou o seu primeiro ambiente gráfico, o Windows, em Novembro de 1995 como sendo um “aditivo” ao MS-DOS[3], tentando responder à então crescente procura por ambientes de trabalho gráficos. A Microsoft, com este ambiente gráfico, conseguiu atingir uma posição dominante a nível internacional, apesar da existência de outros ambientes gráficos, como o Mac OS, que surgiram primeiro. Em Outubro de 2009, o Windows tinha aproximadamente 91% de cota de mercado a nível mundial, em Sistemas Operativos, com ambiente gráfico, para computadores de secretária (Desktop). A versão actual do Windows é a “7”, que veio substitui o Windows Vista, tendo começado com a já longínqua versão do Windows 95, passando pelo Windows 2000 e pelo Windows XP, que até hoje foi a versão que alcançou mais sucesso. O Windows é uma conhecida família de Sistemas Operativos, que inicialmente se designar por MSDOS. Mais tarde surgiu a versão Windows 95. Sendo a Microsoft uma empresa, os seus produtos têm fins comerciais e por isso mesmo o seu código fonte (core business secret) é fechado. [3] Sistema operativo em ambiente de texto em que os utilizadores inseriam comandos através do teclado. Fig.1 Cota de Mercado de Sistemas Operativos Total Cost of Ownership (TCO) O conceito do TCO foi criado pelo empresa Gartner em 1980, tendo por objectivos conseguir definir os custos totais da aquisição, configuração e manutenção de computadores pessoais e servidores durante o seu ciclo de vida [Gartner, 1980] . Estes custos contemplam de uma forma genérica os custos com o hardware, o software e a formação [Wikipedia, 2010]. Alguns dos custos associados ao TCO para o “deployment of technology” são: • hardware e software • hardware e software de rede • hardware e software dos servidores • hardware e software dos posto de trabalho (desktop) • Instalação e integração de hardware e software • Pesquisa para aquisição • Garantia e licenças • Conformidade de licenciamento • Outros custos de migração • Riscos: vulnerabilidades, disponibilização de upgrades, correção de erros e politica de licenciamento. • Custos Operacionais • Infraestrutura (locais) • Electricidade (equipamento, arrefecimento, backups) • Custos relacionados com testes • Custos de “Downtime”, falhas e interrupções • Diminuição de performance (i.e., utilizadores sem poderem trabalhar) • Segurança (incluindo violações, perda de reputação, de recuperação e prevenção) • Processos de “Backup and recovery”. • Formaçao • Audição (interna e externa) • Seguros • Mão de Obra da equipa de IT • Tempo de gestão da direcção • Despesas de a médio e longo prazo • Substituição • Upgrades e/ou escalabilidade • Desmantelamento 3. Metodologia Para atingir os objectivos propostos neste artigo foi efectuada uma revisão de literatura tendo em vista a obtenção de dados que possam suportar uma decisão final, quanto ao método de pesquisa cientifica mais apropriado para tratar o tema “Linux vs Windows TCO: the milion dollar queston”. A revisão de literatura baseou-se na abordagem de duas dimensões, a dimensão técnica (quantitativa) e a dimensão cientifica (qualitativa). A pesquisa de artigos técnicos foi efectuada através de motores de pesquisa google.com e yahoo.com; para a pesquisa dos artigos científicos foram usados os motores de pesquisa scholar.google.com e scopus.com. Foram lidos 11 artigos e sumariados em tabela os métodos de pesquisa usados. 4. Dados A Tabela 1. ilustra a revisão de literatura efectua a 10 artigos científicos e técnicos. Autor(s) Data Artigo Área de Método de Universo Pesquisa Pesquisa Robert Frances Group 2002.07 TCO for Linux in the Enterprise TCO Survey 14 Dedrick, J., West, J. 2003 OSS Interview 10 Yankee Group 2004.03 Yankee Independently Pits Windows TCO vs. Linux TCO TCO Survey 1000 Robert Frances Group 2005.08 TCO for Application Servers: Comparing Linux with Windows ans TCO Solaris Interview 20 Crowston, K., Survey 170 Econimides, Katsamakas, E. 2006 N., 2006 Why firms adopt OS platforms: A grounded theory of innovation and standards adoption IS Success in FOSS Devlopment: Theory and Mesures OSS Linux vs. Windows: A Comparison of App. and Platform Innovation OSS Incentives for OS and Proprietary SW Platforms Case Study NA (based on IDC surveys) Ven, K., and Verelst, 2006 J. The Organizational Adoption of OSS by Belgian Organizations Case Study (based Interviews) S.L. Toral, M.R. 2008 Matinez-Torres and F. Barrero Analysis of virtual communities supporting OSS projects using OSS social network analysis Case Study 2 Gurbani, V.K.,Garvert, A.,Herbsleb, J.D. A case study of a corporate open source development model OSS Case Study 1 Mockus, A.,Fielding, 2002 R.T.,Herbsleb, J.D. Two case studies of open source software development: Apache and OSS Mozilla Case Study 2 Scacchi, W. Opportunities and Challenges for Modeling and Simulating Free/Open Source Software Processes Surveys (sample) NA 2006 2004 Tabela 1. OSS OSS 5 on 5. Analise Da análise dos resultados expostos na Tabela 1. imergem duas dimensões: a qualitativa e a quantitativa. Dos 11 artigos lidos 5 usaram o método de pesquisa “Surveys”, sendo que destes, 3 foram na forma de entrevistas e 2 de inquéritos, tendo todos uma abordagem quantitativa. Dois artigos usaram “combinações” de métodos. Um dos artigos baseou-se numa amostra (sample) de um inquérito já efectuado [Scacchi, W., 2004] o outro usou o método Casos de Estudo, baseado num inquérito [Econimides, N., Katsamakas, E., 2006]. Os restantes 5 artigos optaram por uma abordagem qualitativa, tendo sido usado sempre o método Casos de Estudo. 6. Conclusão O objectivo deste artigo é a escolha do método de pesquisa mais apropriado à obtenção de dados que sustentem a defesa de uma tese de doutoramento. No caso do tema escolhido: FOSS vs. PCS TCO: “...the million dollar question” e após analise dos dados da Tabela1., inferem-se (só) duas opções: “Casos de estudo” e “Surveys”. Estas duas opções estão directamente relacionadas com o nível de análise pretendido pelos pesquisadores. É de salientar que à medida que se restringia o nível de análise, a pesquisa assumia um carácter mais quantitativo. Como se pode observar na análise dos dados da Tabela 1., sempre que a abordagem foi qualitativa o método de pesquisa usado foi o de “Casos de estudo”. Assim constata-se que será aconselhável usar este método se o propósito for o de efectuar uma pesquisa qualitativa. Se por outro lado pretendermos efectuar uma pesquisa quantitativa então a nossa escolha deverá recair sobre o método “Surveys” como também se pode constatar pela análise da Tabela 1, em que todas os artigos que utilizaram pesquisas quantitativas optaram pelo método “Surveys”, podendo estes ser inquéritos ou entrevistas. 7. Referências Gartner Group, 1980 Wikipedia, http://en.wikipedia.org/wiki/Total_cost_of_ownership,2010. GNU, http://www.gnu.org, 2010. FOSS, http://freeopensourcesoftware.org/index.php?title=Main_Page, 2010. Free Software Fundation, http://www.fsf.org, 2010. FOSS, http://en.wikipedia.org/wiki/Free_and_open_source_software, 2010. Linux, http://linux.com, 2010. kernel, http://www.kernel.org, 2010. IDC, http://www.idc.com, 2010. Cork College, http://opensource.ucc.ie, 2006 Robert Frances Group, TCO for Linux in the Enterprise, 2002 Dedrick, J., West, J., Why firms adopt OS platforms:A grounded theory of innovation and standards adoption, 2003 Yankee Group, Yankee Independently Pits Windows TCO vs. Linux TCO, 2004 Robert Frances Group,TCO for Application Servers: Comparing Linux with Windows ans Solaris, 2005 Crowston, K., IS Success in FOSS Devlopment: Theory and Mesures,2006 Econimides, N., Katsamakas, E., Linux vs. Windows: A Comparison of App. and Platform Innovation Incentives for OS and Proprietary SW Platforms, 2006 Ven, K., and Verelst, J., The Organizational Adoption of OSS by Belgian Organizations, 2006 S.L. Toral, M.R. Matinez-Torres and F. Barrero, Analysis of virtual communities supporting OSS projects using social network analysis, 2008 Gurbani, V.K.,Garvert, A.,Herbsleb, J.D., A case study of a corporate open source development model, 2006 Mockus, A.,Fielding, R.T.,Herbsleb, J.D., Two case studies of open source software development: Apache and Mozilla, 2002 Scacchi, W., Opportunities and Challenges for Modeling and Simulating Free/Open Source Software Processes, 2004