UNIVERSIDADE FEDERAL DA PARAÍBA CENTRO DE CIÊNCIAS EXATAS E DA NATUREZA DEPARTAMENTO DE QUÍMICA PROGRAMA DE PÓS-GRADUAÇÃO PÓS GRADUAÇÃO EM QUÍMICA DISSERTAÇÃO DE MESTRADO CLASSIFICAÇÃO DE ALFACES E BARRAS DE CEREAIS A PARTIR DA ESPECTROSCOPIA NIR E ANÁLISE DISCRIMINANTE LINEAR Anna Luiza Bizerra de Brito João Pessoa – PB - Brasil Fevereiro / 2014 i UNIVERSIDADE FEDERAL DA PARAÍBA CENTRO DE D CIÊNCIAS EXATAS E DA NATUREZA DEPARTAMENTO DE QUÍMICA PROGRAMA DE PÓS-GRADUAÇÃO PÓS GRADUAÇÃO EM QUÍMICA DISSERTAÇÃO DE MESTRADO CLASSIFICAÇÃO DE ALFACES E BARRAS DE CEREAIS A PARTIR DA ESPECTROSCOPIA NIR E ANÁLISE DISCRIMINANTE LINEAR Anna Luiza Bizerra de Brito Dissertação apresentada como requisito para obtenção do título de Mestre em Química pela Universidade Federal da Paraíba. Orientadora: Profa. Dra. Liliana de Fátima Bezerra Lira de Pontes 2º Orientador: Prof. Dr. Márcio José Coelho de Pontes *Bolsista CNPq João Pessoa – PB - Brasil Fevereiro / 2014 i B862m UFPB/BC Brito, Anna Luiza Bizerra de. Classificação de alfaces e barras de cereais a partir da espectroscopia NIR e análise discriminante linear / Anna Luiza Bizerra de Brito.-- João Pessoa, 2014. 86f. : il. Orientadores: Liliana de Fátima Bezerra Lira de Pontes, Márcio José Coelho de Pontes Dissertação (Mestrado) - UFPB/CCEN 1. Química. 2. Classificação de alimentos - metodologias. 3. Barra de cereais. 4. Alfaces. 5. Espectroscopia no infravermelho próximo. 6. LDA. CDU: 54(043) i “Classificação de alfaces e barras de cereais a partir da espectroscopia NIR e Análise Discriminante Linear” Dissertação de Mestrado de Anna Luiza Bizerra de Brito aprovada pela banca examinadora em 03 de fevereiro de 2014: i Dedico a Deus, aos meus pais que tanto investiram em nossos estudos, de meus irmãos e meus, e por terem sido meus oráculos, dedico principalmente à minha mãe por ser minha base. i AGRADECIMENTOS A Deus por ter aberto portas e proporcionado a presença de meus avós, pais, irmãos e pessoas de bom coração, amigos em minha vida, por ter me dado saúde e paz e por ter principalmente trabalhado em meus pensamentos nos momentos de dificuldades; A minha família, por me proporcionar a orientação, a educação que precisava e ainda preciso e por me deixar feliz sempre que estou com eles; À professora Liliana de Fátima Bezerra Lira de Pontes pela orientação, disponibilidade, delicadeza, dedicação, paciência, descontração, esforço e confiança tanto para produção do presente trabalho, quanto nas outras atividades acadêmicas e pessoais vivenciadas; Ao professor Márcio José Coelho de Pontes por sua disponibilidade e orientação; À professora Fernanda Honorato por seu apoio, disponibilidade e confiança; Ao professor Mário César Ugulino Araújo pela disponibilidade do espaço cedido e acolhimento acadêmico; Aos professores Sherlan Lemos e Luciano Farias pelas correções realizadas neste trabalho; A Dimitri Albuquerque e Lívia Brito pela enorme contribuição na parte experimental; i Aos colegas do grupo LAQA, em especial ao David Douglas, e aos demais sempre dispostos a ajudar a qualquer hora que eu precisava; As minhas amigas, Lorena Luryann, Valeria Visani e Viviane Tibúrcio que tanto me apoiaram e ajudaram nas horas difíceis; A Universidade Federal da Paraíba-UFPB; Ao CNPq pelo apoio financeiro e financiamento da bolsa de pesquisa; Ao NUQAAPE, FACEPE e LAC-UFPE pelo apoio financeiro e utilização do equipamento NIR; Ao Lacom pela utilização da estufa; Enfim, aos que ajudaram e não ajudaram neste trabalho!! Serei eternamente grata!! i O SENHOR é o meu pastor, nada me faltará. Deitar-me faz em verdes pastos, guia-me mansamente a águas tranqüilas. Refrigera a minha alma; guia-me pelas veredas da justiça, por amor do seu nome. Ainda que eu andasse pelo vale da sombra da morte, não temeria mal algum,porque tu estás comigo;a tua vara e o teu cajado me consolam. Preparas uma mesa perante mim na presença dos meus inimigos,unges a minha cabeça com óleo,o meu cálice transborda. Certamente que a bondade e a misericórdia me seguirão todos os dias da minha vida; e habitarei na casa do Senhor por longos dias. Salmos 23:1-6 i SUMÁRIO LISTA DE FIGURAS............................................................................. iii LISTA DE TABELAS............................................................................. v LISTA DE SIGLAS............................................................................... vi RESUMO............................................................................................. vii ABSTRACT.......................................................................................... viii 1 INTRODUÇÃO................................................................................. 2 2 FUNDAMENTAÇÃO TEÓRICA............................................................ 6 2.1 Barra de cereais............................................................................ 6 2.1.1 Alimentos convencionais, light e diet.......................................... 7 2.2 A cultura da alface........................................................................ 9 2.2.1 Modos de cultivo convencional, hidropônico e orgânico................. 12 2.3 Espectroscopia no Infravermelho Próximo (NIR)................................ 14 2.4 Técnicas de pré-processamento dos dados........................................ 16 2.5 Quimiometria................................................................................ 17 2.5.1 Técnicas de reconhecimento de padrão....................................... 18 2.6 Técnicas de seleção de variáveis...................................................... 20 2.7 Objetivos...................................................................................... 22 2.7.1 Objetivo geral.......................................................................... 22 2.7.2 Objetivos específicos................................................................ 22 3 METODOLOGIA................................................................................ 24 3.1 Amostras de barra de cereais.......................................................... 24 3.2 Amostras de alface........................................................................ 24 3.3 Aquisição dos espectros NIR............................................................ 25 3.4 Tratamentos quimiométricos e softwares.......................................... 25 4 RESULTADOS E DISCUSSÃO............................................................. 29 4.1 Barra de cereais............................................................................ 29 4.2 Alface.......................................................................................... 39 i 5 CONCLUSÃO................................................................................... 51 REFERÊNCIAS.................................................................................... 53 ANEXO............................................................................................... 65 i LISTA DE FIGURAS Figura 2.1. Barras de cereais............................................................. 6 Figura 2.2. Alface............................................................................. 10 Figura 4.1. Espectros NIR das 121 amostras de barras de cereais........... 29 Figura 4.2. Espectros NIR das médias das classes de barras de cereais (região destacada referente ao carboidrato).......................................... 30 Figura 4.3. Gráfico de escores PC2 x PC1, para as 121 amostras de barras de cereais ( convencional, light e diet)............................. 31 Figura 4.4. Representação das variáveis selecionadas pelo algoritmo SW para as amostras de barra de cereais................................................... 33 Figura 4.5. Representação das variáveis selecionadas pelo algoritmo SPA para as amostras de barra de cereais................................................... 33 Figura 4.6. Representação das variáveis selecionadas pelo algoritmo GA para as amostras de barra de cereais (região destacada referente à sacarose)......................................................................................... 34 Figura 4.7. Gráfico dos escores de DF2 x DF1 para o modelo SW-LDA, considerando as 121 amostras de barra de cereais ( light e convencional, diet).................................................................................. 35 Figura 4.8. Gráfico dos escores de DF2 x DF1 para o modelo SPA-LDA, considerando as 121 amostras de barra de cereais ( light e convencional, diet).................................................................................. 36 Figura 4.9. Gráfico dos escores de DF2 x DF1 para o modelo GA-LDA, considerando as 121 amostras de barra de cereais ( light e convencional, diet).................................................................................. 36 Figura 4.10. Gráfico dos pesos das variáveis selecionadas pelo GA-LDA, para as 121 amostras de barra de cereais............................................. 37 Figura 4.11. Espectros brutos na região NIR (10000-4000 cm-1) das amostras de alface............................................................................ 39 Figura 4.12. Espectros brutos na região NIR selecionada (5500-4000 cm1 ) das amostras de alface................................................................... Figura 4.13. Gráfico de pesos na faixa de 10000 – 4000 cm-1. (variáveis 40 i de maiores pesos na área destacada)................................................... 40 Figura 4.14. Gráfico de escores PC2 x PC1, para as 104 amostras de alfaces ( convencional, hidropônico e orgânico)............................. 41 Figura 4.15. Espectros NIR das médias das classes (convencional – preto, hidropônico – vermelho e orgânico – azul) (área destacada pela característica de lipídios)..................................................... 42 Figura 4.16. Representação das variáveis selecionadas pelo algoritmo SW para as amostras de alface............................................................ 44 Figura 4.17. Representação das variáveis selecionadas pelo algoritmo SPA para as amostras de alface........................................................... 44 Figura 4.18. Representação das variáveis selecionadas pelo algoritmo GA para as amostras de alface............................................................ 45 Figura 4.19. Gráfico dos escores de DF2 x DF1 para o modelo SW-LDA, considerando as 104 amostras de alface ( convencional, hidropônico e orgânico)..................................................................................... 46 Figura 4.20. Gráfico dos escores de DF2 x DF1 para o modelo SPA-LDA, considerando as 104 amostras de alface ( convencional, hidropônico e orgânico)...................................................................................... 46 Figura 4.21. Gráfico dos escores de DF2 x DF1 para o modelo GA-LDA, considerando as 104 amostras de alface ( convencional, hidropônico e orgânico)...................................................................................... 47 Figura 4.22. Gráfico dos pesos das variáveis selecionadas pelo GA-LDA, para as 104 amostras de alface........................................................... 48 i LISTA DE TABELAS Tabela 2.1 Informação sobre os alimentos light.................................... 7 Tabela 2.2 Composição da alface tipo crespa por 100 gramas de parte comestível: centesimal, minerais, vitaminas e colesterol......................... 10 Tabela 3.1 Número de amostras dos conjuntos de treinamento, validação e teste em cada classe para as amostras de barra de cereais.... 26 Tabela 3.2 Número de amostras dos conjuntos de treinamento, validação e teste em cada classe para as amostras de alfaces.................. 26 Tabela 4.1 Tabela dos erros dos conjuntos de amostras de barras de cereais, dos modelos obtidos a partir de diferentes pré-processamentos... 31 Tabela 4.2 Resultados de classificação obtidos com os modelos SW-LDA, SPA-LDA e GA-LDA para o conjunto de teste das amostras de barra de cereais. (1) diet; (2): convencional e (3) light....................................... 38 Tabela 4.3 Tabela dos erros dos conjuntos de amostras de alface dos modelos construídos a partir de diferentes pré-processamentos............... 43 Tabela 4.4 Resultados de classificação obtidos com os modelos SW-LDA, SPA-LDA e GA-LDA para o conjunto de teste das amostras de alface (1): convencional; (2): hidropônico e (3): orgânico..................................... 49 i LISTA DE SIGLAS ANVISA Agência Nacional de Vigilância Sanitária AOAC Associação Oficial de Químicos Analíticos APS Algoritmo das Projeções Sucessivas FD Função Discriminante GA Algoritmo Genético KNN K-Ésimos Vizinhos mais Próximos KS Kernnard-Stone LED Diodo Emissor de Luz LDA Análise Discriminante Linear MAPA Ministério da Agricultura, Pecuária e Abastecimento MS Ministério da Saúde MSC Correção de Espalhamento Multiplicativo NIR Infravermelho Próximo NIRA Acessório de Reflectância no Infravermelho Próximo OMS Organização Mundial de Saúde PCA Análise de Componentes Principais PLS Mínimos Quadrados Parciais SIMCA Modelagem Independente e Flexível por Analogia de Classes SNV Variação Normal Padrão SNVS Sistema Nacional de Vigilância Sanitária SW Stepwise RNA Rede Neural Artificial TCC Taxa de Classificação Correta i Título: Classificação de alfaces e barras de cereais a partir da espectroscopia NIR e Análise Discriminante Linear. Autora: Anna Luiza Bizerra de Brito. Orientadores: Profa. Dra. Liliana de Fátima Bezerra Lira de Pontes e Prof. Dr. Márcio José Coelho de Pontes RESUMO A busca por uma melhor qualidade de vida tem levado ao aumento do consumo de alimentos com menos calorias, ricos em fibras e vitaminas, e obtidos de formas de cultivo diferenciadas. Em meio a esses alimentos, encontram-se as barras de cereais e as alfaces, que são alimentos de fácil acesso, muito consumidos e que possuem altos valores nutricionais. Como qualquer outro alimento, necessitam de métodos eficientes que possam assegurar sua qualidade. Assim, surge a necessidade de métodos analíticos rápidos, precisos e de baixo custo, que possam ajudar a identificar e classificar com segurança a esses alimentos. Dentro desta perspectiva, este trabalho faz uso da Espectroscopia no Infravermelho Próximo (NIR) aliada a Análise Discriminante Linear (LDA) para classificar amostras de barras de cereais e alfaces. Um total de 121 amostras de barras de cereais, de três tipos distintos (convencional, diet e light) e 104 amostras de alface de três diferentes tipos de cultivo (convencional, orgânico e hidropônico) foi utilizado. A aquisição dos espectros foi feita no equipamento Spectrum 400 (Perkin Elmer) com acessório NIRA (Near Infrared Reflectance Acessory) na faixa de 10.000 a 4.000 cm-1. Modelos de classificação foram construídos através da associação da LDA e algoritmos de seleção de variáveis: Stepwise (SW), Algoritmo das Projeções Sucessivas (SPA) e Algoritmo Genético (GA). Estratégias de pré-processamento de dados foram avaliadas e a eficiência dos modelos foi determinada em relação à taxa de classificação correta (TCC), para o conjunto total das amostras e para o conjunto de teste. Para as duas matrizes o modelo que gerou um melhor TCC foi o GA-LDA com valor de 95% para matriz das barras de cereais e 97,1% para matriz das alfaces, ambos baseados no conjunto total das amostras (treinamento, validação e teste). Em relação ao conjunto de teste os modelos apresentaram resultados de TCC com desempenho de 90,3% e 95,4% para as matrizes das barras de cereais e alfaces respectivamente. Palavras–chave: barras de infravermelho próximo; LDA. cereais; alfaces; espectroscopia no i Title: Classification of lettuce and cereal bars as from the NIR spectroscopy and Linear Discriminate Analysis. Authoress: Anna Luiza Bizerra de Brito. Advisors: Prof. Dr. Liliana de Fátima Bezerra Lira Pontes and Prof. Dr. Márcio José Coelho de Pontes ABSTRACT The search for a better quality of life has led to increased consumption of foods with fewer calories, high in fiber and vitamins, and obtained from different forms of cultivation. Amid these foods, there are cereal bars and lettuce, foods that are easily accessible, widely consumed and have high nutritional values. Like any other food, require efficient methods that can ensure its quality. Thus, the need for rapid, accurate analytical methods and low cost, which can help to identify and classify these foods safely arises. Within this perspective, this paper makes use of Near Infrared Spectroscopy (NIR) combined with Linear Discriminant Analysis (LDA) to classify samples of cereal bars and lettuce. A total of 121 samples of cereal bars, three distinct types (conventional, diet and light) and 104 samples of three different types of lettuce cultivation (conventional, organic and hydroponic) was used. The acquisition of the spectra was made on equipment Spectrum 400 (Perkin Elmer) with accessory NIRA (Near Infrared Reflectance Acessory) in the range 10000 - 4000 cm-1. Classification models were constructed by combining the LDA algorithms and variable selection: Stepwise (SW), Successive Projections Algorithm (SPA) and Genetic Algorithm (GA). Strategies for pre - processing data were evaluated and the efficiency of the models was determined from the of correct classification rate (CCR) for the full set of samples and the test set. For both matrices the model that generated a better CCR was the GA-LDA valued 95% to matrix of the cereal bars and 97.1 % for array of lettuces, both based on the total set of samples (training, validation and testing). Regarding the set of test models presented results of CCR with performance of 90.3 % and 95.4 % for matrices of cereal bars and lettuce respectively. Keywords: cereal bars; lettuce; near infrared spectroscopy; LDA. CAPÍTULO I . INTRODUÇÃO CAPÍTULO I – INTRODUÇÃO |2 1 INTRODUÇÃO Para alcançar o bem-estar físico, mental e social o primeiro passo começa por alimentar-se bem. Por isso a alimentação saudável nas quantidades e proporções corretas é fundamental para a manutenção das diversas funções do corpo. (MACDIARMID et al., 2013; SONNENBERG et al., 2013) A rotina acelerada exigida nos dias atuais dificulta a manutenção de uma alimentação balanceada, o que diminui as chances do consumo de nutrientes, podendo provocar uma diminuição da qualidade de vida associada a problemas de saúde como obesidade, hipertensão, diabetes, entre outros (CYBERDIET, 2013). Segundo a Organização Mundial de Saúde (OMS), a prática de uma alimentação saudável promove o bemestar físico, psicoemocional e social e evita o surgimento de patologias. (OMS, 2000). Assim, o consumo de alimentos com menos calorias, ricos em fibras e vitaminas, e oriundos de cultivos diferenciados tem aumentado consideravelmente (MATIAS, 2013). Todavia, os consumidores se deparam no mercado com uma série de denominações tais como produtos “orgânicos”, “hidropônicos”, light, diet, “transgênico”, “enriquecido”, “funcional”, entre outros, que dificultam a escolha correta do alimento. Alimentos light e diet podem ser encontrados na maioria dos supermercados e são classificados como produtos que contem baixo teor de gordura, sal, proteínas, entre outros, quando comparados aos produtos convencionais, segundo a Portaria nº 29, de 13 de janeiro de 1998. De acordo com a Agência Nacional de Vigilância Sanitária (ANVISA), estes alimentos são especialmente formulados com modificações no conteúdo dos nutrientes para utilização em dietas diferenciadas ou para pessoas com condições metabólicas e fisiológicas específicas. (ANVISA, 2013b) CAPÍTULO I – INTRODUÇÃO |3 Em meio aos alimentos diet e light podem ser destacadas as barras de cereais consumidas em todo o mundo, seja por pessoas em dieta, ou por aquelas com problemas de saúde, ou apenas como lanche rápido. De fato, elas estão muito bem adaptadas ao cotidiano das pessoas atualmente por possuírem diferentes sabores, marcas, teores nutricionais, além de serem de fácil transporte. (FARINAZZI-MACHADO et al., 2012; LOBATO et al., 2012; VILLAVICENCIO et al., 2007; ZAVERI e DRUMMOND, 2009) A escolha do produto por parte do consumidor geralmente está associada a sua aparência e, principalmente a informação nutricional descrita na embalagem, mas estes parâmetros nem sempre são eficazes na garantia de escolha segura do alimento desejado. Informação incorreta ou mesmo a falta de informação podem causar problemas mais graves, como hiperglicemia e problemas cardiovasculares, especialmente em caso de pessoas portadores de doenças, como os diabéticos, público alvo do consumo destes alimentos (SCOTT et al., 2011). Há também os alimentos originados de cultivos diferenciados como, por exemplo, os orgânicos e os hidropônicos. Essa diferença na forma de produção tem atraído consumidores que buscam uma alternativa para ingestão de produtos mais saudáveis (MAPA, 2013a). Entre os alimentos provenientes de cultivos diferenciados pode ser destacada a alface, por ser considerada a mais importante hortaliça folhosa no Brasil (SANTANA et al., 2006; HENZ e SUINAGA, 2009; VIANA et al., 2013; FERREIRA et al., 2013; KANO et al., 2012; SUINAGA et al., 2013). Possui alto teor nutricional, é rica em sais minerais, vitaminas e tem efeito medicinal calmante, diurético e laxante (SILVA et al., 2013). O crescente consumo da alface tem sua origem na grande utilização dessa hortaliça em fast foods e pela maior demanda e preferência do consumidor na ingestão de saladas (SALA e COSTA, 2012). As alfaces podem ser produzidas pelo método orgânico, convencional e hidropônico e CAPÍTULO I – INTRODUÇÃO |4 isso gera uma considerável diferença de preço quando chegam às prateleiras dos supermercados. Neste sentido, surge a necessidade do desenvolvimento de métodos analíticos rápidos e precisos que possam ajudar a identificar e classificar com segurança as amostras de alface e barras de cereais. Tais métodos possuem grande importância tanto do ponto de vista econômico, quanto de saúde pública. A associação da espectroscopia no NIR com técnicas quimiométricas de análise de dados tem sido utilizada no controle de qualidade e classificação de muitos alimentos (CHEN et al., 2006; FERREIRA et al., 2014; BEVILACQUA et al., 2013). Entre suas principais vantagens estão a não utilização de reagentes químicos, é uma técnica não-destrutiva, permite análises rápidas com determinação de diferentes propriedades simultaneamente (PASQUINI, 2003). Diante do exposto, este trabalho propõe a utilização da espectroscopia na região do Infravermelho Próximo (NIR), associada a ferramentas quimiométricas para classificar amostras de alface em relação ao modo de produção (orgânico, convencional e hidropônico) e barras de cereais quanto ao tipo (diet, light e convencional). CAPÍTULO II . FUNDAMENTAÇÃO TEÓRICA CAPÍTULO II – FUNDAMENTAÇÃO TEÓRICA |6 2 FUNDAMENTAÇÃO TEÓRICA 2.1 Barra de cereais ereais As barras de cereais (Figura 2.1) vêm ganhando bastante destaque nos últimos anos devido a sua conveniência e associação com alimentos saudáveis (PAIVA et al., 2012). São formadas por grãos de cereais, aveia como ingrediente principal, processados e misturados, misturados podendo ser adicionados ionados a outros ingredientes, como frutas desidratadas ou cristalizadas, sementes, castanhas, nozes, caramelos, chocolates, musse de morango, musse de limão, entre outros. (OLIVEIRA et al., 2013) Figura 2.1. 2.1 Barras de cereais. ereais. Fonte: Casadesaron As barras rras de cereais apresentam alto teor nutricional, baixo índice de gordura, altos teores de fibras e aporte energético. São fontes de vitaminas, sais minerais, proteínas, proteínas, lipídios e carboidratos (RODRIGUES et al., 2011). Esses sses constituintes são tidos como parâmetro arâmetro de qualidade q das barras de cereais sendo avaliados, avaliados por exemplo, determinação da umidade e determinação das cinzas (INSTITUTO ADOLF LUTZ, 1985); 1985) determinação de lipídios pelo método Soxhlet, determinação de proteína pelo método Kjeldhal e determinação de fibra em detergente etergente ácido (AOAC, CAPÍTULO II – FUNDAMENTAÇÃO TEÓRICA |7 1990), além de análises sensoriais e análises da rotulagem (MELLO et al., 2012). É importante salientar que informação incorreta na embalagem ou rótulo dos alimentos, tais como a ausência ou presença de açúcar ou outros carboidratos, pode levar a escolhas erradas por diabéticos, por exemplo, causando hiperglicemia e problemas cardiovasculares (SCOTT et al., 2011).Assim, não é difícil que o consumidor se confunda diante de todas as informações contidas nos rótulos ou mesmo diante das opções não somente de marcas e sabores, mas também de tipos existentes, como as convencionais, as light e diet. 2.1.1. Alimentos convencionais, light e diet Alimento convencional é aquele sem restrições ou adicionais na composição inicial do produto. De acordo com a Portaria nº 27, de 13 de janeiro de 1998, os alimentos nomeados com o termo light são alimentos que tem o conteúdo absoluto de nutrientes e ou valor energético baixo ou reduzido. Em termos de comparação, os alimentos light possuem uma diferença relativa mínima de 25% no valor energético ou conteúdo de nutrientes em relação aos alimentos do tipo convencional. Essas informações podem ser vista na Tabela 2.1 (ANVISA, 2013a). Tabela 2.1 Informação sobre os alimentos light Conteúdo Comparativo Valor Energético Total Atributos (Redução mínima de 25%) No Valor Energético Total e diferença maior que 40 Kcal/100 g (sólidos) No teor de Açúcares e diferença maior Açúcares que 5 g de açúcares/100 g (sólidos) e mesmas condições exigidas para os atributos REDUZIDOS ou BAIXO VALOR CAPÍTULO II – FUNDAMENTAÇÃO TEÓRICA |8 ENERGÉTICO, ou frase "este não é um alimento com valor energético reduzido" ou frase equivalente, quando a redução de mais de 25% de açúcar implicar em aumento ou manutenção do valor energético do produto. Em Gorduras Totais e diferença maior Gorduras Totais que 3 g gorduras/100 g (sólidos) Em gorduras saturadas e diferença maior Gorduras Saturadas que 1,5 g de gordura saturada/100 g (sólidos) Em colesterol e diferença maior que 20 mg colesterol/100 g (sólidos) e máximo de 1,5 g de gordura saturada/100 g Colesterol (sólidos) e Energia fornecida por gorduras saturadas deve ser no máximo 10% do Valor Energético Total. Em sódio e diferença maior que 120 Sólido mg/100 g (sólidos) Fonte: Portaria nº 27, de 13 de janeiro de 1998 Assim, barra de cereais nomeadas como light não são, necessariamente, alimentos que tem isenção total de certo ingrediente. Ao contrário de outros tipos de alimentos, os alimentos light não foram desenvolvidos para atender a necessidades nutricionais de determinado grupo, apenas surgiram para atender a um número elevado de pessoas que se preocupam com o bem estar e a saúde (MAPA, 2013b). Hoje em dia, os alimentos diet são consumidos livremente, já que antes eram considerados medicamentos e só podiam ser comercializados em farmácias (PERTSCHY, 2010). Segundo a Portaria nº 29, de 13 de janeiro de 1998 (versão republicada 30.03.1998), o termo diet pode ser opcionalmente usado para alimentos voltados para dietas com restrição de nutrientes como CAPÍTULO II – FUNDAMENTAÇÃO TEÓRICA |9 carboidratos, proteínas, gorduras, sódio; ou para alimentos destinados a fins específicos e alimentos classificados para ingestão controlada de nutrientes, empregados exclusivamente para controle de peso ou para dieta de ingestão controlada de açúcares (ANVISA, 2013b). Barras de cereais diet são direcionadas especialmente para pessoas com exigências patológicas, fisiológicas, metabólicas ou físicas particulares (PERTSCHY, 2010). Pessoas que tem o objetivo de emagrecer devem prestar muita atenção ao comprar barra de cereais diet, porque nem sempre a isenção de uma substância implica em redução de calorias, e com isso, pagam mais caro em um produto que não é voltado para seu problema. É importante mencionar que alimentos rotulado com “zero” não são alimentos diet. Esses alimentos possuem outras designações conforme é apresentado na Portaria nº 27, de 13 de janeiro de 1998 (ANVISA, 2013a). 2.2. A cultura da alface Originária da Europa e da Ásia, a alface (Lactuca sativa), da família dos Asteraceae, é conhecida há milênios pelos homens. Os maiores produtores mundiais são os Estados Unidos, a China, Espanha e Itália. Existem cerca de seis tipos (crespa, lisa, americana, mimosa, romana e vermelha) (SALA e COSTA, 2012). A alface tipo crespa é bastante consumida no Brasil e é importante devido ao seu valor comercial (FAVARO-TRINDADE et al., 2007) (Figura 2.2). CAPÍTULO II – FUNDAMENTAÇÃO TEÓRICA | 10 Figura 2.2. 2.2 Alface. Fonte: Fotos bol. Possui alto teor nutricional e baixo teor calórico, calórico fonte de sais minerais, como cálcio, ferro e fósforo, de vitaminas A, B1, B1 B2, C e E, fibras, entre outros, (Tabela ( 2.2) concentrando-se se a maior quantidade de vitaminas e minerais nas folhas mais externas. (LIMA, 2007; OMAIAA, 2013) Tabela 2.2 Composição da d alface tipo crespa por 100 00 gramas de parte comestível: centesimal, centesimal, minerais, vitaminas e colesterol. colesterol Composição Valores Umidade (%) 96,1 Proteína (g) 1,3 Lipídeos (g) 0,2 Colesterol (mg) NA Carboidrato (g) 1,7 Fibra Alimentar (g) 1,8 Cinzas (g) 0,7 Cálcio (mg) 38 Magnésio (mg) 11 Manganês (mg) 0,20 Fósforo (mg) 26 Ferro (mg) 0,4 Sódio (mg) 3 CAPÍTULO II – FUNDAMENTAÇÃO TEÓRICA Potássio (mg) 267 Cobre (mg) 0,03 Zinco (mg) 0,3 Retinol (µg) NA Tiamina (mg) 0,11 Riboflavina (mg) 0,12 Piridoxina (mg) | 11 Tr Niacina (mg) 1,09 Vitamina C (mg) 15,6 Fonte: TACO – 4ª Edição (NA: Não Aplicável/ Tr: Traço) A alface é bastante utilizada em saladas, sendo de fácil acesso e baixo custo e, portanto consumida por todas as classes sociais no Brasil. É útil no combate a insônia (OMAIAA, 2013), possui efeito laxativo, tem propriedades diuréticas e calmante, bem como um sabor agradável e refrescante (NETO et al., 2012; LIMA, 2007). Segundo LÓPEZ-GÁLVEZ et al. (2010), citado por (NETO et al., 2012) há uma relação direta entre o consumo desse alimento, na categoria do vegetal folhoso, e redução de doenças crônicas, como hipertensão, diabetes, aterosclerose e câncer. A alface é um vegetal adaptado a clima ameno, sendo própria para cultivos de outono e inverno (FAVARO-TRINDADE et al., 2007). No entanto, graças ao melhoramento genético das cultivares, possibilitou-se a produção durante o ano inteiro, sobretudo no verão, que era uma das suas limitações (LIMA, 2007; VIANA et al., 2013). O cultivo dessa hortaliça apresenta algumas limitações, em especial devido aos efeitos de temperatura, umidade e chuva. A temperatura é o elemento que exerce maior influência na fisiologia das alfaces, podendo acelerar ou retardar as reações metabólicas. Outras desvantagens são relacionadas à dificuldade de conservação e ao transporte pós-colheita. (LIMA, 2007). CAPÍTULO II – FUNDAMENTAÇÃO TEÓRICA | 12 A planta da alface é bastante vulnerável a doenças. Segundo FILGUEIRA (2003) apud LIMA (2007), são conhecidos aproximadamente 75 diferentes tipos de doenças presentes no consumidor possivelmente causadas pela presença de resíduos deixados nessa planta, em decorrência principalmente do uso de produtos tóxicos no controle fitossanitário. O modo de cultivo da alface é realizado através de sistemas tradicionais, orgânicos e hidropônicos. Várias pesquisas investigaram o acúmulo de nitrato em alfaces produzidas nesses tipos de cultivo. Porém, poucos trabalhos avaliaram outros parâmetros de interesse como teor de vitaminas, fibras, contagem microbiana e aceitação sensorial. (FREIRE et al., 2009; FAVARO-TRINDADE et al., 2007; COMETTI et al., 2004; DAROLT, 2003; MIYAZAWA et al., 2001;). 2.2.1 Modos de cultivo convencional, hidropônico e orgânico O método convencional ou tradicional caracteriza-se pelo cultivo das alfaces em solo utilizando adubos altamente solúveis e pesticidas, de natureza química (NETO et al., 2012). Contudo, esse sistema de produção polui águas e degrada o solo devido aos elementos químicos residuais (DAROLT, 2003). Nos últimos anos, o tipo de cultivo hidropônico vem ganhando bastante destaque. Essa forma de cultivo tem por característica a não utilização do solo e seu principal componente é a água. Tem como objetivos elevar a produtividade, aumentar o número de colheitas por ano, reduzir mão de obra com gastos de defensivos agrícolas, obter um produto de melhor aparência, além de ocupar um menor espaço físico para cultivo. Outra vantagem dessa técnica é a não exposição das alfaces a geadas, chuvas intensas, mudança brusca de temperatura, ventos fortes e regularidade de produção. (SALA e COSTA, 2012; FAVARO-TRINDADE et al., 2007; DOMINGUES et al., 2012) CAPÍTULO II – FUNDAMENTAÇÃO TEÓRICA | 13 No cultivo hidropônico são utilizadas soluções nutritivas balanceadas capazes de proporcionar o crescimento da planta. A solução nutritiva é constituída por nutrientes básicos, perfazendo um total de dezesseis elementos: carbono, hidrogênio, oxigênio, nitrogênio, fósforo, potássio, enxofre, cálcio, magnésio, manganês, ferro, zinco, boro, cobre, molibdênio e cloro (DOMINGUES et al., 2012). Nesse modo de produção é necessário acompanhamento técnico especializado que forneça nutrição adequada às plantas e evite, dentre outros problemas, o acúmulo excessivo de nitrato. (FAVARO-TRINDADE et al., 2007). O nitrato (NO3-) quando absorvido em grande quantidade, a planta não consegue metabolizá-lo totalmente, o que provoca o acúmulo nos tecidos. Quando ingerido pelos consumidores, pode ser reduzido a nitrito (NO2-), que entrando na corrente sangüínea oxida o ferro da hemoglobina que passa do estado 2+ a 3+, produzindo a metahemoglobina, tornando-o incapaz de ligar-se e transportar oxigênio. Outro problema é que parte do nitrito pode acabar combinado a aminas formando nitrosaminas, as quais são cancerígenas e mutagênicas (OHSE, 2009). A hidroponia investimento possui inicial, gasto desvantagem de energia por necessitar elétrica, um maior necessidade de monitoramento contínuo do funcionamento do sistema, controle de nutrientes na solução, bem como novos produtos e técnicas apropriadas para controle de pragas e doenças. (DOMINGUES et al., 2012; FAVAROTRINDADE et al., 2007) Outra forma de produção é a forma orgânica, assim considerada quando são cultivados alimentos em um ambiente que considere sustentabilidade social, ambiental e econômica e valorize a cultura das comunidades rurais. (MAPA, 2013a) Esta técnica apresenta uma grande vantagem comparada ao sistema convencional devido a ser um modelo tecnológico de produção menos impactante ao meio ambiente. A cultura orgânica adota práticas de aproveitamento de resíduos orgânicos, conserva a biodiversidade, não faz CAPÍTULO II – FUNDAMENTAÇÃO TEÓRICA | 14 queimadas, não usa agrotóxicos, hormônios, adubos minerais sintéticos ou outros agentes contaminantes. (FAVARO-TRINDADE et al.; LIMA, 2007) No cultivo orgânico são utilizadas plantas consideradas daninhas para muitas lavouras, alternadas na produção ou durante o cultivo, com o intuito de atraírem para si as pragas, enriquecerem o solo, assim evitando doenças. É utilizado também técnicas de rodízio de culturas, plantio direto e adubação verde (MAPA, 2013a). Contudo, umas das grandes dificuldades para sua expansão é a conversão dos sistemas convencionais em sistemas orgânicos, isso porque, nos primeiros anos de produção, as áreas de lavoura do tipo convencional, ainda estão à base de agrotóxicos. (LIMA, 2007) Uma desvantagem do produto final oriundo do sistema de cultivo orgânico são os preços mais elevados, chegando a ser cerca de 40% maior que os convencionais. Esse valor tem por justificativa a qualidade do produto. Existem algumas entidades que certificam os produtos orgânicos como é o caso do Selo Brasileiro, mas não há quem comprove se o alimento tem ou não agrotóxicos (GUIVANT, 2003). 2.3 Espectroscopia no Infravermelho Próximo (NIR) A radiação do infravermelho foi descoberta em 1800 por Herschel e em 1900, Colblentz obteve os espectros no infravermelho de vários compostos orgânicos (ROCHA, 2006; WORKMAN, 1996). Técnica analítica muito usada devido às inúmeras informações que ele fornece sobre uma determinada amostra. A espectroscopia do infravermelho envolve transferência de energia entre a luz e a matéria. Caracteriza-se por sobretons e combinação de bandas de vibrações moleculares fundamentais. Os perfis espectrais CAPÍTULO II – FUNDAMENTAÇÃO TEÓRICA | 15 dominantes do NIR incluem: metil C-H, metileno C-H, metoxi C-H, carbonil C-H, aromático C-H, hidroxila O-H, N-H de amidas primárias, amidas secundárias (ambos de associações de grupos alquil e aril), N-H de aminas primárias, secundárias e aminas terciárias, e N-H a partir dos sais (XIAOBO et al., 2010; WORKMAN, 1996). Para que as moléculas de um composto absorvam radiação é preciso uma variação no momento dipolo associado ao movimento rotacional ou vibracional. O infravermelho é dividido em três regiões: infravermelho distante (FIR) que compreende a faixa de 200 – 10 cm-1, o infravermelho médio (MIR) com faixa de 4000 – 200 cm-1 e o infravermelho próximo (NIR) cuja faixa é 12800 – 4000 cm-1 (SKOOG et al., 2002). O NIR apresenta características como maior razão sinal-ruído e baixo custo comparado a outras técnicas. (WORKMAN, 1996). Associada a equipamentos que operam no infravermelho próximo, o modo de medida de reflectância difusa destaca-se por ser caracterizada pela determinação direta e com economia de reagentes e de tempo (LIMA et al., 2008). Nesta técnica de reflexão o feixe incidente penetra a superfície da amostra interagindo com a matriz, retornando à superfície da mesma, após absorção parcial e múltiplos espalhamentos (KONZEN et al., 2003). A intensidade das bandas pode ser expressa em transmitância e absorbância. A absorbância é calculada pela transformação da porcentagem de reflectância [log10 (1/Reflectância)]. (SILVERSTEIN et al., 2007). A região do NIR é bastante visada por indústrias de alimento, tanto para as análises de matérias primas como para o produto acabado (CEN e HE, 2007). Diversos trabalhos na área de alimentos envolvendo a técnica NIR e métodos de reconhecimento de padrões nos mostram que essa associação é uma ferramenta eficaz (CRUZ et al., 2013; GRANATO et al.; 2011; TEYE et al., 2013; BERRUETA et al.; 2007; CEN e HE, 2007; ALAMPRESE et al., 2013). CAPÍTULO II – FUNDAMENTAÇÃO TEÓRICA | 16 Devido à grande quantidade de valores de absorbância contida na matriz de dados obtidos pela técnica NIR, necessita-se da quimiometria, que extrai as informações presentes no espectro. Para tanto, é necessário em alguns casos, um pré-processamento dos dados. 2.4 Técnicas de pré-processamento dos dados Técnicas de pré-processamento da informação espectral são geralmente empregadas, quando necessário, para remoção de variação sistemática ou aleatória que mascara uma variação de interesse nos dados a ser estudados. Os pré-processamentos podem ser aplicados tanto nas amostras como nas variáveis. Exemplos de pré-processamentos aplicados nas amostras são a normalização, ponderação, suavização e correção da linha de base. Já os exemplos de pré-processamento aplicados nas variáveis são a centralização pela média, escalonamento e autoescalonamento. Pré-processamento com derivação tem por finalidade a correção de problemas de linhas de base, remoção de ruídos e melhoramento na definição das bandas que se encontram sobrepostos. Informações contidas ao longo dos diferentes comprimentos de onda são geralmente enfatizadas com a utilização da primeira ou segunda derivada. Esse processo tem por desvantagem diminuir a relação sinal/ruído quando presente ruído nos espectros, assim, aplica-se alisamento junto com a derivação. Como exemplo desse procedimento tem derivação Savitzky Golay. (MAZUR, 2012) Para problemas relacionados a variações do espalhamento da luz ocasionadas pelas medidas de reflectância difusa, vindas principalmente pela falta de homogeneidade ou diferenças na granulometria das amostras, sugere a Correção de Espalhamento Multiplicativo (MSC). Este método matemático minimiza a interferência através da correção de linha CAPÍTULO II – FUNDAMENTAÇÃO TEÓRICA | 17 de base dos espectros de modo que todos os apresentem o espalhamento “ideal”. Em seguida, uma regressão linear é usada para calcular o coeficiente angular e linear do gráfico entre o espectro ideal e o espectro que vai ser corrigido. O espectro corrigido é calculado pela subtração de cada ponto pelo valor do coeficiente linear e divide-se este pelo coeficiente angular. (RIBEIRO, 2009; ROGGO, 2003) Similar ao MSC, a Variação Normal Padrão (SNV) corrigi espalhamento multiplicativo e interferências de espalhamento, porém a correção por SNV contorna problemas de espalhamento através da normalização de cada espectro pelo desvio padrão, não havendo a necessidade de um espectro “ideal” para fazer as correções dos espectros (COSTA FILHO, 2003). Cuidados devem ser tomados para não se extrair informação útil, e por isso, um re-exame deve sempre ser realizado após o pré- processamento. 2.5 Quimiometria A análise mutlivariada engloba métodos estatísticos de análises simultânea de medidas múltiplas realizadas sobre um individuo ou objeto sob investigação. Assim, qualquer análise simultânea realizada em duas ou mais variáveis, pode ser considerada uma análise mutlivariada. (HAIR et al., 2005) A quimiometria surge em 1970 e um dos grandes divulgadores foi Bruce Kowalski. Umas das causas para sua criação foi a automação das análises, a acessibilidade a microcomputadores e a disponiblibidade de metodologias e softwares dedicados à realização de cálculos com dados multivariados. Bastante utilizada na química analítica, a quimiometria é uma associação de métodos de análise multivariada para o tratamento de dados químicos. (TEÓFILO, 2013) CAPÍTULO II – FUNDAMENTAÇÃO TEÓRICA Usando ferramentas quimiométricas, os | 18 métodos de desenvolvimento de produtos alimentícios e as análises de alimentos podem ser simplificados. A quimiometria ajuda a decidir quais determinações são importantes e se algumas delas podem ou não serem anuladas. (FERNANDES, 2006) Entre as subdivisões da quimiometria, se encontra o planejamento experimental, reconhecimento de padrões, métodos de inteligência artificial e calibração multivariada (NETO, 2006). Dentre as vertentes da quimiometria apresentados, os métodos de reconhecimento de padrão são utilizados neste trabalho e serão abordados mais detalhadamente na seção seguinte. 2.5.1 Técnicas de reconhecimento de padrão Técnicas de reconhecimento de padrões tornaram-se uma poderosa ferramenta na caracterização e identificação de similaridades e diferenças entre classes de amostras em diferentes conjuntos de dados e na avaliação da qualidade e composição dos alimentos (BERRUETA et al., 2007; CEN e HE, 2007). Divide-se em reconhecimento de padrões não-supervisionados, por exemplo técnicas como Análise por Componentes Principais (PCA) e Análise por Agrupamentos Hierárquicos (HCA) e reconhecimento de padrões supervisionados, técnicas como Análise Discriminante Linear (LDA), Modelagem Independente e Flexível por Analogia de Classes (SIMCA) e K-Ésimos Vizinhos mais Próximos (KNN). As técnicas de reconhecimento de padrões não-supervisionados têm por finalidade realizar uma análise exploratória nos dados, ou seja, analisam a existência de agrupamentos entre as classes das amostras em estudo sem que seja necessário o conhecimento de suas identidades. São elas análise de agrupamentos hierárquicos (HCA) e a análise de CAPÍTULO II – FUNDAMENTAÇÃO TEÓRICA | 19 componentes principais (PCA) (NETO et al., 2006; FERNANDES, 2006). Entre essas técnicas, é abordado nesse trabalho a PCA. A PCA baseia-se na construção de um conjunto novo de variáveis denominadas por componentes principais (PCs), as quais são ortogonais entre si e construídas na ordem da maior para a menor variância explicada dos dados. Os conjuntos de dados são assim redimensionados e cada amostra é representada por um ponto no espaço multidimensional, gráficos de escores, favorecendo a observação de agrupamentos entre as amostras de cada classe apresentando características semelhantes provenientes das propriedades químicas. (MARTINEZ, 2011). Já as técnicas de reconhecimento de padrões supervisionadas diferem essencialmente na estrutura das regras de classificação que são adotadas. Dividem-se em métodos de modelagem de classe e discriminatórios (CASTRO E PRADO, 2002). Além disso, necessitam que as identidades das amostras usadas na construção dos modelos sejam conhecidas para poderem ser utilizadas na classificação de amostras desconhecidas, ou seja, uma variável de categoria. A análise discriminante linear (LDA) e análise discriminante dos mínimos quadrados parciais (PLS-DA) são exemplos de métodos discriminatórios. Esse método tem por objetivo classificar as amostras desconhecidas em uma única classe. Encontram as diferenças entre as classes e, as amostras devem ser classificadas em uma classe de treinamento específico (ROGGO et al., 2003). O desenvolvimento de modelos LDA conta com uma etapa preliminar para seleção de amostras que irá compor os conjuntos de treinamento, validação e teste. Para tanto, um algoritmo usual KennardStone (KS), é utilizado. O algoritmo maximiza as distâncias euclidianas entre os vetores das respostas instrumentais das amostras e é aplicado separadamente para cada classe. Os conjuntos de treinamento são formados na ordem de amostras mais representativas e os demais conjuntos são divididos em validação e teste (KENNARD e STONE, 1969). CAPÍTULO II – FUNDAMENTAÇÃO TEÓRICA | 20 O método LDA emprega limites de decisão linear, ou seja, funções discriminantes lineares que maximizam a razão entre as classes e minimizam a dispersão dentro de cada classe (FISHER, 1936). Contudo, em comparação aos outros métodos de classificação supracitados, possui a desvantagem de necessitar de matrizes de pequenas dimensões, devido a problemas de colinearidade. Portanto, é necessária a associação aos algoritmos de seleções de variáveis, como o Algoritmo das Projeções Sucessivas (SPA), Stepwise (SW) e Algoritmo Genético (GA). 2.6 Técnicas de seleção de variáveis O SPA é uma técnica de seleção de variáveis que faz uso de operações que objetivam a minimização de problemas relacionados à colinearidade dos dados, reduzindo informações redundantes. Este objetivo é alcançado com o uso de procedimentos matemáticos, onde as variáveis existentes na matriz de dados são projetadas sucessivamente, gerando cadeias com menor número destas. Em seguida, a função de custo é calculada, a qual esta baseada no risco médio G (Equação 1), e a cadeia gerada que apresentar o menor valor de custo será selecionada. ∑ (1) onde: é o risco de uma classificação incorreta das amostras, que pode ser visto com mais detalhes em PONTES (2009). O SW é outra alternativa dentre as técnicas de seleção de variáveis que visa discriminar e investigar individualmente cada uma destas. De tal forma que cada variável é adicionada e excluída do modelo de acordo com o método de validação cruzada leave-one-out (PONTES, 2009). Calcula-se então o fator de discriminação (Di) de uma variável ni , baseando em CAPÍTULO II – FUNDAMENTAÇÃO TEÓRICA | 21 medidas de dispersão dentro das classes e entre as classes (como mostrado na Equação 2) (CANECA et al., 2006). (2) onde: é a dispersão entre as classes e o a dispersão dentro da classe (PONTES, 2009). Nessa técnica são testados diferentes valores de limiar (threshold), e esses valores são comparados baseados nos erros do conjunto de validação. O GA diferentemente dos algoritmos supracitados é um algoritmo de natureza estocástica. É baseado na teoria da evolução das espécies, introduzida pelo fisiologista e naturalista Charles Darwin, na qual as espécies evoluem pelo princípio da seleção natural e sobrevivência do mais apto (CONDE, et al., 2007). Nesse algoritmo, as variáveis são codificadas de forma binária, parecendo-se assim, de forma análoga aos cromossomos biológicos. Para isso, ele necessita de valores: populações de indivíduos e gerações, esses indivíduos são combinados entre si (crossover), gerando “filhos” que podem sofrer ou não mutação. Essas populações evoluem através de sucessivas gerações até se encontrar solução ótima. Testa-se então a aptidão do indivíduo, verificando, matematicamente, quais apresentam melhor resposta para o sistema. Aptidão, neste trabalho, é calculada considerando-a como inverso do risco G (Equação 2) (PONTES, 2009). Surge assim, a necessidade por um método rápido e confiável para detectar propriedades características das amostras quantos ao diferentes tipos e produções. Método este baseado em análises screening que nos dão respostas binárias como, por exemplo, sim ou não, pertence ou não pertence, etc., e são análises mais simples, mais rápidas e de menor custo quando comparadas aos métodos laboratoriais convencionais (VALCÁRCEL et al., 1999). Para isso, associa a espectroscopia no NIR com CAPÍTULO II – FUNDAMENTAÇÃO TEÓRICA | 22 as ferramentas quimiométricas, juntamente com os algoritmos de seleção de variáveis. 2.7 Objetivos 2.7.1 Objetivo geral Desenvolver um método para a classificação de amostras de alface de acordo com o modo de cultivo (orgânico, convencional e hidropônico) e amostras de barras de cereais em relação ao tipo (diet, light e convencional), utilizando espectroscopia NIR e ferramentas quimiométricas. 2.7.2 Objetivos específicos Realizar uma análise exploratória utilizando Análise por Componentes Principais (PCA) para avaliar as regiões informativas da faixa espectral, detecção de outiliers e os agrupamentos naturais das amostras de barras de cereais e alfaces; Determinar o modo de medida a ser utilizado; Escolher o melhor processamento para as amostras; Criar modelos screening baseados na Análise Discriminante Linear (LDA), com prévia seleção de variáveis, para classificar amostras de barra de cereais quanto ao tipo light, diet e convencional e amostras de alface quanto ao modo de produção (orgânico, hidropônico e convencional); Comparar os métodos obtidos (SPA-LDA, GA-LDA e SW-LDA), avaliandoos em termos de resultados de classificação de um conjunto externo de amostras. CAPÍTULO III . METODOLOGIA CAPÍTULO III – METODOLOGIA | 24 3 METODOLOGIA 3.1 Amostras de barra de cereais Cento e vinte e uma amostras de três tipos de barra de cereais foram adquiridas em estabelecimentos comerciais das cidades de João Pessoa-PB e Recife-PE. Dessas amostras, 35 foram do tipo diet, 44 amostras do tipo convencional e 42 amostras do tipo light. As barras foram congeladas, em seguida trituradas no liquificador, peneiradas com uma peneira de granulometria 20 mesh de tamanho de partícula. 3.2 Amostras de alface Cento e quatro amostras de alfaces de três diferentes formas de cultivo foram adquiridas em estabelecimentos comerciais e feiras livres das cidades de João Pessoa-PB e Recife-PE. Dentre essas amostras, 27 são provenientes de cultivo orgânico, 30 amostras de cultivo convencional e 47 amostras de cultivo hidropônico. Escolhida seis a sete folhas, as mais externas, foram lavadas em água corrente e em seguida água destilada. Foram secas em estufa de recirculação de ar, à temperatura de 60ºC por 48 horas. Após esse período, as amostras foram trituradas com auxílio do almofariz e pistilo, e por fim, peneiradas com peneira de granulometria 20 mesh de tamanho de partícula. CAPÍTULO III – METODOLOGIA | 25 3.3 Aquisição dos espectros NIR Os espectros das amostras foram obtidos usando um espectrofotômetro modelo Spectrum 400 FT-IR/FT-NIR da Perkin Elmer, equipado com acessório de NIRA, na faixa de 10000 a 4000 cm-1. Todos os espectros foram obtidos com média de 16 varreduras e resolução de 8 cm-1. A temperatura foi controlada a 23 ± 1ºC durante todo o processo de aquisição espectral. Os espectros do branco foram feitos usando um Spectralon® padrão. Estes padrões são constituído por material polimérico, quimicamente inerte, que podem oferecer os mais altos valores de reflectância difusa de qualquer substância conhecida. 3.4 Tratamentos quimiométricos e softwares Estratégias de pré-processamento dos dados foram avaliadas com a finalidade de melhorar a eficiência dos modelos. Além dos dados sem préprocessamento, os modelos foram desenvolvidos usando os dados tratados com SNV (BARNES et al., 1989) e o método MSC, o método Savitzky - Golay (SAVITZKY e GOLAY, 1964), onde foram utilizados diferentes tamanhos de janelas (11, 15, 17 e 21 pontos) e derivação dos dados na primeira ordem. Os pré-processamentos utlizados para essas matrizes foram usados para contornar alguns efeitos nos espectros como espalhamento do sinal, desvio de linha de base, e, também com o intuito de melhor discriminação entre as classes das amostras. Uma análise exploratória foi realizada inicialmente a fim de observar a existência de agrupamentos naturais. Para este efeito, a PCA foi aplicada. O gráfico dos escores foi observado com o intuito de auxiliar na detecção e eliminação de amostras anômalas. Em relação a faixa de CAPÍTULO III – METODOLOGIA | 26 trabalho, o gráfico de pesos foi utilizado para a escolha da faixa a ser utilizada. As amostras foram divididas em conjuntos de treinamento, validação e teste, na proporção de 60%, 20% e 20% respectivamente. Essa divisão foi realizada pelo algoritmo KS (KENNARD e STONE, 1969). O algoritmo KS foi aplicado separadamente para cada classe do conjunto de dados, como citado por PONTES et al. (2005). As Tabelas 3.1 e 3.2 apresentam o número de amostras para cada subconjunto considerando as duas matrizes estudadas. Tabela 3.1 Número de amostras dos conjuntos de treinamento, validação e teste em cada classe para as amostras de barra de cereais. Tipos Diet Convencional Light Total Conjuntos Treinamento 17 22 20 59 Validação 9 11 11 31 Teste 9 11 11 31 Tabela 3.2 Número de amostras dos conjuntos de treinamento, validação e teste em cada classe para as amostras de alface. Tipos Convencional Hidropônico Orgânico Total No Conjuntos Treinamento 18 27 15 60 desenvolvimento dos Validação 6 10 6 22 modelos de Teste 6 10 6 22 classificação LDA, três algoritmos de seleção de variáveis foram testados, o SPA, SW e GA. Usando o modelo SW-LDA, oito valores limites de coeficientes de correlação foram testados (0,10, 0,30, 0,50, 0,70, 0,80, 0,90, 0,95 e 0,99) para decidir quais as variáveis selecionadas foram mais relevantes (CANECA et al., 2006). O valor do limiar escolhido no modelo SW-LDA, baseado no conjunto de validação, foi de 0,90 para a matriz de barra de cereais, enquanto que para a matriz de alface foi 0,99. CAPÍTULO III – METODOLOGIA | 27 O modelo GA-LDA, foi executado para 100 gerações com 200 cromossomos em cada geração. Cruzamento e mutação foram definidos com probabilidades de 60% e 10%, respectivamente. Essa rotina foi repetida 10 vezes devido à sua natureza estocástica, mantendo-se a melhor solução encontrada (PONTES et al., 2005). O SPA-LDA também foi avaliado com base no risco médio de uma classificação incorreta realizada pelas variáveis selecionadas no modelo LDA. (PONTES et al., 2005) As amostras de treinamento e as amostras de validação foram utilizadas no procedimento de cálculo dos modelos de classificação. As amostras de teste, entretanto, só foram utilizadas para fins de comparação de desempenho dos modelos construídos. O pré-processamento dos dados e a PCA foram realizados utilizando o software Unscrambler® X.1 (CAMO ASA, da Noruega). Os algoritmos KS, SW-LDA, GA-LDA e SPA-LDA foram executados em ambiente do Matlab versão 6.5 (Mathworks, EUA). A eficiência dos modelos foi avaliada em termos de erros de classificação total, ou seja, para os três subconjuntos de amostras, e do conjunto de teste. Esse termo de classificação correta (TCC) é calculado dividindo-se o número de acertos pelo número total de amostras, multiplicando por 100%. CAPÍTULO IV . RESULTADOS E DISCUSSÃO CAPÍTULO IV – RESULTADOS E DISCUSSÃO | 29 4 RESULTADOS E DISCUSSÃO 4.1 .1 Barra de cereais A Figura 4.1 apresenta os espectros sem pré-processamento processamento na região do NIR registrados na faixa de 10000 cm-1 a 4000 cm-1. As cores verde, azul e vermelho representam as classes diet, convencional e light, respectivamente. Figura 4.1. Espectros NIR das 121 amostras de barras arras de cereais. Os espectros mostram bandas características de carboidratos, tais como amido e açúcares em 4760, 6711 e 6740 cm-1, proteínas de 48784878 4854 cm-1 e 6667-6536 6536 cm-1, gorduras em 4200 e 4830 cm-1 e umidade em 5135 e 8310 cm-11 (WORKMAN , 1996; WORKMAN & WEYER , 2008). 2008) Na Figura 4.2 2 é possível observar que em algumas regiões do espectro há algumas diferenças entre as absorbâncias médias de cada classe (diet - verde, e, convencional - azul e light - vermelho). Na região em torno de 7002 cm-1, destacada na figura, nota-se se uma diferença entre a média dos espectros da classe diet em comparação com as classes CAPÍTULO IV – RESULTADOS E DISCUSSÃO | 30 convencional e light no que se refere ao primeiro sobretom O-H O proveniente de carboidratos. O mesmo acontece na região por volta de 5002 cm-1, região característica das combinações O--H, também aos carboidratos, onde a média da classe convencional se destaca. Figura 4.2. Espectros NIR das médias das classes de barras de cereais (região região destacada referente ao carboidrato). A Figura 4.3 apresenta o gráfico dos escores (PC2 x PC1) resultante da aplicação da d PCA para os espectros brutos do NIR. PC1 e PC2 explicam 94% e 2% da variância dos dados, respectivamente. respectivamente Como pode ser visto, há uma dispersão substancial e sobreposição dos tipos de barra de cereais. Detectou-se se uma amostra anômala nessa etapa exploratória. exploratória Esse outliers foi retirado da matriz de dados ficando um total das 121 amostras. CAPÍTULO IV – RESULTADOS E DISCUSSÃO | 31 scores PC2 x PC1, para as 121 amostras de Figura 4.3. Gráfico dos escores barra de cereais ( convencional, onvencional, light e diet). Nota-se também a não formação de agrupamentos naturais das amostras de barra de cereais, portanto, os procedimentos de seleção de variáveis espectrais são necessários a fim de obter uma melhor discriminação scriminação entre as classes. Diferentes pré-processamento processamento foram realizados, como mostrado na Tabela 4.1 a seguir.. A tabela apresenta valores de TCC total (conjuntos de treinamento, validação e teste teste) dos dados com e sem pré pré- processamentos. Tabela 4.1 Tabela dos erros dos conjuntos de amostras de barras de cereais, c dos modelos obtidos a partir de diferentes pré-processamentos. pré processamentos. PRÉPROC. SEM P. SNV GA-LDA Var. Sel. Erros Trein. Val 17 2 1 TCC(%) 95,0 ,0 Var. Erros Sel. Trein. Val 24 2 3 TCC(%) 93,4 SW-LDA SPA-LDA Var. Erros Var. Erros Test Sel. Trein. Val Test Sel. Trein. Val Test 3 4 25 10 12 12 6 3 6 61,1 87,6 Var. Erros Var. Erros Test Sel. Trein. Val Test Sel. Trein. Val Test 3 17 4 4 3 8 10 4 4 90,9 85,1 CAPÍTULO IV – RESULTADOS E DISCUSSÃO DERIV. MSC | 32 Var. Erros Var. Erros Var. Erros Sel. Trein. Val Test Sel. Trein. Val Test Sel. Trein. Val Test 17 4 5 2 46 0 9 11 7 13 5 3 TCC(%) 90,9 83,5 82,6 Var. Erros Var. Erros Var. Erros Sel. Trein. Val Test Sel. Trein. Val Test Sel. Trein. Val Test 28 0 3 4 10 10 5 6 8 10 3 6 TCC(%) 94,2 82,6 84,3 Como pode ser observado, os resultados para os modelos SW-LDA e SPA-LDA estão abaixo de 90%, com exceção do modelo SW-LDA com os dados de pré-processamento SNV. Porém, entre os resultados para os diferentes pré-tratamentos do modelo GA-LDA, notam-se valores de porcentagem bem próximos como, 95% para os dados sem préprocessamento, 93,4% e 94,2% para os dados com pré-processamento SNV e MSC respectivamente. Assim, optou-se por utilizar os dados com 1ª derivada S. Golay, janela de 21 pontos e polinômio de 2ª ordem. Entre os modelos LDA , os piores resultados de validação em termos de TCC foram obtidos com o SW, onde foram classificadas corretamente somente 22 das 31 amostras de validação. Este resultado corresponde a um TCC de 70,9%. Os valores de TCC no conjunto de validação obtido por GA-LDA e modelos SPA-LDA foram de 83,9%. Com isso, consegue-se diferenciar as classes do três tipos (diet, convencional e light) tanto com o modelo SPALDA quanto com GA-LDA, sendo que o GA-LDA obteve mais êxito na discriminação entre as classes devido as suas escolhas nas variáveis selecionadas e maior TCC no conjunto completo das amostras. Obtidos os modelos, o número de variáveis selecionadas pelo SW, SPA e GA foram 46, 7 e 17, como pode ser visto nas Figuras 4.4, 4.5, 4.6, respectivamente. As variáveis selecionadas pelos três algoritmos são alocadas nas médias dos espectros das 121 amostras de barra de cereais. CAPÍTULO IV – RESULTADOS E DISCUSSÃO | 33 Figura 4.4. Representação das variáveis ariáveis selecionadas pelo algoritmo SW para as amostras de barra de cereais. Figura 4.5. Representação das Variáveis selecionadas pelo algoritmo SPA para as amostras de barra de cereais. CAPÍTULO IV – RESULTADOS E DISCUSSÃO | 34 Figura 4.6. Representação das variáveis ariáveis selecionadas pelo algoritmo GA para as amostras de barra de cereais (região destacada referente à sacarose). sacarose) Como pode ser observado na Figura 4.6,, o GA selecionou números de onda em torno de 8040 cm-1 e 8500 cm-1, que podem ser atribuídos ao segundo sobretom de estiramentos C-H C H provenientes de sacarose (FILHO, 2009; WORKMAN , 1996; WORKMAN & WEYER , 2008). É interessante notar que essas variáveis não foram selecionados pelos algoritmos SW e SPA apresentados tados nas Figuras 4.4 e 4.5,, respectivamente. Esta diferença possivelmente explica os melhores resultados de discriminação obtidos com a seleção GA. Pode-se se observar que uma grande quantidade de variáveis foram selecionadas por SW (Figura ( 4.4) localizadas s na região entre 9002 e 10000 cm-1, e pode ser atribuído ao segundo sobretom de estiramento NN H associado com a proteína. Estas variáveis não estavam entre aquelas selecionados pelo SPA e GA algoritmo (Figuras ( 4.5 e 4.6 .6). Ainda, as variáveis selecionadas pelos algoritmos GA e entre 62006900 cm-1 que podem m ser atribuídas as combinações O-H H dos carboidratos (FILHO, 2009; WORKMAN, 1996; WEYER & WORKMAN , 2008). CAPÍTULO IV – RESULTADOS E DISCUSSÃO O desempenho dos modelos LDA obtidos com | 35 as variáveis selecionadas lecionadas pode ser visualizado através dos escores mostrados nas Figuras 4.7, 4.8 e 4.9, para SW-LDA, SPA-LDA LDA e GA GA-LDA, respectivamente. As figuras ilustram os pontos das duas primeiras funções discriminantes (DF2 × DF1) para o conjunto dos d dados em geral. Figura 4.7. Gráfico dos escores de DF2 x DF1 para o modelo SW-LDA, considerando as 121 amostras de barra de cereais ( convencional, onvencional, light e diet). CAPÍTULO IV – RESULTADOS E DISCUSSÃO | 36 SPA Figura 4.8. Gráfico dos escores de DF2 x DF1 para o modelo SPA-LDA, considerando as 121 amostras de barra de cereais ( convencional, onvencional, light e diet). Figura 4.9. Gráfico dos escores de DF2 x DF1 para o modelo GA-LDA, GA considerando as 121 amostras de barra de cereais ( convencional, onvencional, light e diet). CAPÍTULO IV – RESULTADOS E DISCUSSÃO | 37 Observa-se se na Figura 4.7 que ao longo da DF1 uma sobreposição entre as classes das amostras de barra de cereais, mas na direção da DF2, uma separação da classe light das demais, diet e convencional. Para os modelos LDA obtidos a partir dos algoritmos SPA e GA, Figuras 4.8 e 4.9, observa-se se um comportamento similar ao longo da DF1 e DF2. A DF1 separa as classes de amostras do tipo diet das demais, light e convencional e a DF2 separa as classes light da convencional. Possivelmente, essa separação no modelo GA-LDA LDA ao longo da DF1 pela pela ausência de sacarose, variável selecionada nessa banda característica de 8500 cm-1. A Figura 4.10 apresenta o gráfico de pesos das variáveis escolhidas pelo modelo GA-LDA.. Figura 4.10. Gráfico dos pesos das variáveis selecionadas pelo GA-LDA, para as 121 amostras de barra de cereais As variáveis de maiores maior pesos s tanto para a DF1 como para a FD2 foram a 11 e 12 2 correspondendo aos ao números de ondas 4660 e 4658 cm1 , referente à presença ça de um segundo sobretom de C-H, H, banda associada a gordura e combinação de estiramentos C-H. C Essas bandas tem correlação com a classe das amostras diet separadas pela DF1 das classes das amostras light e convencional, ou seja, pela ausência de gordura nas CAPÍTULO IV – RESULTADOS E DISCUSSÃO | 38 amostras diet. Por outro lado, a FD2 separa a classe light da classe convencional pela diferenciação de 25% de gordura. Os modelos LDA obtidos com as variáveis selecionadas por algoritmos SW, SPA e GA foram aplicados à classificação de um conjunto de teste. Na Tabela 4.2 está resumido os resultados dos modelos SWLDA, SPA-LDA e GA-LDA em termos de classificações corretas (índice previsto igual para índice correto) e classificações incorretas (índice tipo previsto diferente do índice correto) para o conjunto de teste. Nesta tabela, o valor de N representa o número de amostras em cada conjunto, e nota-se que os melhores resultados de modelos LDA foram alcançados com GA, que classificou corretamente 29 das 31 amostras de teste. Este desempenho da classificação não foi conseguida usando o SW-LDA, que teve uma taxa de apenas 64,5% de classificação correta. Como pode ser visto nessas tabelas, os erros mais frequentes ocorreram entre os tipos de light e convencional. De fato, estes alimentos têm os mesmos nutrientes, mas, por vezes, em diferentes concentrações. Tabela 4.2 Resultados de classificação obtidos com os modelos SW-LDA, SPALDA e GA-LDA para o conjunto de teste das amostras de barra de cereais. (1) diet; (2): convencional e (3) light. Conjunto de Teste Índ. de classe verdadeiro SW-LDA (46)* SPA-LDA (7) Índice de classe Previsto N TCC (%) 1 2 3 4 5 TCC (%) 1 2 3 - 8 1 1 9 2 11 64,5 1 8 2 90,3 - 3 11 1 2 8 - *0,90 GA-LDA (17) 1 2 3 - 8 1 - 10 1 93,5 - 1 10 TCC (%) - 11 1 10 CAPÍTULO IV – RESULTADOS E DISCUSSÃO | 39 4.2 Alface A Figura 4.11 1 apresenta os espectros brutos na região NIR registrados na faixa de 10000 cm-1 a 4000 cm-1. Figura 4.11. Espectros brutos na região NIR (10000-4000 (10000 cm-1) das amostras de alface. Os espectros mostram as bandas características de carboidratos em 6800 e 4770 cm-1, proteínas entre 4600 e 6660 cm-1, lipídios em 4200, 4830, 5200, 8500 cm-1 e umidade próximo a 4545 cm-1 (WORKMAN, 1996; WORKMAN e WEYER, 2008). Toda oda a faixa espectral foi particionada a fim de e estudar a região que indicaria uma melhor discriminação entre as amostras. As regiões selecionadas foram: foram de 10000 cm-1 - 7746 cm-1, 7744 cm-1 - 6068 cm-1, 6066 cm-1 - 5502 cm-1 e 5500 cm-1 – 4000 cm-1. A faixa 10000 cm-1 - 7746 cm-1 continha bastante ruído e, portanto, portanto não foi utilizada. A região de 5500 - 4000 cm-1 foi a utilizada, ilustrada na Figura 4.12. A escolha dessa região foi auxiliada pelo uso do gráfico de pesos, CAPÍTULO IV – RESULTADOS E DISCUSSÃO | 40 ferramenta essa vista na etapa da análise exploratória, como mostrado na Figura 4.13. 1 Figura 4.12. Espectros brutos na região NIR selecionada (5500-4000 cm) das amostras de alface lface. Figura 4.13. Gráfico de pesos na faixa de 10000 – 4000 cm-1. (variáveis de maiores pesos na área destacada) CAPÍTULO IV – RESULTADOS E DISCUSSÃO | 41 A Figura 4.14 4.. apresenta o gráfico dos escores escore resultante da aplicação da PCA aos os espectros brutos NIR. Como pode ser visto, não há formação de agrupamentos naturais e oberva-se oberva se uma sobreposição das classes quanto as formas de cultivo. Figura 4.14. Gráfico dos escores e PC2 x PC1, para ara as 104 amostras de alface ( Convencional, Hidropônico e Orgânico). A Figura 4.15 5 apresenta os espectros médios relativos a cada classe das amostras de alface. É possível observar que os espectros médios das classes de alface são similares visualmente, não apresentando diferenças renças significativas, a não ser pela diferença diferença de valores de absorbância. Nota-se se ainda que em algumas regiões do espectro, como nas regiões entre 5500-5302 5500 cm-1, 4902-4302 cm-1, 4200-4102 4200 cm-1, os espectros das classes (hidropônico (hidropônico e orgânico) são bastante semelhantes em relação aos valores de absorbância. Contudo, na região em torno de 5200 cm-1 (região destacada) características da banda de lipídios. elas diferem, provavelmente, pela CAPÍTULO IV – RESULTADOS E DISCUSSÃO | 42 Figura 4.15. Espectros NIR das médias das classes (convencional – preto, hidropônico – vermelho e orgânico – azul) (área destacada pela característica de lipídios). Devido à grande semelhança entre os espectros apresentados na Figura 4.15, faz-se se necessário o uso de métodos de seleção de variáveis para obtenção de um modelo com maior capacidade de discriminação entre as classes estudadas. Na Tabela 4.3 .3 são apresentadas os resultados de TCC para os modelos obtidos com os diferentes pré-processamento. pré Como podem ser observados, os melhores resultados foram obtidos com os dados sem pré-processamento, pré processamento, entretanto, os dados derivados com S.Golay,, 1ª derivada, janelas de 21 pontos, polinômio de 2ª ordem para o modelo GA-LDA LDA com 96,1% 9 de e taxa de classificação correta, correta foi escolhido por possuir menor número de erro no conjunto conjunt teste em comparação aos outros pré-processamentos. pré Tal escolha se explica também porque os dados derivados podem não conter características físicas nos espectros NIR como, desvio de linha de base e espalhamento de sinal, características estas tas presentes nos dados sem pré-processamento processamento e isso pode influenciar nos modelos de classificação a ser desenvolvido. CAPÍTULO IV – RESULTADOS E DISCUSSÃO | 43 Tabela 4.3 Tabela dos erros dos conjuntos de amostras de alface dos modelos construídos a partir de diferentes pré-processamentos. PRÉPROC. SEM P. GA-LDA Var. Sel. Erros Trein. Val 25 2 0 TCC(%) 97,1 SNV Var. Erros Sel. Trein. Val 30 1 0 TCC(%) 96,1 DERIV. Var. Erros Sel. Trein. Val 31 0 2 TCC(%) 96,1 MSC Var. Erros Sel. Trein. Val 24 1 3 TCC(%) 93,3 SW-LDA Var. Erros Sel. Test Trein. Val 1 5 22 8 66,3 Var. Erros Test Sel. Trein. Val 3 10 12 8 75,9 Var. Erros Test Sel. Trein. Val 2 30 4 5 84,6 Var. Erros Test Sel. Trein. Val 3 10 14 8 73,1 SPA-LDA Var. Erros Sel. Test Trein. Val 5 14 7 5 81,7 Var. Erros Test Sel. Trein. Val 5 9 12 2 83,6 Var. Erros Test Sel. Trein. Val 7 4 14 6 76,9 Var. Erros Test Sel. Trein. Val 6 10 11 6 78,8 Test 7 Test 3 Test 4 Test 5 Entre os modelos LDA , os piores resultados de validação em termos de TCC foram obtidos com SPA-LDA onde somente 16 das 22 amostras de validação foram classificadas corretamente. Este resultado corresponde a um TCC de 72,7%, indicando a pouca discriminação entre as classes para o conjunto de validação. O GA, no entanto, proporcionou melhores resultados na validação para todos os três tipos de cultivo, classificando corretamente as amostras desse conjunto com um TCC de 90,9%. O modelo SPA-LDA obteve um TCC total (com amostras de treinamento, validação e teste) um valor de 76,9%, ou seja, classifica corretamente 80 amostras das 104 no total. Já para o modelo GA-LDA, uma melhor discriminação entre as classes das amostras de alface foi observada (TCC de 96,1%) baseado nos três conjuntos das amostras. As Figuras 4.16, 4.17 e 4.18 a seguir mostram os números de variáveis selecionadas pelo SW, SPA e GA de 30, 4 e 31, respectivamente. CAPÍTULO IV – RESULTADOS E DISCUSSÃO | 44 Figura 4.16. Representação das variáveis ariáveis selecionadas pelo algoritmo al SW para as amostras de alface. alface Figura 4.17. Representação das variáveis variáveis selecionadas pelo algoritmo SPA para as amostras de alface. alface CAPÍTULO IV – RESULTADOS E DISCUSSÃO | 45 Figura 4.18. Representação das variáveis variáveis selecionadas pelo algoritmo GA para as amostras de alface. alface O algoritmo GA seleciona vários números de onda em uma única banda, enquanto que o SPA (Figura 4.17) seleciona poucos números de ondas,, isso é causado por problemas de colinearidade por parte do GA. GA Esse fato pode ter contribuído contribu do para que o GA tenha melhor poder discriminatório quando comparado ao SPA.. Adicionalmente, Adicionalmente o SPA selecionou variáveis na n próximo a 4200 cm-1 e 4800 cm-1 , que podem ser atribuídas à presença de estiramentos C-H C e CH2 associada aos lípidios, lípid bem como bandas de combinação N-H e O-H, H, os quais podem ser atribuídas às proteínas e carboidratos, ca , respectivamente (WORKMAN, 1996; WORKMAN e WEYER, 2008). As variáveis correspondentes a estas bandas também foram selecionados pelos outros dois algo algoritmos estudados. Além disso, SPA e GA selecionaram variáveis na região de 5300 cm-1 associados a CONH2, proteínas (WORKMAN, WORKMAN, 1996). 1996 O desempenho dos modelos LDA construídos com as variáveis selecionadas lecionadas pode ser visualizado através dos escores mostrados nas Figuras 4.19, 4.20 20 e 4.21, para SW-LDA, SPA--LDA e GA-LDA, CAPÍTULO IV – RESULTADOS E DISCUSSÃO | 46 respectivamente. Os gráficos apresentam as funções discriminantes (DF2 × DF1) para ra o conjunto dos dados. dados Figura 4.19. Gráfico dos escores de DF2 x DF1 para o modelo SW-LDA, considerando as 104 amostras de alface a ( convencional, hidropônico e orgânico). Figura 4.20. Gráfico dos escores de DF2 x DF1 para o modelo SPA-LDA, hidropônico e considerando as 104 amostras de alface ( convencional, orgânico). CAPÍTULO IV – RESULTADOS E DISCUSSÃO | 47 Figura 4.21. Gráfico dos escores de DF2 x DF1 para o modelo GA-LDA, considerando as 104 amostras de alface ( convencional, hidropônico e orgânico). Nota-se nas Figuras 4.19, 4.20 e 4.21 que para os três modelos modelos obtidos há uma mesma tendência na separação das classes ao longo da DF1 e DF2. A DF1 separa as amostras da classe hidropônico das demais, orgânico e convencional, e, essa discriminação possivelmente é causada pelo teor de nitrato presente em maior quantidade nas plantas de cultivo hidropônico do que nas plantas de cultivo orgânico orgânico e convencional. Já na DF2 para os modelos obtidos pelo SPA-LDA SPA (Figura Figura 4.20), observase uma sobreposição das classes convencional e orgânico, enquanto en que para os modelos GA--LDA (Figura 4.21) e SW-LDA (Figura Figura 4.19), notase a separação dessas classes (orgânico e convencional) devido a umidade. A Figura 4.22 mostra o gráfico dos pesos das variáveis escolhidas pelo modelo GA-LDA. CAPÍTULO IV – RESULTADOS E DISCUSSÃO | 48 Figura 4.22. Gráfico dos pesos das variáveis selecionadas pelo GA-LDA, para as 104 amostras de alface A partir o gráfico dos pesos na Figura 4.22, observa-se que entre as variáveis escolhidas pelo modelo GA-LDA, as variáveis de maiores pesos para a FD1 foram as variáveis 19, 20 e 21 correspondendo aos números de ondas 4528 cm-1 4524 cm-1 e 4512 cm-1,respectivamente. Esses números de onda são referentes a banda de proteína (CONH2), por isso a função discriminante 1 separa as classes das amostras provenientes do cultivo hidropônico das demais classes (orgânico e convencional). Já para a FD2 as variáveis de maiores pesos foram 17 e 18, correspondendo aos números de ondas 4568 cm-1 e 4566 cm-1, atribuídos a banda de umidade (H2O). Esse resultado faz sentindo pois as variáveis selecionadas nessa região de 4545 cm-1 tem uma melhor discriminação das classes orgânico e convencional ao longo da DF2 (Figuras 4.19 e 4.21). Os modelos LDA obtidos com as variáveis selecionadas por SW, SPA e algoritmos GA foram aplicados à classificação de um conjunto de teste. A Tabela 4.4 resume os resultados em termos de classificação correta para os três modelos. CAPÍTULO IV – RESULTADOS E DISCUSSÃO | 49 Tabela 4.4 Resultados de classificação obtidos com os modelos SW-LDA, SPALDA e GA-LDA para o conjunto de teste das amostras de alface (1): Convencional; (2): Hidropônico e (3): Orgânico. Conjunto de Teste Índ. de classe verdadeiro SW-LDA (30)* SPA-LDA (4) GA-LDA (31) Índice de classe Previsto N 1 6 2 10 3 6 TCC (%) 1 2 3 5 1 68,2 1 5 TCC (%) 1 2 3 - 2 1 9 - 81,8 - - 1 - 1 2 3 3 5 - 1 10 - 90,9 - - TCC (%) 6 1 10 - 5 *0,99 É interessante notar que a maior taxa de erros nos modelos de GALDA e SW-LDA está entre as classes 1 (convencional) e classe 3 (orgânico). No entanto, o modelo de GA-LDA mostrou apenas dois erros devido a uma amostra do tipo orgânico ser classificada como convencional e uma amostra convencional ser classificada como orgânica. O desempenho da classificação não foi alcançado por SW-LDA, que teve uma taxa de apenas 68,2% de classificação correta. Estes erros podem ser atribuídos a semelhanças entre os tipos de cultivos em questão, da concentração de nutrients, teor de água presente nas amostras ou a baixa sensibilidade do NIR. CAPÍTULO V . CONCLUSÃO CAPÍTULO V – CONCLUSÃO | 51 5 CONCLUSÃO Estes estudos de caso, obtidos de amostras de barra de cereais e alface de tipos e formas de cultivos distintos, mostraram que a seleção do número de onda pode ser a chave para uma discriminação correta das amostras, especialmente quando o modelo GA-LDA é usado. Os resultados mostraram ainda a importância da análise exploratória dos dados, bem como a escolha da região espectral e pré-processamento dos dados e realização da divisão dos conjuntos de amostras, como conjunto de treinamento, validação e teste. Os métodos desenvolvidos baseados em análises screening, apresentaram ser simples e rápidos, proporcionando a identificação das classes das matrizes avaliadas com uma redução de custo. Os resultados obtidos indicaram que o método proposto neste trabalho apresentou ser uma alternativa promissora para classificar amostras de barra de cereais e alface. CAPÍTULO VI . REFERÊNCIAS CAPÍTULO VI – REFERÊNCIAS | 53 REFERÊNCIAS ALAMPRESE, C.; CASALE, M.; SINELLI, N.; LANTERI, S.; CASIRAGHI, E., Detection of minced beef adulteration with turkey meat by UVevis, NIR and MIR spectroscopy, LWT - Food Science and Technology,. 53: 225, 2013. ANVISA(a). Portaria ANVISA SVS/MS No. 27 de 13.01.1998. Disponível em: <http://portal.anvisa.gov.br/wps/wcm/connect/9180ca00474581008d31d d3fbc4c6735/PORTARIA_27_1998.pdf?MOD=AJPERES >. Acessado em: 15 de novembro de 2013. ANVISA(b). Portaria ANVISA SVS/MS No. 29 de 13.01.1998. Disponível em: <http://portal.anvisa.gov.br/wps/wcm/connect/e155af80474597059f50df 3fbc4c6735/portaria_29.pdf?MOD=AJPERES>. Acessado em: 15 de novembro de 2013. AOAC. Official methods of analysis of the association of official analytical chemists. 15ª edição. Washington, D.C.: AOAC, 1990. BARNES, R. J.; DHANOA, M. S.; LISTER, S. J., Standard normal variate transformation and de-trending of near-infrared diffuse reflectance spectra. Applied Spectroscopy, 43: 772, 1989. BERRUETA, L. A.; ALONSO-SALCES, R. M.; HÉBERGER, K., Supervised pattern recognition in food analysis, Journal of Chromatography A, 1158: 196, 2007. CAPÍTULO VI – REFERÊNCIAS | 54 BEVILACQUA, M.; BUCCI, R.; MATERAZZI, S.; MARINI, F., Application of near infrared (NIR) spectroscopy coupled to chemometrics for dried eggpasta characterization and egg content quantification, Food Chemistry, 140: 726, 2013. CANECA, A. R.; PIMENTEL, M. F.; GALVÃO, R. K. H.; MATTA, C. E.; CARVALHO, F. R.; RAIMUNDO JR., I. M.; PASQUINI, C.; ROHWEDDER, J. J. R., Assessment of infrared spectroscopy andmultivariate techniques for monitoring the service condition of diesel-engine lubricating oils, Talanta, 70: 344, 2006. CASTRO, A. A. M.; PRADO, P. P. L. Algoritmos para reconhecimento de padrões, Revista de Ciências Exatas, 5-8: 129-145, 1999-2002. CEN, H.; HE, Y., Theory and application of near infrared reflectance spectroscopy in determination of food quality, Trends in Food Science Technology, 18: 72, 2007. CHEN, Q.; ZHAO, J.; HUANG, X.; ZHANG, H.; LIU, M., Simultaneous determination of total polyphenols and caffeine contents of green tea by near-infrared reflectance spectroscopy, Microchemical Journal, 83: 42, 2006. CONDE, B.; GOLDSCHMIDT, R.; FERLIN, C.; SOARES, J., Seleção de Variáveis na descoberta de conhecimento em Bases de Dados, 2º Congresso Científico da UniverCidade – Rio de Janeiro, 2007. COMETTI, N. N.; MATIAS, G. C. S.; ZONTA, E.; MARY, W.; FERNANDES, M. S., Compostos nitrogenados e açúcares solúveis em tecidos de alface orgânica, hidropônica e convencional, Horticultura Brasileira, 22: 748, 2004. CAPÍTULO VI – REFERÊNCIAS | 55 COSTA FILHO, P. A., Estudo comparativo de técnicas de inteligência artificial e modelos lineares em determinações quantitativas no infravermelho próximo, Tese de doutorado, UNICAMP. Campinas, São Paulo, 2003. CYBERDIET. Doenças causadas pela má alimentação. Disponível em: <http://cyberdiet.terra.com.br/doencas-causadas-pela-ma-alimentacao12-1-12-55.html>. Acessado em: 15 de novembro de 2013. CRUZ, A. G.; CADENA, R. S.; ALVARO, M. B. V. B.; SANT'ANA, A. S.; OLIVEIRA, C. A. F.; FARIA, J. A. F.; BOLINI, H. M. A.; FERREIRA, M. M. C., Assessing the use of different chemometric techniques to discriminate low-fat and full-fat yogurts, LWT - Food Science and Technology, 50: 210, 2013. DAROLT, M. R. Comparação da Qualidade do Alimento Orgânico com o Convencional In: STRIGHETA, P.C & MUNIZ, J.N. Alimentos Orgânicos:Produção, Tecnologia e Certificação.1 ed.Viçosa: p. 289-312. 2003. DOMINGUES, D. S.; TAKAHASHI, H. W.; CAMARA, C. A. P.; NIXDORF, S. L., Automated system developed to control pH and concentration of nutrient solution evaluated in hydroponic lettuce production, Computers and Electronics in Agriculture, 84: 53, 2012. FARINAZZI-MACHADO, F. M. V.; BARBALHO, S. M.; OSHIIWA, M.; GOULART, R.; PESSAN JUNIOR, O, Use of cereal bars with quinoa (Chenopodium quinoa W.) to reduce risk factors related to cardiovascular diseases, Ciência e Tecnologia de Alimentos, 32: 239, 2012. FAVARO-TRINDADE, C. S.; MARTELLO, L. S.; MARCATTI, B.; MORETTI, T. S.; PETRUS, R. R.; ALMEIDA, E.; FERRAZ, J. B. S., Efeito dos Sistemas de CAPÍTULO VI – REFERÊNCIAS | 56 Cultivo Orgânico, Hidropônico e Convencional na Qualidade de Alface Lisa, Brazilian Journal of Food Technology, 10: 111, 2007. FERNANDES, A. P., Emprego de estratégias quimiométricas para a diferenciação de alimentos de acordo com as formas de produção. Tese de doutorado. UFSCar – São Carlos, 2006. FERREIRA, D. S.; GALÃO, O. F.; PALLONE, J. A. L.; POPPI, R. J., Comparison and application of near-infrared (NIR) and mid-infrared (MIR) spectroscopy for determination of quality parameters in soybean samples, Food Control, 35: 227, 2014. FERREIRA, L. L.; ANICETO, R. R.; MONTENEGRO, I. N. A.; RIBEIRO, T. S.; ALMEIDA, D. G.; PORTO, V. C. N.,Comportamento de variedades de alface na semeadura de março no município de Areia-PB, Scientia plena, 9: 040202, 2013. FILGUEIRA, F. A. R., Novo manual de olericultura: agrotecnologia moderna na produção e comercialização de hortaliças. 2ª ed., UFV, 2003. FILHO, P. A. C., Rapid determination of sucrose in chocolate mass using near infrared spectroscopy, Analytica Chimica Acta, 631: 206, 2009. FISHER, R. A., The use of multiple measurements in taxonomic problems. Annals of Eugenics, 7: 179, 1936. FREIRE, A. G.; OLIVEIRA, F. A.; CARRILHO, M. J. S. O.; TEIXEIRA, M. K. O.; FREITAS, D. C., Qualidade de cultivares de alface produzida em condições Salinas, Revista Caatinga, 22: 81, 2009. GRANATO, D.; BRANCO, G. F.; FARIA, J. A. F.; CRUZ, A. G., Characterization of Brazilian lager and brown ale beers based on color, CAPÍTULO VI – REFERÊNCIAS | 57 phenolic compounds, and antioxidant activity using chemometrics, Journal of the Science of Food and Agriculture, 91: 563, 2011. GUIVANT, J. A. S., Os supermercados na oferta de alimentos orgânicos: apelando ao estilo de vida ego-trip, Ambiente & Sociedade, 6: 63, 2003. HAIR, J. F.; TATHAM, R. L.; ANDERSON, R. E.; BLACK, W., Análise Multivariada dos dados, 5ª Edição, Bookman, 2005 Porto Alegre HENZ, G. P.; SUINAGA, F. A., Tipos de Alface Cultivados no Brasil, Comunicado Técnico 75, 2009. INSTITUTO ADOLFO LUTZ. Métodos químicos e físicos para análise de alimentos. 3ª edição. São Paulo, 1985. KANO, C.; CHAVES, F. C. M.; BERNI, R. F.; GONÇALVES, N. R.; SUINAGA, F. A., Avaliação de cultivares de alface crespa sob cultivo protegido no município de Iranduba/AM, Horticultura Brasileira, 30: S390, 2012. KENNARD, R. W.; STONE, L. A., Computer aided design of experiments,Technometrics, 11: 137, 1969. KONZEN, P. H. A.; FURTADO, J. C.; CARVALHO, C. W.; FERRÃO, M. F.; MOLZ, R. F.; BASSANI, I. A.; HÜNING, S. L., Otimização de métodos de controle de qualidade de fármacos usando algoritmo genético e busca tabu, Pesqui. Oper.,23: 189, 2003. LIMA, M. E., Avaliação do desempenho da cultura da alface (Lactuca sativa) cultivada em sistema orgânico de produção, sob diferentes lâminas de irrigação e coberturas do solo. Dissertação de mestrado, Seropédica – RJ, 2007. CAPÍTULO VI – REFERÊNCIAS | 58 LIMA, K. M. G.; TREVISAN, M. G.; POPPI, R. J.; ANDRADE, J. C., Determinação não destrutiva do nitrogênio total em plantas por espectroscopia de reflectância difusa no infravermelho próximo, Quim. Nova, 31: 700, 2008. LOBATO, L. P.; PEREIRA, A. E. C.; LAZARETTI, M. M. L.; BARBOSA, D. S.; CARREIRA, C. M.; MANDARINO, J. M. G.; GROSSMANN, M. V. E., Snack bars with high soy protein and isoflavone content for use in diets to control dyslipidaemia, International Journal of Food Sciences and Nutrition, 63: 49, 2012. LÓPEZ-GALVÉZ, F.; ALLENDE, A.; TRUCHADO, P.; MARTINEZ-SÁNCHEZ, A.; TUDELA, J. A.; SELMA, M. V.; GIL, M. I., Suitability of aqueous chlorine dioxide versus sodium hypochlorite as an effective sanitizer for preserving quality of fresh-cut lettuce while avoiding by-product formation. Postharvest Biology and Technology, 55: 53, 2010. LOUREDO, P., Nutrientes. Disponível em: < http://www.brasilescola.com/saude-na-escola/conteudo/nutrientes.htm>. Acessado em: 18 de novembro de 2013. MACDIARMID, J. I.; LOE, J.; KYLE, J.; MCNEILL, G., ‘‘It was an education in portion size’’. Experience of eating a healthy diet and barriers to long term dietary change, Appetite, 71: 411, 2013. MAPA(a). Ministério de Agricultura, Pecuária e Abastecimento,. Disponível em: <http://www.agricultura.gov.br/portal/page/portal/Internet- MAPA/pagina-inicial/desenvolvimento-sustentavel/organicos/o-que-eagricultura-organica/perguntas-e-respostas>. novembro de 2013. Acessado em: 15 de CAPÍTULO VI – REFERÊNCIAS | 59 MAPA(b). Ministério de Agricultura, Pecuária e Abastecimento,. Disponível em: <http://www.agricultura.gov.br/acessoainformacao/perguntas- frequentes>. Acessado em: 15 de novembro de 2013. MARTINEZ, M. I. V., Discriminação de alface orgânnicas e convencionais usando determinação elementar e métodos quimiométricos. Dissertação de mestrado, UFABC, Santo André, 2011. MATIAS, B., Consumo de alimentos saudáveis no Brasil cresce 82%. Disponível em: <http://www.agenciasebrae.com.br/noticia.kmf?canal=199&cod=100425 95>. Acessado em: 15 de novembro de 2013. MAZUR, L., Aplicação de metodologia por nir para determinação de metilxantinas presentes na erva-mate, Dissertação de mestrado, Universidade Federal Do Paraná, Curitiba – 2012. MELLO, A. V.; CASSIMIRO, T. A. S.; POSPISCHEK, V. S.; VILLARIM, W. L. F.; PEREIRA, I. R. O.; ABREU, E. S., Avaliação da composição centesimal e da rotulagem de barras de cereais, e-Scientia, 5: 41, 2012. MIYAZAWA, M.; KHATOUNIAN, C. A.; PENHA, L. A. O., Teor de nitrato nas folhas de alface produzida em cultivo convencional, orgânico e hidropônico, Agroecologia, fevereiro-março: 23, 2001. NETO, N. J. G.; PESSOA, R. M. L.; QUEIROGA, I. M. B. N.; MAGNANI, M.; FREITAS, F. I. S.; SOUZA, E. L.; MACIEL, J. F., Bacterial counts and the occurrence of parasites in lettuce (Lactuca sativa) from different cropping systems in Brazil, Food Control, 28: 47, 2012. NETO, B. B; SCARMINIO, I. S; BRUNS, R. E. 25 anos de quimiometria no Brasil, Química Nova, 29:1401, 2006. CAPÍTULO VI – REFERÊNCIAS | 60 OHSE, S.; RAMOS, D. M.; CARVALHO, S. M.; FETT, R.; OLIVEIRA, J. L. B., Composição centesimal e teor de nitrato em cinco cultivares de alface produzidas sob cultivo hidropônico, Bragantia, 68:.407, 2009. OLIVEIRA, C. F. P.; MALTA, H. L.; JESUS, M. A. C. L.; CRUZ, R. S.; CARDOSO, F. S. N., Desenvolvimento, avaliação sensorial e físico-química de barra de cereal de caju, Revista Brasileira de Tecnologia Agroindustrial, 7: 934, 2013. OMAIAA. Observatório dos Mercados Agrícolas e das Importações Agro – Alimentares. Disponível <http://www.observatorioagricola.pt/item.asp?id_item=133>. em: Acessado em: 17 de novembro de 2013. OMS. The World Health Report: Health 2000: Health Systems:Improving Performance, Geneva :2000. PASQUINI, C., Near infrared spectroscopy: Fundamentals, practical aspects and analytical applications, Journal of the Brazilian Chemical Society, 14: 198, 2003. PAIVA, C. L.; QUEIROZ, V. A. V.; RODRIGUES, J. A. S., Estudos sensoriais para determinação da vida de prateleira de barra de cereais com pipoca de sorgo, Revista Brasileira de Milho e Sorgo, 11: 302, 2012. PERTSCHY, P., Comparação do teor de sódio em alimentos convencionais, light e diet pela rotulagem dos produtos, Trabalho de Conclusão de Curso, UNICENTRO. Guarapuava, 2010. PONTES, M. J. C.; Algoritmo das projeções sucessivas para a seleção de variáveis espectrais em problemas de classificação. Tese de doutorado. UFPB, João Pessoa, 2009. CAPÍTULO VI – REFERÊNCIAS | 61 PONTES, M J C.; GALVAO, R. K. H.; ARAÚJO, M. C. U.; MOREIRA, P. N. T.; PESSOA NETO, O. D.; JOSÉ, G. E.; SALDANHA, T. C. B., The successive projections algorithm for spectral variable selection in classification problems, Chemometrics and intelligent laboratory systems, 78: 11, 2005. RIBEIRO, D. B. M., Desenvolvimento de metodologias analíticas multivariadas empregando espectroscopia Raman de baixa resolução amplificada por superfície, Tese de Doutorado em Ciências, Universidade Estadual de Campinas, Campinas, São Paulo, 2009. ROCHA, R. S. F. “Estudo de propriedades físico-químicas de resinas odontológicas: grau de conversão, dureza e expansão térmica.” Solteira – SP, Pós-Graduação Ilha em Ciências dos Materiais, UNESP, Dissertação de Mestrado, 2006. RODRIGUES, M. L.; FIORESE, F.; JÚLIO, T. S. K.; LIRA, R. K., Controle de qualidade e análise centesimal de uma barra de cereal, comercializada na cidade de Cascavel-PR, Cultivando o Saber, 4: 36, 2011. ROGGO, Y.; DUPONCHEL, L.; HUVENNE, J. P., Comparison of supervised pattern recognition methods with McNemar's statistical test application to qualitative analysis of sugar beet by near-infrared spectroscopy. Analytica Chimica Acta, 477: 187–200, 2003. ROVERSI, R. minimamente M.; MASSON, processada M. L., Qualidade acondicionada em da alface atmosfera crespa modificada, Ciência e Agrotecnologia, 28: 823, 2004. SALA, F. C.; COSTA, C. P., Retrospectiva e tendência da alfacicultura brasileira, Horticultura Brasileira, 30: 187, 2012. CAPÍTULO VI – REFERÊNCIAS | 62 SANTANA, L. R. R.; CARVALHO, R. D. S; LEITE, C. C.; ALCÂNTARA, L. M.; OLIVEIRA, T. W. S.; RODRIGUES, B. M., Qualidade física, microbiológica e parasitológica de alfaces (lactuca sativa) de diferentes sistemas de cultivo, Ciência e Tecnologia de Alimentos, 26: 264, 2006. SAVITZKY, A.; GOLAY, M. J. E., Smoothing and differentiation of data by simplified least squares procedures, Analytical Chemistry, 36: 1627, 1964. SCOTT, R.; DONOGHOE, M.; WATTS, G. F.; O'BRIEN, R.; PARDY, C.; TASKINEN, M. R.; DAVIS, T. M.; COLMAN, P. G.; MANNING, P.; FULCHER, G.; KEECH, A. C., Impact ofmetabolic syndrome and its components on cardiovascular disease eventrates in 4900 patients with type 2 diabetes assigned to placebo in the field randomised trial, Cardiovascular Diabetology, 10: 102, 2011. SILVA, T. C.; RODRIGUES, T. P.; CARVALHO, P. D.; OLIVEIRA, T. B.; CAMPOS, D. M. B., Encontro de rhabditis sp em alface lactuca sativa comercializada em Anápolis, Goiás, Brasil, Revista de Patologia Tropical, 42: 201, 2013. SILVERSTEIN, R. M; WEBSTER, F. X; KIEMLE, D. J. Identificação Espectrométrica de Compostos Orgânicos. Sétima Edição, Gen – LTC, 2007. SKOOG, D. A.; HOLLER, F. J.; NIEMAN T. A, Princípios de Análise Instrumental. Quinta Edição, Porto Alegre: Bookmam, 2002. SONNENBERG, L.; GELSOMIN, E.; LEVY, D. E.; RIIS, J.; BARRACLOUGH, S.; THORNDIKE, A. N.; A traffic light food labeling intervention increases CAPÍTULO VI – REFERÊNCIAS | 63 consumer awareness of health and healthy choices at the point-ofpurchase, Preventive Medicine, 57: 253, 2013. STARK, E.; LUCHTER, K.; MARGOSHES, M., Near-Infrared Analysis (NIRA): A Technology for Quantitative and Qualitative Analysis, 22: 335, 1986. SUINAGA, F. A.; BOITEUX, L. S.; CABRAL, C. S.; RODRIGUES, C. S., Efeitos do calor e fontes tolerância ao florescimento precoce em variedades de alface do tipo americana, ComunicadoTécnico 88, 2013. TACO. Tabela Brasileira de Composição de Alimentos, 4ª Edição. Disponível em:<http://www.unicamp.br/nepa/taco/contar/taco_4_edicao_ampliada_ e_revisada>. Acessado em: 17 de novembro de 2013. TEYE, E.; HUANG, X.; DAI, H.; CHEN, Q., Rapid differentiation of Ghana cocoa beans by FT-NIR spectroscopy coupled with multivariate classification, Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy, 114: 183, 2013. TEÓFILO, R. F., Métodos Quimiométricos: Uma Visão Geral - Conceitos básicos de quimiometria, Universidade Federal de Viçosa, Viçosa, 2013. VALCÁRCEL, M.; CÁRDENAS, S.; GALLEGO, M., Sample screening systems in analytical chemistry, Trends in Analytical Chemistry, 18: 685, 1999. VIANA, E. P. T.; DANTAS, R. T.; SILVA, R. T. S.; COSTA, J. H. S.; SOARES, L. A. A., Cultivo de alface sob diferentes condições ambientais, Agropecuária científica no semiárido, 9: 21, 2013. CAPÍTULO VI – REFERÊNCIAS | 64 VILLAVICENCIO, A. L. C. H.; ARAÚJO, M. M.; FANARO, G. B.; RELA, P. R.; MANCINI-FILHO, J., Sensorial analysis evaluation in cereal bars preserved by ionizing radiation processing, Radiation Physics and Chemistry, 76: 1875, 2007. XIAOBO, Z.; JIEWEN, Z.; POVEY, M. J. W.; HOLMES, M.; HANPINA, M., Variables selection methods in near-infrared spectroscopy, Analytica Chimica Acta, 667: 14, 2010. WORKMAN, J. J., Interpretive spectroscopy for near infrared, Reviews Applied Spectroscopy, 31: 251, 1996. WORKMAN, J.; WEYER, L.,. Practical guide to interpretive near infrared spectroscopy. Nova York, 2008. ZAVERI, S.; DRUMMOND, S., The effect of including a conventional snack (cereal bar) and a nonconventional snack (almonds) on hunger, eating frequency, dietary intake and body weight, Journal of Human Nutrition and Dietetics, 22: 461, 2009. CAPÍTULO VI . ANEXO Food Research International 51 (2013) 924–928 Contents lists available at SciVerse ScienceDirect Food Research International journal homepage: www.elsevier.com/locate/foodres Classification of cereal bars using near infrared spectroscopy and linear discriminant analysis Anna Luiza Bizerra Brito a, Lívia Rodrigues Brito b, Fernanda Araújo Honorato c, Márcio José Coelho Pontes a, Liliana Fátima Bezerra Lira Pontes a,⁎ a b c Universidade Federal da Paraíba, Departamento de Química, João Pessoa, PB, Brazil Universidade Federal de Pernambuco, Departamento de Química Fundamental, Recife PE, Brazil Universidade Federal de Pernambuco, Departamento de Engenharia Química, Recife PE, Brazil a r t i c l e i n f o Article history: Received 5 November 2012 Accepted 9 February 2013 Available online 20 February 2013 Keywords: Cereal bar Near infrared spectroscopy Linear discriminant analysis Successive projection algorithm Genetic algorithm Stepwise formulation a b s t r a c t This work proposes an analytical method for cereal bar classification based on the use of near infrared spectroscopy (NIRS) and supervised pattern recognition techniques. Linear discriminant analysis (LDA) is employed to build a classification model on the basis of a reduced subset of variables (wavenumbers). For the purpose of variable selection, three techniques are considered, namely successive projection algorithm (SPA), Genetic Algorithm (GA), and stepwise (SW) formulation. The methodology is validated in a case study involving the classification of 121 cereal bar samples into three different types (conventional, diet and light). The results show that the LDA/GA model is superior to the LDA/SPA and LDA/SW models with respect to classification accuracy in an independent prediction set. Some advantages of the proposed method are speed, that the analytical measurement is performed quickly (one minute or less per sample), no reagents, low sample consumption and minimum sample preparation demands. In view of the results obtained in this study the proposed method may be considered valid for use in cereal bar classification. © 2013 Elsevier Ltd. All rights reserved. 1. Introduction Consumption of foods which have low calorie content has increased considerably (Bingol, Zhang, Pan, & McHugh, 2012; Carrillo, Varela, & Fiszman, 2012; Gerend, 2009; Kocken, Buijs, & Snel, 2006). With so many options on the market, however, the consumer finds it confusing to select the product they want among foods with labels such as “natural”, “light”, “diet”, “organic”, and “functional”, among others. Light and diet foods can been found in most supermarkets and labeled as products with low fat, salt, protein, carbohydrates or sugar contents. According to the National Health Surveillance Agency (ANVISA) (Brazilian Agency of Sanitary Surveillance, 2012) these foods are specially formulated with modifications in nutrient content, suitable for use in different diets or for people with specific physiological and metabolic conditions. The term “light” can be used for a food when the quantity of calories or nutrients is at least 25% less than the conventional product. According to ANVISA, “diet” can be applied to foods with an absence of sucrose/glucose or foods indicated for diets with restriction of some nutrients such as fat, carbohydrate, protein and sodium (Brazilian Agency of Sanitary Surveillance, 2012). ⁎ Corresponding author at: Universidade Federal da Paraíba, Departamento de Química, Laboratório de Combustíveis e Materiais (LACOM), CEP 58051-970, João Pessoa, PB, Brazil. Tel./fax: +55 83 3216 7441. E-mail address: [email protected] (L.F.B.L. Pontes). 0963-9969/$ – see front matter © 2013 Elsevier Ltd. All rights reserved. http://dx.doi.org/10.1016/j.foodres.2013.02.014 In order to complement regular food, products such as cereal bars are widely consumed as a fast snack with low caloric value. These foods were introduced nearly a decade ago, when consumers became particularly interested in health and diet, since the cereal bars have nutrients such as fibers, vitamins and minerals. Today, cereal bars are consumed worldwide, including by people on diets, or those with health problems or just as a quick snack (Farinazzi-Machado, Barbalho, Oshiiwa, Goulart, & Pessan Junior, 2012; Lobato et al., 2012; Villavicencio, Araújo, Fanaro, Rela, & Mancini-Filho, 2007; Zaveri & Drummond, 2009). Because they are easy to carry and are available on the market in different types, brands, flavors and nutritional compositions, these foods are very well adapted in the day-to-day lives of modern people. For the consumer, the choice of the product is associated with its appearance, the description on the package and the nutritional information given. These parameters are not always effective, however, in guaranteeing a safe choice of the desired food. Incorrect information on the package or food label, such as the absence or presence of sugar or carbohydrates, can lead to incorrect choices by diabetics, for example, causing hyperglycemia and cardiovascular problems (Scott et al., 2011). The quality control of cereal bars is performed through physical and chemical tests, such as protein content using the method described by Kjeldahl (AOAC, 1997), moisture determination (Adolfo Lutz Institute, 1985), lipid content (AOAC, 1997) as well as sensory analysis. These reference methods have the drawback of being A.L.B. Brito et al. / Food Research International 51 (2013) 924–928 destructive, tedious, time-consuming, using huge amounts of toxic chemical reagents, expensive and, in some cases, subjective. Infrared spectroscopy (IR) is a non-destructive alternative analytical technique which allows reliable, direct and fast determination of different properties at the same time without sample pre-treatment (Pasquini, 2003). Several papers in the literature report the use of near infrared (NIR) spectroscopy to monitor the quality of foods (Riovanto, Cynkar, Berzaghi, & Cozzolino, 2011; Sinelli, Cerretani, Di Egidio, Bendini, & Casiraghi, 2010). In chemometrics data analysis, pattern recognition methods are a powerful tool in context of food quality assessment and food composition analysis (Berrueta, Alonso-Salces, & Héberger, 2007; Cen & He, 2007). These methods have been successfully applied to classify a number of foods, including yogurt (Cruz et al., 2013), beer (Granato, Branco, Faria, & Cruz, 2011), coffee (Souto et al., 2010), and coconut oil (Rohman & Che Man, 2011), among others (Berrueta et al., 2007; Cen & He, 2007). Supervised pattern recognition methods essentially differ in the way they define classification rules. Basically, they can be divided into discriminating and class-modelling methods (Roggo, Duponchel, & Huvenne, 2003). Linear discriminant analysis (LDA) and partial least square-discriminant analysis (PLS-DA) are examples of discriminating techniques, whereas the soft independent modelling of class analogy (SIMCA) is a class-modelling method. The modeling strategies among these methods are substantially different. LDA and PLS-DA focus on the dissimilarity between classes and the samples must be classified in a particular training classe (Roggo et al., 2003; Vaid, Burl, & Lewis, 2001). The SIMCA method, however, considers each class separately and performs outlier tests to decide whether a new object belongs to a certain class, to all classes or does not belong to any class. The SIMCA method is frequently used in data sets with high dimensionality (Brereton, 2009) such as spectroscopic data. However, the testing procedure adopted by SIMCA has the disadvantage that one has to set a confidence level, α. If the data are normally distributed, α % (e.g. 5%) of objects belonging to the class will be considered as not belonging to it. This misclassification problem can be avoided when the LDA method is employed. The LDA method employs linear decision boundaries, which are defined in order to maximize the ratio of between-class to within-class dispersion (Fisher, 1936). Its has been successfully applied to a number of classification problems (Gambarra Neto et al., 2009; Gori, Maggio, Cerretani, Nocetti, & Caboni, 2012; Riovanto et al., 2011; Sinelli et al., 2010; Souto et al., 2010). When compared with SIMCA and PLS-DA, the LDA method has the disadvantage that the number of training samples must be larger than the number of variables included in the LDA model. Therefore, procedures based on the selection of each variable are required for the classification of spectral data. The successive projections algorithm (SPA) (Pontes et al., 2005; Pontes, Pereira, Pimentel, Vasconcelos, & Silva; Silva, Pontes, Pimentel, & Pontes, 2012; Silva, Borba, et al., 2012), genetic algorithm (GA) (Pontes et al., 2005) and stepwise (SW) formulation (Caneca et al., 2006) methods have been adopted for this purpose in different classification problems. In general, the literature reports only on works involving the characterization of cereal bars as well as new food products being developed for the market by conventional methods (Egert et al., 2012; Fonseca, Santo, Souza, & Pereira, 2011; Heenan et al., 2012; Santos et al., 2011). Explicit studies regarding the classification of cereal bars with respect to type (conventional, diet and light) using NIR spectrometry and multivariate classification with wavenumber selection have not been found in the specialized literature. Thus, development of rapid and accurate methodologies is important for the economy and public health in order to identify non-conformity in cereal bar samples. In the present work, an analytical method to classify cereal bar samples according to type (diet, light, conventional) using NIR spectroscopy and pattern recognition technique is proposed. For this, LDA is employed to build a classification model on the basis of a reduced 925 subset of spectral variables selected using three different techniques: successive projection algorithm (SPA) (Moreira, Pontes, Galvão, & Araújo, 2009; Pontes et al., 2005), the genetic algorithm (GA) (Pontes et al., 2005), and a stepwise (SW) formulation (Caneca et al., 2006). The results obtained by these three methods (LDA/SPA, LDA/GA, and LDA/SW) have been assessed in terms of classification results in a set of samples not used in the model-building process (prediction samples). 2. Material and methods 2.1. Samples One hundred and twenty-one samples of three different types of cereal bars were analyzed: Diet (35); Conventional (44) and Light (42). All samples were crushed and sieved with 20 mesh particle size. 2.2. NIR spectra measurements A Spectrum 400 FT–IR/FT–NIR spectrophotometer (Perkin Elmer) equipped with accessory reflectance (NIRA) was employed to obtain NIR spectra in the range of 10,000 a 4000 cm−1. All spectra were recorded with an average of 16 scans, and a spectral resolution of 8 cm−1. The background spectra were obtained using the Spectralon standard. Temperature was controlled at 23 ±1 °C throughout the spectral acquisition process. 2.3. Chemometric procedure Raw spectra and some pre-processing strategies such as baseline correction, standard normal variate (SNV) (Barnes, Dhanoa, & Lister, 1989), smoothing and the Savitzky–Golay first derivative (Savitzky & Golay, 1964), second-order polynomial (7, 11 and 15 window points), were evaluated in terms of overall classification errors. Detection and elimination of outliers were carried out using score, residual and leverage plots. For each type, the Kennard–Stone (KS) algorithm (Kennard & Stone, 1969) was applied in order to divide the samples into training, validation and prediction subsets. Table 1 presents the number of samples in each set. The validation method employed in this study is based on the test set, thereby the training and validation samples were used in the modelling procedures (including variable selection for LDA) whereas the prediction samples were only used in the final evaluation of the classification models. All spectral data were mean-centered before modeling procedures. An exploratory analysis was initially performed in order to observe the existence of natural groupings. For this purpose, the principal component analysis (PCA) (Souza et al., 2011) was applied to the overall spectral data set. The present work adopts the stepwise (SW) formulation developed by Caneca et al. (2006). In order to decide which wavenumbers were to be discarded, seven threshold values (0.30, 0.50, 0.70, 0.80, 0.90, 0.95, and 0.99) of multiple correlation coefficients were tested in the LDA/ SW model. The best threshold was selected on the basis of the classification errors in the validation set. The SPA algorithm utilized in this paper (Pontes et al., 2005) employs, as the cost function, the average risk G of misclassification by Table 1 Number of training, validation and prediction samples in each cereal bar type. Type Sets Training Validation Prediction Diet Conventional Light Total 17 22 20 59 09 11 11 31 09 11 11 31 926 A.L.B. Brito et al. / Food Research International 51 (2013) 924–928 LDA which is calculated in the validation set, as presented in Eq. (1). The subset of variables which presented the lowest value of G was then selected by the LDA/SPA algorithm. Kv X G ¼ ð1=kvÞ gk ; ð1Þ k¼1 where gk is the risk of misclassification of the k th validation object xk, k = 1, …, Kv. More details about the LDA/SPA can be found in Pontes et al. (2005) and Moreira et al. (2009). The GA algorithm formulation presented in Pontes et al. (2005) was used in this study, where a fitness value was defined for each chromosome as the inverse of the average risk G of misclassification by LDA, as defined in Eq. (1). The GA routine was carried out over 100 generations with 200 chromosomes in each generation. Mutation and crossover probabilities were set to 10% and 60%, respectively. Because of the stochastic nature of the LDA/GA algorithm, the routine was repeated ten times (starting from different random initial populations) and the best solution found during these 10 executions was retained. Spectral acquisition was obtained with Spectrum Version 6.3.4. Data preprocessing and PCA were carried out using Unscrambler® X.1 (CAMO ASA, Norway). The KS, LDA/SW, LDA/SPA and LDA/GA algorithms were coded in Matlab version 6.5 (Mathworks, USA). 3. Results and discussion 3.1. NIR spectra Fig. 1 presents the raw NIR spectra of 121 cereal bar samples recorded in the range of 10,000–4000 cm −1. The spectra show the characteristics bands of carbohydrates such as starch and sugars at 4760, 6711, 6740 cm−1; proteins at 4878–4854, 6667–6536 cm−1; fats at 4200, 4830 cm−1 and moisture at 5135, 8310 cm−1 (Workman, 1996; Workman & Weyer, 2008). 3.2. Principal component analysis Fig. 2 presents the PC2× PC1 score plot resulting from the application of PCA to the raw NIR spectra. As can be seen, there is a substantial dispersion and overlapping of the cereal bar types. Therefore, spectral variable selection procedures are required in order to obtain a better discrimination among the three cereal bar types studied. PC1 and PC2 explain 94% and 2% of the data variance, respectively. Fig. 1. Raw NIR spectra of 121 cereal bar samples. Fig. 2. PC2×PC1 score plot for the overall set of 121 cereal bar samples ( :conventional; b: diet and :light). 3.3. LDA classification The best validation results were achieved with the raw spectra (without preprocessing). The variable numbers selected by SW, SPA and GA were 4, 12 and 17, respectively. Among the LDA models, the worst validation results in terms of correct classification rate (CCR) were obtained with SW, which only correctly classified 21 of the 31 validation samples. This outcome corresponds to a CCR of 68%. LDA/GA, however, provided better results in the validation set for all three cereal bar types, where only one light sample was incorrectly classified as a conventional type sample. The CCR in validation set obtained by LDA/GA and LDA/SPA models were 97%, and 90%, respectively. Possibly, the best results were achieved by LDA/GA because it selects wavenumbers around 8040 cm − 1and 8500 cm − 1, which can be attributed to second overtone of C–H stretching of sucrose (Filho, 2009; Workman, 1996; Workman & Weyer, 2008). It is worth noting that these variables were not selected by LDA/SW and LDA/SPA algorithms. The wavenumbers selected by SW, SPA and GA algorithms are presented in Fig. 3. It can be observed that the few variables selected by SW (Fig. 3a) are located in the region between 4300 and 5800 cm − 1 which can be attributed to presence of a second overtone C–H band associated with fat and combination C–H stretching. The isolated wavenumber selected by SW (10,000 cm − 1) can be attributed to the second overtone N–H stretch associated with protein. These variables were among those selected by SPA and GA algorithm (Fig. 3b and c). Additionally, peaks around 8040 and 8500 cm − 1 (second overtone Fig. 3. Mean NIR spectra with wavenumbers selected by (a) SW, (b) SPA and (c) GA. A.L.B. Brito et al. / Food Research International 51 (2013) 924–928 927 of C–H stretching of sucrose) and 9440 cm−1 (second overtone of O–H stretch) were selected by GA. Furthermore, the SPA and GA algorithms selected variables around 6200–6900 cm−1 which may be attributed to the O–H polymeric of carbohydrates (Filho, 2009; Workman, 1996; Workman & Weyer, 2008). The LDA models obtained with the variables selected by SW, SPA and GA algorithms were applied to the classification of the prediction set. Table 2 summarizes the results of the LDA/SW, LDA/SPA and LDA/GA models in terms of correct classifications (predicted type index equal to correct type index) and incorrect classifications (predicted type index different from correct type index) for the prediction set. The CCR for each model is also presented in Table 2. The best results of LDA models were achieved with GA which correctly classified 28 of the 31 prediction samples. This classification performance was not achieved by LDA/SW, which had a correct prediction rate of only 61%. As can be seen in Table 2, the most frequent errors occurred between the light and conventional types. In fact, these foods have the same nutrients, but sometimes in different concentrations. The classification performance of LDA models built with wavenumbers selected is further demonstrated by Fig. 4a–c, which illustrate the scores of the first two discriminant functions (DF2× DF1) for the overall data set. The best discrimination was found when LDA was applied to wavenumbers selected by GA (Fig. 4c) and SPA (Fig. 4b). In these two cases, the diet samples were separated from the light and conventional samples along DF1 direction. In addition, DF2 distinguished conventional samples from the diet and light types. It is worth noting that the methodology employed was based solely on spectroscopic measurements and pattern recognition techniques. This indicates that laborious procedures for chemical characterization of the cereal bars are not required. However, these classification models cannot be applied to the analysis of other foods different from those included in this study. For different food samples, new classification models should be built and validated. 4. Conclusions This paper proposed a methodology for cereal bar classification employing NIR spectroscopy and linear discriminant analysis coupled with the variable selection algorithms. In a case study involving three different cereal bar types (conventional, diet and light), the results indicate that wavenumber selection is key to an accurate discrimination of the samples. More specifically, the best classification results were achieved with the LDA/GA model, which correctly classified 28 of the 31 prediction samples. Table 2 Classification results obtained with LDA/SW, LDA/SPA and LDA/GA models in the prediction set. (1): diet; (2): conventional and (3): Light. The numbers of wavenumbers employed in the LDA/SW, LDA/SPA and LDA/GA models were 4, 12 and 17, respectively. The numbers of prediction samples employed in this study were 9, 11 and 11 for diet, conventional and light types, respectively. LDA/SWa Prediction Set a LDA/SPA Predicted type index True type index 1 2 3 1 5 2 2 2 1 7 3 3 1 3 7 Predicted type index CCR 61% The threshold value selected was 0.90. 1 2 3 7 1 1 1 8 2 1 - 10 Fig. 4. DF2 × DF1 score plots for the overall data set (121 samples) using wavenumbers selected by (a) SW, (b) SPA and (c) GA. ( :conventional; : diet and :light). LDA/GA Predicted type index CCR 81% 1 2 3 7 1 1 - 10 1 - - 11 CCR 90% The results obtained in this work indicate that the proposed method is a promising alternative for classifying cereal bar samples. Moreover, the analytical measurement can be performed quickly, without reagents and involves less consumption of the sample. Future works could investigate the combination of NIR with other methods, such as soft independent modelling of class analogy (SIMCA), partial least square — discriminant analysis (PLS-DA), artificial neural network (ANN) and k-nearest neighbor (KNN) for the purpose of improving the classification outcome. 928 A.L.B. Brito et al. / Food Research International 51 (2013) 924–928 Acknowledgments This work was supported by NUQAAPE (FACEPE) and CNPq. References Adolfo Lutz Institute (1985). Métodos químicos e físicos para análise de alimentos (3 ª ed.). (São Paulo). Association of Official Analytical Chemists — AOAC (). Official methods of analysis of the association of official analytical chemists (16th ed.). Washington, D.C.: AOAC International. Barnes, R. J., Dhanoa, M. S., & Lister, S. J. (1989). Standard normal variate transformation and de-trending of near-infrared diffuse reflectance spectra. Applied Spectroscopy, 43, 772–777. Berrueta, L. A., Alonso-Salces, R. M., & Héberger, K. (2007). Supervised pattern recognition in food analysis. Journal of Chromatography. A, 1158, 196–214. Bingol, G., Zhang, A., Pan, Z., & McHugh, T. H. (2012). Producing lower-calorie deep fat fried French fries using infrared dry-blanching as pretreatment. Food Chemistry, 132, 686–692. Brazilian Agency of Sanitary Surveillance (2012). Portaria ANVISA SVS/MS No. 27 e 29 de 13.01.1998. Available at http://www.anvisa.gov.br/alimentos/legis/especifica/ regutec.htm (Accessed in 24.08.12). Brereton, R. G. (2009). Chemometrics for pattern recognition. Bristol, UK: John Wiley & Sons Ltd. Caneca, A. R., Pimentel, M. F., Galvão, R. K. H., Matta, C. E., Carvalho, F. R., Raimundo, I. M., Jr., et al. (2006). Assessment of infrared spectroscopy and multivariate techniques for monitoring the service condition of diesel-engine lubricating oils. Talanta, 70, 344–352. Carrillo, E., Varela, P., & Fiszman, S. (2012). Packaging information as a modulator of consumers' perception of enriched and reduced-calorie biscuits in tasting and non-tasting tests. Food Quality and Preference, 25, 105–115. Cen, H., & He, Y. (2007). Theory and application of near infrared reflectance spectroscopy in determination of food quality. Trends in Food Science and Technology, 18, 72–83. Cruz, A. G., Cadena, R. S., Alvaro, M. B. V. B., Sant'Ana, A. S., Oliveira, C. A. F., Faria, J. A. F., et al. (2013). Assessing the use of different chemometric techniques to discriminate low-fat and full-fat yogurts. LWT- Food Science and Technology, 50, 210–214. Egert, S., Wolffram, S., Schulze, B., Langgunth, P., Hubbermann, E. M., Schwarz, K., et al. (2012). Enriched cereal bars are more effective in increasing plasma quercetin compared with quercetin from powder-filled hard capsules. The British Journal of Nutrition, 107, 539–546. Farinazzi-Machado, F. M. V., Barbalho, S. M., Oshiiwa, M., Goulart, R., & Pessan Junior, O. (2012). Use of cereal bars with quinoa (Chenopodium quinoa W.) to reduce risk factors related to cardiovascular diseases. Ciência e Tecnologia de Alimentos, 32, 239–244. Filho, P. A. C. (2009). Rapid determination of sucrose in chocolate mass using near infrared spectroscopy. Analytica Chimica Acta, 631, 206–211. Fisher, R. A. (1936). The use of multiple measurements in taxonomic problems. Annals of Eugenics, 7, 179–188. Fonseca, R. S., Santo, V. R. D., Souza, G. B., & Pereira, C. A. M. (2011). Elaboração de barra de cereais com casca de abacaxi. Archivos Latino Americanos Nutrición, 61, 216–223. Gambarra Neto, F. F., Marino, G., Araujo, M. C. U., Galvão, R. K. H., Pontes, M. J. C., Medeiros, E. P., et al. (2009). Classification of edible vegetable oils using square wave voltammetry with multivariate data analysis. Talanta, 77, 1660–1666. Gerend, M. A. (2009). Does calorie information promote lower calorie fast food choices among college students? The Journal of Adolescent Health, 44, 84–86. Gori, A., Maggio, R., Cerretani, L., Nocetti, M., & Caboni, M. F. (2012). Discrimination of grated cheeses by Fourier transform infrared sprectroscopy coupled with chemometric techniques. International Dairy Journal, 23, 115–120. Granato, D., Branco, G. F., Faria, J. A. F., & Cruz, A. G. (2011). Characterization of Brazilian lager and brown ale beers based on color, phenolic compounds, and antioxidant activity using chemometrics. Journal of the Science of Food and Agriculture, 91, 563–571. Heenan, S., Soukoulis, C., Silcock, P., Fabris, A., Aprea, E., Cappellin, L., et al. (2012). PTR-TOF-MS monitoring of in vitro and in vivo flavour release in cereal bars with varying sugar composition. Food Chemistry, 131, 477–484. Kennard, R. W., & Stone, L. A. (1969). Computer aided design of experiments. Technometrics, 11, 137–148. Kocken, P., Buijs, G., & Snel, J. (2006). Promotion of purchase of low-calorie foods from vending machines at secondary schools in the Netherlands. European Journal of Public Health, 16, 174-174. Lobato, L. P., Pereira, A. E. C., Lazaretti, M. M. L., Barbosa, D. S., Carreira, C. M., Mandarino, J. M. G., et al. (2012). Snack bars with high soy protein and isoflavone content for use in diets to control dyslipidaemia. International Journal of Food Sciences and Nutrition, 63, 49–58. Moreira, E. D., Pontes, M. J. C., Galvão, R. K. H., & Araújo, M. C. U. (2009). Near infrared reflectance spectrometry classification of cigarettes using the successive projections algorithm for variable selection. Talanta, 79, 1260–1264. Pasquini, C. (2003). Near infrared spectroscopy: Fundamentals, practical aspects and analytical applications. Journal of the Brazilian Chemical Society, 14, 198–219. Pontes, M. J. C., Galvão, R. K. H., Araújo, M. C. U., Moreira, P. N. T., Pessoa Neto, O. D., José, G. E., et al. (2005). The successive projections algorithm for spectral variable selection in classification problems. Chemometrics and Intelligent Laboratory Systems, 78, 11–18. Riovanto, R., Cynkar, W. U., Berzaghi, P., & Cozzolino, D. (2011). Discrimination between Shiraz wines from different Australian regions: The role of spectroscopy and chemometrics. Journal of Agricultural and Food Chemistry, 59, 10356–10360. Roggo, Y., Duponchel, L., & Huvenne, J. -P. (2003). Comparison of supervised pattern recognition methods with McNemar's statistical test application to qualitative analysis of sugar beet by near-infrared spectroscopy. Analytica Chimica Acta, 477, 187–200. Rohman, A., & Che Man, Y. B. (2011). The use of Fourier transform mid infrared (FT-MIR) spectroscopy for detection and quantification of adulteration in virgin coconut oil. Food Chemistry, 129, 583–588. Santos, C. T., Bonomo, R. F., Fontan, R. C. I., Bonomo, P., Veloso, C. M., & Fontan, G. C. R. (2011). Characterization and sensorial evaluation of cereal bars with jackfruit. Acta Scientiarum — Technology, 33, 81–85. Savitzky, A., & Golay, M. J. E. (1964). Smoothing and differentiation of data by simplified least squares procedures. Analytical Chemistry, 36, 1627–1639. Scott, R., Donoghoe, M., Watts, G. F., O'Brien, R., Pardy, C., Taskinen, M. R., et al. (2011). Impact of metabolic syndrome and its components on cardiovascular disease event rates in 4900 patients with type 2 diabetes assigned to placebo in the field randomised trial. Cardiovascular Diabetology, 10, 102. Silva, A. C., Pontes, L. F. B. L., Pimentel, M. F., & Pontes, M. J. C. (2012). Detection of adulteration in hydrated ethyl alcohol fuel using infrared spectroscopy and supervised pattern recognition methods. Talanta, 93, 129–134. Silva, C. S., Borba, F. S. L., Pimentel, M. F., Pontes, M. J. C., Honorato, R. S., & Pasquini, C. (2012). Classification of blue pen ink using infrared spectroscopy and linear discriminant analysis. Microchemical Journal. http://dx.doi.org/10.1016/j.microc.2012.03.025. Sinelli, N., Cerretani, L., Di Egidio, V., Bendini, A., & Casiraghi, E. (2010). Application of near (NIR) infrared and mid (MIR) infrared spectroscopy as a rapid tool to classify extra virgin olive oil on the basis of fruity attribute intensity. Food Research International, 43, 369–375. Souto, U. T. C. P., Pontes, M. J. C., Silva, E. C., Galvão, R. K. H., Araújo, M. C. U., Sanches, F. A. C., et al. (2010). UV–Vis spectrometric classification of coffees by SPA–LDA. Food Chemistry, 119, 368–371. Souza, S. S., Cruz, A. G., Walter, E. H. M., Faria, J. A. F., Celeghini, R. M. S., Ferreira, M. M. C., et al. (2011). Monitoring the authenticity of Brazilian UHT milk: A chemometric approach. Food Chemistry, 124, 692–695. Vaid, T. P., Burl, M. C., & Lewis, N. S. (2001). Comparison of the performance of different discriminant algorithms in analyte discrimination tasks using an array of carbon black-polymer composite vapor detectors. Analytical Chemistry, 73, 321–331. Villavicencio, A. L. C. H., Araújo, M. M., Fanaro, G. B., Rela, P. R., & Mancini-Filho, J. (2007). Sensorial analysis evaluation in cereal bars preserved by ionizing radiation processing. Radiation Physics and Chemistry, 76, 1875–1877. Workman, J. J. (1996). Interpretive spectroscopy for near infrared. Applied Spectroscopy Reviews, 31, 251–320. Workman, J., & Weyer, L. (2008). Practical guide to interpretive near — infrared spectroscopy. New York: CRC Press. Zaveri, S., & Drummond, S. (2009). The effect of including a conventional snack (cereal bar) and a nonconventional snack (almonds) on hunger, eating frequency, dietary intake and body weight. Journal of Human Nutrition and Dietetics, 22, 461–468.