UNIVERSIDADE FEDERAL DA PARAÍBA
CENTRO DE CIÊNCIAS EXATAS E DA NATUREZA
DEPARTAMENTO DE QUÍMICA
PROGRAMA DE PÓS-GRADUAÇÃO
PÓS GRADUAÇÃO EM QUÍMICA
DISSERTAÇÃO DE MESTRADO
CLASSIFICAÇÃO DE ALFACES E BARRAS DE CEREAIS A PARTIR DA
ESPECTROSCOPIA NIR E ANÁLISE DISCRIMINANTE LINEAR
Anna Luiza Bizerra de Brito
João Pessoa – PB - Brasil
Fevereiro / 2014
i
UNIVERSIDADE FEDERAL DA PARAÍBA
CENTRO DE
D CIÊNCIAS EXATAS E DA NATUREZA
DEPARTAMENTO DE QUÍMICA
PROGRAMA DE PÓS-GRADUAÇÃO
PÓS GRADUAÇÃO EM QUÍMICA
DISSERTAÇÃO DE MESTRADO
CLASSIFICAÇÃO DE ALFACES E BARRAS DE CEREAIS A PARTIR DA
ESPECTROSCOPIA NIR E ANÁLISE DISCRIMINANTE LINEAR
Anna Luiza Bizerra de Brito
Dissertação
apresentada
como
requisito para obtenção do título de
Mestre
em
Química
pela
Universidade Federal da Paraíba.
Orientadora: Profa. Dra. Liliana de Fátima Bezerra Lira de Pontes
2º Orientador: Prof. Dr. Márcio José Coelho de Pontes
*Bolsista CNPq
João Pessoa – PB - Brasil
Fevereiro / 2014
i
B862m
UFPB/BC
Brito, Anna Luiza Bizerra de.
Classificação de alfaces e barras de cereais a partir da
espectroscopia NIR e análise discriminante linear / Anna Luiza
Bizerra de Brito.-- João Pessoa, 2014.
86f. : il.
Orientadores: Liliana de Fátima Bezerra Lira de Pontes,
Márcio José Coelho de Pontes
Dissertação (Mestrado) - UFPB/CCEN
1. Química. 2. Classificação de alimentos - metodologias.
3. Barra de cereais. 4. Alfaces. 5. Espectroscopia no
infravermelho próximo. 6. LDA.
CDU: 54(043)
i
“Classificação de alfaces e barras de cereais a partir da
espectroscopia NIR e Análise Discriminante Linear”
Dissertação de Mestrado de Anna Luiza Bizerra de Brito aprovada pela
banca examinadora em 03 de fevereiro de 2014:
i
Dedico a Deus, aos meus
pais que tanto investiram
em
nossos
estudos,
de
meus irmãos e meus, e por
terem sido meus oráculos,
dedico
principalmente
à
minha mãe por ser minha
base.
i
AGRADECIMENTOS
A Deus por ter aberto portas e proporcionado a presença de meus
avós, pais, irmãos e pessoas de bom coração, amigos em minha
vida, por ter me dado saúde e paz e por ter principalmente
trabalhado em meus pensamentos nos momentos de dificuldades;
A minha família, por me proporcionar a orientação, a educação
que precisava e ainda preciso e por me deixar feliz sempre que
estou com eles;
À professora Liliana de Fátima Bezerra Lira de Pontes pela
orientação,
disponibilidade,
delicadeza,
dedicação,
paciência,
descontração, esforço e confiança tanto para produção do presente
trabalho, quanto nas outras atividades acadêmicas e pessoais
vivenciadas;
Ao
professor
Márcio
José
Coelho
de
Pontes
por
sua
disponibilidade e orientação;
À professora Fernanda Honorato por seu apoio, disponibilidade e
confiança;
Ao professor Mário César Ugulino Araújo pela disponibilidade do
espaço cedido e acolhimento acadêmico;
Aos professores Sherlan Lemos e Luciano Farias pelas correções
realizadas neste trabalho;
A Dimitri Albuquerque e Lívia Brito pela enorme contribuição na
parte experimental;
i
Aos colegas do grupo LAQA, em especial ao David Douglas, e aos
demais sempre dispostos a ajudar a qualquer hora que eu
precisava;
As minhas amigas, Lorena Luryann, Valeria Visani e Viviane
Tibúrcio que tanto me apoiaram e ajudaram nas horas difíceis;
A Universidade Federal da Paraíba-UFPB;
Ao CNPq pelo apoio financeiro e financiamento da bolsa de
pesquisa;
Ao NUQAAPE, FACEPE e LAC-UFPE pelo apoio financeiro e
utilização do equipamento NIR;
Ao Lacom pela utilização da estufa;
Enfim, aos que ajudaram e não ajudaram neste trabalho!!
Serei eternamente grata!!
i
O SENHOR é o meu pastor, nada me faltará.
Deitar-me faz em verdes pastos, guia-me mansamente a águas tranqüilas.
Refrigera a minha alma; guia-me pelas veredas da justiça, por amor do seu nome.
Ainda que eu andasse pelo vale da sombra da morte, não temeria mal algum,porque tu estás comigo;a tua vara e o teu
cajado me consolam.
Preparas uma mesa perante mim na presença dos meus inimigos,unges a minha cabeça com óleo,o meu cálice transborda.
Certamente que a bondade e a misericórdia me seguirão todos os dias da minha vida; e habitarei na casa do Senhor por
longos dias.
Salmos 23:1-6
i
SUMÁRIO
LISTA DE FIGURAS.............................................................................
iii
LISTA DE TABELAS.............................................................................
v
LISTA DE SIGLAS...............................................................................
vi
RESUMO.............................................................................................
vii
ABSTRACT..........................................................................................
viii
1 INTRODUÇÃO.................................................................................
2
2 FUNDAMENTAÇÃO TEÓRICA............................................................
6
2.1 Barra de cereais............................................................................
6
2.1.1 Alimentos convencionais, light e diet..........................................
7
2.2 A cultura da alface........................................................................
9
2.2.1 Modos de cultivo convencional, hidropônico e orgânico.................
12
2.3 Espectroscopia no Infravermelho Próximo (NIR)................................
14
2.4 Técnicas de pré-processamento dos dados........................................
16
2.5 Quimiometria................................................................................
17
2.5.1 Técnicas de reconhecimento de padrão.......................................
18
2.6 Técnicas de seleção de variáveis......................................................
20
2.7 Objetivos......................................................................................
22
2.7.1 Objetivo geral..........................................................................
22
2.7.2 Objetivos específicos................................................................
22
3 METODOLOGIA................................................................................
24
3.1 Amostras de barra de cereais..........................................................
24
3.2 Amostras de alface........................................................................
24
3.3 Aquisição dos espectros NIR............................................................
25
3.4 Tratamentos quimiométricos e softwares..........................................
25
4 RESULTADOS E DISCUSSÃO.............................................................
29
4.1 Barra de cereais............................................................................
29
4.2 Alface..........................................................................................
39
i
5 CONCLUSÃO...................................................................................
51
REFERÊNCIAS....................................................................................
53
ANEXO...............................................................................................
65
i
LISTA DE FIGURAS
Figura 2.1. Barras de cereais.............................................................
6
Figura 2.2. Alface.............................................................................
10
Figura 4.1. Espectros NIR das 121 amostras de barras de cereais...........
29
Figura 4.2. Espectros NIR das médias das classes de barras de cereais
(região destacada referente ao carboidrato)..........................................
30
Figura 4.3. Gráfico de escores PC2 x PC1, para as 121 amostras de
barras de cereais (
convencional,
light e
diet).............................
31
Figura 4.4. Representação das variáveis selecionadas pelo algoritmo SW
para as amostras de barra de cereais...................................................
33
Figura 4.5. Representação das variáveis selecionadas pelo algoritmo SPA
para as amostras de barra de cereais...................................................
33
Figura 4.6. Representação das variáveis selecionadas pelo algoritmo GA
para as amostras de barra de cereais (região destacada referente à
sacarose).........................................................................................
34
Figura 4.7. Gráfico dos escores de DF2 x DF1 para o modelo SW-LDA,
considerando as 121 amostras de barra de cereais (
light e
convencional,
diet)..................................................................................
35
Figura 4.8. Gráfico dos escores de DF2 x DF1 para o modelo SPA-LDA,
considerando as 121 amostras de barra de cereais (
light e
convencional,
diet)..................................................................................
36
Figura 4.9. Gráfico dos escores de DF2 x DF1 para o modelo GA-LDA,
considerando as 121 amostras de barra de cereais (
light e
convencional,
diet)..................................................................................
36
Figura 4.10. Gráfico dos pesos das variáveis selecionadas pelo GA-LDA,
para as 121 amostras de barra de cereais.............................................
37
Figura 4.11. Espectros brutos na região NIR (10000-4000 cm-1) das
amostras de alface............................................................................
39
Figura 4.12. Espectros brutos na região NIR selecionada (5500-4000 cm1
) das amostras de alface...................................................................
Figura 4.13. Gráfico de pesos na faixa de 10000 – 4000 cm-1. (variáveis
40
i
de maiores pesos na área destacada)...................................................
40
Figura 4.14. Gráfico de escores PC2 x PC1, para as 104 amostras de
alfaces ( convencional,
hidropônico e
orgânico).............................
41
Figura 4.15. Espectros NIR das médias das classes (convencional –
preto, hidropônico – vermelho e orgânico – azul) (área destacada
pela característica de lipídios).....................................................
42
Figura 4.16. Representação das variáveis selecionadas pelo algoritmo
SW para as amostras de alface............................................................
44
Figura 4.17. Representação das variáveis selecionadas pelo algoritmo
SPA para as amostras de alface...........................................................
44
Figura 4.18. Representação das variáveis selecionadas pelo algoritmo
GA para as amostras de alface............................................................
45
Figura 4.19. Gráfico dos escores de DF2 x DF1 para o modelo SW-LDA,
considerando as 104 amostras de alface ( convencional,
hidropônico e
orgânico).....................................................................................
46
Figura 4.20. Gráfico dos escores de DF2 x DF1 para o modelo SPA-LDA,
considerando as 104 amostras de alface ( convencional,
hidropônico e
orgânico)......................................................................................
46
Figura 4.21. Gráfico dos escores de DF2 x DF1 para o modelo GA-LDA,
considerando as 104 amostras de alface ( convencional,
hidropônico e
orgânico)......................................................................................
47
Figura 4.22. Gráfico dos pesos das variáveis selecionadas pelo GA-LDA,
para as 104 amostras de alface...........................................................
48
i
LISTA DE TABELAS
Tabela 2.1 Informação sobre os alimentos light....................................
7
Tabela 2.2 Composição da alface tipo crespa por 100 gramas de parte
comestível: centesimal, minerais, vitaminas e colesterol.........................
10
Tabela 3.1 Número de amostras dos conjuntos de treinamento,
validação e teste em cada classe para as amostras de barra de cereais....
26
Tabela 3.2 Número de amostras dos conjuntos de treinamento,
validação e teste em cada classe para as amostras de alfaces..................
26
Tabela 4.1 Tabela dos erros dos conjuntos de amostras de barras de
cereais, dos modelos obtidos a partir de diferentes pré-processamentos...
31
Tabela 4.2 Resultados de classificação obtidos com os modelos SW-LDA,
SPA-LDA e GA-LDA para o conjunto de teste das amostras de barra de
cereais. (1) diet; (2): convencional e (3) light.......................................
38
Tabela 4.3 Tabela dos erros dos conjuntos de amostras de alface dos
modelos construídos a partir de diferentes pré-processamentos...............
43
Tabela 4.4 Resultados de classificação obtidos com os modelos SW-LDA,
SPA-LDA e GA-LDA para o conjunto de teste das amostras de alface (1):
convencional; (2): hidropônico e (3): orgânico.....................................
49
i
LISTA DE SIGLAS
ANVISA
Agência Nacional de Vigilância Sanitária
AOAC
Associação Oficial de Químicos Analíticos
APS
Algoritmo das Projeções Sucessivas
FD
Função Discriminante
GA
Algoritmo Genético
KNN
K-Ésimos Vizinhos mais Próximos
KS
Kernnard-Stone
LED
Diodo Emissor de Luz
LDA
Análise Discriminante Linear
MAPA
Ministério da Agricultura, Pecuária e Abastecimento
MS
Ministério da Saúde
MSC
Correção de Espalhamento Multiplicativo
NIR
Infravermelho Próximo
NIRA
Acessório de Reflectância no Infravermelho Próximo
OMS
Organização Mundial de Saúde
PCA
Análise de Componentes Principais
PLS
Mínimos Quadrados Parciais
SIMCA
Modelagem Independente e Flexível por Analogia de Classes
SNV
Variação Normal Padrão
SNVS
Sistema Nacional de Vigilância Sanitária
SW
Stepwise
RNA
Rede Neural Artificial
TCC
Taxa de Classificação Correta
i
Título: Classificação
de
alfaces e barras de cereais a
partir
da
espectroscopia NIR e Análise Discriminante Linear.
Autora: Anna Luiza Bizerra de Brito.
Orientadores: Profa. Dra. Liliana de Fátima Bezerra Lira de Pontes e
Prof. Dr. Márcio José Coelho de Pontes
RESUMO
A busca por uma melhor qualidade de vida tem levado ao aumento do
consumo de alimentos com menos calorias, ricos em fibras e vitaminas, e
obtidos de formas de cultivo diferenciadas. Em meio a esses alimentos,
encontram-se as barras de cereais e as alfaces, que são alimentos de fácil
acesso, muito consumidos e que possuem altos valores nutricionais. Como
qualquer outro alimento, necessitam de métodos eficientes que possam
assegurar sua qualidade. Assim, surge a necessidade de métodos
analíticos rápidos, precisos e de baixo custo, que possam ajudar a
identificar e classificar com segurança a esses alimentos. Dentro desta
perspectiva, este trabalho faz uso da Espectroscopia no Infravermelho
Próximo (NIR) aliada a Análise Discriminante Linear (LDA) para classificar
amostras de barras de cereais e alfaces. Um total de 121 amostras de
barras de cereais, de três tipos distintos (convencional, diet e light) e 104
amostras de alface de três diferentes tipos de cultivo (convencional,
orgânico e hidropônico) foi utilizado. A aquisição dos espectros foi feita no
equipamento Spectrum 400 (Perkin Elmer) com acessório NIRA (Near
Infrared Reflectance Acessory) na faixa de 10.000 a 4.000 cm-1. Modelos
de classificação foram construídos através da associação da LDA e
algoritmos de seleção de variáveis: Stepwise (SW), Algoritmo das
Projeções Sucessivas (SPA) e Algoritmo Genético (GA). Estratégias de
pré-processamento de dados foram avaliadas e a eficiência dos modelos
foi determinada em relação à taxa de classificação correta (TCC), para o
conjunto total das amostras e para o conjunto de teste. Para as duas
matrizes o modelo que gerou um melhor TCC foi o GA-LDA com valor de
95% para matriz das barras de cereais e 97,1% para matriz das alfaces,
ambos baseados no conjunto total das amostras (treinamento, validação e
teste). Em relação ao conjunto de teste os modelos apresentaram
resultados de TCC com desempenho de 90,3% e 95,4% para as matrizes
das barras de cereais e alfaces respectivamente.
Palavras–chave: barras de
infravermelho próximo; LDA.
cereais;
alfaces;
espectroscopia
no
i
Title: Classification of lettuce and cereal bars as from the NIR
spectroscopy and Linear Discriminate Analysis.
Authoress: Anna Luiza Bizerra de Brito.
Advisors: Prof. Dr. Liliana de Fátima Bezerra Lira Pontes and Prof. Dr.
Márcio José Coelho de Pontes
ABSTRACT
The search for a better quality of life has led to increased consumption of
foods with fewer calories, high in fiber and vitamins, and obtained from
different forms of cultivation.
Amid these foods, there are cereal bars and lettuce, foods that are easily
accessible, widely consumed and have high nutritional values. Like any
other food, require efficient methods that can ensure its quality. Thus, the
need for rapid, accurate analytical methods and low cost, which can help
to identify and classify these foods safely arises. Within this perspective,
this paper makes use of Near Infrared Spectroscopy (NIR) combined with
Linear Discriminant Analysis (LDA) to classify samples of cereal bars and
lettuce. A total of 121 samples of cereal bars, three distinct types
(conventional, diet and light) and 104 samples of three different types of
lettuce cultivation (conventional, organic and hydroponic) was used. The
acquisition of the spectra was made on equipment Spectrum 400 (Perkin
Elmer) with accessory NIRA (Near Infrared Reflectance Acessory) in the
range 10000 - 4000 cm-1. Classification models were constructed by
combining the LDA algorithms and variable selection: Stepwise (SW),
Successive Projections Algorithm (SPA) and Genetic Algorithm (GA).
Strategies for pre - processing data were evaluated and the efficiency of
the models was determined from the of correct classification rate (CCR)
for the full set of samples and the test set. For both matrices the model
that generated a better CCR was the GA-LDA valued 95% to matrix of the
cereal bars and 97.1 % for array of lettuces, both based on the total set of
samples (training, validation and testing). Regarding the set of test
models presented results of CCR with performance of 90.3 % and 95.4 %
for matrices of cereal bars and lettuce respectively.
Keywords: cereal bars; lettuce; near infrared spectroscopy; LDA.
CAPÍTULO
I
.
INTRODUÇÃO
CAPÍTULO I – INTRODUÇÃO
|2
1 INTRODUÇÃO
Para alcançar o bem-estar físico, mental e social o primeiro passo
começa por alimentar-se bem. Por isso a alimentação saudável nas
quantidades e proporções corretas é fundamental para a manutenção das
diversas funções do corpo. (MACDIARMID et al., 2013; SONNENBERG et
al., 2013)
A rotina acelerada exigida nos dias atuais dificulta a manutenção de
uma alimentação balanceada, o que diminui as chances do consumo de
nutrientes, podendo provocar uma diminuição da qualidade de vida
associada a problemas de saúde como obesidade, hipertensão, diabetes,
entre outros (CYBERDIET, 2013). Segundo a Organização Mundial de
Saúde (OMS), a prática de uma alimentação saudável promove o bemestar físico, psicoemocional e social e evita o surgimento de patologias.
(OMS, 2000). Assim, o consumo de alimentos com menos calorias, ricos em
fibras e vitaminas, e oriundos de cultivos diferenciados tem aumentado
consideravelmente (MATIAS, 2013). Todavia, os consumidores se deparam no
mercado com uma série de denominações tais como produtos “orgânicos”,
“hidropônicos”, light, diet, “transgênico”, “enriquecido”, “funcional”, entre outros,
que dificultam a escolha correta do alimento.
Alimentos light e diet podem ser encontrados na maioria dos
supermercados e são classificados como produtos que contem baixo teor
de gordura, sal, proteínas, entre outros, quando comparados aos produtos
convencionais, segundo a Portaria nº 29, de 13 de janeiro de 1998. De
acordo com a Agência Nacional de Vigilância Sanitária (ANVISA), estes
alimentos são especialmente formulados com modificações no conteúdo
dos nutrientes para utilização em dietas diferenciadas ou para pessoas
com condições metabólicas e fisiológicas específicas. (ANVISA, 2013b)
CAPÍTULO I – INTRODUÇÃO
|3
Em meio aos alimentos diet e light podem ser destacadas as barras
de cereais consumidas em todo o mundo, seja por pessoas em dieta, ou
por aquelas com problemas de saúde, ou apenas como lanche rápido. De
fato, elas
estão
muito
bem adaptadas ao
cotidiano
das
pessoas
atualmente por possuírem diferentes sabores, marcas, teores nutricionais,
além de serem de fácil transporte. (FARINAZZI-MACHADO et al., 2012;
LOBATO et al., 2012; VILLAVICENCIO et al., 2007; ZAVERI e DRUMMOND,
2009)
A escolha do produto por parte do consumidor geralmente está
associada a sua aparência e, principalmente a informação nutricional
descrita na embalagem, mas estes parâmetros nem sempre são eficazes
na garantia de escolha segura do alimento desejado.
Informação incorreta ou mesmo a falta de informação podem causar
problemas mais graves, como hiperglicemia e problemas cardiovasculares,
especialmente em caso de pessoas portadores de doenças, como os
diabéticos, público alvo do consumo destes alimentos (SCOTT et al.,
2011).
Há também os alimentos originados de cultivos diferenciados como,
por exemplo, os orgânicos e os hidropônicos. Essa diferença na forma de
produção tem atraído consumidores que buscam uma alternativa para
ingestão de produtos mais saudáveis (MAPA, 2013a).
Entre os alimentos provenientes de cultivos diferenciados pode ser
destacada a alface, por ser considerada a mais importante hortaliça
folhosa no Brasil (SANTANA et al., 2006; HENZ e SUINAGA, 2009; VIANA
et al., 2013; FERREIRA et al., 2013; KANO et al., 2012; SUINAGA et al.,
2013). Possui alto teor nutricional, é rica em sais minerais, vitaminas e
tem efeito medicinal calmante, diurético e laxante (SILVA et al., 2013).
O crescente consumo da alface tem sua origem na grande utilização
dessa hortaliça em fast foods e pela maior demanda e preferência do
consumidor na ingestão de saladas (SALA e COSTA, 2012). As alfaces
podem ser produzidas pelo método orgânico, convencional e hidropônico e
CAPÍTULO I – INTRODUÇÃO
|4
isso gera uma considerável diferença de preço quando chegam às
prateleiras dos supermercados.
Neste sentido, surge a necessidade do desenvolvimento de métodos
analíticos rápidos e precisos que possam ajudar a identificar e classificar
com segurança as amostras de alface e barras de cereais. Tais métodos
possuem grande importância tanto do ponto de vista econômico, quanto
de saúde pública. A associação da espectroscopia no NIR com técnicas
quimiométricas de análise de dados tem sido utilizada no controle de
qualidade e classificação de muitos alimentos (CHEN et al., 2006;
FERREIRA et al., 2014; BEVILACQUA et al., 2013). Entre suas principais
vantagens estão a não utilização de reagentes químicos, é uma técnica
não-destrutiva, permite análises rápidas com determinação de diferentes
propriedades simultaneamente (PASQUINI, 2003).
Diante
do
exposto,
este
trabalho
propõe
a
utilização
da
espectroscopia na região do Infravermelho Próximo (NIR), associada a
ferramentas quimiométricas para classificar amostras de alface em relação
ao modo de produção (orgânico, convencional e hidropônico) e barras de
cereais quanto ao tipo (diet, light e convencional).
CAPÍTULO
II
.
FUNDAMENTAÇÃO
TEÓRICA
CAPÍTULO II – FUNDAMENTAÇÃO TEÓRICA
|6
2 FUNDAMENTAÇÃO TEÓRICA
2.1 Barra de cereais
ereais
As barras de cereais (Figura 2.1) vêm ganhando bastante destaque
nos últimos anos devido a sua conveniência e associação com alimentos
saudáveis (PAIVA et al., 2012). São formadas por grãos de cereais, aveia
como ingrediente principal, processados e misturados,
misturados podendo ser
adicionados
ionados
a
outros
ingredientes,
como
frutas
desidratadas
ou
cristalizadas, sementes, castanhas, nozes, caramelos, chocolates, musse
de morango, musse de limão, entre outros. (OLIVEIRA et al., 2013)
Figura 2.1.
2.1 Barras de cereais.
ereais. Fonte: Casadesaron
As barras
rras de cereais apresentam alto teor nutricional, baixo índice
de gordura, altos teores de fibras e aporte energético. São fontes de
vitaminas, sais minerais, proteínas,
proteínas, lipídios e carboidratos (RODRIGUES et
al., 2011). Esses
sses constituintes são tidos como parâmetro
arâmetro de qualidade
q
das
barras de cereais sendo avaliados,
avaliados por exemplo, determinação da
umidade e determinação das cinzas (INSTITUTO ADOLF LUTZ, 1985);
1985)
determinação de lipídios pelo método Soxhlet, determinação de proteína
pelo método Kjeldhal e determinação de fibra em detergente
etergente ácido (AOAC,
CAPÍTULO II – FUNDAMENTAÇÃO TEÓRICA
|7
1990), além de análises sensoriais e análises da rotulagem (MELLO et al.,
2012).
É importante salientar que informação incorreta na embalagem ou
rótulo dos alimentos, tais como a ausência ou presença de açúcar ou
outros carboidratos, pode levar a escolhas erradas por diabéticos, por
exemplo, causando hiperglicemia e problemas cardiovasculares (SCOTT et
al., 2011).Assim, não é difícil que o consumidor se confunda diante de
todas as informações contidas nos rótulos ou mesmo diante das opções
não somente de marcas e sabores, mas também de tipos existentes,
como as convencionais, as light e diet.
2.1.1. Alimentos convencionais, light e diet
Alimento convencional é aquele sem restrições ou adicionais na
composição inicial do produto.
De acordo com a Portaria nº 27, de 13 de janeiro de 1998, os
alimentos nomeados com o termo light são alimentos que tem o conteúdo
absoluto de nutrientes e ou valor energético baixo ou reduzido. Em termos
de comparação, os alimentos light possuem uma diferença relativa
mínima de 25% no valor energético ou conteúdo de nutrientes em relação
aos alimentos do tipo convencional. Essas informações podem ser vista na
Tabela 2.1 (ANVISA, 2013a).
Tabela 2.1 Informação sobre os alimentos light
Conteúdo Comparativo
Valor Energético Total
Atributos
(Redução mínima de 25%)
No Valor Energético Total e diferença
maior que 40 Kcal/100 g (sólidos)
No teor de Açúcares e diferença maior
Açúcares
que 5 g de açúcares/100 g (sólidos) e
mesmas
condições
exigidas
para
os
atributos REDUZIDOS ou BAIXO VALOR
CAPÍTULO II – FUNDAMENTAÇÃO TEÓRICA
|8
ENERGÉTICO, ou frase "este não é um
alimento com valor energético reduzido"
ou frase equivalente, quando a redução
de mais de 25% de açúcar implicar em
aumento
ou
manutenção
do
valor
energético do produto.
Em Gorduras Totais e diferença maior
Gorduras Totais
que 3 g gorduras/100 g (sólidos)
Em gorduras saturadas e diferença maior
Gorduras Saturadas
que 1,5 g de gordura saturada/100 g
(sólidos)
Em colesterol e diferença maior que 20
mg colesterol/100 g (sólidos) e máximo
de 1,5 g de gordura saturada/100 g
Colesterol
(sólidos)
e
Energia
fornecida
por
gorduras saturadas deve ser no máximo
10% do Valor Energético Total.
Em sódio e diferença maior que 120
Sólido
mg/100 g (sólidos)
Fonte: Portaria nº 27, de 13 de janeiro de 1998
Assim,
barra
de
cereais
nomeadas
como
light
não
são,
necessariamente, alimentos que tem isenção total de certo ingrediente.
Ao contrário de outros tipos de alimentos, os alimentos light não foram
desenvolvidos para atender a necessidades nutricionais de determinado
grupo, apenas surgiram para atender a um número elevado de pessoas
que se preocupam com o bem estar e a saúde (MAPA, 2013b).
Hoje em dia, os alimentos diet são consumidos livremente, já que
antes eram considerados medicamentos e só podiam ser comercializados
em farmácias (PERTSCHY, 2010).
Segundo a Portaria nº 29, de 13 de janeiro de 1998 (versão
republicada 30.03.1998), o termo diet pode ser opcionalmente usado para
alimentos voltados para dietas com restrição de nutrientes como
CAPÍTULO II – FUNDAMENTAÇÃO TEÓRICA
|9
carboidratos, proteínas, gorduras, sódio; ou para alimentos destinados a
fins específicos e alimentos classificados para ingestão controlada de
nutrientes, empregados exclusivamente para controle de peso ou para
dieta de ingestão controlada de açúcares (ANVISA, 2013b).
Barras de cereais diet são direcionadas especialmente para pessoas
com exigências patológicas, fisiológicas, metabólicas ou físicas particulares
(PERTSCHY, 2010). Pessoas que tem o objetivo de emagrecer devem
prestar muita atenção ao comprar barra de cereais diet, porque nem
sempre a isenção de uma substância implica em redução de calorias, e
com isso, pagam mais caro em um produto que não é voltado para seu
problema.
É importante mencionar que alimentos rotulado com “zero” não são
alimentos diet. Esses alimentos possuem outras designações conforme é
apresentado na Portaria nº 27, de 13 de janeiro de 1998 (ANVISA,
2013a).
2.2. A cultura da alface
Originária da Europa e da Ásia, a alface (Lactuca sativa), da família
dos Asteraceae, é conhecida há milênios pelos homens. Os maiores
produtores mundiais são os Estados Unidos, a China, Espanha e Itália.
Existem cerca de seis tipos (crespa, lisa, americana, mimosa, romana e
vermelha) (SALA e COSTA, 2012).
A alface tipo crespa é bastante consumida no Brasil e é importante
devido ao seu valor comercial (FAVARO-TRINDADE et al., 2007) (Figura
2.2).
CAPÍTULO II – FUNDAMENTAÇÃO TEÓRICA
| 10
Figura 2.2.
2.2 Alface. Fonte: Fotos bol.
Possui alto teor nutricional e baixo teor calórico,
calórico fonte de sais
minerais, como cálcio, ferro e fósforo, de vitaminas A, B1,
B1 B2, C e E,
fibras, entre outros, (Tabela
(
2.2) concentrando-se
se a maior quantidade de
vitaminas e minerais nas folhas mais externas. (LIMA, 2007; OMAIAA,
2013)
Tabela 2.2 Composição da
d alface tipo crespa por 100
00 gramas de parte
comestível: centesimal,
centesimal, minerais, vitaminas e colesterol.
colesterol
Composição
Valores
Umidade (%)
96,1
Proteína (g)
1,3
Lipídeos (g)
0,2
Colesterol (mg)
NA
Carboidrato (g)
1,7
Fibra Alimentar (g)
1,8
Cinzas (g)
0,7
Cálcio (mg)
38
Magnésio (mg)
11
Manganês (mg)
0,20
Fósforo (mg)
26
Ferro (mg)
0,4
Sódio (mg)
3
CAPÍTULO II – FUNDAMENTAÇÃO TEÓRICA
Potássio (mg)
267
Cobre (mg)
0,03
Zinco (mg)
0,3
Retinol (µg)
NA
Tiamina (mg)
0,11
Riboflavina (mg)
0,12
Piridoxina (mg)
| 11
Tr
Niacina (mg)
1,09
Vitamina C (mg)
15,6
Fonte: TACO – 4ª Edição (NA: Não Aplicável/ Tr: Traço)
A alface é bastante utilizada em saladas, sendo de fácil acesso e
baixo custo e, portanto consumida por todas as classes sociais no Brasil. É
útil no combate a insônia (OMAIAA, 2013), possui efeito laxativo, tem
propriedades diuréticas e calmante, bem como um sabor agradável e
refrescante (NETO et al., 2012; LIMA, 2007). Segundo LÓPEZ-GÁLVEZ et
al. (2010), citado por (NETO et al., 2012) há uma relação direta entre o
consumo desse alimento, na categoria do vegetal folhoso, e redução de
doenças crônicas, como hipertensão, diabetes, aterosclerose e câncer.
A alface é um vegetal adaptado a clima ameno, sendo própria para
cultivos de outono e inverno (FAVARO-TRINDADE et al., 2007). No
entanto, graças ao melhoramento genético das cultivares, possibilitou-se
a produção durante o ano inteiro, sobretudo no verão, que era uma das
suas limitações (LIMA, 2007; VIANA et al., 2013).
O cultivo dessa hortaliça apresenta algumas limitações, em especial
devido aos efeitos de temperatura, umidade e chuva. A temperatura é o
elemento que exerce maior influência na fisiologia das alfaces, podendo
acelerar ou retardar as reações metabólicas. Outras desvantagens são
relacionadas à dificuldade de conservação e ao transporte pós-colheita.
(LIMA, 2007).
CAPÍTULO II – FUNDAMENTAÇÃO TEÓRICA
| 12
A planta da alface é bastante vulnerável a doenças. Segundo
FILGUEIRA (2003) apud LIMA (2007), são conhecidos aproximadamente
75 diferentes tipos de doenças presentes no consumidor possivelmente
causadas
pela
presença
de
resíduos
deixados
nessa
planta,
em
decorrência principalmente do uso de produtos tóxicos no controle
fitossanitário.
O modo de cultivo da alface é realizado através de sistemas
tradicionais, orgânicos e hidropônicos. Várias pesquisas investigaram o
acúmulo de nitrato em alfaces produzidas nesses tipos de cultivo. Porém,
poucos trabalhos avaliaram outros parâmetros de interesse como teor de
vitaminas, fibras, contagem microbiana e aceitação sensorial. (FREIRE et
al., 2009; FAVARO-TRINDADE et al., 2007; COMETTI et al., 2004;
DAROLT, 2003; MIYAZAWA et al., 2001;).
2.2.1 Modos de cultivo convencional, hidropônico e orgânico
O método convencional ou tradicional caracteriza-se pelo cultivo das
alfaces em solo utilizando adubos altamente solúveis e pesticidas, de
natureza química (NETO et al., 2012). Contudo, esse sistema de produção
polui águas e degrada o solo devido aos elementos químicos residuais
(DAROLT, 2003).
Nos últimos anos, o tipo de cultivo hidropônico vem ganhando
bastante destaque. Essa forma de cultivo tem por característica a não
utilização do solo e seu principal componente é a água. Tem como
objetivos elevar a produtividade, aumentar o número de colheitas por
ano, reduzir mão de obra com gastos de defensivos agrícolas, obter um
produto de melhor aparência, além de ocupar um menor espaço físico
para cultivo. Outra vantagem dessa técnica é a não exposição das alfaces
a geadas, chuvas intensas, mudança brusca de temperatura, ventos fortes
e regularidade de produção. (SALA e COSTA, 2012; FAVARO-TRINDADE et
al., 2007; DOMINGUES et al., 2012)
CAPÍTULO II – FUNDAMENTAÇÃO TEÓRICA
| 13
No cultivo hidropônico são utilizadas soluções nutritivas balanceadas
capazes de proporcionar o crescimento da planta. A solução nutritiva é
constituída por nutrientes básicos, perfazendo um total de dezesseis
elementos: carbono, hidrogênio, oxigênio, nitrogênio, fósforo, potássio,
enxofre,
cálcio,
magnésio,
manganês,
ferro,
zinco,
boro,
cobre,
molibdênio e cloro (DOMINGUES et al., 2012).
Nesse modo de produção é necessário acompanhamento técnico
especializado que forneça nutrição adequada às plantas e evite, dentre
outros problemas, o acúmulo excessivo de nitrato. (FAVARO-TRINDADE et
al., 2007). O nitrato (NO3-) quando absorvido em grande quantidade, a
planta não consegue metabolizá-lo totalmente, o que provoca o acúmulo
nos tecidos. Quando ingerido pelos consumidores, pode ser reduzido a
nitrito (NO2-), que entrando na corrente sangüínea oxida o ferro da
hemoglobina
que
passa
do
estado
2+
a
3+,
produzindo
a
metahemoglobina, tornando-o incapaz de ligar-se e transportar oxigênio.
Outro problema é que parte do nitrito pode acabar combinado a aminas
formando nitrosaminas, as quais são cancerígenas e mutagênicas (OHSE,
2009).
A
hidroponia
investimento
possui
inicial,
gasto
desvantagem
de
energia
por
necessitar
elétrica,
um
maior
necessidade
de
monitoramento contínuo do funcionamento do sistema, controle de
nutrientes na solução, bem como novos produtos e técnicas apropriadas
para controle de pragas e doenças. (DOMINGUES et al., 2012; FAVAROTRINDADE et al., 2007)
Outra forma de produção é a forma orgânica, assim considerada
quando são cultivados alimentos em um ambiente
que considere
sustentabilidade social, ambiental e econômica e valorize a cultura das
comunidades rurais. (MAPA, 2013a)
Esta técnica apresenta uma grande vantagem comparada ao
sistema convencional devido a ser um modelo tecnológico de produção
menos impactante ao meio ambiente. A cultura orgânica adota práticas de
aproveitamento de resíduos orgânicos, conserva a biodiversidade, não faz
CAPÍTULO II – FUNDAMENTAÇÃO TEÓRICA
| 14
queimadas, não usa agrotóxicos, hormônios, adubos minerais sintéticos
ou outros agentes contaminantes. (FAVARO-TRINDADE et al.; LIMA,
2007)
No cultivo orgânico são utilizadas plantas consideradas daninhas
para muitas lavouras, alternadas na produção ou durante o cultivo, com o
intuito de atraírem para si as pragas, enriquecerem o solo, assim evitando
doenças. É utilizado também técnicas de rodízio de culturas, plantio direto
e
adubação
verde
(MAPA,
2013a).
Contudo,
umas
das
grandes
dificuldades para sua expansão é a conversão dos sistemas convencionais
em sistemas orgânicos, isso porque, nos primeiros anos de produção, as
áreas de lavoura do tipo convencional, ainda estão à base de agrotóxicos.
(LIMA, 2007)
Uma desvantagem do produto final oriundo do sistema de cultivo
orgânico são os preços mais elevados, chegando a ser cerca de 40%
maior que os convencionais. Esse valor tem por justificativa a qualidade
do produto.
Existem algumas entidades que certificam os produtos orgânicos
como é o caso do Selo Brasileiro, mas não há quem comprove se o
alimento tem ou não agrotóxicos (GUIVANT, 2003).
2.3 Espectroscopia no Infravermelho Próximo (NIR)
A radiação do infravermelho foi descoberta em 1800 por Herschel e
em 1900, Colblentz obteve os espectros no infravermelho de vários
compostos orgânicos (ROCHA, 2006; WORKMAN, 1996). Técnica analítica
muito usada devido às inúmeras informações que ele fornece sobre uma
determinada amostra.
A espectroscopia do infravermelho envolve transferência de energia
entre a luz e a matéria. Caracteriza-se por sobretons e combinação de
bandas de vibrações moleculares fundamentais. Os perfis espectrais
CAPÍTULO II – FUNDAMENTAÇÃO TEÓRICA
| 15
dominantes do NIR incluem: metil C-H, metileno C-H, metoxi C-H,
carbonil C-H, aromático C-H, hidroxila O-H, N-H de amidas primárias,
amidas secundárias (ambos de associações de grupos alquil e aril), N-H de
aminas primárias, secundárias e aminas terciárias, e N-H a partir dos sais
(XIAOBO et al., 2010; WORKMAN, 1996). Para que as moléculas de um
composto absorvam radiação é preciso uma variação no momento dipolo
associado ao movimento rotacional ou vibracional.
O infravermelho é dividido em três regiões: infravermelho distante
(FIR) que compreende a faixa de 200 – 10 cm-1, o infravermelho médio
(MIR) com faixa de 4000 – 200 cm-1 e o infravermelho próximo (NIR) cuja
faixa é 12800 – 4000 cm-1 (SKOOG et al., 2002). O NIR apresenta
características como maior razão sinal-ruído e baixo custo comparado a
outras técnicas. (WORKMAN, 1996).
Associada a equipamentos que operam no infravermelho próximo, o
modo de medida de reflectância difusa destaca-se por ser caracterizada
pela determinação direta e com economia de reagentes e de tempo (LIMA
et al., 2008). Nesta técnica de reflexão o feixe incidente penetra a
superfície da amostra interagindo com a matriz, retornando à superfície
da mesma, após absorção parcial e múltiplos espalhamentos (KONZEN et
al., 2003).
A intensidade das bandas pode ser expressa em transmitância e
absorbância.
A
absorbância
é
calculada
pela
transformação
da
porcentagem de reflectância [log10 (1/Reflectância)]. (SILVERSTEIN et al.,
2007).
A região do NIR é bastante visada por indústrias de alimento, tanto
para as análises de matérias primas como para o produto acabado (CEN e
HE, 2007). Diversos trabalhos na área de alimentos envolvendo a técnica
NIR e métodos de reconhecimento de padrões nos mostram que essa
associação é uma ferramenta eficaz (CRUZ et al., 2013; GRANATO et al.;
2011; TEYE et al., 2013; BERRUETA et al.; 2007; CEN e HE, 2007;
ALAMPRESE et al., 2013).
CAPÍTULO II – FUNDAMENTAÇÃO TEÓRICA
| 16
Devido à grande quantidade de valores de absorbância contida na
matriz de dados obtidos pela técnica NIR, necessita-se da quimiometria,
que extrai as informações presentes no espectro. Para tanto, é necessário
em alguns casos, um pré-processamento dos dados.
2.4 Técnicas de pré-processamento dos dados
Técnicas
de
pré-processamento
da
informação
espectral
são
geralmente empregadas, quando necessário, para remoção de variação
sistemática ou aleatória que mascara uma variação de interesse nos
dados a ser estudados. Os pré-processamentos podem ser aplicados tanto
nas amostras como nas variáveis. Exemplos de pré-processamentos
aplicados nas amostras são a normalização, ponderação, suavização e
correção da linha de base. Já os exemplos de pré-processamento
aplicados nas variáveis são a centralização pela média, escalonamento e
autoescalonamento.
Pré-processamento com derivação tem por finalidade a correção de
problemas de linhas de base, remoção de ruídos e melhoramento na
definição
das bandas que se encontram sobrepostos. Informações
contidas ao longo dos diferentes comprimentos de onda são geralmente
enfatizadas com a utilização da primeira ou segunda derivada. Esse
processo tem por desvantagem diminuir a relação sinal/ruído quando
presente ruído nos espectros, assim, aplica-se alisamento junto com a
derivação. Como exemplo desse procedimento tem derivação Savitzky
Golay. (MAZUR, 2012)
Para problemas relacionados a variações do espalhamento da luz
ocasionadas pelas medidas de reflectância difusa, vindas principalmente
pela falta de homogeneidade ou diferenças na granulometria das
amostras, sugere a Correção de Espalhamento Multiplicativo (MSC). Este
método matemático minimiza a interferência através da correção de linha
CAPÍTULO II – FUNDAMENTAÇÃO TEÓRICA
| 17
de base dos espectros de modo que todos os apresentem o espalhamento
“ideal”. Em seguida, uma regressão linear é usada para calcular o
coeficiente angular e linear do gráfico entre o espectro ideal e o espectro
que vai ser corrigido. O espectro corrigido é calculado pela subtração de
cada ponto pelo valor do coeficiente linear e divide-se este pelo coeficiente
angular. (RIBEIRO, 2009; ROGGO, 2003)
Similar
ao
MSC,
a
Variação
Normal
Padrão
(SNV)
corrigi
espalhamento multiplicativo e interferências de espalhamento, porém a
correção por SNV contorna problemas de espalhamento através da
normalização de cada espectro pelo desvio padrão, não havendo a
necessidade de um espectro “ideal” para fazer as correções dos espectros
(COSTA FILHO, 2003).
Cuidados devem ser tomados para não se extrair informação útil, e
por
isso,
um
re-exame
deve
sempre
ser
realizado
após
o
pré-
processamento.
2.5 Quimiometria
A análise mutlivariada engloba métodos estatísticos de análises
simultânea de medidas múltiplas realizadas sobre um individuo ou objeto
sob investigação. Assim, qualquer análise simultânea realizada em duas
ou mais variáveis, pode ser considerada uma análise mutlivariada. (HAIR
et al., 2005)
A quimiometria surge em 1970 e um dos grandes divulgadores foi
Bruce Kowalski. Umas das causas para sua criação foi a automação das
análises, a acessibilidade a microcomputadores e a disponiblibidade de
metodologias e softwares dedicados à realização de cálculos com dados
multivariados. Bastante utilizada na química analítica, a quimiometria é
uma associação de métodos de análise multivariada para o tratamento de
dados químicos. (TEÓFILO, 2013)
CAPÍTULO II – FUNDAMENTAÇÃO TEÓRICA
Usando
ferramentas
quimiométricas,
os
| 18
métodos
de
desenvolvimento de produtos alimentícios e as análises de alimentos
podem
ser
simplificados.
A
quimiometria
ajuda
a
decidir
quais
determinações são importantes e se algumas delas podem ou não serem
anuladas. (FERNANDES, 2006)
Entre as subdivisões da quimiometria, se encontra o planejamento
experimental,
reconhecimento
de
padrões,
métodos de
inteligência
artificial e calibração multivariada (NETO, 2006).
Dentre as vertentes da quimiometria apresentados, os métodos de
reconhecimento
de
padrão
são
utilizados
neste
trabalho
e
serão
abordados mais detalhadamente na seção seguinte.
2.5.1 Técnicas de reconhecimento de padrão
Técnicas de reconhecimento de padrões tornaram-se uma poderosa
ferramenta na caracterização e identificação de similaridades e diferenças
entre classes de amostras em diferentes conjuntos de dados e na
avaliação da qualidade e composição dos alimentos (BERRUETA et al.,
2007; CEN e HE, 2007).
Divide-se em reconhecimento de padrões não-supervisionados, por
exemplo técnicas como Análise por Componentes Principais (PCA) e
Análise por Agrupamentos Hierárquicos (HCA) e reconhecimento de
padrões supervisionados, técnicas como Análise Discriminante Linear
(LDA), Modelagem Independente e Flexível por Analogia de Classes
(SIMCA) e K-Ésimos Vizinhos mais Próximos (KNN).
As técnicas de reconhecimento de padrões não-supervisionados têm
por finalidade realizar uma análise exploratória nos dados, ou seja,
analisam a existência de agrupamentos entre as classes das amostras em
estudo sem que seja necessário o conhecimento de suas identidades. São
elas análise de agrupamentos hierárquicos (HCA) e a análise de
CAPÍTULO II – FUNDAMENTAÇÃO TEÓRICA
| 19
componentes principais (PCA) (NETO et al., 2006; FERNANDES, 2006).
Entre essas técnicas, é abordado nesse trabalho a PCA.
A PCA baseia-se na construção de um conjunto novo de variáveis
denominadas por componentes principais (PCs), as quais são ortogonais
entre si e construídas na ordem da maior para a menor variância
explicada dos dados. Os conjuntos de dados são assim redimensionados e
cada amostra é representada por um ponto no espaço multidimensional,
gráficos de escores, favorecendo a observação de agrupamentos entre as
amostras
de
cada
classe
apresentando
características
semelhantes
provenientes das propriedades químicas. (MARTINEZ, 2011).
Já as técnicas de reconhecimento de padrões supervisionadas
diferem essencialmente na estrutura das regras de classificação que são
adotadas.
Dividem-se
em
métodos
de
modelagem
de
classe
e
discriminatórios (CASTRO E PRADO, 2002). Além disso, necessitam que as
identidades das amostras usadas na construção dos modelos sejam
conhecidas para poderem ser utilizadas na classificação de amostras
desconhecidas, ou seja, uma variável de categoria.
A análise discriminante linear (LDA) e análise discriminante dos
mínimos
quadrados
parciais
(PLS-DA)
são
exemplos
de
métodos
discriminatórios. Esse método tem por objetivo classificar as amostras
desconhecidas em uma única classe. Encontram as diferenças entre as
classes e, as amostras devem ser classificadas em uma classe de
treinamento específico (ROGGO et al., 2003).
O
desenvolvimento
de
modelos
LDA
conta
com
uma
etapa
preliminar para seleção de amostras que irá compor os conjuntos de
treinamento, validação e teste. Para tanto, um algoritmo usual KennardStone (KS), é utilizado. O algoritmo maximiza as distâncias euclidianas
entre os vetores das respostas instrumentais das amostras e é aplicado
separadamente para cada classe. Os conjuntos de treinamento são
formados na ordem de amostras mais representativas e os demais
conjuntos são divididos em validação e teste (KENNARD e STONE, 1969).
CAPÍTULO II – FUNDAMENTAÇÃO TEÓRICA
| 20
O método LDA emprega limites de decisão linear, ou seja, funções
discriminantes lineares que maximizam a razão entre as classes e
minimizam a dispersão dentro de cada classe (FISHER, 1936). Contudo,
em comparação aos outros métodos de classificação supracitados, possui
a desvantagem de necessitar de matrizes de pequenas dimensões, devido
a problemas de colinearidade. Portanto, é necessária a associação aos
algoritmos de seleções de variáveis, como o Algoritmo das Projeções
Sucessivas (SPA), Stepwise (SW) e Algoritmo Genético (GA).
2.6 Técnicas de seleção de variáveis
O SPA é uma técnica de seleção de variáveis que faz uso de
operações que objetivam a minimização de problemas relacionados à
colinearidade
dos
dados,
reduzindo
informações
redundantes.
Este
objetivo é alcançado com o uso de procedimentos matemáticos, onde as
variáveis existentes na matriz de dados são projetadas sucessivamente,
gerando cadeias com menor número destas. Em seguida, a função de
custo é calculada, a qual esta baseada no risco médio G (Equação 1), e a
cadeia gerada que apresentar o menor valor de custo será selecionada.
∑
(1)
onde: é o risco de uma classificação incorreta das amostras, que pode
ser visto com mais detalhes em PONTES (2009).
O SW é outra alternativa dentre as técnicas de seleção de variáveis
que visa discriminar e investigar individualmente cada uma destas. De tal
forma que cada variável é adicionada e excluída do modelo de acordo com
o método de validação cruzada leave-one-out (PONTES, 2009). Calcula-se
então o fator de discriminação (Di) de uma variável ni , baseando em
CAPÍTULO II – FUNDAMENTAÇÃO TEÓRICA
| 21
medidas de dispersão dentro das classes e entre as classes (como
mostrado na Equação 2) (CANECA et al., 2006).
(2)
onde: é a dispersão entre as classes e o a dispersão dentro da
classe (PONTES, 2009).
Nessa técnica são testados diferentes valores de limiar (threshold),
e esses valores são comparados baseados nos erros do conjunto de
validação.
O GA diferentemente dos algoritmos supracitados é um algoritmo de
natureza estocástica. É baseado na teoria da evolução das espécies,
introduzida pelo fisiologista e naturalista Charles Darwin, na qual as
espécies evoluem pelo princípio da seleção natural e sobrevivência do
mais apto (CONDE, et al., 2007). Nesse algoritmo, as variáveis são
codificadas de forma binária, parecendo-se assim, de forma análoga aos
cromossomos biológicos. Para isso, ele necessita de valores: populações
de indivíduos e gerações, esses indivíduos são combinados entre si
(crossover), gerando “filhos” que podem sofrer ou não mutação. Essas
populações evoluem através de sucessivas gerações até se encontrar
solução ótima. Testa-se então a aptidão do indivíduo, verificando,
matematicamente, quais apresentam melhor resposta para o sistema.
Aptidão, neste trabalho, é calculada considerando-a como inverso do risco
G (Equação 2) (PONTES, 2009).
Surge assim, a necessidade por um método rápido e confiável para
detectar propriedades características das amostras quantos ao diferentes
tipos e produções. Método este baseado em análises screening que nos
dão respostas binárias como, por exemplo, sim ou não, pertence ou não
pertence, etc., e são análises mais simples, mais rápidas e de menor
custo
quando
comparadas aos métodos laboratoriais convencionais
(VALCÁRCEL et al., 1999). Para isso, associa a espectroscopia no NIR com
CAPÍTULO II – FUNDAMENTAÇÃO TEÓRICA
| 22
as ferramentas quimiométricas, juntamente com os algoritmos de seleção
de variáveis.
2.7 Objetivos
2.7.1 Objetivo geral
Desenvolver um método para a classificação de amostras de alface
de acordo com o modo de cultivo (orgânico, convencional e hidropônico) e
amostras de barras de cereais em relação ao tipo (diet, light e
convencional),
utilizando
espectroscopia
NIR
e
ferramentas
quimiométricas.
2.7.2 Objetivos específicos
Realizar uma análise exploratória utilizando Análise por Componentes
Principais (PCA) para avaliar as regiões informativas da faixa espectral,
detecção de outiliers e os agrupamentos naturais das amostras de barras
de cereais e alfaces;
Determinar o modo de medida a ser utilizado;
Escolher o melhor processamento para as amostras;
Criar modelos screening baseados na Análise Discriminante Linear (LDA),
com prévia seleção de variáveis, para classificar amostras de barra de
cereais quanto ao tipo light, diet e convencional e amostras de alface
quanto ao modo de produção (orgânico, hidropônico e convencional);
Comparar os métodos obtidos (SPA-LDA, GA-LDA e SW-LDA), avaliandoos em termos de resultados de classificação de um conjunto externo de
amostras.
CAPÍTULO
III
.
METODOLOGIA
CAPÍTULO III – METODOLOGIA
| 24
3 METODOLOGIA
3.1 Amostras de barra de cereais
Cento e vinte e uma amostras de três tipos de barra de cereais
foram adquiridas em estabelecimentos comerciais das cidades de João
Pessoa-PB e Recife-PE. Dessas amostras, 35 foram do tipo diet, 44
amostras do tipo convencional e 42 amostras do tipo light.
As barras foram congeladas, em seguida trituradas no liquificador,
peneiradas com uma peneira de granulometria 20 mesh de tamanho de
partícula.
3.2 Amostras de alface
Cento e quatro amostras de alfaces de três diferentes formas de
cultivo foram adquiridas em estabelecimentos comerciais e feiras livres
das cidades de João Pessoa-PB e Recife-PE. Dentre essas amostras, 27
são provenientes de cultivo orgânico, 30 amostras de cultivo convencional
e 47 amostras de cultivo hidropônico.
Escolhida seis a sete folhas, as mais externas, foram lavadas em
água corrente e em seguida água destilada. Foram secas em estufa de
recirculação de ar, à temperatura de 60ºC por 48 horas. Após esse
período, as amostras foram trituradas com auxílio do almofariz e pistilo, e
por fim, peneiradas com peneira de granulometria 20 mesh de tamanho
de partícula.
CAPÍTULO III – METODOLOGIA
| 25
3.3 Aquisição dos espectros NIR
Os
espectros
das
amostras
foram
obtidos
usando
um
espectrofotômetro modelo Spectrum 400 FT-IR/FT-NIR da Perkin Elmer,
equipado com acessório de NIRA, na faixa de 10000 a 4000 cm-1.
Todos os espectros foram obtidos com média de 16 varreduras e
resolução de 8 cm-1. A temperatura foi controlada a 23 ± 1ºC durante
todo o processo de aquisição espectral. Os espectros do branco foram
feitos usando um Spectralon® padrão. Estes padrões são constituído por
material polimérico, quimicamente inerte, que podem oferecer os mais
altos valores de reflectância difusa de qualquer substância conhecida.
3.4 Tratamentos quimiométricos e softwares
Estratégias de pré-processamento dos dados foram avaliadas com a
finalidade de melhorar a eficiência dos modelos. Além dos dados sem préprocessamento, os modelos foram desenvolvidos usando os dados
tratados com SNV (BARNES et al., 1989) e o método MSC, o método
Savitzky - Golay (SAVITZKY e GOLAY, 1964), onde foram utilizados
diferentes tamanhos de janelas (11, 15, 17 e 21 pontos) e derivação dos
dados na primeira ordem.
Os pré-processamentos utlizados para essas matrizes foram usados
para contornar alguns efeitos nos espectros como espalhamento do sinal,
desvio de linha de base, e, também com o intuito de melhor discriminação
entre as classes das amostras.
Uma análise exploratória foi realizada inicialmente a fim de observar
a existência de agrupamentos naturais. Para este efeito, a PCA foi
aplicada. O gráfico dos escores foi observado com o intuito de auxiliar na
detecção e eliminação de amostras anômalas. Em relação a faixa de
CAPÍTULO III – METODOLOGIA
| 26
trabalho, o gráfico de pesos foi utilizado para a escolha da faixa a ser
utilizada.
As
amostras
foram
divididas
em
conjuntos
de
treinamento,
validação e teste, na proporção de 60%, 20% e 20% respectivamente.
Essa divisão foi realizada pelo algoritmo KS (KENNARD e STONE, 1969). O
algoritmo KS foi aplicado separadamente para cada classe do conjunto de
dados, como citado por PONTES et al. (2005). As Tabelas 3.1 e 3.2
apresentam o número de amostras para cada subconjunto considerando
as duas matrizes estudadas.
Tabela 3.1 Número de amostras dos conjuntos de treinamento, validação e
teste em cada classe para as amostras de barra de cereais.
Tipos
Diet
Convencional
Light
Total
Conjuntos
Treinamento
17
22
20
59
Validação
9
11
11
31
Teste
9
11
11
31
Tabela 3.2 Número de amostras dos conjuntos de treinamento, validação e
teste em cada classe para as amostras de alface.
Tipos
Convencional
Hidropônico
Orgânico
Total
No
Conjuntos
Treinamento
18
27
15
60
desenvolvimento
dos
Validação
6
10
6
22
modelos
de
Teste
6
10
6
22
classificação
LDA,
três
algoritmos de seleção de variáveis foram testados, o SPA, SW e GA.
Usando o modelo SW-LDA, oito valores limites de coeficientes de
correlação foram testados (0,10, 0,30, 0,50, 0,70, 0,80, 0,90, 0,95 e
0,99) para decidir quais as variáveis selecionadas foram mais relevantes
(CANECA et al., 2006). O valor do limiar escolhido no modelo SW-LDA,
baseado no conjunto de validação, foi de 0,90 para a matriz de barra de
cereais, enquanto que para a matriz de alface foi 0,99.
CAPÍTULO III – METODOLOGIA
| 27
O modelo GA-LDA, foi executado para 100 gerações com 200
cromossomos em cada geração. Cruzamento e mutação foram definidos
com probabilidades de 60% e 10%, respectivamente. Essa rotina foi
repetida 10 vezes devido à sua natureza estocástica, mantendo-se a
melhor solução encontrada (PONTES et al., 2005).
O SPA-LDA também foi avaliado com base no risco médio de uma
classificação incorreta realizada pelas variáveis selecionadas no modelo
LDA. (PONTES et al., 2005)
As amostras de treinamento e as amostras de validação foram
utilizadas no procedimento de cálculo dos modelos de classificação. As
amostras
de
teste,
entretanto,
só
foram
utilizadas
para
fins
de
comparação de desempenho dos modelos construídos.
O pré-processamento dos dados e a PCA foram realizados utilizando
o software Unscrambler® X.1 (CAMO ASA, da Noruega). Os algoritmos KS,
SW-LDA, GA-LDA e SPA-LDA foram executados em ambiente do Matlab
versão 6.5 (Mathworks, EUA).
A eficiência dos modelos foi avaliada em termos de erros de
classificação total, ou seja, para os três subconjuntos de amostras, e do
conjunto de teste. Esse termo de classificação correta (TCC) é calculado
dividindo-se o número de acertos pelo número total de amostras,
multiplicando por 100%.
CAPÍTULO
IV
.
RESULTADOS E
DISCUSSÃO
CAPÍTULO IV – RESULTADOS E DISCUSSÃO
| 29
4 RESULTADOS E DISCUSSÃO
4.1
.1 Barra de cereais
A Figura 4.1 apresenta os espectros sem pré-processamento
processamento na
região do NIR registrados na faixa de 10000 cm-1 a 4000 cm-1. As cores
verde, azul e vermelho representam as classes diet, convencional e light,
respectivamente.
Figura 4.1. Espectros NIR das 121 amostras de barras
arras de cereais.
Os espectros mostram bandas características de carboidratos, tais
como amido e açúcares em 4760, 6711 e 6740 cm-1, proteínas de 48784878
4854 cm-1 e 6667-6536
6536 cm-1, gorduras em 4200 e 4830 cm-1 e umidade
em 5135 e 8310 cm-11 (WORKMAN , 1996; WORKMAN & WEYER , 2008).
2008)
Na Figura 4.2
2 é possível observar que em algumas regiões do
espectro há algumas diferenças entre as absorbâncias médias de cada
classe (diet - verde,
e, convencional - azul e light - vermelho). Na região em
torno de 7002 cm-1, destacada na figura, nota-se
se uma diferença entre a
média dos espectros da classe diet em comparação com as classes
CAPÍTULO IV – RESULTADOS E DISCUSSÃO
| 30
convencional e light no que se refere ao primeiro sobretom O-H
O
proveniente de carboidratos. O mesmo acontece na região por volta de
5002 cm-1, região característica das combinações O--H, também aos
carboidratos, onde a média da classe convencional se destaca.
Figura 4.2. Espectros NIR das médias das classes de barras de cereais
(região
região destacada referente ao carboidrato).
A Figura 4.3 apresenta o gráfico dos escores (PC2 x PC1)
resultante da aplicação da
d PCA para os espectros brutos do NIR. PC1 e
PC2 explicam 94% e 2% da variância dos dados, respectivamente.
respectivamente Como
pode ser visto, há uma dispersão substancial e sobreposição dos tipos de
barra de cereais.
Detectou-se
se uma amostra anômala nessa etapa exploratória.
exploratória Esse
outliers foi retirado da matriz de dados ficando um total das 121
amostras.
CAPÍTULO IV – RESULTADOS E DISCUSSÃO
| 31
scores PC2 x PC1, para as 121 amostras de
Figura 4.3. Gráfico dos escores
barra de cereais ( convencional,
onvencional,
light e
diet).
Nota-se também a não formação de agrupamentos naturais das
amostras de barra de cereais, portanto, os procedimentos de seleção de
variáveis espectrais são necessários a fim de obter uma melhor
discriminação
scriminação entre as classes.
Diferentes pré-processamento
processamento foram realizados, como mostrado na
Tabela 4.1 a seguir.. A tabela apresenta valores de TCC total (conjuntos
de
treinamento,
validação
e
teste
teste)
dos
dados
com
e
sem
pré
pré-
processamentos.
Tabela 4.1 Tabela dos erros dos conjuntos de amostras de barras de cereais,
c
dos modelos obtidos a partir de diferentes pré-processamentos.
pré processamentos.
PRÉPROC.
SEM P.
SNV
GA-LDA
Var.
Sel.
Erros
Trein. Val
17
2
1
TCC(%)
95,0
,0
Var.
Erros
Sel.
Trein. Val
24
2
3
TCC(%)
93,4
SW-LDA
SPA-LDA
Var.
Erros
Var.
Erros
Test Sel. Trein. Val Test Sel. Trein. Val Test
3
4
25
10
12
12
6
3
6
61,1
87,6
Var.
Erros
Var.
Erros
Test Sel. Trein. Val Test Sel. Trein. Val Test
3
17
4
4
3
8
10
4
4
90,9
85,1
CAPÍTULO IV – RESULTADOS E DISCUSSÃO
DERIV.
MSC
| 32
Var.
Erros
Var.
Erros
Var.
Erros
Sel.
Trein. Val Test Sel. Trein. Val Test Sel. Trein. Val Test
17
4
5
2
46
0
9
11
7
13
5
3
TCC(%)
90,9
83,5
82,6
Var.
Erros
Var.
Erros
Var.
Erros
Sel.
Trein. Val Test Sel. Trein. Val Test Sel. Trein. Val Test
28
0
3
4
10
10
5
6
8
10
3
6
TCC(%)
94,2
82,6
84,3
Como pode ser observado, os resultados para os modelos SW-LDA e
SPA-LDA estão abaixo de 90%, com exceção do modelo SW-LDA com os
dados de pré-processamento SNV. Porém, entre os resultados para os
diferentes pré-tratamentos do modelo GA-LDA, notam-se valores de
porcentagem bem próximos como, 95% para os dados sem préprocessamento, 93,4% e 94,2% para os dados com pré-processamento
SNV e MSC respectivamente. Assim, optou-se por utilizar os dados com 1ª
derivada S. Golay, janela de 21 pontos e polinômio de 2ª ordem.
Entre os modelos LDA , os piores resultados de validação em termos
de TCC foram obtidos com o SW, onde foram classificadas corretamente
somente 22 das 31 amostras de validação. Este resultado corresponde a
um TCC de 70,9%.
Os valores de TCC no conjunto de validação obtido por GA-LDA e
modelos SPA-LDA foram de 83,9%. Com isso, consegue-se diferenciar as
classes do três tipos (diet, convencional e light) tanto com o modelo SPALDA quanto com GA-LDA, sendo que o GA-LDA obteve mais êxito na
discriminação entre as classes devido as suas escolhas nas variáveis
selecionadas e maior TCC no conjunto completo das amostras.
Obtidos os modelos, o número de variáveis selecionadas pelo SW,
SPA e GA foram 46, 7 e 17, como pode ser visto nas Figuras 4.4, 4.5,
4.6, respectivamente. As variáveis selecionadas pelos três algoritmos são
alocadas nas médias dos espectros das 121 amostras de barra de cereais.
CAPÍTULO IV – RESULTADOS E DISCUSSÃO
| 33
Figura 4.4. Representação das variáveis
ariáveis selecionadas pelo algoritmo SW
para as amostras de barra de cereais.
Figura 4.5. Representação das Variáveis selecionadas pelo algoritmo SPA
para as amostras de barra de cereais.
CAPÍTULO IV – RESULTADOS E DISCUSSÃO
| 34
Figura 4.6. Representação das variáveis
ariáveis selecionadas pelo algoritmo GA
para as amostras de barra de cereais (região destacada referente à sacarose).
sacarose)
Como pode ser observado na Figura 4.6,, o GA selecionou números
de onda em torno de 8040 cm-1 e 8500 cm-1, que podem ser atribuídos ao
segundo sobretom de estiramentos C-H
C H provenientes de sacarose (FILHO,
2009; WORKMAN , 1996; WORKMAN & WEYER , 2008). É interessante
notar que essas variáveis não foram selecionados pelos algoritmos SW e
SPA apresentados
tados nas Figuras 4.4 e 4.5,, respectivamente. Esta diferença
possivelmente explica os melhores resultados de discriminação obtidos
com a seleção GA.
Pode-se
se observar que uma grande quantidade de variáveis foram
selecionadas por SW (Figura
(
4.4) localizadas
s na região entre 9002 e
10000 cm-1, e pode ser atribuído ao segundo sobretom de estiramento NN
H associado com a proteína. Estas variáveis não estavam entre aquelas
selecionados pelo SPA e GA algoritmo (Figuras
(
4.5 e 4.6
.6).
Ainda, as variáveis selecionadas pelos algoritmos GA e entre 62006900 cm-1 que podem
m ser atribuídas as combinações O-H
H dos carboidratos
(FILHO, 2009; WORKMAN, 1996; WEYER & WORKMAN , 2008).
CAPÍTULO IV – RESULTADOS E DISCUSSÃO
O
desempenho
dos
modelos
LDA
obtidos
com
| 35
as
variáveis
selecionadas
lecionadas pode ser visualizado através dos escores mostrados nas
Figuras
4.7,
4.8
e
4.9,
para
SW-LDA,
SPA-LDA
LDA
e
GA
GA-LDA,
respectivamente. As figuras ilustram os pontos das duas primeiras
funções discriminantes (DF2 × DF1) para o conjunto dos
d dados em geral.
Figura 4.7. Gráfico dos escores de DF2 x DF1 para o modelo SW-LDA,
considerando as 121 amostras de barra de cereais ( convencional,
onvencional,
light e
diet).
CAPÍTULO IV – RESULTADOS E DISCUSSÃO
| 36
SPA
Figura 4.8. Gráfico dos escores de DF2 x DF1 para o modelo SPA-LDA,
considerando as 121 amostras de barra de cereais ( convencional,
onvencional,
light e
diet).
Figura 4.9. Gráfico dos escores de DF2 x DF1 para o modelo GA-LDA,
GA
considerando as 121 amostras de barra de cereais ( convencional,
onvencional,
light e
diet).
CAPÍTULO IV – RESULTADOS E DISCUSSÃO
| 37
Observa-se
se na Figura 4.7 que ao longo da DF1 uma sobreposição
entre as classes das amostras de barra de cereais, mas na direção da
DF2, uma separação da classe light das demais, diet e convencional.
Para os modelos LDA obtidos a partir dos algoritmos SPA e GA, Figuras
4.8 e 4.9, observa-se
se um comportamento similar ao longo da DF1 e DF2. A DF1
separa as classes de amostras do tipo diet das demais, light e convencional e a
DF2 separa as classes light da convencional. Possivelmente, essa separação no
modelo GA-LDA
LDA ao longo da DF1 pela
pela ausência de sacarose, variável selecionada
nessa banda característica de 8500 cm-1.
A Figura 4.10 apresenta o gráfico de pesos das variáveis escolhidas
pelo modelo GA-LDA..
Figura 4.10. Gráfico dos pesos das variáveis selecionadas pelo GA-LDA,
para as 121 amostras de barra de cereais
As variáveis de maiores
maior
pesos
s tanto para a DF1 como para a FD2
foram a 11 e 12
2 correspondendo aos
ao números de ondas 4660 e 4658 cm1
, referente à presença
ça de um segundo sobretom de C-H,
H, banda associada
a gordura e combinação de estiramentos C-H.
C
Essas bandas tem
correlação com a classe das amostras diet separadas pela DF1 das classes
das amostras light e convencional, ou seja, pela ausência de gordura nas
CAPÍTULO IV – RESULTADOS E DISCUSSÃO
| 38
amostras diet. Por outro lado, a FD2 separa a classe light da classe
convencional pela diferenciação de 25% de gordura.
Os modelos LDA obtidos com as variáveis selecionadas por
algoritmos SW, SPA e GA foram aplicados à classificação de um conjunto
de teste. Na Tabela 4.2 está resumido os resultados dos modelos SWLDA, SPA-LDA e GA-LDA em termos de classificações corretas (índice
previsto igual para índice correto) e classificações incorretas (índice tipo
previsto diferente do índice correto) para o conjunto de teste.
Nesta tabela, o valor de N representa o número de amostras em
cada conjunto, e nota-se que os melhores resultados de modelos LDA
foram alcançados com GA, que classificou corretamente 29 das 31
amostras de teste. Este desempenho da classificação não foi conseguida
usando o SW-LDA, que teve uma taxa de apenas 64,5% de classificação
correta. Como pode ser visto nessas tabelas, os erros mais frequentes
ocorreram entre os tipos de light e convencional. De fato, estes alimentos
têm os mesmos nutrientes, mas, por vezes, em diferentes concentrações.
Tabela 4.2 Resultados de classificação obtidos com os modelos SW-LDA, SPALDA e GA-LDA para o conjunto de teste das amostras de barra de cereais. (1)
diet; (2): convencional e (3) light.
Conjunto
de Teste
Índ. de
classe
verdadeiro
SW-LDA (46)*
SPA-LDA (7)
Índice de classe Previsto
N
TCC
(%)
1
2
3
4
5
TCC
(%)
1
2
3
-
8
1
1
9
2
11
64,5 1
8
2
90,3 -
3
11
1
2
8
-
*0,90
GA-LDA (17)
1
2
3
-
8
1
-
10 1
93,5 -
1
10
TCC
(%)
-
11 1
10
CAPÍTULO IV – RESULTADOS E DISCUSSÃO
| 39
4.2 Alface
A Figura 4.11
1 apresenta os espectros brutos na região NIR
registrados na faixa de 10000 cm-1 a 4000 cm-1.
Figura 4.11. Espectros brutos na região NIR (10000-4000
(10000
cm-1) das
amostras de alface.
Os espectros mostram as bandas características de carboidratos em
6800 e 4770 cm-1, proteínas entre 4600 e 6660 cm-1, lipídios em 4200,
4830, 5200, 8500 cm-1 e umidade próximo a 4545 cm-1 (WORKMAN,
1996; WORKMAN e WEYER, 2008).
Toda
oda a faixa espectral foi particionada a fim de
e estudar a região que
indicaria uma melhor discriminação entre as amostras.
As regiões selecionadas foram:
foram de 10000 cm-1 - 7746 cm-1, 7744
cm-1 - 6068 cm-1, 6066 cm-1 - 5502 cm-1 e 5500 cm-1 – 4000 cm-1. A faixa
10000 cm-1 - 7746 cm-1 continha bastante ruído e, portanto,
portanto não foi
utilizada.
A região de 5500 - 4000 cm-1 foi a utilizada, ilustrada na Figura
4.12. A escolha dessa região foi auxiliada pelo uso do gráfico de pesos,
CAPÍTULO IV – RESULTADOS E DISCUSSÃO
| 40
ferramenta essa vista na etapa da análise exploratória, como mostrado na
Figura 4.13.
1
Figura 4.12. Espectros brutos na região NIR selecionada (5500-4000 cm) das amostras de alface
lface.
Figura 4.13. Gráfico de pesos na faixa de 10000 – 4000 cm-1. (variáveis
de maiores pesos na área destacada)
CAPÍTULO IV – RESULTADOS E DISCUSSÃO
| 41
A Figura 4.14
4.. apresenta o gráfico dos escores
escore resultante da
aplicação da PCA aos
os espectros brutos NIR. Como pode ser visto, não há
formação de agrupamentos naturais e oberva-se
oberva se uma sobreposição das
classes quanto as formas de cultivo.
Figura 4.14. Gráfico dos escores
e
PC2 x PC1, para
ara as 104 amostras de
alface ( Convencional,
Hidropônico e
Orgânico).
A Figura 4.15
5 apresenta os espectros médios relativos a cada
classe das amostras de alface. É possível observar que os espectros
médios das classes de alface são similares visualmente, não apresentando
diferenças
renças
significativas,
a
não
ser
pela
diferença
diferença
de
valores
de
absorbância. Nota-se
se ainda que em algumas regiões do espectro, como
nas regiões entre 5500-5302
5500
cm-1, 4902-4302 cm-1, 4200-4102
4200
cm-1, os
espectros das classes (hidropônico
(hidropônico e orgânico) são bastante semelhantes
em relação aos valores de absorbância. Contudo, na região em torno de
5200
cm-1
(região
destacada)
características da banda de lipídios.
elas
diferem,
provavelmente,
pela
CAPÍTULO IV – RESULTADOS E DISCUSSÃO
| 42
Figura 4.15. Espectros NIR das médias das classes (convencional – preto,
hidropônico – vermelho e orgânico – azul) (área destacada pela característica de
lipídios).
Devido à grande semelhança entre os espectros apresentados na
Figura 4.15, faz-se
se necessário o uso de métodos de seleção de variáveis
para obtenção de um modelo com maior capacidade de discriminação
entre as classes estudadas.
Na Tabela 4.3
.3 são apresentadas os resultados de TCC para os
modelos obtidos com os diferentes pré-processamento.
pré
Como podem ser observados, os melhores resultados foram obtidos
com os dados sem pré-processamento,
pré processamento, entretanto, os dados derivados
com S.Golay,, 1ª derivada, janelas de 21 pontos, polinômio de 2ª ordem
para o modelo GA-LDA
LDA com 96,1%
9
de
e taxa de classificação correta,
correta foi
escolhido por possuir menor número de erro no conjunto
conjunt teste em
comparação aos outros pré-processamentos.
pré
Tal escolha se explica também porque os dados derivados podem
não conter características físicas nos espectros NIR como, desvio de linha
de base e espalhamento de sinal, características estas
tas presentes nos
dados sem pré-processamento
processamento e isso pode influenciar nos modelos de
classificação a ser desenvolvido.
CAPÍTULO IV – RESULTADOS E DISCUSSÃO
| 43
Tabela 4.3 Tabela dos erros dos conjuntos de amostras de alface dos modelos
construídos a partir de diferentes pré-processamentos.
PRÉPROC.
SEM P.
GA-LDA
Var.
Sel.
Erros
Trein. Val
25
2
0
TCC(%)
97,1
SNV
Var.
Erros
Sel.
Trein. Val
30
1
0
TCC(%)
96,1
DERIV.
Var.
Erros
Sel.
Trein. Val
31
0
2
TCC(%)
96,1
MSC
Var.
Erros
Sel.
Trein. Val
24
1
3
TCC(%)
93,3
SW-LDA
Var.
Erros
Sel.
Test
Trein. Val
1
5
22
8
66,3
Var.
Erros
Test Sel. Trein. Val
3
10
12
8
75,9
Var.
Erros
Test Sel. Trein. Val
2
30
4
5
84,6
Var.
Erros
Test Sel. Trein. Val
3
10
14
8
73,1
SPA-LDA
Var.
Erros
Sel.
Test
Trein. Val
5
14
7
5
81,7
Var.
Erros
Test Sel. Trein. Val
5
9
12
2
83,6
Var.
Erros
Test Sel. Trein. Val
7
4
14
6
76,9
Var.
Erros
Test Sel. Trein. Val
6
10
11
6
78,8
Test
7
Test
3
Test
4
Test
5
Entre os modelos LDA , os piores resultados de validação em termos
de TCC foram obtidos com SPA-LDA onde somente 16 das 22 amostras de
validação foram classificadas corretamente. Este resultado corresponde a
um TCC de 72,7%, indicando a pouca discriminação entre as classes para
o conjunto de validação. O GA, no entanto, proporcionou melhores
resultados na validação para todos os três tipos de cultivo, classificando
corretamente as amostras desse conjunto com um TCC de 90,9%.
O modelo SPA-LDA obteve um TCC total (com amostras de
treinamento, validação e teste) um valor de 76,9%, ou seja, classifica
corretamente 80 amostras das 104 no total. Já para o modelo GA-LDA,
uma melhor discriminação entre as classes das amostras de alface foi
observada (TCC de 96,1%) baseado nos três conjuntos das amostras.
As Figuras 4.16, 4.17 e 4.18 a seguir mostram os números de
variáveis selecionadas pelo SW, SPA e GA de 30, 4 e 31, respectivamente.
CAPÍTULO IV – RESULTADOS E DISCUSSÃO
| 44
Figura 4.16. Representação das variáveis
ariáveis selecionadas pelo algoritmo
al
SW
para as amostras de alface.
alface
Figura 4.17. Representação das variáveis
variáveis selecionadas pelo algoritmo
SPA para as amostras de alface.
alface
CAPÍTULO IV – RESULTADOS E DISCUSSÃO
| 45
Figura 4.18. Representação das variáveis
variáveis selecionadas pelo algoritmo GA
para as amostras de alface.
alface
O algoritmo GA seleciona vários números de onda em uma única
banda, enquanto que o SPA (Figura 4.17) seleciona poucos números de
ondas,, isso é causado por problemas de colinearidade por parte do GA.
GA
Esse fato pode ter contribuído
contribu do para que o GA tenha melhor poder
discriminatório quando comparado ao SPA.. Adicionalmente,
Adicionalmente o SPA
selecionou variáveis na
n próximo a 4200 cm-1 e 4800 cm-1
, que podem ser
atribuídas à presença de estiramentos C-H
C
e CH2 associada aos lípidios,
lípid
bem como bandas de combinação N-H e O-H,
H, os quais podem ser
atribuídas às proteínas e carboidratos,
ca
, respectivamente (WORKMAN,
1996; WORKMAN e WEYER, 2008). As variáveis correspondentes a estas
bandas
também
foram
selecionados
pelos
outros
dois
algo
algoritmos
estudados. Além disso, SPA e GA selecionaram variáveis na região de
5300 cm-1 associados a CONH2, proteínas (WORKMAN,
WORKMAN, 1996).
1996
O desempenho dos modelos LDA construídos com as variáveis
selecionadas
lecionadas pode ser visualizado através dos escores mostrados nas
Figuras 4.19, 4.20
20 e 4.21, para SW-LDA, SPA--LDA e GA-LDA,
CAPÍTULO IV – RESULTADOS E DISCUSSÃO
| 46
respectivamente. Os gráficos apresentam as funções discriminantes (DF2
× DF1) para
ra o conjunto dos dados.
dados
Figura 4.19. Gráfico dos escores de DF2 x DF1 para o modelo SW-LDA,
considerando as 104 amostras de alface
a
( convencional,
hidropônico e
orgânico).
Figura 4.20. Gráfico dos escores de DF2 x DF1 para o modelo SPA-LDA,
hidropônico e
considerando as 104 amostras de alface ( convencional,
orgânico).
CAPÍTULO IV – RESULTADOS E DISCUSSÃO
| 47
Figura 4.21. Gráfico dos escores de DF2 x DF1 para o modelo GA-LDA,
considerando as 104 amostras de alface ( convencional,
hidropônico e
orgânico).
Nota-se nas Figuras 4.19, 4.20 e 4.21 que para os três modelos
modelos obtidos há uma mesma tendência na separação das classes ao
longo da DF1 e DF2. A DF1 separa as amostras da classe hidropônico das
demais, orgânico e convencional, e, essa discriminação possivelmente é
causada pelo teor de nitrato presente em maior quantidade nas plantas de
cultivo hidropônico do que nas plantas de cultivo orgânico
orgânico e convencional.
Já na DF2 para os modelos obtidos pelo SPA-LDA
SPA
(Figura
Figura 4.20), observase uma sobreposição das classes convencional e orgânico, enquanto
en
que
para os modelos GA--LDA (Figura 4.21) e SW-LDA (Figura
Figura 4.19), notase a separação dessas classes (orgânico e convencional) devido a
umidade.
A Figura 4.22 mostra o gráfico dos pesos das variáveis escolhidas
pelo modelo GA-LDA.
CAPÍTULO IV – RESULTADOS E DISCUSSÃO
| 48
Figura 4.22. Gráfico dos pesos das variáveis selecionadas pelo GA-LDA,
para as 104 amostras de alface
A partir o gráfico dos pesos na Figura 4.22, observa-se que entre
as variáveis escolhidas pelo modelo GA-LDA, as variáveis de maiores
pesos para a FD1 foram as variáveis 19, 20 e 21 correspondendo aos
números de ondas 4528 cm-1 4524 cm-1 e 4512 cm-1,respectivamente.
Esses números de onda são referentes a banda de proteína (CONH2), por
isso a função discriminante 1 separa as classes das amostras provenientes
do cultivo hidropônico das demais classes (orgânico e convencional). Já
para a FD2 as variáveis de maiores pesos foram 17 e 18, correspondendo
aos números de ondas 4568 cm-1 e 4566 cm-1, atribuídos a banda de
umidade (H2O). Esse resultado faz sentindo pois as variáveis selecionadas
nessa região de 4545 cm-1 tem uma melhor discriminação das classes
orgânico e convencional ao longo da DF2 (Figuras 4.19 e 4.21).
Os modelos LDA obtidos com as variáveis selecionadas por SW, SPA
e algoritmos GA foram aplicados à classificação de um conjunto de teste.
A Tabela 4.4 resume os resultados em termos de classificação correta
para os três modelos.
CAPÍTULO IV – RESULTADOS E DISCUSSÃO
| 49
Tabela 4.4 Resultados de classificação obtidos com os modelos SW-LDA, SPALDA e GA-LDA para o conjunto de teste das amostras de alface (1):
Convencional; (2): Hidropônico e (3): Orgânico.
Conjunto
de Teste
Índ. de
classe
verdadeiro
SW-LDA (30)*
SPA-LDA (4)
GA-LDA (31)
Índice de classe Previsto
N
1
6
2
10
3
6
TCC
(%)
1
2
3
5
1
68,2 1
5
TCC
(%)
1
2
3
-
2
1
9
-
81,8 -
-
1
-
1
2
3
3
5
-
1
10 -
90,9 -
-
TCC
(%)
6
1
10 -
5
*0,99
É interessante notar que a maior taxa de erros nos modelos de GALDA e SW-LDA está entre as classes 1 (convencional) e classe 3
(orgânico). No entanto, o modelo de GA-LDA mostrou apenas dois erros
devido a uma amostra do tipo orgânico ser classificada como convencional
e uma amostra convencional ser classificada como orgânica.
O desempenho da classificação não foi alcançado por SW-LDA, que
teve uma taxa de apenas 68,2% de classificação correta. Estes erros
podem ser atribuídos a semelhanças entre os tipos de cultivos em
questão, da concentração de nutrients, teor de água presente nas
amostras ou a baixa sensibilidade do NIR.
CAPÍTULO
V
.
CONCLUSÃO
CAPÍTULO V – CONCLUSÃO
| 51
5 CONCLUSÃO
Estes estudos de caso, obtidos de amostras de barra de cereais e
alface de tipos e formas de cultivos distintos, mostraram que a seleção do
número de onda pode ser a chave para uma discriminação correta das
amostras, especialmente quando o modelo GA-LDA é usado.
Os resultados mostraram ainda a importância da análise exploratória
dos dados, bem como a escolha da região espectral e pré-processamento
dos dados e realização da divisão dos conjuntos de amostras, como
conjunto de treinamento, validação e teste.
Os
métodos
desenvolvidos
baseados
em
análises
screening,
apresentaram ser simples e rápidos, proporcionando a identificação das
classes das matrizes avaliadas com uma redução de custo.
Os resultados obtidos indicaram que o método proposto neste
trabalho apresentou ser uma alternativa promissora para classificar
amostras de barra de cereais e alface.
CAPÍTULO
VI
.
REFERÊNCIAS
CAPÍTULO VI – REFERÊNCIAS
| 53
REFERÊNCIAS
ALAMPRESE, C.; CASALE, M.; SINELLI, N.; LANTERI, S.; CASIRAGHI, E.,
Detection of minced beef adulteration with turkey meat by UVevis, NIR
and MIR spectroscopy, LWT - Food Science and Technology,. 53: 225,
2013.
ANVISA(a). Portaria ANVISA SVS/MS No. 27 de 13.01.1998. Disponível
em:
<http://portal.anvisa.gov.br/wps/wcm/connect/9180ca00474581008d31d
d3fbc4c6735/PORTARIA_27_1998.pdf?MOD=AJPERES >. Acessado em:
15 de novembro de 2013.
ANVISA(b). Portaria ANVISA SVS/MS No. 29 de 13.01.1998. Disponível
em:
<http://portal.anvisa.gov.br/wps/wcm/connect/e155af80474597059f50df
3fbc4c6735/portaria_29.pdf?MOD=AJPERES>.
Acessado
em:
15
de
novembro de 2013.
AOAC. Official methods of analysis of the association of official analytical
chemists. 15ª edição. Washington, D.C.: AOAC, 1990.
BARNES, R. J.; DHANOA, M. S.; LISTER, S. J., Standard normal variate
transformation
and
de-trending
of
near-infrared
diffuse
reflectance
spectra. Applied Spectroscopy, 43: 772, 1989.
BERRUETA, L. A.; ALONSO-SALCES, R. M.; HÉBERGER, K., Supervised
pattern recognition in food analysis, Journal of Chromatography A, 1158:
196, 2007.
CAPÍTULO VI – REFERÊNCIAS
| 54
BEVILACQUA, M.; BUCCI, R.; MATERAZZI, S.; MARINI, F., Application of
near infrared (NIR) spectroscopy coupled to chemometrics for dried eggpasta characterization and egg content quantification, Food Chemistry,
140: 726, 2013.
CANECA, A. R.; PIMENTEL, M. F.; GALVÃO, R. K. H.; MATTA, C. E.;
CARVALHO, F. R.; RAIMUNDO JR., I. M.; PASQUINI, C.; ROHWEDDER, J.
J. R., Assessment of infrared spectroscopy andmultivariate techniques for
monitoring the service condition of diesel-engine lubricating oils, Talanta,
70: 344, 2006.
CASTRO, A. A. M.; PRADO, P. P. L. Algoritmos para reconhecimento de
padrões, Revista de Ciências Exatas, 5-8: 129-145, 1999-2002.
CEN, H.; HE, Y., Theory and application of near infrared reflectance
spectroscopy in determination of food quality, Trends in Food Science
Technology, 18: 72, 2007.
CHEN, Q.; ZHAO, J.; HUANG, X.; ZHANG, H.; LIU, M., Simultaneous
determination of total polyphenols and caffeine contents of green tea by
near-infrared reflectance spectroscopy, Microchemical Journal, 83: 42,
2006.
CONDE, B.; GOLDSCHMIDT, R.; FERLIN, C.; SOARES, J., Seleção de
Variáveis na descoberta de conhecimento em Bases de Dados, 2º
Congresso Científico da UniverCidade – Rio de Janeiro, 2007.
COMETTI, N. N.; MATIAS, G. C. S.; ZONTA, E.; MARY, W.; FERNANDES,
M. S., Compostos nitrogenados e açúcares solúveis em tecidos de alface
orgânica, hidropônica e convencional, Horticultura Brasileira, 22: 748,
2004.
CAPÍTULO VI – REFERÊNCIAS
| 55
COSTA FILHO, P. A., Estudo comparativo de técnicas de inteligência
artificial
e
modelos
lineares
em
determinações
quantitativas
no
infravermelho próximo, Tese de doutorado, UNICAMP. Campinas, São
Paulo, 2003.
CYBERDIET. Doenças causadas pela má alimentação. Disponível em:
<http://cyberdiet.terra.com.br/doencas-causadas-pela-ma-alimentacao12-1-12-55.html>. Acessado em: 15 de novembro de 2013.
CRUZ, A. G.; CADENA, R. S.; ALVARO, M. B. V. B.; SANT'ANA, A. S.;
OLIVEIRA, C. A. F.; FARIA, J. A. F.; BOLINI, H. M. A.; FERREIRA, M. M. C.,
Assessing the use of different chemometric techniques to discriminate
low-fat and full-fat yogurts, LWT - Food Science and Technology, 50:
210, 2013.
DAROLT, M. R. Comparação da Qualidade do Alimento Orgânico com o
Convencional
In:
STRIGHETA,
P.C
&
MUNIZ,
J.N.
Alimentos
Orgânicos:Produção, Tecnologia e Certificação.1 ed.Viçosa: p. 289-312.
2003.
DOMINGUES, D. S.; TAKAHASHI, H. W.; CAMARA, C. A. P.; NIXDORF, S.
L., Automated system developed to control pH and concentration of
nutrient solution evaluated in hydroponic lettuce production, Computers
and Electronics in Agriculture, 84: 53, 2012.
FARINAZZI-MACHADO, F. M. V.; BARBALHO, S. M.; OSHIIWA, M.;
GOULART, R.; PESSAN JUNIOR, O, Use of cereal bars with quinoa
(Chenopodium quinoa W.) to reduce risk factors related to cardiovascular
diseases, Ciência e Tecnologia de Alimentos, 32: 239, 2012.
FAVARO-TRINDADE, C. S.; MARTELLO, L. S.; MARCATTI, B.; MORETTI, T.
S.; PETRUS, R. R.; ALMEIDA, E.; FERRAZ, J. B. S., Efeito dos Sistemas de
CAPÍTULO VI – REFERÊNCIAS
| 56
Cultivo Orgânico, Hidropônico e Convencional na Qualidade de Alface Lisa,
Brazilian Journal of Food Technology, 10: 111, 2007.
FERNANDES, A. P., Emprego de estratégias quimiométricas para a
diferenciação de alimentos de acordo com as formas de produção. Tese de
doutorado. UFSCar – São Carlos, 2006.
FERREIRA, D. S.; GALÃO, O. F.; PALLONE, J. A. L.; POPPI, R. J.,
Comparison and application of near-infrared (NIR) and mid-infrared (MIR)
spectroscopy for determination of quality parameters in soybean samples,
Food Control, 35: 227, 2014.
FERREIRA, L. L.; ANICETO, R. R.; MONTENEGRO, I. N. A.; RIBEIRO, T. S.;
ALMEIDA, D. G.; PORTO, V. C. N.,Comportamento de variedades de alface
na semeadura de março no município de Areia-PB, Scientia plena, 9:
040202, 2013.
FILGUEIRA, F. A. R., Novo manual de olericultura: agrotecnologia
moderna na produção e comercialização de hortaliças. 2ª ed., UFV, 2003.
FILHO, P. A. C., Rapid determination of sucrose in chocolate mass using
near infrared spectroscopy, Analytica Chimica Acta, 631: 206, 2009.
FISHER, R. A., The use of multiple measurements in taxonomic problems.
Annals of Eugenics, 7: 179, 1936.
FREIRE, A. G.; OLIVEIRA, F. A.; CARRILHO, M. J. S. O.; TEIXEIRA, M. K.
O.; FREITAS, D. C., Qualidade de cultivares de alface produzida em
condições Salinas, Revista Caatinga, 22: 81, 2009.
GRANATO,
D.;
BRANCO,
G.
F.;
FARIA,
J.
A.
F.;
CRUZ,
A.
G.,
Characterization of Brazilian lager and brown ale beers based on color,
CAPÍTULO VI – REFERÊNCIAS
| 57
phenolic compounds, and antioxidant activity using chemometrics, Journal
of the Science of Food and Agriculture, 91: 563, 2011.
GUIVANT, J. A. S., Os supermercados na oferta de alimentos orgânicos:
apelando ao estilo de vida ego-trip, Ambiente & Sociedade, 6: 63, 2003.
HAIR, J. F.; TATHAM, R. L.; ANDERSON, R. E.; BLACK, W., Análise
Multivariada dos dados, 5ª Edição, Bookman, 2005 Porto Alegre
HENZ, G. P.; SUINAGA, F. A., Tipos de Alface Cultivados no Brasil,
Comunicado Técnico 75, 2009.
INSTITUTO ADOLFO LUTZ. Métodos químicos e físicos para análise de
alimentos. 3ª edição. São Paulo, 1985.
KANO, C.; CHAVES, F. C. M.; BERNI, R. F.; GONÇALVES, N. R.; SUINAGA,
F. A., Avaliação de cultivares de alface crespa sob cultivo protegido no
município de Iranduba/AM, Horticultura Brasileira, 30: S390, 2012.
KENNARD,
R.
W.;
STONE,
L.
A.,
Computer
aided
design
of
experiments,Technometrics, 11: 137, 1969.
KONZEN, P. H. A.; FURTADO, J. C.; CARVALHO, C. W.; FERRÃO, M. F.;
MOLZ, R. F.; BASSANI, I. A.; HÜNING, S. L., Otimização de métodos de
controle de qualidade de fármacos usando algoritmo genético e busca
tabu, Pesqui. Oper.,23: 189, 2003.
LIMA, M. E., Avaliação do desempenho da cultura da alface (Lactuca
sativa) cultivada em sistema orgânico de produção, sob diferentes lâminas
de irrigação e coberturas do solo. Dissertação de mestrado, Seropédica –
RJ, 2007.
CAPÍTULO VI – REFERÊNCIAS
| 58
LIMA, K. M. G.; TREVISAN, M. G.; POPPI, R. J.; ANDRADE, J. C.,
Determinação
não
destrutiva
do
nitrogênio
total
em
plantas
por
espectroscopia de reflectância difusa no infravermelho próximo, Quim.
Nova, 31: 700, 2008.
LOBATO, L. P.; PEREIRA, A. E. C.; LAZARETTI, M. M. L.; BARBOSA, D. S.;
CARREIRA, C. M.; MANDARINO, J. M. G.; GROSSMANN, M. V. E., Snack
bars with high soy protein and isoflavone content for use in diets to
control
dyslipidaemia,
International
Journal
of
Food
Sciences
and
Nutrition, 63: 49, 2012.
LÓPEZ-GALVÉZ, F.; ALLENDE, A.; TRUCHADO, P.; MARTINEZ-SÁNCHEZ,
A.; TUDELA, J. A.; SELMA, M. V.; GIL, M. I., Suitability of aqueous
chlorine dioxide versus sodium hypochlorite as an effective sanitizer for
preserving
quality
of
fresh-cut
lettuce
while
avoiding
by-product
formation. Postharvest Biology and Technology, 55: 53, 2010.
LOUREDO,
P.,
Nutrientes.
Disponível
em:
<
http://www.brasilescola.com/saude-na-escola/conteudo/nutrientes.htm>.
Acessado em: 18 de novembro de 2013.
MACDIARMID, J. I.; LOE, J.; KYLE, J.; MCNEILL, G., ‘‘It was an education
in portion size’’. Experience of eating a healthy diet and barriers to long
term dietary change, Appetite, 71: 411, 2013.
MAPA(a). Ministério de Agricultura, Pecuária e Abastecimento,. Disponível
em:
<http://www.agricultura.gov.br/portal/page/portal/Internet-
MAPA/pagina-inicial/desenvolvimento-sustentavel/organicos/o-que-eagricultura-organica/perguntas-e-respostas>.
novembro de 2013.
Acessado
em:
15
de
CAPÍTULO VI – REFERÊNCIAS
| 59
MAPA(b). Ministério de Agricultura, Pecuária e Abastecimento,. Disponível
em:
<http://www.agricultura.gov.br/acessoainformacao/perguntas-
frequentes>. Acessado em: 15 de novembro de 2013.
MARTINEZ, M. I. V., Discriminação de alface orgânnicas e convencionais
usando determinação elementar e métodos quimiométricos. Dissertação
de mestrado, UFABC, Santo André, 2011.
MATIAS, B., Consumo de alimentos saudáveis no Brasil cresce 82%.
Disponível
em:
<http://www.agenciasebrae.com.br/noticia.kmf?canal=199&cod=100425
95>. Acessado em: 15 de novembro de 2013.
MAZUR, L., Aplicação de metodologia por nir para determinação de
metilxantinas
presentes
na
erva-mate,
Dissertação
de
mestrado,
Universidade Federal Do Paraná, Curitiba – 2012.
MELLO, A. V.; CASSIMIRO, T. A. S.; POSPISCHEK, V. S.; VILLARIM, W. L.
F.; PEREIRA, I. R. O.; ABREU, E. S., Avaliação da composição centesimal
e da rotulagem de barras de cereais, e-Scientia, 5: 41, 2012.
MIYAZAWA, M.; KHATOUNIAN, C. A.; PENHA, L. A. O., Teor de nitrato nas
folhas
de
alface
produzida
em
cultivo
convencional,
orgânico
e
hidropônico, Agroecologia, fevereiro-março: 23, 2001.
NETO, N. J. G.; PESSOA, R. M. L.; QUEIROGA, I. M. B. N.; MAGNANI, M.;
FREITAS, F. I. S.; SOUZA, E. L.; MACIEL, J. F., Bacterial counts and the
occurrence of parasites in lettuce (Lactuca sativa) from different cropping
systems in Brazil, Food Control, 28: 47, 2012.
NETO, B. B; SCARMINIO, I. S; BRUNS, R. E. 25 anos de quimiometria no
Brasil, Química Nova, 29:1401, 2006.
CAPÍTULO VI – REFERÊNCIAS
| 60
OHSE, S.; RAMOS, D. M.; CARVALHO, S. M.; FETT, R.; OLIVEIRA, J. L. B.,
Composição centesimal e teor de nitrato em cinco cultivares de alface
produzidas sob cultivo hidropônico, Bragantia, 68:.407, 2009.
OLIVEIRA, C. F. P.; MALTA, H. L.; JESUS, M. A. C. L.; CRUZ, R. S.;
CARDOSO, F. S. N., Desenvolvimento, avaliação sensorial e físico-química
de barra de cereal de caju, Revista Brasileira de Tecnologia Agroindustrial,
7: 934, 2013.
OMAIAA. Observatório dos Mercados Agrícolas e das Importações Agro –
Alimentares.
Disponível
<http://www.observatorioagricola.pt/item.asp?id_item=133>.
em:
Acessado
em: 17 de novembro de 2013.
OMS. The World Health Report: Health 2000: Health Systems:Improving
Performance, Geneva :2000.
PASQUINI, C., Near infrared spectroscopy: Fundamentals, practical
aspects and analytical applications, Journal of the Brazilian Chemical
Society, 14: 198, 2003.
PAIVA, C. L.; QUEIROZ, V. A. V.; RODRIGUES, J. A. S., Estudos sensoriais
para determinação da vida de prateleira de barra de cereais com pipoca
de sorgo, Revista Brasileira de Milho e Sorgo, 11: 302, 2012.
PERTSCHY, P., Comparação do teor de sódio em alimentos convencionais,
light e diet pela rotulagem dos produtos, Trabalho de Conclusão de Curso,
UNICENTRO. Guarapuava, 2010.
PONTES, M. J. C.; Algoritmo das projeções sucessivas para a seleção de
variáveis espectrais em problemas de classificação. Tese de doutorado.
UFPB, João Pessoa, 2009.
CAPÍTULO VI – REFERÊNCIAS
| 61
PONTES, M J C.; GALVAO, R. K. H.; ARAÚJO, M. C. U.; MOREIRA, P. N. T.;
PESSOA NETO, O. D.; JOSÉ, G. E.; SALDANHA, T. C. B., The successive
projections algorithm for spectral variable selection in classification
problems, Chemometrics and intelligent laboratory systems, 78: 11,
2005.
RIBEIRO,
D.
B.
M.,
Desenvolvimento
de
metodologias
analíticas
multivariadas empregando espectroscopia Raman de baixa resolução
amplificada por superfície, Tese de Doutorado em Ciências, Universidade
Estadual de Campinas, Campinas, São Paulo, 2009.
ROCHA, R. S. F. “Estudo de propriedades físico-químicas de resinas
odontológicas: grau de conversão, dureza e expansão térmica.”
Solteira
–
SP, Pós-Graduação
Ilha
em Ciências dos Materiais, UNESP,
Dissertação de Mestrado, 2006.
RODRIGUES, M. L.; FIORESE, F.; JÚLIO, T. S. K.; LIRA, R. K., Controle de
qualidade e análise centesimal de uma barra de cereal, comercializada na
cidade de Cascavel-PR, Cultivando o Saber, 4: 36, 2011.
ROGGO, Y.; DUPONCHEL, L.; HUVENNE, J. P., Comparison of supervised
pattern recognition methods with McNemar's statistical test application to
qualitative analysis of sugar beet by near-infrared spectroscopy. Analytica
Chimica Acta, 477: 187–200, 2003.
ROVERSI,
R.
minimamente
M.;
MASSON,
processada
M.
L.,
Qualidade
acondicionada
em
da
alface
atmosfera
crespa
modificada,
Ciência e Agrotecnologia, 28: 823, 2004.
SALA, F. C.; COSTA, C. P., Retrospectiva e tendência da alfacicultura
brasileira, Horticultura Brasileira, 30: 187, 2012.
CAPÍTULO VI – REFERÊNCIAS
| 62
SANTANA, L. R. R.; CARVALHO, R. D. S; LEITE, C. C.; ALCÂNTARA, L. M.;
OLIVEIRA, T. W. S.; RODRIGUES, B. M., Qualidade física, microbiológica e
parasitológica de alfaces (lactuca sativa) de diferentes sistemas de cultivo,
Ciência e Tecnologia de Alimentos, 26: 264, 2006.
SAVITZKY, A.; GOLAY, M. J. E., Smoothing and differentiation of data by
simplified least squares procedures, Analytical Chemistry, 36: 1627,
1964.
SCOTT, R.; DONOGHOE, M.; WATTS, G. F.; O'BRIEN, R.; PARDY, C.;
TASKINEN, M. R.; DAVIS, T. M.; COLMAN, P. G.; MANNING, P.; FULCHER,
G.; KEECH, A. C., Impact ofmetabolic syndrome and its components on
cardiovascular disease eventrates in 4900 patients with type 2 diabetes
assigned
to
placebo
in
the
field
randomised
trial,
Cardiovascular
Diabetology, 10: 102, 2011.
SILVA, T. C.; RODRIGUES, T. P.; CARVALHO, P. D.; OLIVEIRA, T. B.;
CAMPOS, D. M. B., Encontro de rhabditis sp em alface lactuca sativa
comercializada em Anápolis, Goiás, Brasil, Revista de Patologia Tropical,
42: 201, 2013.
SILVERSTEIN, R. M; WEBSTER, F. X; KIEMLE, D. J. Identificação
Espectrométrica de Compostos Orgânicos. Sétima Edição, Gen – LTC,
2007.
SKOOG, D. A.; HOLLER, F. J.; NIEMAN T. A, Princípios de Análise
Instrumental. Quinta Edição, Porto Alegre: Bookmam, 2002.
SONNENBERG, L.; GELSOMIN, E.; LEVY, D. E.; RIIS, J.; BARRACLOUGH,
S.; THORNDIKE, A. N.; A traffic light food labeling intervention increases
CAPÍTULO VI – REFERÊNCIAS
| 63
consumer awareness of health and healthy choices at the point-ofpurchase, Preventive Medicine, 57: 253, 2013.
STARK, E.; LUCHTER, K.; MARGOSHES, M., Near-Infrared Analysis
(NIRA): A Technology for Quantitative and Qualitative Analysis, 22: 335,
1986.
SUINAGA, F. A.; BOITEUX, L. S.; CABRAL, C. S.; RODRIGUES, C. S.,
Efeitos do calor e fontes tolerância ao florescimento precoce em
variedades de alface do tipo americana, ComunicadoTécnico 88, 2013.
TACO.
Tabela
Brasileira
de
Composição
de
Alimentos,
4ª
Edição.
Disponível
em:<http://www.unicamp.br/nepa/taco/contar/taco_4_edicao_ampliada_
e_revisada>. Acessado em: 17 de novembro de 2013.
TEYE, E.; HUANG, X.; DAI, H.; CHEN, Q., Rapid differentiation of Ghana
cocoa
beans
by
FT-NIR
spectroscopy
coupled
with
multivariate
classification, Spectrochimica Acta Part A: Molecular and Biomolecular
Spectroscopy, 114: 183, 2013.
TEÓFILO, R. F., Métodos Quimiométricos: Uma Visão Geral - Conceitos
básicos de quimiometria, Universidade Federal de Viçosa, Viçosa, 2013.
VALCÁRCEL, M.; CÁRDENAS, S.; GALLEGO, M., Sample screening systems
in analytical chemistry, Trends in Analytical Chemistry, 18: 685, 1999.
VIANA, E. P. T.; DANTAS, R. T.; SILVA, R. T. S.; COSTA, J. H. S.;
SOARES, L. A. A., Cultivo de alface sob diferentes condições ambientais,
Agropecuária científica no semiárido, 9: 21, 2013.
CAPÍTULO VI – REFERÊNCIAS
| 64
VILLAVICENCIO, A. L. C. H.; ARAÚJO, M. M.; FANARO, G. B.; RELA, P. R.;
MANCINI-FILHO, J., Sensorial analysis evaluation in cereal bars preserved
by ionizing radiation processing, Radiation Physics and Chemistry, 76:
1875, 2007.
XIAOBO, Z.; JIEWEN, Z.; POVEY, M. J. W.; HOLMES, M.; HANPINA, M.,
Variables selection methods in near-infrared spectroscopy, Analytica
Chimica Acta, 667: 14, 2010.
WORKMAN, J. J., Interpretive spectroscopy for near infrared, Reviews
Applied Spectroscopy, 31: 251, 1996.
WORKMAN, J.; WEYER, L.,. Practical guide to interpretive near infrared
spectroscopy. Nova York, 2008.
ZAVERI, S.; DRUMMOND, S., The effect of including a conventional snack
(cereal bar) and a nonconventional snack (almonds) on hunger, eating
frequency, dietary intake and body weight, Journal of Human Nutrition
and Dietetics, 22: 461, 2009.
CAPÍTULO
VI
.
ANEXO
Food Research International 51 (2013) 924–928
Contents lists available at SciVerse ScienceDirect
Food Research International
journal homepage: www.elsevier.com/locate/foodres
Classification of cereal bars using near infrared spectroscopy and linear
discriminant analysis
Anna Luiza Bizerra Brito a, Lívia Rodrigues Brito b, Fernanda Araújo Honorato c,
Márcio José Coelho Pontes a, Liliana Fátima Bezerra Lira Pontes a,⁎
a
b
c
Universidade Federal da Paraíba, Departamento de Química, João Pessoa, PB, Brazil
Universidade Federal de Pernambuco, Departamento de Química Fundamental, Recife PE, Brazil
Universidade Federal de Pernambuco, Departamento de Engenharia Química, Recife PE, Brazil
a r t i c l e
i n f o
Article history:
Received 5 November 2012
Accepted 9 February 2013
Available online 20 February 2013
Keywords:
Cereal bar
Near infrared spectroscopy
Linear discriminant analysis
Successive projection algorithm
Genetic algorithm
Stepwise formulation
a b s t r a c t
This work proposes an analytical method for cereal bar classification based on the use of near infrared spectroscopy (NIRS) and supervised pattern recognition techniques. Linear discriminant analysis (LDA) is
employed to build a classification model on the basis of a reduced subset of variables (wavenumbers). For
the purpose of variable selection, three techniques are considered, namely successive projection algorithm
(SPA), Genetic Algorithm (GA), and stepwise (SW) formulation. The methodology is validated in a case
study involving the classification of 121 cereal bar samples into three different types (conventional, diet
and light). The results show that the LDA/GA model is superior to the LDA/SPA and LDA/SW models with respect to classification accuracy in an independent prediction set. Some advantages of the proposed method
are speed, that the analytical measurement is performed quickly (one minute or less per sample), no reagents, low sample consumption and minimum sample preparation demands. In view of the results obtained
in this study the proposed method may be considered valid for use in cereal bar classification.
© 2013 Elsevier Ltd. All rights reserved.
1. Introduction
Consumption of foods which have low calorie content has increased
considerably (Bingol, Zhang, Pan, & McHugh, 2012; Carrillo, Varela, &
Fiszman, 2012; Gerend, 2009; Kocken, Buijs, & Snel, 2006). With so
many options on the market, however, the consumer finds it confusing
to select the product they want among foods with labels such as “natural”, “light”, “diet”, “organic”, and “functional”, among others.
Light and diet foods can been found in most supermarkets and
labeled as products with low fat, salt, protein, carbohydrates or
sugar contents. According to the National Health Surveillance Agency
(ANVISA) (Brazilian Agency of Sanitary Surveillance, 2012) these
foods are specially formulated with modifications in nutrient content,
suitable for use in different diets or for people with specific physiological and metabolic conditions.
The term “light” can be used for a food when the quantity of calories
or nutrients is at least 25% less than the conventional product.
According to ANVISA, “diet” can be applied to foods with an absence
of sucrose/glucose or foods indicated for diets with restriction of some
nutrients such as fat, carbohydrate, protein and sodium (Brazilian
Agency of Sanitary Surveillance, 2012).
⁎ Corresponding author at: Universidade Federal da Paraíba, Departamento de Química,
Laboratório de Combustíveis e Materiais (LACOM), CEP 58051-970, João Pessoa, PB, Brazil.
Tel./fax: +55 83 3216 7441.
E-mail address: [email protected] (L.F.B.L. Pontes).
0963-9969/$ – see front matter © 2013 Elsevier Ltd. All rights reserved.
http://dx.doi.org/10.1016/j.foodres.2013.02.014
In order to complement regular food, products such as cereal
bars are widely consumed as a fast snack with low caloric value.
These foods were introduced nearly a decade ago, when consumers
became particularly interested in health and diet, since the cereal
bars have nutrients such as fibers, vitamins and minerals. Today,
cereal bars are consumed worldwide, including by people on
diets, or those with health problems or just as a quick snack
(Farinazzi-Machado, Barbalho, Oshiiwa, Goulart, & Pessan Junior,
2012; Lobato et al., 2012; Villavicencio, Araújo, Fanaro, Rela, &
Mancini-Filho, 2007; Zaveri & Drummond, 2009). Because they
are easy to carry and are available on the market in different
types, brands, flavors and nutritional compositions, these foods
are very well adapted in the day-to-day lives of modern people.
For the consumer, the choice of the product is associated with its
appearance, the description on the package and the nutritional information given. These parameters are not always effective, however, in
guaranteeing a safe choice of the desired food. Incorrect information
on the package or food label, such as the absence or presence of
sugar or carbohydrates, can lead to incorrect choices by diabetics,
for example, causing hyperglycemia and cardiovascular problems
(Scott et al., 2011).
The quality control of cereal bars is performed through physical
and chemical tests, such as protein content using the method described by Kjeldahl (AOAC, 1997), moisture determination (Adolfo
Lutz Institute, 1985), lipid content (AOAC, 1997) as well as sensory
analysis. These reference methods have the drawback of being
A.L.B. Brito et al. / Food Research International 51 (2013) 924–928
destructive, tedious, time-consuming, using huge amounts of toxic
chemical reagents, expensive and, in some cases, subjective.
Infrared spectroscopy (IR) is a non-destructive alternative analytical technique which allows reliable, direct and fast determination
of different properties at the same time without sample pre-treatment (Pasquini, 2003). Several papers in the literature report the
use of near infrared (NIR) spectroscopy to monitor the quality of
foods (Riovanto, Cynkar, Berzaghi, & Cozzolino, 2011; Sinelli,
Cerretani, Di Egidio, Bendini, & Casiraghi, 2010).
In chemometrics data analysis, pattern recognition methods are a
powerful tool in context of food quality assessment and food composition analysis (Berrueta, Alonso-Salces, & Héberger, 2007; Cen & He,
2007). These methods have been successfully applied to classify a number of foods, including yogurt (Cruz et al., 2013), beer (Granato, Branco,
Faria, & Cruz, 2011), coffee (Souto et al., 2010), and coconut oil
(Rohman & Che Man, 2011), among others (Berrueta et al., 2007; Cen
& He, 2007).
Supervised pattern recognition methods essentially differ in the way
they define classification rules. Basically, they can be divided into discriminating and class-modelling methods (Roggo, Duponchel, &
Huvenne, 2003). Linear discriminant analysis (LDA) and partial least
square-discriminant analysis (PLS-DA) are examples of discriminating
techniques, whereas the soft independent modelling of class analogy
(SIMCA) is a class-modelling method. The modeling strategies among
these methods are substantially different. LDA and PLS-DA focus on
the dissimilarity between classes and the samples must be classified
in a particular training classe (Roggo et al., 2003; Vaid, Burl, & Lewis,
2001). The SIMCA method, however, considers each class separately
and performs outlier tests to decide whether a new object belongs to
a certain class, to all classes or does not belong to any class. The
SIMCA method is frequently used in data sets with high dimensionality
(Brereton, 2009) such as spectroscopic data. However, the testing procedure adopted by SIMCA has the disadvantage that one has to set a
confidence level, α. If the data are normally distributed, α % (e.g. 5%)
of objects belonging to the class will be considered as not belonging to
it. This misclassification problem can be avoided when the LDA method
is employed. The LDA method employs linear decision boundaries,
which are defined in order to maximize the ratio of between-class to
within-class dispersion (Fisher, 1936). Its has been successfully applied
to a number of classification problems (Gambarra Neto et al., 2009;
Gori, Maggio, Cerretani, Nocetti, & Caboni, 2012; Riovanto et al., 2011;
Sinelli et al., 2010; Souto et al., 2010). When compared with SIMCA
and PLS-DA, the LDA method has the disadvantage that the number of
training samples must be larger than the number of variables included
in the LDA model. Therefore, procedures based on the selection of
each variable are required for the classification of spectral data. The successive projections algorithm (SPA) (Pontes et al., 2005; Pontes, Pereira,
Pimentel, Vasconcelos, & Silva; Silva, Pontes, Pimentel, & Pontes, 2012;
Silva, Borba, et al., 2012), genetic algorithm (GA) (Pontes et al., 2005)
and stepwise (SW) formulation (Caneca et al., 2006) methods have
been adopted for this purpose in different classification problems.
In general, the literature reports only on works involving the
characterization of cereal bars as well as new food products being
developed for the market by conventional methods (Egert et al.,
2012; Fonseca, Santo, Souza, & Pereira, 2011; Heenan et al., 2012;
Santos et al., 2011). Explicit studies regarding the classification of cereal bars with respect to type (conventional, diet and light) using NIR
spectrometry and multivariate classification with wavenumber selection have not been found in the specialized literature. Thus, development of rapid and accurate methodologies is important for the
economy and public health in order to identify non-conformity in cereal bar samples.
In the present work, an analytical method to classify cereal bar samples according to type (diet, light, conventional) using NIR spectroscopy
and pattern recognition technique is proposed. For this, LDA is
employed to build a classification model on the basis of a reduced
925
subset of spectral variables selected using three different techniques:
successive projection algorithm (SPA) (Moreira, Pontes, Galvão, &
Araújo, 2009; Pontes et al., 2005), the genetic algorithm (GA) (Pontes
et al., 2005), and a stepwise (SW) formulation (Caneca et al., 2006).
The results obtained by these three methods (LDA/SPA, LDA/GA, and
LDA/SW) have been assessed in terms of classification results in a set
of samples not used in the model-building process (prediction
samples).
2. Material and methods
2.1. Samples
One hundred and twenty-one samples of three different types of
cereal bars were analyzed: Diet (35); Conventional (44) and Light
(42). All samples were crushed and sieved with 20 mesh particle size.
2.2. NIR spectra measurements
A Spectrum 400 FT–IR/FT–NIR spectrophotometer (Perkin Elmer)
equipped with accessory reflectance (NIRA) was employed to obtain
NIR spectra in the range of 10,000 a 4000 cm−1. All spectra were
recorded with an average of 16 scans, and a spectral resolution of
8 cm−1. The background spectra were obtained using the Spectralon
standard. Temperature was controlled at 23 ±1 °C throughout the
spectral acquisition process.
2.3. Chemometric procedure
Raw spectra and some pre-processing strategies such as baseline
correction, standard normal variate (SNV) (Barnes, Dhanoa, & Lister,
1989), smoothing and the Savitzky–Golay first derivative (Savitzky &
Golay, 1964), second-order polynomial (7, 11 and 15 window points),
were evaluated in terms of overall classification errors. Detection and
elimination of outliers were carried out using score, residual and leverage plots. For each type, the Kennard–Stone (KS) algorithm (Kennard &
Stone, 1969) was applied in order to divide the samples into training,
validation and prediction subsets. Table 1 presents the number of samples in each set. The validation method employed in this study is based
on the test set, thereby the training and validation samples were used in
the modelling procedures (including variable selection for LDA) whereas the prediction samples were only used in the final evaluation of the
classification models. All spectral data were mean-centered before
modeling procedures.
An exploratory analysis was initially performed in order to observe
the existence of natural groupings. For this purpose, the principal component analysis (PCA) (Souza et al., 2011) was applied to the overall
spectral data set.
The present work adopts the stepwise (SW) formulation developed
by Caneca et al. (2006). In order to decide which wavenumbers were to
be discarded, seven threshold values (0.30, 0.50, 0.70, 0.80, 0.90, 0.95,
and 0.99) of multiple correlation coefficients were tested in the LDA/
SW model. The best threshold was selected on the basis of the classification errors in the validation set.
The SPA algorithm utilized in this paper (Pontes et al., 2005) employs, as the cost function, the average risk G of misclassification by
Table 1
Number of training, validation and prediction samples in each cereal bar type.
Type
Sets
Training
Validation
Prediction
Diet
Conventional
Light
Total
17
22
20
59
09
11
11
31
09
11
11
31
926
A.L.B. Brito et al. / Food Research International 51 (2013) 924–928
LDA which is calculated in the validation set, as presented in Eq. (1).
The subset of variables which presented the lowest value of G was
then selected by the LDA/SPA algorithm.
Kv
X
G ¼ ð1=kvÞ
gk ;
ð1Þ
k¼1
where gk is the risk of misclassification of the k th validation object xk,
k = 1, …, Kv. More details about the LDA/SPA can be found in Pontes
et al. (2005) and Moreira et al. (2009).
The GA algorithm formulation presented in Pontes et al. (2005) was
used in this study, where a fitness value was defined for each chromosome as the inverse of the average risk G of misclassification by LDA,
as defined in Eq. (1). The GA routine was carried out over 100 generations with 200 chromosomes in each generation. Mutation and crossover probabilities were set to 10% and 60%, respectively. Because of
the stochastic nature of the LDA/GA algorithm, the routine was repeated
ten times (starting from different random initial populations) and the
best solution found during these 10 executions was retained.
Spectral acquisition was obtained with Spectrum Version 6.3.4. Data
preprocessing and PCA were carried out using Unscrambler® X.1
(CAMO ASA, Norway). The KS, LDA/SW, LDA/SPA and LDA/GA algorithms were coded in Matlab version 6.5 (Mathworks, USA).
3. Results and discussion
3.1. NIR spectra
Fig. 1 presents the raw NIR spectra of 121 cereal bar samples
recorded in the range of 10,000–4000 cm −1.
The spectra show the characteristics bands of carbohydrates such as
starch and sugars at 4760, 6711, 6740 cm−1; proteins at 4878–4854,
6667–6536 cm−1; fats at 4200, 4830 cm−1 and moisture at 5135,
8310 cm−1 (Workman, 1996; Workman & Weyer, 2008).
3.2. Principal component analysis
Fig. 2 presents the PC2× PC1 score plot resulting from the application of PCA to the raw NIR spectra. As can be seen, there is a substantial
dispersion and overlapping of the cereal bar types. Therefore, spectral
variable selection procedures are required in order to obtain a better
discrimination among the three cereal bar types studied. PC1 and PC2
explain 94% and 2% of the data variance, respectively.
Fig. 1. Raw NIR spectra of 121 cereal bar samples.
Fig. 2. PC2×PC1 score plot for the overall set of 121 cereal bar samples ( :conventional;
b: diet and :light).
3.3. LDA classification
The best validation results were achieved with the raw spectra
(without preprocessing). The variable numbers selected by SW,
SPA and GA were 4, 12 and 17, respectively. Among the LDA models,
the worst validation results in terms of correct classification rate
(CCR) were obtained with SW, which only correctly classified 21 of
the 31 validation samples. This outcome corresponds to a CCR of
68%. LDA/GA, however, provided better results in the validation set
for all three cereal bar types, where only one light sample was incorrectly classified as a conventional type sample. The CCR in validation
set obtained by LDA/GA and LDA/SPA models were 97%, and 90%, respectively. Possibly, the best results were achieved by LDA/GA because it selects wavenumbers around 8040 cm − 1and 8500 cm − 1,
which can be attributed to second overtone of C–H stretching of sucrose (Filho, 2009; Workman, 1996; Workman & Weyer, 2008). It is
worth noting that these variables were not selected by LDA/SW and
LDA/SPA algorithms. The wavenumbers selected by SW, SPA and GA
algorithms are presented in Fig. 3.
It can be observed that the few variables selected by SW (Fig. 3a)
are located in the region between 4300 and 5800 cm − 1 which can be
attributed to presence of a second overtone C–H band associated
with fat and combination C–H stretching. The isolated wavenumber
selected by SW (10,000 cm − 1) can be attributed to the second overtone N–H stretch associated with protein. These variables were
among those selected by SPA and GA algorithm (Fig. 3b and c).
Additionally, peaks around 8040 and 8500 cm − 1 (second overtone
Fig. 3. Mean NIR spectra with wavenumbers selected by (a) SW, (b) SPA and (c) GA.
A.L.B. Brito et al. / Food Research International 51 (2013) 924–928
927
of C–H stretching of sucrose) and 9440 cm−1 (second overtone of O–H
stretch) were selected by GA. Furthermore, the SPA and GA algorithms
selected variables around 6200–6900 cm−1 which may be attributed to
the O–H polymeric of carbohydrates (Filho, 2009; Workman, 1996;
Workman & Weyer, 2008).
The LDA models obtained with the variables selected by SW, SPA
and GA algorithms were applied to the classification of the prediction
set. Table 2 summarizes the results of the LDA/SW, LDA/SPA and
LDA/GA models in terms of correct classifications (predicted type
index equal to correct type index) and incorrect classifications (predicted
type index different from correct type index) for the prediction set.
The CCR for each model is also presented in Table 2.
The best results of LDA models were achieved with GA which correctly classified 28 of the 31 prediction samples. This classification performance was not achieved by LDA/SW, which had a correct prediction
rate of only 61%. As can be seen in Table 2, the most frequent errors occurred between the light and conventional types. In fact, these foods
have the same nutrients, but sometimes in different concentrations.
The classification performance of LDA models built with wavenumbers selected is further demonstrated by Fig. 4a–c, which illustrate
the scores of the first two discriminant functions (DF2× DF1) for the
overall data set.
The best discrimination was found when LDA was applied to
wavenumbers selected by GA (Fig. 4c) and SPA (Fig. 4b). In these
two cases, the diet samples were separated from the light and conventional samples along DF1 direction. In addition, DF2 distinguished
conventional samples from the diet and light types.
It is worth noting that the methodology employed was based solely
on spectroscopic measurements and pattern recognition techniques.
This indicates that laborious procedures for chemical characterization
of the cereal bars are not required. However, these classification models
cannot be applied to the analysis of other foods different from those included in this study. For different food samples, new classification
models should be built and validated.
4. Conclusions
This paper proposed a methodology for cereal bar classification
employing NIR spectroscopy and linear discriminant analysis coupled
with the variable selection algorithms. In a case study involving three
different cereal bar types (conventional, diet and light), the results indicate that wavenumber selection is key to an accurate discrimination of
the samples. More specifically, the best classification results were
achieved with the LDA/GA model, which correctly classified 28 of the
31 prediction samples.
Table 2
Classification results obtained with LDA/SW, LDA/SPA and LDA/GA models in the prediction set. (1): diet; (2): conventional and (3): Light. The numbers of wavenumbers
employed in the LDA/SW, LDA/SPA and LDA/GA models were 4, 12 and 17, respectively.
The numbers of prediction samples employed in this study were 9, 11 and 11 for diet,
conventional and light types, respectively.
LDA/SWa
Prediction
Set
a
LDA/SPA
Predicted
type index
True type
index
1
2
3
1
5
2
2
2
1
7
3
3
1
3
7
Predicted
type index
CCR
61%
The threshold value selected was 0.90.
1
2
3
7
1
1
1
8
2
1
-
10
Fig. 4. DF2 × DF1 score plots for the overall data set (121 samples) using wavenumbers
selected by (a) SW, (b) SPA and (c) GA. ( :conventional; : diet and :light).
LDA/GA
Predicted
type index
CCR
81%
1
2
3
7
1
1
-
10
1
-
-
11
CCR
90%
The results obtained in this work indicate that the proposed method
is a promising alternative for classifying cereal bar samples. Moreover,
the analytical measurement can be performed quickly, without reagents and involves less consumption of the sample.
Future works could investigate the combination of NIR with other
methods, such as soft independent modelling of class analogy
(SIMCA), partial least square — discriminant analysis (PLS-DA), artificial neural network (ANN) and k-nearest neighbor (KNN) for the
purpose of improving the classification outcome.
928
A.L.B. Brito et al. / Food Research International 51 (2013) 924–928
Acknowledgments
This work was supported by NUQAAPE (FACEPE) and CNPq.
References
Adolfo Lutz Institute (1985). Métodos químicos e físicos para análise de alimentos (3 ª ed.).
(São Paulo).
Association of Official Analytical Chemists — AOAC (). Official methods of analysis of
the association of official analytical chemists (16th ed.). Washington, D.C.: AOAC
International.
Barnes, R. J., Dhanoa, M. S., & Lister, S. J. (1989). Standard normal variate transformation and de-trending of near-infrared diffuse reflectance spectra. Applied Spectroscopy, 43, 772–777.
Berrueta, L. A., Alonso-Salces, R. M., & Héberger, K. (2007). Supervised pattern recognition in food analysis. Journal of Chromatography. A, 1158, 196–214.
Bingol, G., Zhang, A., Pan, Z., & McHugh, T. H. (2012). Producing lower-calorie deep fat
fried French fries using infrared dry-blanching as pretreatment. Food Chemistry,
132, 686–692.
Brazilian Agency of Sanitary Surveillance (2012). Portaria ANVISA SVS/MS No. 27 e 29
de 13.01.1998. Available at http://www.anvisa.gov.br/alimentos/legis/especifica/
regutec.htm (Accessed in 24.08.12).
Brereton, R. G. (2009). Chemometrics for pattern recognition. Bristol, UK: John Wiley &
Sons Ltd.
Caneca, A. R., Pimentel, M. F., Galvão, R. K. H., Matta, C. E., Carvalho, F. R., Raimundo, I. M.,
Jr., et al. (2006). Assessment of infrared spectroscopy and multivariate techniques for
monitoring the service condition of diesel-engine lubricating oils. Talanta, 70,
344–352.
Carrillo, E., Varela, P., & Fiszman, S. (2012). Packaging information as a modulator of
consumers' perception of enriched and reduced-calorie biscuits in tasting and
non-tasting tests. Food Quality and Preference, 25, 105–115.
Cen, H., & He, Y. (2007). Theory and application of near infrared reflectance spectroscopy
in determination of food quality. Trends in Food Science and Technology, 18, 72–83.
Cruz, A. G., Cadena, R. S., Alvaro, M. B. V. B., Sant'Ana, A. S., Oliveira, C. A. F., Faria, J. A. F.,
et al. (2013). Assessing the use of different chemometric techniques to discriminate low-fat and full-fat yogurts. LWT- Food Science and Technology, 50, 210–214.
Egert, S., Wolffram, S., Schulze, B., Langgunth, P., Hubbermann, E. M., Schwarz, K., et al.
(2012). Enriched cereal bars are more effective in increasing plasma quercetin
compared with quercetin from powder-filled hard capsules. The British Journal of
Nutrition, 107, 539–546.
Farinazzi-Machado, F. M. V., Barbalho, S. M., Oshiiwa, M., Goulart, R., & Pessan Junior, O.
(2012). Use of cereal bars with quinoa (Chenopodium quinoa W.) to reduce risk factors related to cardiovascular diseases. Ciência e Tecnologia de Alimentos, 32, 239–244.
Filho, P. A. C. (2009). Rapid determination of sucrose in chocolate mass using near infrared spectroscopy. Analytica Chimica Acta, 631, 206–211.
Fisher, R. A. (1936). The use of multiple measurements in taxonomic problems. Annals
of Eugenics, 7, 179–188.
Fonseca, R. S., Santo, V. R. D., Souza, G. B., & Pereira, C. A. M. (2011). Elaboração de barra
de cereais com casca de abacaxi. Archivos Latino Americanos Nutrición, 61, 216–223.
Gambarra Neto, F. F., Marino, G., Araujo, M. C. U., Galvão, R. K. H., Pontes, M. J. C.,
Medeiros, E. P., et al. (2009). Classification of edible vegetable oils using square
wave voltammetry with multivariate data analysis. Talanta, 77, 1660–1666.
Gerend, M. A. (2009). Does calorie information promote lower calorie fast food choices
among college students? The Journal of Adolescent Health, 44, 84–86.
Gori, A., Maggio, R., Cerretani, L., Nocetti, M., & Caboni, M. F. (2012). Discrimination
of grated cheeses by Fourier transform infrared sprectroscopy coupled with
chemometric techniques. International Dairy Journal, 23, 115–120.
Granato, D., Branco, G. F., Faria, J. A. F., & Cruz, A. G. (2011). Characterization of Brazilian
lager and brown ale beers based on color, phenolic compounds, and antioxidant
activity using chemometrics. Journal of the Science of Food and Agriculture, 91,
563–571.
Heenan, S., Soukoulis, C., Silcock, P., Fabris, A., Aprea, E., Cappellin, L., et al. (2012).
PTR-TOF-MS monitoring of in vitro and in vivo flavour release in cereal bars with
varying sugar composition. Food Chemistry, 131, 477–484.
Kennard, R. W., & Stone, L. A. (1969). Computer aided design of experiments.
Technometrics, 11, 137–148.
Kocken, P., Buijs, G., & Snel, J. (2006). Promotion of purchase of low-calorie foods from
vending machines at secondary schools in the Netherlands. European Journal of
Public Health, 16, 174-174.
Lobato, L. P., Pereira, A. E. C., Lazaretti, M. M. L., Barbosa, D. S., Carreira, C. M.,
Mandarino, J. M. G., et al. (2012). Snack bars with high soy protein and isoflavone
content for use in diets to control dyslipidaemia. International Journal of Food
Sciences and Nutrition, 63, 49–58.
Moreira, E. D., Pontes, M. J. C., Galvão, R. K. H., & Araújo, M. C. U. (2009). Near infrared
reflectance spectrometry classification of cigarettes using the successive projections algorithm for variable selection. Talanta, 79, 1260–1264.
Pasquini, C. (2003). Near infrared spectroscopy: Fundamentals, practical aspects and
analytical applications. Journal of the Brazilian Chemical Society, 14, 198–219.
Pontes, M. J. C., Galvão, R. K. H., Araújo, M. C. U., Moreira, P. N. T., Pessoa Neto, O. D., José,
G. E., et al. (2005). The successive projections algorithm for spectral variable selection
in classification problems. Chemometrics and Intelligent Laboratory Systems, 78, 11–18.
Riovanto, R., Cynkar, W. U., Berzaghi, P., & Cozzolino, D. (2011). Discrimination between Shiraz wines from different Australian regions: The role of spectroscopy
and chemometrics. Journal of Agricultural and Food Chemistry, 59, 10356–10360.
Roggo, Y., Duponchel, L., & Huvenne, J. -P. (2003). Comparison of supervised pattern
recognition methods with McNemar's statistical test application to qualitative
analysis of sugar beet by near-infrared spectroscopy. Analytica Chimica Acta, 477,
187–200.
Rohman, A., & Che Man, Y. B. (2011). The use of Fourier transform mid infrared
(FT-MIR) spectroscopy for detection and quantification of adulteration in virgin
coconut oil. Food Chemistry, 129, 583–588.
Santos, C. T., Bonomo, R. F., Fontan, R. C. I., Bonomo, P., Veloso, C. M., & Fontan, G. C. R.
(2011). Characterization and sensorial evaluation of cereal bars with jackfruit. Acta
Scientiarum — Technology, 33, 81–85.
Savitzky, A., & Golay, M. J. E. (1964). Smoothing and differentiation of data by simplified least squares procedures. Analytical Chemistry, 36, 1627–1639.
Scott, R., Donoghoe, M., Watts, G. F., O'Brien, R., Pardy, C., Taskinen, M. R., et al. (2011).
Impact of metabolic syndrome and its components on cardiovascular disease event
rates in 4900 patients with type 2 diabetes assigned to placebo in the field
randomised trial. Cardiovascular Diabetology, 10, 102.
Silva, A. C., Pontes, L. F. B. L., Pimentel, M. F., & Pontes, M. J. C. (2012). Detection of adulteration in hydrated ethyl alcohol fuel using infrared spectroscopy and supervised
pattern recognition methods. Talanta, 93, 129–134.
Silva, C. S., Borba, F. S. L., Pimentel, M. F., Pontes, M. J. C., Honorato, R. S., & Pasquini, C.
(2012). Classification of blue pen ink using infrared spectroscopy and linear discriminant analysis. Microchemical Journal. http://dx.doi.org/10.1016/j.microc.2012.03.025.
Sinelli, N., Cerretani, L., Di Egidio, V., Bendini, A., & Casiraghi, E. (2010). Application of
near (NIR) infrared and mid (MIR) infrared spectroscopy as a rapid tool to classify
extra virgin olive oil on the basis of fruity attribute intensity. Food Research International, 43, 369–375.
Souto, U. T. C. P., Pontes, M. J. C., Silva, E. C., Galvão, R. K. H., Araújo, M. C. U., Sanches, F.
A. C., et al. (2010). UV–Vis spectrometric classification of coffees by SPA–LDA. Food
Chemistry, 119, 368–371.
Souza, S. S., Cruz, A. G., Walter, E. H. M., Faria, J. A. F., Celeghini, R. M. S., Ferreira, M. M.
C., et al. (2011). Monitoring the authenticity of Brazilian UHT milk: A chemometric
approach. Food Chemistry, 124, 692–695.
Vaid, T. P., Burl, M. C., & Lewis, N. S. (2001). Comparison of the performance of different
discriminant algorithms in analyte discrimination tasks using an array of carbon
black-polymer composite vapor detectors. Analytical Chemistry, 73, 321–331.
Villavicencio, A. L. C. H., Araújo, M. M., Fanaro, G. B., Rela, P. R., & Mancini-Filho, J.
(2007). Sensorial analysis evaluation in cereal bars preserved by ionizing radiation
processing. Radiation Physics and Chemistry, 76, 1875–1877.
Workman, J. J. (1996). Interpretive spectroscopy for near infrared. Applied Spectroscopy
Reviews, 31, 251–320.
Workman, J., & Weyer, L. (2008). Practical guide to interpretive near — infrared spectroscopy. New York: CRC Press.
Zaveri, S., & Drummond, S. (2009). The effect of including a conventional snack (cereal
bar) and a nonconventional snack (almonds) on hunger, eating frequency, dietary
intake and body weight. Journal of Human Nutrition and Dietetics, 22, 461–468.
Download

DISSERTAÇÃO DISSERTAÇÃO DE MESTRADO MESTRADO