基于太赫兹时域光谱技术与 pca-svm 的转基因大豆油...2017/11/23  ·...

6
基于太赫兹时域光谱技术与 PCA-SVM 的转基因大豆油 鉴别研究 张文涛 12 ,李跃文 12 ,占平平 12 , 熊显名 12 (1. 桂林电子科技大学 电子工程与自动化学院,广西 桂林 5410042. 广西高校光电信息处理重点实验室,广西桂林 541004) 太赫兹时域光谱(THz-TDS) 技术是基于飞秒超快激光技术的 THz 波段光谱测量新技术,具 有较强的光谱分辨本领以及良好的透视性和安全性,在物质检测方面具有广泛的应用价值。文中在 采用太赫兹时域光谱技术对转基因大豆油光谱检测的基础上结合主成分分析方法(PCA) 及支持向量 (SVM) ,构建 PCA-SVM 模型对转基因大豆油进行鉴别。首先,从样品在太赫兹波段测得的时域光 谱中得到其吸光度光谱;然后,将其作为输入源导入 PCA-SVM 模型中,剔除冗余数据、降低数据维 数并鉴别。实验结果表明,所建立的 PCA-SVM 模型能准确识别校验集,可以准确地对转基因大豆油 进行鉴别。研究结果表明:太赫兹时域光谱技术可以实现转基因大豆油的快速、无损检测,在食品安 全领域有广泛的应用前景。 关键词转基因大豆油; 太赫兹; 主成分分析; 支持向量机; 无损检测 中图分类号O433.4 文献标志码A DOI10.3788/IRLA201746.1125004 Recognition of transgenic soybean oil based on terahertz time鄄 domain spectroscopy and PCA-SVM Zhang Wentao 1,2 , Li Yuewen 1,2 , Zhan Pingping 1,2 , Xiong Xianming 1,2 (1. Institute of Electrical Engineering and Automation, Guilin University of Electronic Technology, Guilin 541004, China; 2. Guangxi Colleges and Universities Key Laboratory of Optoelectronic Information Processing, Guilin 541004, China) Abstract: Terahertz time鄄domain spectroscopy (THz-TDS) is a new spectroscopic measurement technique based on ultra鄄fast femtosecond laser technology. THz -TDS technology has been applicated in material detection widely due to its good penetration and safety. In this paper, a method of indentifying transgenic soybean oil with THz-TDS technology was proposed. The methods of the Principle Component Analysis (PCA) and Support Vector Machine (SVM) were based on spectral analysis in the terahertz (THz) range. First, the absorbance spectrum was extracted from the original THz time鄄domain spectra data of the sample, and then imported into the model of PCA-SVM as an input source import. The utilization of the dimension鄄reduced data in PCA -SVM model can recognize the validation set accurately, and the 收稿日期2017-03-05修订日期2017-04-03 基金项目(61565004) 广 西 (2014GXNSFGA118003) (20140127-120150133-3) 作者简介(1976-) Email:[email protected] 1125004-1 46 卷第 11 红外与激光工程 2017 11 Vol.46 No.11 Infrared and Laser Engineering Nov.2017

Upload: others

Post on 07-Dec-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 基于太赫兹时域光谱技术与 PCA-SVM 的转基因大豆油...2017/11/23  · 基于太赫兹时域光谱技术与PCA-SVM的转基因大豆油 鉴别研究 张文涛 1,2,李跃文

基于太赫兹时域光谱技术与 PCA-SVM 的转基因大豆油

鉴别研究

张文涛 1,2,李跃文 1,2,占平平 1,2, 熊显名 1,2

(1. 桂林电子科技大学 电子工程与自动化学院,广西 桂林 541004;

2. 广西高校光电信息处理重点实验室,广西 桂林 541004)

摘 要院 太赫兹时域光谱(THz-TDS)技术是基于飞秒超快激光技术的 THz 波段光谱测量新技术,具

有较强的光谱分辨本领以及良好的透视性和安全性,在物质检测方面具有广泛的应用价值。文中在

采用太赫兹时域光谱技术对转基因大豆油光谱检测的基础上结合主成分分析方法(PCA)及支持向量

机(SVM),构建 PCA-SVM模型对转基因大豆油进行鉴别。首先,从样品在太赫兹波段测得的时域光

谱中得到其吸光度光谱;然后,将其作为输入源导入 PCA-SVM 模型中,剔除冗余数据、降低数据维

数并鉴别。实验结果表明,所建立的 PCA-SVM模型能准确识别校验集,可以准确地对转基因大豆油

进行鉴别。研究结果表明:太赫兹时域光谱技术可以实现转基因大豆油的快速、无损检测,在食品安

全领域有广泛的应用前景。

关键词院 转基因大豆油; 太赫兹; 主成分分析; 支持向量机; 无损检测

中图分类号院 O433.4 文献标志码院 A DOI院 10.3788/IRLA201746.1125004

Recognition of transgenic soybean oil based on terahertz time鄄

domain spectroscopy and PCA-SVM

Zhang Wentao1,2, Li Yuewen1,2, Zhan Pingping1,2, Xiong Xianming1,2

(1. Institute of Electrical Engineering and Automation, Guilin University of Electronic Technology, Guilin 541004, China;

2. Guangxi Colleges and Universities Key Laboratory of Optoelectronic Information Processing, Guilin 541004, China)

Abstract: Terahertz time鄄domain spectroscopy (THz-TDS) is a new spectroscopic measurement technique

based on ultra鄄fast femtosecond laser technology. THz -TDS technology has been applicated in material

detection widely due to its good penetration and safety. In this paper, a method of indentifying transgenic

soybean oil with THz-TDS technology was proposed. The methods of the Principle Component Analysis

(PCA) and Support Vector Machine (SVM) were based on spectral analysis in the terahertz (THz) range.

First, the absorbance spectrum was extracted from the original THz time鄄domain spectra data of the

sample, and then imported into the model of PCA-SVM as an input source import. The utilization of the

dimension鄄reduced data in PCA -SVM model can recognize the validation set accurately, and the

收稿日期院2017-03-05曰 修订日期院2017-04-03

基金项目院 国 家 自 然 科 学 基 金 (61565004)曰 广 西 自 然 科 学 基 金 (2014GXNSFGA118003)曰

桂 林 市 科 学 研 究 与 技 术 开 发 课 题 (20140127-1袁20150133-3)

作者简介院 张 文 涛 (1976-)袁 男 袁 教 授 袁 博 士 袁 主 要 从 事 光 电 检 测 尧 纳 米 计 量 及 激 光 技 术 方 面 的 研 究 遥 Email:[email protected]

1125004-1

第 46卷第 11期 红外与激光工程 2017年 11月

Vol.46 No.11 Infrared and Laser Engineering Nov.2017

Page 2: 基于太赫兹时域光谱技术与 PCA-SVM 的转基因大豆油...2017/11/23  · 基于太赫兹时域光谱技术与PCA-SVM的转基因大豆油 鉴别研究 张文涛 1,2,李跃文

红外与激光工程

第 11期 www.irla.cn 第 46卷

transgenic soybeans can be accurately identified. The research results show that THz-TDS technology can

identify the transgenic soybeans rapidly and nondestructively, and which could be widely applied in field

of food safety inspection.

Key words: transgenic soybean oil; terahertz; principle component analysis; support vector machine;

nondestructive testing

1125004-2

0 引 言

1983 年 袁 世 界 上 最 早 的 转 基 因 作 物 ( 烟 草 ) 诞 生 [1]遥

1996 年 转 基 因 作 物 在 美 国 开 始 商 业 化 种 植 袁2015 年

是 其 商 业 化 的 20 周 年 遥 20 年 来 袁 全 球 转 基 因 作 物 累

计 种 植 面 积 达 到 空 前 的 2伊108 km2袁 相 当 于 中 国 总 面

积 (9.6伊107 km) 或 美 国 总 面 积 (9.4 伊107 km2) 的 2 倍

多 遥 而 其 中 转 基 因 大 豆 约 占 50%(1伊108 km2)袁 其 种 植

面 积 已 经 超 过 中 国 或 美 国 的 国 土 面 积 [2]遥 转 基 因 大 豆

通 常 并 不 直 接 被 人 们 食 用 袁 而 是 当 作 饲 料 或 深 加 工

成 各 种 油 制 品 遥 含 有 转 基 因 大 豆 成 分 的 食 用 油 早 已

进 入 人 们 的 日 常 生 活 中 袁 然 而 到 目 前 为 止 还 没 有 任

何 的 研 究 能 够 完 全 否 定 其 潜 在 的 危 害 性 遥 因 此 袁 基 于

对 公 众 食 品 安 全 的 考 虑 袁 转 基 因 大 豆 油 的 检 测 鉴 别

具 有 重 要 意 义 遥 目 前 转 基 因 产 品 的 检 测 方 法 中 袁 应 用

最 为 广 泛 的 是 聚 合 酶 链 式 反 应 (Polymerase Chain

Reaction袁PCR)[3-4]遥 这 是 一 种 基 于 DNA 的 分 析 检 测

技 术 袁 但 加 工 后 的 食 用 油 中 DNA 含 量 较 低 袁 且 破 坏

严 重 袁 要 提 取 大 豆 深 加 工 产 品 中 的 DNA袁 成 本 较 高 [5]遥

还 有 少 数 研 究 通 过 其 他 手 段 提 取 DNA袁 提 取 过 程 繁

杂 袁 较 为 耗 时 [6-7]遥

近 年 来 太 赫 兹 时 域 光 谱 技 术 的 出 现 为 生 物 检 测

提 供 了 一 种 新 方 法 遥 太 赫 兹 (terahertz袁THz) 辐 射 是 频

率 介 于 微 波 和 红 外 波 段 之 间 的 电 磁 辐 射 袁 其 波 长 在

3 000~30 滋m 之 间 袁 其 特 殊 的 频 段 位 置 ( 位 于 电 子 学

和 光 子 学 之 间 的 过 渡 区 ) 使 其 在 理 论 研 究 和 实 际 应

用 中 都 具 有 极 高 的 研 究 价 值 [8-10]遥 有 机 分 子 和 生 物 分

子 在 THz 频 段 的 光 谱 特 征 与 其 大 幅 度 振 动 及 分 子 间

的 互 作 用 相 关 袁 不 同 基 因 片 段 转 录 的 氨 基 酸 结 构 不 一

样 袁 导 致 在 THz 波 段 出 现 的 吸 收 峰 位 不 一 样 [11]遥 而 且

THz 波 的 能 量 非 常 低 ( 约 1~10 meV)袁 不 会 对 生 物 大

分 子 造 成 伤 害 遥 这 些 特 性 在 对 生 物 大 分 子 的 检 测 时

显 得 尤 为 重 要 [12-14]遥

1 实验装置和技术原理

1.1 实验装置

实 验 采 用 的 太 赫 兹 时 域 光 谱 系 统 (terahertz time鄄

domain spectroscopy system袁THz -TDS) 是 美 国

Zomega 公 司 生 产 的 Z-3 系 统 袁 可 选 择 反 射 或 者 透 射

模 式 遥 文 中 实 验 采 用 透 射 模 式 [15]袁 光 谱 范 围 在 0.1~

3.5 THz 之 间 袁 动 态 范 围 峰 值 大 于 70 dB袁 数 据 采 集 时

间 大 约 需 60 s袁 上 位 机 界 面 为 LabVIEW 编 译 构 成 遥

THz-TDS 装 置 如 图 员 所 示 袁 实 验 采 用 的 超 快 飞

秒 激 光 器 由 Toptica Photonics AG 公 司 生 产 袁 中 心 波

图 1 THz-TDS 原 理 图

Fig.1 Schematic diagram of the THz-TDS

长 780 nm袁 脉 宽 <100 fs袁 重 复 频 率 80 MHz袁 平 均 输 出

功 率 140 mW遥 首 先 袁 激 光 器 发 出 的 飞 秒 激 光 脉 冲 经

过 分 束 镜 (PBS) 后 分 为 泵 浦 光 和 探 测 光 遥 泵 浦 光 经 过

反 射 后 照 射 到 已 施 加 偏 压 的 光 电 导 天 线 (GaAs) 上 激

发 THz 脉 冲 袁 离 轴 抛 物 面 反 射 镜 将 激 发 的 THz 脉 冲

聚 焦 并 照 射 在 样 品 上 曰 探 测 光 在 经 过 延 迟 尧 准 直 和 聚

焦 后 与 泵 浦 光 同 时 入 射 到 THz 探 测 装 置 碲 化 锌

(ZnTe) 晶 体 上 遥 最 后 袁 对 太 赫 兹 电 场 进 行 电 光 取 样 探

测 [16]袁THz 信 号 经 探 测 器 接 收 并 输 入 到 锁 相 放 大 器

Page 3: 基于太赫兹时域光谱技术与 PCA-SVM 的转基因大豆油...2017/11/23  · 基于太赫兹时域光谱技术与PCA-SVM的转基因大豆油 鉴别研究 张文涛 1,2,李跃文

红外与激光工程

第 11期 www.irla.cn 第 46卷

1125004-3

中 遥 此 外 袁 由 于 水 分 对 THz 波 有 非 常 强 的 吸 收 作 用 袁

为 了 减 少 周 围 环 境 的 影 响 袁 将 探 测 空 间 的 湿 度 降 低

至 3豫 以 下 袁 温 度 稳 定 在 22耀25 益遥

1.2 实验原理

通 过 太 赫 兹 时 域 光 谱 系 统 获 得 时 域 的 参 考 信 号

E0(t) 和 透 射 过 样 品 的 太 赫 兹 时 域 信 号 Etrans(t)袁 对 波 形

进 行 傅 里 叶 变 换 袁 得 到 其 频 谱 E0( ) 和 Etrans( )遥 理 想

状 态 下 样 品 处 于 真 空 中 袁 其 前 后 的 介 质 折 射 率 均 为

1袁 且 表 现 为 弱 吸 收 率 袁 即

Etrans( )E0( )

=T( )exp(-i ( )) (1)

据 公 式 (1) 得 到 T( ) 和 ( )袁 继 而 可 以 计 算 出

样 品 在 THz 波 段 的 折 射 率 和 吸 收 系 数 为 院

n( )= ( ) cd

+1 (2)

( )= 2d

ln4n( )

T( )[n( )+1]2蓸 蔀 (3)

式 中 院c 为 光 速 曰d 为 样 品 厚 度 曰 ( ) 为 样 品 与 参 考 信

号 的 相 差 曰 为 太 赫 兹 波 振 动 角 频 率 遥 如 果 忽 略 边 界

损 失 袁 公 式 (3) 可 近 似 为 院

= 2d

ln4n

A(n+1)2蓘 蓡 (4)

在 实 验 中 袁 选 取 的 实 验 样 品 尽 管 放 置 在 特 制 的

聚 乙 烯 器 皿 中 袁 剂 量 也 尽 量 保 持 一 致 袁 但 是 样 品 的 厚

度 仍 存 在 误 差 袁 导 致 在 样 品 的 折 射 率 和 吸 收 系 数 计

算 时 出 现 误 差 遥 为 了 避 免 样 品 厚 度 误 差 导 致 的 实 验

结 果 误 差 袁 采 用 吸 光 度 (absorbance) 分 析 实 验 数 据 遥 吸

光 度 表 示 表 征 材 料 对 光 波 的 吸 收 程 度 袁 是 一 个 无 量

纲 的 相 对 量 袁 计 算 过 程 中 无 需 测 量 样 品 厚 度 袁 计 算 公

式 如 下 院

Absorbance=-lgEtrans( )2

E0( )2蓘 蓡 (5)

得 到 吸 光 度 光 谱 后 袁 运 用 主 成 分 分 析 (Principal

Component Analysis袁PCA) 对 光 谱 数 据 进 行 处 理 遥

PCA 是 一 种 应 用 非 常 广 泛 的 数 据 处 理 方 法 袁 通 过 对

数 据 的 原 始 特 征 进 行 线 性 变 换 袁 可 得 到 能 表 达 原 始

数 据 信 息 的 新 的 综 合 变 量 袁 降 低 数 据 维 度 遥 通 过

PCA 将 光 谱 数 据 转 换 成 维 度 尽 量 少 的 综 合 变 量 袁 降

低 数 据 空 间 的 大 小 袁 减 少 模 型 训 练 和 测 试 时 间 袁 同

时 减 少 噪 声 干 扰 袁 提 高 映 射 性 能 袁 最 终 达 到 改 善 诊

断 能 力 的 目 的 遥

利 用 PCA 对 数 据 处 理 之 后 袁 运 用 支 持 向 量 机

(Support Vector Machine袁SVM) 建 模 进 行 分 类 预 测 遥

SVM 是 建 立 在 统 计 学 理 论 中 的 VC 维 (Vapnik鄄

chervonenkis dimension) 理 论 和 结 构 风 险 最 小 化 原 理

基 础 之 上 的 一 种 统 计 学 方 法 遥 SVM 通 过 非 线 性 核 函

数 如 径 向 基 核 函 数 (Radial Basis Function袁RBF)袁 将

输 入 样 本 空 间 映 射 到 高 维 线 性 特 征 空 间 袁 具 有 处 理

非 线 性 回 归 问 题 的 能 力 遥 SVM 与 人 工 神 经 网 络 相

比 袁 拥 有 训 练 效 率 高 尧 模 型 泛 化 能 力 强 等 优 点 [17]遥

此 次 实 验 选 用 市 面 上 愿 种 不 同 的 大 豆 食 用 油

作 为 探 测 对 象 袁 运 用 太 赫 兹 时 域 光 谱 技 术 结 合 主 成

分 分 析 - 支 持 向 量 机 (PCA-SVM) 的 方 法 进 行 分 类

鉴 别 遥

2 实验结果及分析

实 验 选 取 的 实 验 样 品 为 在 市 面 上 易 获 取 的 8

种 不 同 的 大 豆 食 用 油 遥 分 别 是 1 号 院 恒 大 兴 安 绿 色

大 豆 油 ( 非 转 基 因 )袁2 号 院 九 三 大 豆 油 ( 非 转 基 因 )袁3

号 院 金 龙 鱼 食 用 调 和 油 ( 非 转 基 因 )袁4 号 院 鲁 花 食 用

调 和 油 ( 非 转 基 因 )袁5 号 院 福 临 门 食 用 调 和 油 ( 转 基

因 )袁6 号 院 金 龙 鱼 精 炼 一 级 大 豆 油 ( 转 基 因 )袁7 号 院 金

龙 鱼 调 和 油 ( 转 基 因 )袁8 号 院 惠 宜 食 用 调 和 油 ( 转 基

因 )遥 以 上 调 和 油 样 品 的 原 料 中 均 包 含 大 豆 成 分 遥 每

种 豆 油 各 制 备 12 组 样 品 袁 共 96 组 袁 其 中 每 种 豆 油

都 取 其 前 8 组 样 品 的 光 谱 作 为 训 练 集 袁 后 4 组 为 测

试 集 遥

2.1 光谱分析

图 2 为 转 基 因 大 豆 油 样 品 的 太 赫 兹 时 域 光 谱 袁

其 中 图 2(a) 为 整 体 效 果 袁 图 2(b) 为 局 部 放 大 遥 为 了 降

低 回 波 带 来 的 干 扰 袁 手 动 截 取 太 赫 兹 波 的 主 脉 冲 袁 滤

除 了 尾 端 的 回 波 遥 从 图 中 可 以 看 出 袁 相 对 于 参 考 信

号 袁8 种 大 豆 油 样 品 的 时 域 光 谱 在 振 幅 和 相 位 上 都

具 有 一 定 程 度 的 改 变 袁2 号 样 品 九 三 非 转 基 因 大 豆

油 的 相 位 延 迟 最 久 袁1 号 样 品 恒 大 非 转 基 因 大 豆 油

的 振 幅 衰 减 最 少 遥 总 体 上 看 袁 包 含 转 基 因 大 豆 成 分 的

样 品 相 对 于 包 含 非 转 基 因 大 豆 成 分 的 样 品 在 相 位 上

延 迟 更 少 袁 在 幅 值 上 衰 减 更 大 遥 聂 君 扬 [18] 等 人 在 关 于

转 基 因 大 豆 鉴 别 实 验 中 袁 观 测 到 院 相 对 于 参 考 信 号 而

言 袁 大 豆 粉 末 中 含 有 的 转 基 因 大 豆 成 分 浓 度 越 高 袁 其

太 赫 兹 时 域 光 谱 幅 值 衰 减 越 大 袁 相 位 延 迟 越 少 袁 与 此

次 实 验 的 观 测 结 果 相 一 致 遥

Page 4: 基于太赫兹时域光谱技术与 PCA-SVM 的转基因大豆油...2017/11/23  · 基于太赫兹时域光谱技术与PCA-SVM的转基因大豆油 鉴别研究 张文涛 1,2,李跃文

红外与激光工程

第 11期 www.irla.cn 第 46卷

1125004-4

图 2 样 品 和 参 考 信 号 的 太 赫 兹 时 域 光 谱 遥 (a) 滤 波 后 的 太 赫 兹 时

域 光 谱 曰(b) 太 赫 兹 时 域 光 谱 的 局 部 放 大

Fig.2 THz time鄄domain spectra of the samples and the reference

signal. (a) The filtered spectra of THz time鄄domain; (b) the

partial enlargement of THz time鄄domain spectra

为 了 进 一 步 研 究 样 品 在 太 赫 兹 波 段 内 各 频 率 的

变 化 特 性 袁 对 样 品 进 行 鉴 别 研 究 袁 将 时 域 光 谱 补 零 后

进 行 傅 里 叶 变 换 后 得 到 其 频 谱 遥 图 3(a) 为 样 品 在

0.2~1.5 THz 的 频 谱 图 袁 从 图 中 可 以 观 测 到 所 有 样 品

相 对 于 参 考 信 号 在 各 频 率 上 均 有 较 大 幅 度 的 衰 减 袁

在 0.35 THz 附 近 有 着 一 个 较 明 显 的 吸 收 峰 袁 且 各 样

品 的 截 至 频 率 均 在 1.4 THz 左 右 遥 将 其 局 部 放 大 后

得 图 3(b)袁 图 中 表 明 在 0.4 THz 之 后 袁 相 对 于 参 考 信

号 而 言 袁1 号 样 品 恒 大 非 转 基 因 大 豆 油 在 各 频 率 上

的 衰 减 最 小 袁6 号 样 品 金 龙 鱼 转 基 因 大 豆 油 的 波 形

衰 减 则 最 大 遥 整 体 上 看 袁 含 有 非 转 基 因 成 分 的 样 品 袁

其 各 波 段 的 频 率 相 对 于 含 有 转 基 因 成 分 的 样 品 袁 衰

减 较 小 遥 从 图 3(b) 中 可 以 看 出 袁 除 4 号 样 品 鲁 花 非 转

基 因 调 和 油 的 频 域 光 谱 波 峰 在 2.3伊10-5 左 右 袁 其 他

含 有 非 转 基 因 大 豆 成 分 样 品 的 频 域 光 谱 波 峰 样 品 的

幅 值 均 超 过 2.5伊10-5袁 在 3伊10-5 左 右 袁 而 含 有 转 基 因

成 分 的 样 品 其 幅 值 则 不 超 过 2.5伊10-5袁 在 2伊10-5 左

右 遥 通 过 以 上 分 析 可 得 袁 含 有 转 基 因 大 豆 成 分 的 样 品

相 对 于 含 有 非 转 基 因 大 豆 成 分 的 样 品 袁 在 太 赫 兹 波

段 的 吸 收 会 更 强 遥

图 3 样 品 和 参 考 信 号 的 频 域 谱 遥 (a)样 品 和 参 考 信 号 在 0.2~1.5THz

上 的 频 域 谱 袁(b) 频 域 谱 的 局 部 放 大

Fig.3 Frequency spectra of the samples and the reference signal.

(a) Frequency spectra of the reference and the samples signal

from 0.2-1.5 THz; (b) the partial enlargement of

frequency spectra

为 了 降 低 实 验 器 皿 中 每 组 样 品 油 脂 厚 度 差 异 引

起 的 干 扰 袁 选 用 吸 光 度 作 为 参 量 来 处 理 光 谱 数 据 袁 得

到 的 光 谱 数 据 如 图 4 所 示 遥 其 中 图 4(a) 为 各 样 品 在

0.2~1.4 THz 的 吸 光 度 光 谱 袁 为 了 更 详 细 地 对 吸 收 度

光 谱 进 行 分 析 袁 对 图 4(a) 进 行 局 部 放 大 袁 得 到 图 4(b)遥

在 图 4 中 袁 容 易 观 测 到 所 有 样 品 在 0.35 THz 附 近 出

现 一 个 吸 收 峰 袁 与 频 谱 中 的 观 测 结 果 相 一 致 遥 除 此 之

Page 5: 基于太赫兹时域光谱技术与 PCA-SVM 的转基因大豆油...2017/11/23  · 基于太赫兹时域光谱技术与PCA-SVM的转基因大豆油 鉴别研究 张文涛 1,2,李跃文

红外与激光工程

第 11期 www.irla.cn 第 46卷

1125004-5

图 4 样 品 的 吸 光 度 谱 遥 (a) 样 品 在 0.2~1.4 THz 上 的 吸 光 度 谱 袁

(b) 吸 光 度 谱 的 局 部 放 大

Fig.4 Absorbance spectra of the samples. (a) Absorbance spectra of

the samples from 0.2-1.4 THz; (b) the partial

enlargement of absorbance spectra

外 袁 所 有 样 品 的 吸 光 度 随 着 频 率 的 增 加 在 提 高 遥 从

图 4(b) 中 可 以 发 现 袁 在 0.4 THz 之 后 袁1 号 样 品 恒 大

非 转 基 因 大 豆 油 的 吸 光 度 最 低 袁6 号 样 品 金 龙 鱼 大

豆 油 的 吸 光 度 最 高 袁 且 含 有 转 基 因 大 豆 成 分 的 样 品

相 对 于 含 有 非 转 基 因 成 分 的 样 品 袁 在 太 赫 兹 波 段 的

吸 光 度 会 更 高 袁 与 频 谱 中 观 测 到 的 结 果 相 一 致 遥

2.2 建模与鉴别

为 了 减 少 光 谱 的 数 据 冗 余 袁 同 时 降 低 模 型 的 学

习 时 间 袁 提 高 建 模 效 率 袁 对 样 品 吸 光 度 光 谱 中 0.2~

1.4 THz 波 段 的 原 始 数 据 归 一 化 处 理 后 袁 进 行 主 成 分

分 析 袁 结 果 如 表 1 所 示 遥 从 表 1 可 以 看 出 袁 前 8 项 主

成 分 的 累 计 方 差 贡 献 率 达 到 了 98.912%袁 可 以 近 似

解 释 所 有 原 变 量 遥 可 以 用 这 8 个 新 变 量 代 替 原 有 光

谱 数 据 导 入 SVM 中 进 行 建 模 遥

表 1 各成分解释总方差

Tab.1 Total variance explained by each component

实 验 中 袁 选 取 径 向 基 核 函 数 为 模 型 的 核 函 数 袁

同 时 采 用 交 叉 验 证 法 自 动 选 择 最 佳 的 惩 罚 参 数 c

和 核 函 数 参 数 g袁 保 证 训 练 与 预 测 效 果 达 到 最 优 遥

如 图 5 所 示 袁 实 验 结 果 表 明 当 惩 罚 参 数 c 为 2.926 1袁

核 函 数 参 数 g 为 0.052 261 时 袁 实 验 的 交 叉 验 证 准

确 率 尧 训 练 准 确 率 尧 测 试 准 确 率 均 为 100%袁 说 明 该

模 型 取 得 较 好 的 鉴 别 效 果 袁 可 以 对 转 基 因 大 豆 油 进

行 很 好 的 鉴 别 遥

图 5 模 型 测 试 结 果

Fig.5 Test results of the model

3 结 论

文 中 以 市 售 8 种 含 有 转 基 因 或 非 转 基 因 大 豆 成

分 的 食 用 油 为 研 究 对 象 袁 运 用 太 赫 兹 时 域 光 谱 技 术

得 到 样 品 时 域 光 谱 袁 经 滤 波 袁 补 零 袁 傅 里 叶 变 换 等 数

据 处 理 得 到 其 频 域 光 谱 和 吸 光 度 光 谱 袁 并 对 光 谱 做

了 简 单 的 特 性 分 析 袁 然 后 运 用 PCA 方 法 提 取 出 0.2~

1.4 THz 波 段 主 要 特 征 数 据 袁 减 少 数 据 冗 余 遥 之 后 袁 用

训 练 集 对 SVM 进 行 训 练 袁 用 测 试 集 对 训 练 出 的

SVM 模 型 测 试 遥 得 到 结 论 如 下 院

(1) 在 太 赫 兹 时 域 谱 中 袁 包 含 非 转 基 因 大 豆 成 分

的 样 品 相 对 于 包 含 转 基 因 大 豆 成 分 的 样 品 在 相 位 上

延 迟 更 久 袁 在 幅 值 上 衰 减 更 少 遥

(2) 含 有 转 基 因 大 豆 成 分 的 样 品 相 对 于 含 有 非 转

基 因 大 豆 成 分 的 样 品 袁在 太 赫 兹 波 段 的 吸 收 会 更 强 遥

(3) 基 于 RBF 核 函 数 的 PCA-SVM 鉴 别 模 型 对

包 含 转 基 因 大 豆 成 分 的 食 用 油 具 有 很 好 的 鉴 别 效 果 遥

参考文献院

[1] Zambryski P, Joos H, Genetello C, et al. Ti plasmid vector

for the introduction of DNA into plant cells without

ComponentInitial eigenvalues

Total

PC1 34.709

Variance

64.101%

Cumulative

64.101%

PC2 10.456 19.309% 83.410%

PC3 3.107 5.738% 89.148%

PC4 1.957 3.615% 92.763%

PC5 1.506 2.781% 95.544%

PC6 1.044 1.927% 97.471%

PC7 0.607 1.121% 98.592%

PC8 0.173 0.320% 98.912%

Page 6: 基于太赫兹时域光谱技术与 PCA-SVM 的转基因大豆油...2017/11/23  · 基于太赫兹时域光谱技术与PCA-SVM的转基因大豆油 鉴别研究 张文涛 1,2,李跃文

红外与激光工程

第 11期 www.irla.cn 第 46卷

1125004-6

alteration of their normal regeneration capacity [J]. The

EMBO Journal, 1983, 2(12): 2143-2150.

[2] James C. 20th anniversary (1996 to 2015) of the global

commercialization of biotech crops and biotech crop

highlights in 2015, ISAAA Brief, No.51 [R]. New York:

ISAAA, 2015.

[3] James D, Schmidt A, Wall E, et al. Reliable detection and

identification of genetically modified maize, soybean, and

canola by multiplex PCR analysis [J]. Journal of

Agricultural and Food Chemistry, 2003, 51(20): 5829-5834.

[4] Liu Yong, Qian Honghu, Zhu Ling, et al. Nonuniformity

correction for fluorescence imaging of microfluidic real鄄time

PCR [J]. Optics and Precision Engineering, 2013, 21 (8):

2161-2168. (in Chinese)

刘 勇 , 钱 鸿 鹄 , 朱 灵 , 等 . 微 流 控 实 时 荧 光 聚 合 酶 链 式 反 应

成 像 非 均 匀 性 的 校 正 [J]. 光 学 精 密 工 程 , 2013, 21 (8):

2161-2168.

[5] Huang Kunlun, Luo Yunbo. Detecting genetically modified

soybean roundup ready ingredient in foodstuffs by nested

PCR and semi鄄nested PCR [J]. Journal of Agicultural

Biotechnology, 2003, 11(5): 461-466. (in Chinese)

黄 昆 仑 , 罗 云 波 . 用 巢 式 和 半 巢 式 PCR 检 测 转 基 因 大 豆

Roundup Ready 及 其 深 加 工 食 品 [J]. 农 业 生 物 技 术 学 报 ,

2003, 11(5): 461-466.

[6] Cheng Hongmei, Peng Yufa, Jin Wujun, et al. A simple and

rapid method for isolation of DNA from and detection of

transgene sequences in soybean oil [J]. Scientia Agricultura

Sinica, 2007, 40(5): 1069-1072. (in Chinese)

程 红 梅 , 彭 于 发 , 金 芜 军 , 等 . 一 种 快 速 袁 简 便 提 取 大 豆 油

DNA 的 方 法 及 转 基 因 大 豆 油 的 检 测 [J]. 中 国 农 业 科 学 ,

2007, 40(5): 1069-1072.

[7] Fischer B M, Walther M, Jepsen P Uhd. Far鄄infrared

vibrational modes of DNA components studied by terahertz

time鄄domain spectroscopy[J]. Phys Med Biol, 2002, 47(S1):

3807-3814.

[8] Tian Li, Jin Weiqi, Cai Yi, et al. Imaging area and contrast

of THz focal plane array CW transmission imaging system

[J]. Optics and Precision Engineering, 2015, 23 (8): 2164 -

2170. (in Chinese)

田 莉 , 金 伟 其 , 蔡 毅 , 等 . THz 焦 平 面 连 续 波 透 射 成 像 系

统 的 成 像 面 积 及 对 比 度 [J]. 光 学 精 密 工 程 , 2015, 23(8):

2164-2170.

[9] Zhang Jianfa, Yuan Xiaodong, Qin Shiqiao. Tunable terahertz

and optical metamaterials [J]. Chinese Optics, 2014, 7 (3):

349-364. (in Chinese)

张 检 发 , 袁 晓 东 , 秦 石 乔 . 可 调 太 赫 兹 与 光 学 超 材 料 [J].

中 国 光 学 , 2014, 7(3): 349-364.

[10] Li Chenyu, Yang Zhou, Zhou Qingli, et al. Influence of

structures on optical modulation in terahertz metamaterials

[J]. Infrared and Laser Engineering, 2016, 45(7): 0703002.

(in Chinese)

李 晨 毓 , 杨 舟 , 周 庆 莉 , 等 . 结 构 对 太 赫 兹 超 材 料 光 调 控 特

性 的 影 响 [J]. 红 外 与 激 光 工 程 , 2016, 45(7): 0703002.

[11] Hosobuchi M, Komatsu M, Xie X, et al. Measurements of

THz absorption peaks in photo鄄degraded polyethylene and

their assignment by quantum chemical calculations [C]//2013

IEEE Conference on Electrical Insulation and Dielectric

Phenomena, 2013: 1046-1049.

[12] Wang Fang, Qiu Dajian, Xia Hongyan, et al. Preliminary

exploration on identification of probiotics in terahertz time鄄

domain spectroscopy [J]. Infrared and Laser Engineering,

2016, 45(7): 0703001. (in Chinese)

王 芳 , 仇 大 剑 , 夏 红 岩 , 等 . 太 赫 兹 时 域 光 谱 技 术 在 识 别 鉴

定 菌 制 剂 中 的 初 探 [J]. 红 外 与 激 光 工 程 , 2016, 45 (7):

0703001.

[13] Fischer B M, Helm H, Jepsen P U. Chemical recognition

with broadband THz spectroscopy [J]. Proceedings of the

IEEE, 2007, 95(8): 1592-1604.

[14] Pickwell E, Cole B E, Fitzgerald A J, et al. Simulation of

terahertz pulse propagation in biological systems [J]. Applied

Physics Letters, 2004, 84(12): 2190-2192.

[15] Platte F, Heise H M. Substance identification based on

transmission THz spectra using library search [J]. Journal of

Molecular Structure, 2014, 1073(S1): 3-9.

[16] Ye Quanyi, Yang Chun. Recent progress in THz sources

based on photonics methods[J]. Chinese Optics, 2012, 5(1):

1-11. (in Chinese)

叶 全 意 , 杨 春 . 光 子 学 太 赫 兹 源 研 究 进 展 [J]. 中 国 光 学 ,

2012, 5(1): 1-11.

[17] Wang Shuzhou, San Ye. A survey on training algorithms for

support vector machine[J]. CAAI Transactions on Intelligent

Systems, 2008, 3(6): 467-475.

[18] Nie Junyang, Zhang Wentao, Xiong Xianming, et al.

Recognition of transgenic soybeans based on terahertz

spectroscopy and PCA -BPN network [J]. Acta Photonica

Sinica, 2016, 45(5): 530001.