福建快3豹子出现规律
张量主成份分析算法在脑医学图像上的应用

日期:2019年04月11日

摘要:医学影像中的CT、MRI图像诊断是目前医生确诊疾病的重要依据。另一方面,大脑作为人类最复杂也是最重要的器官之一,?#26434;?#33041;部图像的特征提取和分类具有重要意义。传?#25104;?#23545;图像特征提取习惯从向量的角度出发,这样忽略了图像结构特点。为了解决这个问题,本文结合高维空间数据结构,以数据张量化为重点将传统的PCA算法升级为Tensor-PCA,并选择当下最流行的Simulated Brain phantom Database 数据集作为本文的仿真对象,经过实验证明,数据张量化的方法在提取图像的特征上具有良好的适用性。

 

关键字:张量模型;脑部医学图像;主成分分析;特征提取

中图分类号:TP391文献标识码:A

 

 

MRI Brain Image via Tensor Principal Component Analysis

LIAO Liang, YE Haichang, WANG Xinqiang

(Zhongyuan University of Technology School of Electric and Information Engineer, Zhengzhou 450007, China)

Abstract: Medical CT, MRI images are an important basis for doctors to diagnose the disease. On the other hand, the brain is one of the most complex and most important organs of human beings,it has very high significance for the feature extraction and classification of brain images. The traditional image feature extraction and classification algorithm research habits from the point of view of the vector, so ignore the structural characteristics of the image.In order to solve this problem, this paper combines high-dimensional spatial data structure, focusing on data quantization, and improves the traditional algorithm of feature extraction of brain medical image data. The traditional PCA is upgraded to Tensor-PCA algorithm, and the most popular Simulated Brain phantom Database (abbreviated as BPD)database is selected as the simulation object of this paper. Through experiments, the method of data quantification is used to extract image features,and has good applicability.

 

Key word: tensor model; brain medical image; principal component analysis; feature extraction

 

 

随着脑成像技术?#22270;?#31639;机的快速发展,使得人们能够更加深入的探索大脑奥秘。MRI成像技术已成为当代最佳的辅助工具之一,帮助了医生对病情诊断的同时也提供给学者们作为最佳的实验选择对象,从而获得了相关领域的关注。但由于MRI成像技术复杂,存在着相当大的数据运算量,传统算法很难解决这一难题,本文以数据张量化的方法来打开突破口[1]。张量是目前能够解决此类问题的主要方法之一,其最大的特点是能表达高维空间的数据特性,因此,如何将医学图像进行数据张量化,并将张量化方法进行有效的推广,是本文的主旨所在[2]

 

1 张量代数

1.1张量的概念

张量(tensor)是一个多线性函数,其可以被直观的理解为一个多维数组,它是由标量和向量扩展而来,标量、向量、矩阵是张量的特殊?#38382;健?#26631;量可以理解成0阶张量,向量是1阶张量,而矩阵为2阶张量[3]

1.2高维图像的张量表示

由张量概念可知,二维图像可以用二阶张量进行描述,而高维图像需要用三阶张量来表示。第一阶表示了图像的宽度,第二阶表示图像的长度,而第三阶则表示图像的矢量维数[4]

1.3张量模型

首先要定义张量模型数学框架,为了表达简洁,以二阶张量的代数为例,它很容易拓展到高阶张量。

定义1.张量加法:给定尺寸均为的张量,两者之和是相同尺寸的张量,其中表示二阶数组?#33041;?#32032;,则代表实数域,满足:

                      (1)

定义2.张量乘法:给定尺寸均为的张量,两者乘积是由的二维循环卷积所得到相同尺寸张量,其中(mod)代表取余,满足

   (2)

给定尺寸相同的张量,可以通过二维快速傅里叶变换及其逆变换来求得计算乘积,因为以下定理成立:

定理1.傅里叶变换:给定张量,以及两者的乘积分别表示各自的傅里叶变换,则:

                   (3)

通过傅里叶变换,其相乘?#38382;?#30001;原来循环卷积的减少到傅里叶域中的[5]。因此,定理1常常被用作循环卷积的快速计算的基础。

定义3.零张量:零张量是一个所有元素全为0的张量,即

                                (4)

定义4.单位张量:单位张量满足:

                         (5)

在上述定义及定理构成了一个张量环,张量向量是?#33041;?#32032;的列表[5]。张量矩阵是?#33041;?#32032;的数组,以下张量矩阵中的张量原子均在张量环上取值。

定义5.张量矩阵的乘法:给定张量矩阵,则它们的乘积为给出,且满足:

                   (6)

上述定义和公式是张量代数的基本理论和框架。

2张量的主成份分析Tensor-PCA

在传统运算(PCA)的基础上,推广到张量的变体TPCA[6]。给出张量向量,对应的协方差张量矩阵如下所示:

           (7)

然后得到的张量奇异值分解,使得:

                            (8)

最后,给定?#25105;?#27979;试张量向量对应得到张量特征向量?#19978;?#24335;给出

                           (9)

为了将的维度从D降低到,剩余的项被适当舍去。把称为张量向量的张量特征向量。整个TPCA过程可以通过在傅里叶域中进行一系列传统SVD来实现。

3实验

3.1实验来源

为了评估TPCA的性能,本文所使用的数据集是关于脑部医学的开放数据库:Simulated Brain phantom Database, brainWeb网站提供了模拟数据操控台可以对脑图像数据进行仿真,此数据库是用于对脑部MRI图像做定量脑部分析所使用的数据集是一个3D立体脑部图像卷。

?#26434;?#26412;实验来讲,数据集包涵有“ground truth”,并且数据集将脑部结构分为10类。 除了实验背景外,选用剩下的9类进行分类实验,同时选取数据集中的脑横断位上的第90帧图像作为本实验的仿真对象。

3.2实验数据处理

       在图像?#33041;?#22788;理上,首先利用Matlab软件提取出数据集(BPD)的脑横断面第90帧,图像尺寸大小为,像元大小为,无噪声,且识别率极高一帧图像,如下图2所示。

图2 预处理图像

3.2.1PCA

本文选取图像数据集上的第90帧图像,其每个位置的体素是一个样本,每个样本属于9类结构中的一种,具体见表1所示。除去图像背景外,一共有28043个像素点现将图像的像素点扩展成为邻域,此时图像大小为,随机抽取20%作为训练集(5607个样本),其余的作为测试样本(22436个)。将所分好的数据带入PCA进行特征提取处理,最后选用KNN(最近邻)分类器对其分类。

 

表1 大脑结构部分的分类和像素个数

类别

实物描述

像素个数

样本个数

C1

CSF(脑脊液)

371945

2760

C2

脑?#23383;?/span>

674777

7226

C3

脑灰质

902912

9369

C4

脑脂肪

146514

327

C5

脑肌肉

617482

2202

C6

脑皮质

726649

2581

C7

脑头骨

362561

2202

C8

神经胶质

5987

250

C9

脑膜

298350

1126

 

3.2.2 TPCA

同理,在PCA的基础上,我们将数据张量化,在每个标量上再找一个的邻域,经过实验验证后的邻域为最佳,大的邻域效果并不明显,反而邻域过大会出现过饱和现象。扩充出来的位置用0来代替,此时数据集的大小为,这样就完成了数据张量化,能够带入TPCA中进行特征提取。由于TPCA?#33041;?#31639;是循环卷积,由于计算量过大,这里将数据带入快速傅里叶变换(2DFFT)中进行,这样就大大的降低了运算时间。

3.3实验结果

首先由于NN分类器的局限性,还处理不了张量数据,这里我们将TPCA所得到结果进行切片操作,这样就可以用NN分类器进行分类了。表2、表3分别给出了PCATPCANN分类器得到的分类混淆矩阵的对?#21462;?#20174;主对角线上黑白程度上对混淆矩阵进行分析可以看出,在采用NN分类器进行分类时,PCA这种算法?#26434;?#22270;像上相似的类别?#26434;?#19968;定的错分现象[7]。反观TPCA算法,其主对角线黑色程度较深,说明准确率高,而且在其他分错的类别上,百分比?#31995;汀?/span>

 

表2 PCA

0.74

0.01

0.00

0.00

0.03

0.19

0.02

0.02

0.00

0.05

0.92

0.03

0.00

0.14

0.00

0.00

0.26

0.06

0.00

0.02

0.96

0.03

0.00

0.00

0.00

0.07

0.18

0.00

0.00

0.00

0.78

0.00

0.00

0.00

0.00

0.03

0.03

0.05

0.00

0.00

0.75

0.03

0.00

0.30

0.07

0.17

0.00

0.00

0.00

0.05

0.73

0.05

0.03

0.00

0.01

0.00

0.00

0.00

0.00

0.05

0.93

0.00

0.00

0.00

0.00

0.00

0.00

0.02

0.00

0.00

0.32

0.00

0.00

0.00

0.01

0.19

0.01

0.00

0.00

0.00

0.66


表3 TPCA

0.82

0.02

0.00

0.00

0.03

0.09

0.02

0.01

0.00

0.05

0.90

0.05

0.00

0.04

0.00

0.00

0.03

0.06

0.00

0.02

0.92

0.03

0.00

0.00

0.00

0.05

0.03

0.00

0.00

0.00

0.88

0.00

0.00

0.00

0.00

0.03

0.03

0.06

0.00

0.00

0.85

0.03

0.00

0.02

0.02

0.09

0.00

0.00

0.00

0.05

0.83

0.05

0.03

0.00

0.01

0.00

0.00

0.00

0.00

0.05

0.93

0.00

0.00

0.00

0.00

0.00

0.00

0.02

0.00

0.00

0.86

0.00

0.00

0.00

0.03

0.09

0.01

0.00

0.00

0.00

0.86


       最后给出PCA算法和TPCA算法的总体的分类精度曲线,可以看出TPCA的算法一?#21271;?#29616;的很稳定,而却分类精度比传统的PCA算法要好。如下图3所示:

 

图3 NN分类器分类结果

4给出了PCA(红色)和TPCA(蓝色)的算法提取在不同特征维度时的总体分类精度的对?#21462;?/span>PCA算法和TPCA算法下都降至到8维。本文分别抽取了2维、4维、6维和8维的图像进行重建,重建图像对比的结果与“ground_truth”进行对比后不难发现TPCA的结果?#21152;?#20110;传统PCA的结果[8]。如图5所示:

     原始      ground_truth

        2        4         6         8

(PCA的分类图)

    2        4         6         8

(TPCA的分类图)

图5 PCA与TPCA图像重建对比图

NN分类器下PCA的分类精?#20219;?/span>86.32%,TPCA87.59%。如表5所示:

表5 脑部实验分类精度的比较

分类器

特征提取

NN

PCA

86.32

TPCA

87.59

 

 

 

 

 

4结论

本文的主要工作是将磁共振大脑结构数据通过张量化的方法将其张量化,并利用基于循环卷积的张量模型,将大脑结构图像进行有监督的分类对比,其主要工作如下:(1)首先BrainWeb在网上提供了一套现实的模拟脑MR的图像卷,?#24066;?#21463;控。(2)本文结合张量模型的优点将主成分分析(PCA)算法进行了全面的升级,传统的PCA算法在对数据进行压缩时,必须首先要将数据转为向量,这?#26434;?#22270;像来说就破坏了数据的内在结构,因此从PCA的基本角度出发,我们将经典的PCA(主成分分析)算法升级为张量变体,称为TPCA(张量主成分分析)。通过大量的仿真实验后发现,基于循环卷积的张量代数框架下的TPCA算法具有非常优秀表现,实现了对张量数据的主成份分析,从而可以扩展到高维图像数据。(3)结合TPCA算法获得具有张量结构的数据特征,为了兼容已有的分类器,在TPCA的分类过程中还进行了切片操作,使得张量化后的数据能够被?#35805;?#20998;类器?#37038;埽?#36825;既体现了张量算法的优势,?#26448;?#22815;扩展其应用范围。

参考文献:

[1]     J. M. Biocas-Dias, A. Plaza, G. Camps-Valls, and P. Scheunders, “Hyperspectral remote sensing data analysis and future challenges[J],” IEEE Geoscience &Remote sensing Magazine, vol. 1, no. 2,pp. 6-36,2013.

[2]     P. Bajorski, “statistical inference in pca for hyperspectral image[J],” IEEE Journal of Selected Topics in Signal Processing, vol. 5, no. 3, pp. 438-445,2011.

[3]     T. Gkamas, F. Renard, C.Heinrich, and S. Kremer, ”A fourth order tensor statistical model for diffusion weighted MRI application to population comparision[J],” Frensenius Zeitchrift fur Analytische Chemie, vol. 182, no. 3, pp. 221-222, 2015.

[4]     M. Dalla Mura, A.Villa, J. A. Benedikktsson, J. Chanussot, and L. Bruzzone,”Classification of hyperspectral images by using extended morphological attribute profiles and independent component analysis[J],” IEEE Geoscience & Remote Sensing Letters, vol.8, no. 3,pp. 542-546,2011.

[5]     M. He and S. Mei, ”Dimension reduction by random projection for endmember extraction[C],” in 2010 5th IEEE Conference on Industrial Electronics and Applications (ICIEA), 2010,PP. 2323-2327.

[6]     D. Ai. G. Duan, X. Han, and Y. W. Chen, “Generalized N-dimensional independent component analysis and its application to multiple feature selection and fusion for image classification[J],”Neuro-computing, vol. 130, no. 2,pp. 186-197, 2013.

[7]     H.ZHOU, L. Li, and H. Zhu, “Tensor regression with applications in neuro-imaging data analysis[J],” Journal of the American Statistical Association, vol. 108, no. 502, pp. 540-552,2013.

[8]     G. Camps-valls, D.Tuia, L. Bruzzone, and J. Atli Benediktsson, “Advances in hyperspectral image classification: Earth monitoring with statistical learning methods[J],” IEEE Signal Processing Magazine, vol. 31, no. 1,pp. 45-54, 2013.

    

广告 ×

在线?#22836;?/p>

返回顶部

彩票的龙虎怎么区分 彩名堂计划软件 双升扑克牌四人规则 十一选五组三投注技巧 飞艇计划软件免费版 幸运快三计划免费版 宝宝计划 免费账号 一品堂免费资料图库 快乐十分20选5技巧 逆袭计划最新版