本條目存在以下問題 ,請協助
改善本條目 或在
討論頁 針對議題發表看法。
此條目需要
精通或熟悉相关主题的编者 参与及协助编辑。
(2015年12月14日 ) 請邀請 適合的人士改善本条目 。更多的細節與詳情請參见討論頁 。
压缩感知 (Compressed sensing),也被称为压缩采样 (Compressive sampling)或稀疏采样 (Sparse sampling),是一种寻找欠定线性系统 的稀疏解的技术。压缩感知被应用于电子工程 尤其是信号处理 中,用于获取和重构稀疏或可压缩的信号。這個方法利用訊號稀疏的特性,相較於奈奎斯特理論 ,得以從較少的測量值還原出原來整個欲得知的訊號。核磁共振 就是一個可能使用此方法的應用。这一方法至少已经存在了四十年,由于Emmanuel Candès 、戴維·多諾霍 、Justin Romberg和陶哲轩 的工作,最近这个领域有了长足的发展。
概览
信号处理 领域中的一个常见问题就是从一系列的采样中重建原本的信号。一般而言,未被采样的部分信号,是不可能重建出來的。然而通过借助对于信号(性质)的预先了解或合理假设,完美地通过一系列采样重建原信号就成为了可能。随着科学的发展,数学家们逐步增进了如何作出合理假设的能力,并慢慢了解到在何种情况下可将这些假设一般化、推广化。
信号处理领域中的一次较早的突破是奈奎斯特采样定理 的提出。这一定理证明了若信号的最高频率小于采样频率的一半,便可完美地从采样结果中恢复原本信号,因此定義了采样定理取樣頻率的下限。这种数据获取模式先采样再压缩,需要大量的时间压缩和空间存储数据,这限制了高速信号处理的发展,也给硬件的实时处理带来了极大的挑战。
在2006年左右,Emmanuel Candès 、戴維·多諾霍 、Justin Romberg和陶哲轩 证明了在已知信号稀疏性的情况下,可能凭借较采样定理所规定更少的采样数重建原信号,这一理论也是压缩感知的基石。
正交基展開(orthogonal basis expansion)採用的是完全正交基(complete and orthogonal basis set)來進行展開,而壓縮感知採用的是过完备的非正交基集(over-complete and non-orthogonal basis set)來展開訊號。
範例
傅立葉級數 展开是正交基 展开(orthogonal basis expansion)的方法:
x
(
t
)
≈ ≈ -->
∑ ∑ -->
m
=
1
M
a
m
exp
-->
(
j
2
π π -->
f
m
t
)
{\displaystyle x(t)\approx \sum _{m=1}^{M}a_{m}\exp(j2\pi f_{m}t)}
∫ ∫ -->
exp
-->
(
j
2
π π -->
f
m
t
)
exp
-->
(
j
2
π π -->
f
n
t
)
¯ ¯ -->
d
t
=
0
,
{\displaystyle \int \exp(j2\pi f_{m}t){\overline {\exp(j2\pi f_{n}t)}}\mathrm {d} t=0,}
if
f
m
≠ ≠ -->
f
n
{\displaystyle f_{m}\neq f_{n}}
Three-parameter atom expansion,Four-parameter atom (chirplet) expansion,
PSWF 展开則是过完备的非正交基集展开(over-complete and non-orthogonal basis expansion )的方法:
x
(
t
)
≈ ≈ -->
∑ ∑ -->
a
t
0
,
f
0
,
σ σ -->
ϕ ϕ -->
t
0
,
f
0
,
σ σ -->
(
t
)
{\displaystyle x(t)\approx \sum a_{t0,f0,{\displaystyle \sigma }}\phi _{t0,f0,{\sigma }}(t)}
ϕ ϕ -->
t
0
,
f
0
,
σ σ -->
{\displaystyle {\displaystyle \phi }_{t0,f0,{\displaystyle \sigma }}}
(t) 不构成一个完备的正交基集。
分類
压缩感知希望处理的问题是:
假设
b
0
(
t
)
,
b
1
(
t
)
,
b
2
(
t
)
,
b
3
(
t
)
,
⋯ ⋯ -->
{\displaystyle b_{0}(t),b_{1}(t),b_{2}(t),b_{3}(t),\cdots }
组成一个过完备的非正交基集
問題一
我们希望最小化
|
|
c
|
|
0
{\displaystyle ||c||_{0}}
(
‖ ‖ -->
⋅ ⋅ -->
‖ ‖ -->
0
{\displaystyle \lVert \cdot \rVert _{0}}
是
L
0
{\displaystyle L_{0}}
范数,
|
|
c
|
|
0
{\displaystyle ||c||_{0}}
意指
c
m
{\displaystyle c_{m}}
的值不為0 的個數),使得:
x
(
t
)
≈ ≈ -->
∑ ∑ -->
m
c
m
b
m
(
t
)
{\displaystyle x(t)\approx \sum _{m}c_{m}b_{m}(t)}
問題二
我们希望最小化
|
|
c
|
|
0
{\displaystyle ||c||_{0}}
,使得:
∫ ∫ -->
(
x
(
t
)
− − -->
∑ ∑ -->
m
c
m
b
m
(
t
)
)
2
d
t
<
threshold
{\displaystyle \int (x(t)-\sum _{m}c_{m}b_{m}(t))^{2}\mathrm {d} t<{\text{threshold}}}
問題三
限制
|
|
c
|
|
0
{\displaystyle ||c||_{0}}
为 M,我们想要最小化:
∫ ∫ -->
(
x
(
t
)
− − -->
∑ ∑ -->
m
c
m
b
m
(
t
)
)
2
d
t
{\displaystyle \int (x(t)-\sum _{m}c_{m}b_{m}(t))^{2}\mathrm {d} t}
方法
原子:
b
m
(
t
)
,
m
=
1
,
2
,
3
,
⋯ ⋯ -->
{\displaystyle b_{m}(t),m=1,2,3,\cdots }
|
∫ ∫ -->
b
m
(
t
)
b
m
∗ ∗ -->
(
t
)
d
t
|
=
1
{\displaystyle \left|\int b_{m}(t)b_{m}^{*}(t)\mathrm {d} t\right|=1}
(归一化)
[第1步]输入:
x
(
t
)
{\displaystyle x(t)}
,初始化:
n
=
0
,
x
r
(
t
)
=
x
(
t
)
{\displaystyle n=0,x_{r}(t)=x(t)}
[第2步]找到最小化
|
∫ ∫ -->
x
r
(
t
)
b
m
∗ ∗ -->
(
t
)
d
t
|
{\displaystyle \left|\int x_{r}(t)b_{m}^{*}(t)\mathrm {d} t\right|}
的m
[第3步]令
ϕ ϕ -->
n
(
t
)
=
b
m
(
t
)
,
u
n
=
∫ ∫ -->
x
r
(
t
)
b
m
∗ ∗ -->
(
t
)
d
t
{\displaystyle \phi _{n}(t)=b_{m}(t),u_{n}=\int x_{r}(t)b_{m}^{*}(t)\mathrm {d} t}
[第4步]
x
r
(
t
)
=
x
r
(
t
)
− − -->
u
n
ϕ ϕ -->
n
(
t
)
{\displaystyle x_{r}(t)=x_{r}(t)-u_{n}{\displaystyle \phi }_{n}(t)}
[第5步]
n
=
n
+
1
{\displaystyle n=n+1}
[第6步]檢查下列條件是否符合,若不符合,回到[第2步];若符合,則進到[第7步]
問題一:是否满足
x
r
(
t
)
=
0
{\displaystyle x_{r}(t)=0}
問題二:是否满足
∫ ∫ -->
x
r
2
(
t
)
d
t
<
threshold
{\displaystyle \int x_{r}^{2}(t)\mathrm {d} t<{\text{threshold}}}
問題三:是否满足
n
=
M
{\displaystyle n=M}
[第7步]
x
(
t
)
≈ ≈ -->
∑ ∑ -->
m
u
m
ϕ ϕ -->
m
(
t
)
{\displaystyle x(t)\approx \sum _{m}u_{m}{\displaystyle \phi }_{m}(t)}
方法二:基追踪(Basis Pursuit)
将
L
0
{\displaystyle L_{0}}
范数改为
L
1
{\displaystyle L_{1}}
范数
‖ ‖ -->
c
‖ ‖ -->
1
=
|
c
|
0
+
|
c
|
1
+
|
c
|
2
+
.
.
.
.
.
.
{\displaystyle \lVert c\rVert _{1}=|c|_{0}+|c|_{1}+|c|_{2}+......}
問題一:
我们想要最小化
|
|
c
|
|
1
{\displaystyle ||c||_{1}}
,使得:
x
(
t
)
≈ ≈ -->
∑ ∑ -->
m
c
m
b
m
(
t
)
{\displaystyle x(t)\approx \sum _{m}c_{m}b_{m}(t)}
問題二:
我们想要最小化
|
|
c
|
|
1
{\displaystyle ||c||_{1}}
,使得:
∫ ∫ -->
(
x
(
t
)
− − -->
∑ ∑ -->
m
c
m
b
m
(
t
)
)
2
d
t
<
threshold
{\displaystyle \int (x(t)-\sum _{m}c_{m}b_{m}(t))^{2}\mathrm {d} t<{\text{threshold}}}
問題三:
令
‖ ‖ -->
c
‖ ‖ -->
1
≤ ≤ -->
M
{\displaystyle \lVert c\rVert _{1}\leq M}
,我们想要最小化:
∫ ∫ -->
(
x
(
t
)
− − -->
∑ ∑ -->
m
c
m
b
m
(
t
)
)
2
d
t
{\displaystyle \int (x(t)-\sum _{m}c_{m}b_{m}(t))^{2}\mathrm {d} t}
問題定義
一般來說,一個常見的線性系統問題,有m 個方程式, n 個未知數,可以被定義如下:
y
=
H
s
,
{\displaystyle y=Hs,}
其中
H
∈ ∈ -->
ℜ ℜ -->
m
× × -->
n
,
s
∈ ∈ -->
ℜ ℜ -->
n
× × -->
1
,
y
∈ ∈ -->
ℜ ℜ -->
m
× × -->
1
{\displaystyle H\in \Re ^{m\times n},s\in \Re ^{n\times 1},y\in \Re ^{m\times 1}}
在通訊系統之中,y 是被收到的訊號,而s 則是要被重建的訊號,一般來說會有以下兩種情況:
1.
m
≥ ≥ -->
n
{\displaystyle m\geq n}
,也就是說方程式的數量大於等於未知數的數量,這種情況發生的時候就可以利用最小平方法 去求得最接近的解,求得的解如下:
s
∗ ∗ -->
=
(
H
T
H
)
− − -->
1
H
T
y
=
H
† † -->
y
,
{\displaystyle s^{*}=(H^{T}H)^{-1}H^{T}y=H^{\dagger }y,}
其中
H
† † -->
=
(
H
T
H
)
− − -->
1
H
T
{\displaystyle \ H^{\dagger }=(H^{T}H)^{-1}H^{T}}
是伪逆矩阵 。
2.
m
<
n
{\displaystyle m<n}
,也就是未知數的數量比方程式的數量來的多,这个方程组就被称为欠定 线性系统,一般而言有无数个解,因此無法使用最小平方法去求得要重建的訊號。
但是,如果这个欠定线性系统只有唯一一个稀疏解,那么我们可以利用压缩感知理论和方法来寻找这个解。值得注意的是,並不是所有欠定线性方程组都具有稀疏解。
舉例來說,
2
=
s
1
+
s
2
+
s
3
+
s
4
,
4
=
s
1
+
2
s
2
+
s
3
+
s
4
{\displaystyle 2=s_{1}+s_{2}+s_{3}+s_{4},4=s_{1}+2s_{2}+s_{3}+s_{4}}
是一個欠定線性系統,會有無限多個解可以滿足這個方程式,然而若加入稀疏的限制条件:
s
1
,
s
2
,
s
3
,
s
4
{\displaystyle s_{1},s_{2},s_{3},s_{4}}
之間只有一個有值,其余都是0;就可以很輕易地得到這個欠定線性系統的解為
(
0
,
2
,
0
,
0
)
{\displaystyle {\bigl (}0,2,0,0{\bigr )}}
,這個就是壓縮感知的最主要的精神所在。
從下圖可以輕易地了解,當解具有稀疏的特性時,就可以從欠定線性系統有無限多組解的情況變成可以利用最小平方法找出解的情況。
稀疏性
一個向量的稀疏性可以被定義如下:
‖
s
‖
0
=
{
i
:
s
i
≠ ≠ -->
0
}
{\displaystyle \left\Vert s\right\Vert _{0}=\{i:s_{i}\neq 0\}}
的个数。
也就是計算一個向量之中非零的個數,舉例來說,如果
s
=
[
0
0
1
0
1
0
0
]
{\displaystyle s=[0\ 0\ 1\ 0\ 1\ 0\ 0]}
,
‖
s
‖
0
=
2
{\displaystyle \left\Vert s\right\Vert _{0}=2}
,因此目標的解就會變成如下:
s
∗ ∗ -->
=
arg
-->
min
‖ ‖ -->
s
‖ ‖ -->
0
,
s
.
t
.
y
=
H
s
{\displaystyle s^{*}=\arg \min \|s\|_{0}\ ,s.t.\ y=Hs}
希望能在非零個數越少的情況之下,找到最有可能的解。然而在实际中,最优化L0范数是一个NP难 的问题,需要穷举s中非零值的所有排列可能,因而无法求解。通常采取的手段是对L1范数进行最优化求解,优化目标则变为:
s
∗ ∗ -->
=
arg
-->
min
‖ ‖ -->
s
‖ ‖ -->
1
,
s
.
t
.
y
=
H
s
{\displaystyle s^{*}=\arg \min \|s\|_{1}\ ,s.t.\ y=Hs}
或是使用匹配追踪系列算法、迭代阈值法以及专门处理二维图像问题的最小全变分法等求得次最优解的算法进行计算。
有限等距性質(Restricted Isometry Property, RIP)
有限等距性質(RIP)是壓縮還原演算法中常常可以看見的名詞,主要可以被用來分析還原演算法的表現好壞。其定義如下:
(
1
− − -->
δ δ -->
)
‖
s
‖
l
2
2
≤ ≤ -->
‖
H
s
‖
l
2
2
≤ ≤ -->
(
1
+
δ δ -->
)
‖
s
‖
l
2
2
{\displaystyle (1-\delta )\left\Vert s\right\Vert _{l_{2}}^{2}\leq \left\Vert Hs\right\Vert _{l_{2}}^{2}\leq (1+\delta )\left\Vert s\right\Vert _{l_{2}}^{2}}
其中的
H
{\displaystyle H}
代表傳感矩陣,
l
2
{\displaystyle l_{2}}
代表的是信號能量,可以表示如下:
‖
x
‖
l
2
2
=
∑ ∑ -->
i
=
1
N
|
x
i
|
2
{\displaystyle \left\Vert x\right\Vert _{l_{2}}^{2}=\sum _{i=1}^{N}\left\vert x_{i}\right\vert ^{2}}
因此整個式子可以視為信號
s
{\displaystyle s}
跟傳感矩陣
H
{\displaystyle H}
的相似程度,也就是做完轉換後的能量,要被RIP限制住,而RIP要求
0
<
δ δ -->
<
1
{\displaystyle 0<\delta <1}
。
取样方法
在理论上,为了确保信号重建的准确度,需要令所采用的取样 矩阵各行列之间相干性 (coherence)尽量地低,且须矩阵元素(element)取值随机性尽量地高。
相干性(coherence)可以簡單定義如下:
μ μ -->
(
H
)
=
max
l
≠ ≠ -->
m
|
ϕ ϕ -->
l
T
ϕ ϕ -->
m
|
{\displaystyle \mu {\bigl (}H{\bigr )}=\max _{l\neq m}\left\vert \phi _{l}^{T}\phi _{m}\right\vert }
也就是取樣矩陣任兩個相異的行做內積後,取絕對值所產生的最大值,可以用來衡量信號重建的準確度。
而目前對於採樣矩陣
A
∈ ∈ -->
R
m
× × -->
n
{\displaystyle A\in \mathbb {R} ^{m\times n}}
有下列幾種選擇可以使還原重建度有一定品質:
對n個A的行向量在m維的單位半徑球面上進行隨機採樣
對任一個
A
i
,
j
{\displaystyle A_{i,j}}
都採用相同獨立的高斯分布N(0,
1
m
{\displaystyle {\frac {1}{m}}}
)進行隨機採樣
對任一個
A
i
,
j
{\displaystyle A_{i,j}}
都採用如下式相同獨立的分布進行隨機採樣
P
(
A
i
,
j
=
± ± -->
1
m
)
=
1
2
{\displaystyle P(A_{i,j}=\pm {\frac {1}{\sqrt {m}}})={\frac {1}{2}}}
除了上述的可能,現在也已經證實任何一個sub-gaussian的分布,都可以成為一個很好的測量矩陣,也就是說具有很好的還原效果。
而上述矩陣之所以常被拿來使用,主要是因為皆已經被驗證具有高機率性滿足有限等距性質,也就是相干性非常低,因此使用此方式進行訊號取樣後,仍可確保在信號具有足夠稀疏性的前提下得到較佳的壓縮感知重建效果。
且當使用上述矩陣時,只要訊號x的非零數目成下列關係,可以確保訊號被完美還原。
m
≥ ≥ -->
C
× × -->
S
log
-->
(
n
S
)
{\displaystyle m\geq C\times S\log({\frac {n}{S}})}
而C是一個根據不同情況而改變的常數。
但是在上述矩陣时,所需要的数据存储量过于庞大——每个矩阵元素都要单独记录,且数据类型一般为浮点数——这就促进了简化取样矩阵的研究;目前被提出的简化取样矩阵主要包括两种:结构简化采样矩阵与数值简化采样矩阵。
结构简化采样矩阵
目前較常被使用的兩種結構簡化採樣矩陣為循環矩陣 與常對角矩陣
循環矩陣的形式為下式:
A
=
[
a
1
a
2
a
3
… … -->
a
n
a
n
a
1
a
2
a
n
− − -->
1
a
n
− − -->
1
a
n
a
1
a
n
− − -->
2
⋮ ⋮ -->
⋱ ⋱ -->
⋮ ⋮ -->
a
n
− − -->
m
+
2
a
n
− − -->
m
+
3
a
n
− − -->
m
+
4
… … -->
a
n
− − -->
m
+
1
]
{\displaystyle A={\begin{bmatrix}a_{1}&a_{2}&a_{3}&\dots &a_{n}\\a_{n}&a_{1}&a_{2}&&a_{n-1}\\a_{n-1}&a_{n}&a_{1}&&a_{n-2}\\\vdots &&&\ddots &\vdots \\a_{n-m+2}&a_{n-m+3}&a_{n-m+4}&\dots &a_{n-m+1}\end{bmatrix}}}
常對角矩陣的形式為下式:
A
=
[
a
0
a
− − -->
1
a
− − -->
2
… … -->
… … -->
a
− − -->
n
+
1
a
1
a
0
a
− − -->
1
⋱ ⋱ -->
⋮ ⋮ -->
a
2
a
1
⋱ ⋱ -->
⋱ ⋱ -->
⋱ ⋱ -->
⋮ ⋮ -->
⋮ ⋮ -->
⋱ ⋱ -->
⋱ ⋱ -->
⋱ ⋱ -->
a
m
− − -->
n
− − -->
1
a
m
− − -->
n
− − -->
2
⋮ ⋮ -->
⋱ ⋱ -->
a
m
− − -->
n
+
1
a
m
− − -->
n
a
m
− − -->
n
− − -->
1
a
m
− − -->
1
… … -->
… … -->
a
m
− − -->
n
+
2
a
m
− − -->
n
+
1
a
m
− − -->
n
]
{\displaystyle A={\begin{bmatrix}a_{0}&a_{-1}&a_{-2}&\ldots &\ldots &a_{-n+1}\\a_{1}&a_{0}&a_{-1}&\ddots &&\vdots \\a_{2}&a_{1}&\ddots &\ddots &\ddots &\vdots \\\vdots &\ddots &\ddots &\ddots &a_{m-n-1}&a_{m-n-2}\\\vdots &&\ddots &a_{m-n+1}&a_{m-n}&a_{m-n-1}\\a_{m-1}&\ldots &\ldots &a_{m-n+2}&a_{m-n+1}&a_{m-n}\end{bmatrix}}}
,
其中
A
i
,
j
=
A
i
+
1
,
j
+
1
=
a
i
− − -->
j
.
{\displaystyle A_{i,j}=A_{i+1,j+1}=a_{i-j}.\ }
。
可以發現到,若採用循環矩陣作為測量矩陣的話,只需要存取一列的矩陣元素;相反地,若使用常對角矩陣,除了第一列的矩陣元素外,需要額外儲存第一行的矩陣元素。
但是經過實驗發現,常對角矩陣的相干性是低於循環矩陣的,因此使用者可以依據自己的使用環境,來找到一個平衡點。
採用這兩種矩陣進行壓縮感知取樣時,可以大幅降低儲存成本,也為此算法的前端感測器大幅降低實現門檻。
数值简化采样矩阵
数值简化采样矩阵普遍将原有的、按照高斯分布随机取值的采样矩阵元素以数值上更为简单的元素取代,但在分布上维持矩阵元素的分布随机性——即缩减了储存浮点数这一方面的成本。
一种较为基本的数值简化采样矩阵是0-1伯努利矩阵 ,其中的元素仅有0和1两种,分布模式为相同独立的伯努利分布 (identical independent Bernoulli distribution)。
对于每一个矩阵元素,该分布的概率质量函数
f
{\displaystyle f}
为:
f
(
k
;
p
)
=
{
p
if
k
=
1
,
1
− − -->
p
if
k
=
0.
{\displaystyle f(k;p)={\begin{cases}p&{\text{if }}k=1,\\[6pt]1-p&{\text{if }}k=0.\end{cases}}}
求解/重构方法
压缩感知利用了很多信号中所存在的冗余(换言之,这些信号并非完全是噪声)。具体而言,很多信号都是“稀疏”的;在适当的表示域中,它们的很多系数都是等于或约等于零。
在信号获取阶段,压缩感知在信号并不稀疏的域对信号进行线性测量。
为了从线性测量中重构出原来的信号,压缩感知求解一个称为L1-范数 正则化的最小二乘 问题。从理论上可以证明,在某些条件下,这个正则化最小二乘问题的解正是原欠定线性系统的稀疏解。
基追踪
基追踪 是一种信号重建演算法,被广泛地用于压缩感知领域,属于数学最优化问题的范畴,形式为
min
s
‖ ‖ -->
s
‖ ‖ -->
1
subject to
y
=
H
s
{\displaystyle \min _{s}\|s\|_{1}\quad {\mbox{subject to}}\quad y=Hs}
。
其中s是n×1向量,表示输出(信号),y 是m×1的测量向量,H 是m ×n的“转换矩阵”或稱作“测量矩阵”,其中M < N 。
基追踪常在需要完美满足欠定线性方程组系统中
y
=
H
s
{\displaystyle y=Hs}
时被应用,且要求解在L 1 基准下为最稀疏的。
若应用情景允许降低对完美恢复的要求,以换取更加稀疏的解s ,降噪基追踪 更为适用。
匹配追踪
匹配追踪 是一种稀疏近似运算,旨在找到多维数据在某个超完备字典(dictionary)
D
{\displaystyle D}
上映射的“最佳匹配”。其基本的概念就是要用来自
D
{\displaystyle D}
的函数组
g
γ γ -->
n
{\displaystyle g_{\gamma _{n}}}
(称为基元,或atom)的加权和来表示希尔伯特空间
H
{\displaystyle H}
上的信号
f
{\displaystyle f}
:
f
(
t
)
=
∑ ∑ -->
n
=
0
+
∞ ∞ -->
a
n
g
γ γ -->
n
(
t
)
{\displaystyle f(t)=\sum _{n=0}^{+\infty }a_{n}g_{\gamma _{n}}(t)}
其中
n
{\displaystyle n}
表示被选取基元的序数,
a
n
{\displaystyle a_{n}}
是每个基元的加权常数。对于固定的字典,匹配追踪会先找到与信号间内积最大的一个基元,再减去该基元带来的影响,然后重复找寻影响力次大的基元直到信号被较好地分解。
相较而言,以傅里叶级数 表示的信号来说,字典是构建于正弦基函数之上的。信号处理领域中傅里叶分析的主要缺点就在于它只能提取出信号中常存的特征,而不能适应当前的分析目标信号
f
{\displaystyle f}
。
若采用一组极端保险、带有大量冗余的字典,我们就能够找到可以完美匹配信号的
f
{\displaystyle f}
函数组。在对信号进行编码与压缩时,最好是能够找到一组映射,使加权和中的大部分系数都接近零(具有“稀疏性”)。
正交匹配追蹤
正交匹配追蹤(Orthogonal Matching Pursuit)是匹配追蹤的特殊形式,正交匹配追蹤的算法與匹配追蹤相同,但是正交匹配追蹤不會重複使用同一個基元來進行匹配,因此會比匹配追蹤更快收斂。
迭代閾值算法
迭代閾值算法(Iterative Shrinkage-Thresholding Algorithm)是上述基於貪婪演算法 (Greedy Algorithm)之匹配追蹤與正交匹配追蹤的替代算法,迭代算法主要是透過不斷的投影和取閾值來進行收斂,而他在每次迭代中,都還可以進行其他優化例如:Wigener 濾波,不僅可以降低運算複雜度,也可以提高還原品質。
正交匹配追蹤(Orthogonal Matching Pursuit)
正交匹配追蹤是一個用來解決壓縮感知問題的演算法,在一定的複雜度之下有不錯的表現,他背後最主要的想法是源自於貪婪演算法 (Greedy Algorithm),以下將逐步解說。
首先這個問題被定義為:y=Ax,目標是要藉由已知的y向量、A矩陣,來還原x向量,他會利用疊代的方式,逐步找出x向量當中最有可能是非零的位置。
一開始會有一個空集合
Λ Λ -->
0
{\displaystyle \Lambda _{0}}
,以及剩餘的部分
r
0
{\displaystyle r_{0}}
,每次疊代都會從
Λ Λ -->
l
− − -->
1
¯ ¯ -->
{\displaystyle {\overline {\Lambda {_{l-1}}}}}
找出一個A矩陣投影到剩餘
r
l
− − -->
1
{\displaystyle r_{l-1}}
有最大值的位置,把這個位置加到
Λ Λ -->
l
{\displaystyle \Lambda _{l}}
之中,並從
Λ Λ -->
l
¯ ¯ -->
{\displaystyle {\overline {\Lambda {_{l}}}}}
當中移除,最後再更新剩餘
r
l
{\displaystyle r_{l}}
。利用疊代的方式,不斷地找出x向量當中最有可能非零的位置,直到達到演算法停止條件。
在正交匹配追踪算法的基础上,Needell等人提出了正则正交匹配追踪 (Regularized Orthogonal Matching Pursuit,ROMP)算法对于所有满足约束等距性条件的矩阵和所有稀疏信号进行重构。之后,引入回溯思想的压缩采样匹配追踪 (Compressive Sampling Matching Pursuit,CoSaMP)算法被提出。
在实际应用中,稀疏信号非零元素个数K往往是未知的,而上述的匹配追踪算法都是建立在稀疏度K已知的基础上,因此出现了对K自适应的稀疏自适应匹配追踪 (Sparsity Adaptive Matching Pursuit,SAMP)算法,它通过固定步长来逐步逼近进行重建,可以在稀疏度K未知的情况下获得较好的重建效果。
迭代閾值算法(Iterative Shrinkage-Thresholding Algorithm)
迭代閾值算法是從Relaxation Method啟發而來,Relaxation Method是用於解決具有稀疏性的線性系統。
在迭代閾值算法中,問題一樣是被定義為:
min
‖ ‖ -->
x
‖ ‖ -->
1
s
u
b
j
e
c
t
t
o
y
=
A
x
{\displaystyle \min \|x\|_{1}\ \ subject\ to\ y=Ax}
而在此算法中,每一次的迭代主要分成兩部分:1、尋找新的解
x
t
+
1
{\displaystyle x^{t+1}}
。2、更新殘值
r
t
{\displaystyle r^{t}}
。
第一階段,主要是利用投影的方式找到更新的向量方向,再透過取閾值的方式來進行優化。
x
t
+
1
=
η η -->
t
h
r
(
x
t
+
K
× × -->
(
A
T
r
t
)
)
{\displaystyle x^{t+1}=\eta _{thr}(x^{t}+{\mathcal {K}}\times (A^{T}r^{t}))}
而
K
{\displaystyle {\mathcal {K}}}
是relaxation parameter,且
K
∈ ∈ -->
(
0
,
1
)
{\displaystyle {\mathcal {K}}\in (0,1)}
。
而
η η -->
t
h
r
(
.
)
{\displaystyle \eta _{thr}(.)}
就是閾值函數(thresholding function),主要就是為了使迭代的過程中,逐漸逼近具有稀疏性性質的解,而目前主要有兩大類取閾值的方式:硬閾值函數(Hard Thresholding Function)與軟閾值函數(Soft Thresholding Function)。
硬閾值函數就是將小於閾值(thr)的解,一律通通過濾成0。
η η -->
t
h
r
H
(
x
)
=
{
x
,
if
|
x
|
>
t
h
r
0
,
otherwise
{\displaystyle \eta _{thr}^{H}(x)={\begin{cases}x,{\text{if }}|x|>thr\\0,{\text{otherwise}}\end{cases}}}
而軟閾值函數則是使用較為平滑的方式,將值逼近於稀疏性的解
η η -->
t
h
r
S
(
x
)
=
sgn
-->
(
x
)
(
|
x
|
− − -->
t
h
r
)
+
, where
(
z
)
+
=
z
× × -->
I
(
z
≥ ≥ -->
0
)
{\displaystyle \eta _{thr}^{S}(x)=\operatorname {sgn}(x)(|x|-thr)_{+}{\text{, where }}(z)_{+}=z\times \mathbb {I} (z\geq 0)}
,而
I
(
.
)
{\displaystyle \mathbb {I} (.)}
是指示函數
而第二階段,則是利用新算出來的
x
t
+
1
{\displaystyle x^{t+1}}
來進行殘差更新。
r
t
+
1
=
y
− − -->
A
x
t
+
1
{\displaystyle r^{t+1}=y-Ax^{t+1}}
之後一直等到規定的迴圈數抵達即完成還原。
而此算法是Landweber iteration的變形,若沒有加入閾值函數的話,就會收斂到
min
‖ ‖ -->
y
− − -->
A
x
‖ ‖ -->
2
2
{\displaystyle \min \|y-Ax\|_{2}^{2}}
。
稀疏性空間投影
壓縮感知還原演算法 包括整個壓縮感知都是建立在信號有稀疏性上,但是並不是所有的信號都天然具有稀疏性,例:聲音。那麼是否不具有稀疏性的信號就不能使用壓縮感知呢?答案為並不是,天然不具有稀疏性的信號還是能夠使用壓縮感知,只需要把該信號投影到其他空間,其他該信號有稀疏性的空間下,壓縮感知就可直接使用在該投影空間上。可以被定義如下:
s
=
ψ ψ -->
z
,
w
h
e
r
e
ψ ψ -->
∈ ∈ -->
ℜ ℜ -->
n
× × -->
k
,
z
∈ ∈ -->
ℜ ℜ -->
k
× × -->
1
,
s
∈ ∈ -->
ℜ ℜ -->
n
× × -->
1
{\displaystyle s=\psi z,where\ \psi \in \Re ^{n\times k},z\in \Re ^{k\times 1},s\in \Re ^{n\times 1}}
s :要被重建的訊號(原信號);ψ :投影矩陣,把非稀疏性信號投影到稀疏性空間;z :非零項遠小於零項
故原壓縮感知公式定義也隨之改變:
y
=
H
s
=
H
ψ ψ -->
z
=
Θ Θ -->
z
,
w
h
e
r
e
Θ Θ -->
∈ ∈ -->
ℜ ℜ -->
m
× × -->
k
{\displaystyle y=Hs=H\psi z=\Theta z,\,where\,\Theta \in \Re ^{m\times k}}
所以可以把
Θ Θ -->
{\displaystyle \Theta }
視為原本壓縮感知公式裡面的H ,還原演算法即可一樣使用。
至於
ψ ψ -->
{\displaystyle \psi }
的選擇對於不同信號來說有很多種,有離散餘弦變換 (DCT) ,離散小波變換 (DWT),字典學習(Dictionary Learning)等。
離散餘弦變換和離散小波變換
利用信號經過這兩種變換後都會有稀疏性的特性,把這兩種變換變成矩陣形式,讓信號直接投影到具有稀疏性的空間上。
好處
不需要特別針對信號做不同
ψ ψ -->
{\displaystyle \psi }
的選擇,對於絕大部分信號可以直接使用。
並不需要前處理,可以直接使用。
壞處
限制了原信號的維度,必須滿足n =
2
x
{\displaystyle 2^{x}}
,x為任意正整數。
因為通用所有信號,故經過壓縮感知還原演算法後還原的信號品質較差。
字典學習
顧名思義即把
ψ ψ -->
{\displaystyle \psi }
當作一本要學習的字典,不斷的利用該信號和還原演算法後的結果做字典的更新,直到找到一個
ψ ψ -->
{\displaystyle \psi }
能夠把該信號投影到稀疏性空間上。
字典學習的流程:
設定字典學習的學習次數(Iter)
收集一定量(L筆)要學習的資料s,組成S = [s1 , s2 , ... ,sL ]
固定
ψ ψ -->
{\displaystyle \psi }
,利用還原演算法找出每一筆資料的z,組成Z = [z1 , z2 , ... ,zL ]
m
i
n
c
{\displaystyle {\underset {c}{min}}}
||S -
ψ ψ -->
{\displaystyle \psi }
Z |
|
F
2
{\displaystyle |_{F}^{2}}
s.t. ||zi ||0 < Kth
∀ ∀ -->
{\displaystyle \forall }
i
固定Z , 利用3.所得之Z 來更新字典
當Z固定時,定義誤差ei = si -
ψ ψ -->
{\displaystyle \psi }
zi ,組成E = [e1 , e2 , ... ,eL ]
所以整體的均方误差為 ||E |
|
F
2
{\displaystyle |_{F}^{2}}
= || [e1 , e2 , ... ,eL ] |
|
F
2
{\displaystyle |_{F}^{2}}
= || S -
ψ ψ -->
{\displaystyle \psi }
Z |
|
F
2
{\displaystyle |_{F}^{2}}
在Z 固定下使得E 最小,將得到關係式 (S -
ψ ψ -->
{\displaystyle \psi }
Z )Z T = 0
=>
ψ ψ -->
{\displaystyle \psi }
= SZT (ZZT )-1
檢查Z 上面是否已經有稀疏性,如有則結束學習;如沒有則回到3.直到達到學習的次數
字典學習的演算法有很多,較為常用的有Method of optimal directions(MOD[ 1] )。
好處
因為針對該種類信號做學習,故還原後的品質較好。
對原信號的維度並沒有任何限制。
壞處
需要事前收集該種類的信號做學習,不能未學習直接使用。
因為針對該種類信號做學習,故直接使用在不同種類信號效果較差/不適用。
相關應用
压缩感知与包括欠定系统 、群验 、稀疏编码 、复用 、稀疏采样 等。在成像科技领域,亦有许多技术如(编码孔 与计算摄影学 )与压缩感知相关。亦有许多在不同技术完成度下将压缩感知实现的案例。
X射線晶體學
壓縮感知在X射線晶體學中的應用主要體現在相位回復問題的研究上。相位回復在X射線晶體結構分析中至關重要,因為晶體結構與其X射線繞射效應之間存在傅里葉轉換關係。傳統方法中,僅能獲得繞射強度的振幅資訊,缺乏相位資訊,這使得直接重建晶體結構變得困難。
為解決這一問題,有學者將壓縮感知應用於相位回復,提出了壓縮相位回復(Compressive phase retrieval)。該方法利用訊號的稀疏性,通過較少的測量數據成功回復原始訊號。在隨機傅里葉轉換模型下,僅需少量隨機的傅里葉測量,即可回復稀疏訊號。
此外,壓縮感知還被用於提升X射線成像的分辨率和穩定性,尤其是將壓縮感知與深度學習相結合的創新方法,進一步優化了圖像重建的效果。
摄影学
压缩感知技术被用于手机摄像头传感器设计中。这一技术使得在获取图像时所耗费的能量大大降低,可达原先耗费的15分之一——当然,需要引入复杂的解压算法;这一运算可能会需要脱机状态下的预先安装、设置。
压缩感知亦被用于实现单像素摄影。贝尔实验室 运用了这一技术,用无镜片单像素相机在栅格中随机选取的孔隙处拍照,以达到成像效果。随着拍照次数的逐渐增多,照片质量也会逐步提高;一般来说,这种技术较之传统的摄影成像技术仅仅需要一小部分的数据占用量,且能完全避免与镜片或聚焦相关的故障或失常;参见[1] (页面存档备份 ,存于互联网档案馆 ) 。
全息成像
压缩感知可被用于增加通过单幅全息图中所能得到的立体像素 的数量改进全息摄影 技术中的图像重建问题。在光学全息图或毫米波全息图采样率不足的情况下,这一技术也能够被用于图像检索 以作出改善。
面部识别
压缩感知目前被用于面部识别应用之中,参见Engineers Test Highly Accurate Face Recognition (页面存档备份 ,存于互联网档案馆 )。
核磁共振成像
壓縮感知也被應用在醫療影像上,特別是核磁共振成像 (Magnetic Resonance Imaging, MRI),具有稀疏的特性,因此能使用壓縮感知的技術。在過去核磁共振成像會因為物理學、生理學上的限制,而有掃描時間較長的問題,如今壓縮感知利用核磁共振成像具有的稀疏特性,來改善成像品質以及降低所需要量測數量,能有效縮短核磁共振的掃描時間,近期相關的壓縮感知演算法也被廣為討論,可以參見[2] (页面存档备份 ,存于互联网档案馆 ) 、[3] (页面存档备份 ,存于互联网档案馆 ) 與[4] (页面存档备份 ,存于互联网档案馆 ),其中涉及的重建方法包括ISTA、FISTA、SISTA等。
地震成像
一般來說地震成像既不稀疏,也不可壓縮,具有高維度、大面積的特性,因此會耗費大量的量測以及運算時間,所以希望能降低取樣的次數,同時能保有原本的品質。因此有人利用壓縮感知技術將取樣以及編碼同時進行,來達到降低維度的目的,最後再透過壓縮感知的還原演算法進行還原,可以參考[ 2] 。
在通訊系統當中會遇到高頻寬的問題,因此會需要較高的取樣頻率,然而其中的信號可能含有的資訊是遠小於頻寬的,因此就會浪費軟、硬體的資源來進行取樣。所以有人提出用類比信息轉換(Analog-to-Information Converter, AIC)取代類比數位轉換(Analog-to-Digital Converter, ADC),利用隨機解調(Random Demodulation)的方式,來降低所需要的取樣次數,對於在時頻上有稀疏特性、寬頻的信號特別適合,可以參考[ 3] 。
网络诊断
压缩感知在被用于旨在利于网络管理 的网络诊断 应用中时带来了极佳成效。对网络延时的估计和网络拥塞 的探知均可被归纳、建模为非定性的线性方程组 系统,其中的参数矩阵正是所分析网络的路由选择矩阵。此外,在互联网情景中,网络路由矩阵常常能够满足压缩感知技术所要求的几个基本要素:低相关性、稀疏性及(可能的)R.I.P条件,请参见[5] (页面存档备份 ,存于互联网档案馆 ) 。
短红外摄影
目前,基于压缩感知技术的商用短红外相机已被推出[6] (页面存档备份 ,存于互联网档案馆 ) 。这些相机的光敏度大约从0.9µm到1.7µm,在上述波段上,人类的肉眼是无效的。
通訊通道估測
隨著通訊要求的頻寬越來越大,因此可用的頻帶從微波(Microwave)轉到毫米波(mmWave)的頻段,雖然可用的頻寬增加,然而會受到更嚴重的通道衰減,所以波束成型 的技術被提出,結合天線陣列來對抗通道衰減的效應。然而大量的天線陣列會使得做通道估測的複雜度上升,傳統的做法是使用最小平方法(Least Square, LS)來進行通道估測,不過有人發現通道具有稀疏的特性,因此提出了利用壓縮感知的技術,進行壓縮通道估測(Compressed Channel Estimation, CCS),相較最小平方法,不僅複雜度降低,還能達到更低的錯誤率以及延遲性。
信号源定位
利用压缩感知理论可以恢复出稀疏信号的特性,压缩感知理论被广泛应用于波达方向估计(Direction of Arrival,DOA)中。基于压缩感知的波达方向估计中将信号源矩阵看作是一个稀疏矩阵,在已知采样矩阵和阵列流形矩阵为前提下,对稀疏信号源矩阵进行重构以获得被测量信号源的波达方向。使用这种方法,不仅避免了传统波达方向估计中需要计算复杂协方差矩阵的步骤,同时还对空间中的相干信号源有着很好的性能。
物聯網
在物聯網 的情境之下,裝置的數量會大幅增加,然而因為資源有限,所以用來辨別裝置的展頻碼(m)會少於裝置的數量(n),因此會使得整個系統變成欠定的線性系統,然而這些裝置大部分的時候都是處於休息、監測的狀態,並不會一直傳送訊息給基地台,因此就有了稀疏的性質,利用壓縮感知的技術就能分辨出處於活動狀態的裝置,並解出其所傳送的訊號。
加密
壓縮感知演算法天生就具有加密的性質,因為要重建原本信號的話,必須要知道採樣矩陣才能進重建。因此現今也有許多加密的研究關注於壓縮感知演算法,因為虛擬亂數傳感矩陣(Pseudo-random Sensing Matrix)可以被視為一組加密後的鑰匙,能對信號進行壓縮並同時加密,而不需要額外的運算,可以參考[ 4] 。
參考資料
Candès, E.J., & Wakin, M.B., An Introduction To Compressive Sampling, IEEE Signal Processing Magazine, V.21, March 2008
J. Choi et al., "Compressive Sensing for Wireless Communications: Useful Tips and Tricks", IEEE Commun. Survey and Tutorials.
C. Bockelmann, H. F. Schepker, and A. Dekorsy, "Compressive sensing based multi‐user detection for machine‐to‐machine communication," Transactions on Emerging Telecommunications Technologies, vol. 24, no. 4, pp. 389-400, 2013.
F. Monsees, C. Bockelmann, D. Wubben, and A. Dekorsy, "Sparsity aware multiuser detection for machine to machine communication," 2012 IEEE Globecom Workshops, Anaheim, CA, 2012, pp. 3-7.
Shen Q, Liu W, Cui W, et al. "Underdetermined DOA Estimation Under the Compressive Sensing Framework: A Review". IEEE Access, 2016: 8865-8878.
Jian-Jiun Ding, “Time Frequency Analysis and Wavelet Transforms ”, NTU, 2021.
外部链接
^ Engan, K.; Aase, S.O.; Hakon Husoy, J. Method of optimal directions for frame design . 1999 IEEE International Conference on Acoustics, Speech, and Signal Processing. Proceedings. ICASSP99 (Cat. No.99CH36258) (IEEE). 1999. ISBN 0780350413 . doi:10.1109/icassp.1999.760624 .
^ Hennenfent, Gilles; Herrmann, Felix J. Simply denoise: Wavefield reconstruction via jittered undersampling . GEOPHYSICS: V19–V28. [2017-12-16 ] . doi:10.1190/1.2841038 . (原始内容存档 于2018-06-09).
^ Laska, J. N.; Kirolos, S.; Duarte, M. F.; Ragheb, T. S.; Baraniuk, R. G.; Massoud, Y. Theory and Implementation of an Analog-to-Information Converter using Random Demodulation . 2007 IEEE International Symposium on Circuits and Systems. May 2007: 1959–1962. doi:10.1109/ISCAS.2007.378360 .
^ Orsdemir, A.; Altun, H. O.; Sharma, G.; Bocko, M. F. On the security and robustness of encryption via compressed sensing . MILCOM 2008 - 2008 IEEE Military Communications Conference. November 2008: 1–7 [2017-12-16 ] . doi:10.1109/MILCOM.2008.4753187 . (原始内容存档 于2021-02-24).