26 Sep 2020
Vector의 sparsity와 compressibility는 어떻게 이야기해야 할까?
Notations
지금부터는 다음의 표현을 사용한다.
\[[N] = \{1,2,...,N\}\] \[card(S) = \textrm{the cardinality of a set } S\]Sparsity and Compressibility
먼저 벡터 \(x\in\mathbb{C}^N\)의 support는 \(x\)의 nonzero entries의 index set으로 정의한다:
\[supp(x) := \{j\in[N] | x_j \neq 0\}.\]그리고 벡터 \(x\in\mathbb{C}^N\)가 아래의 조건을 만족하면 s-sparse 하다라고 정의한다.
\[\| x \|_0 := card(supp(x)) \leq s.\]즉, \(x\)의 support의 크기가 s 이하면 \(x\)는 s-sparse 하다.
Remark \(\|\cdot\|_0\)은 편의상 \(l_0\)-norm이라고 불리는데 norm이나 quasinorm이 아니다. 그리고 다음과 같은 limiting property를 가진다.
\[\|x\|_p^p = \sum_{j=1}^N |x_j|^p \rightarrow \sum_{j=1}^{N}\chi_{\{x_j\neq 0\}} = card(\{j\in[N]:x_j\neq 0\}) ~~\textrm{as}~~ p\rightarrow 0.\]Sparsity는 너무 강한 조건이고 해석학적으로 다루기 힘들기 때문에 relaxation으로써 더 약한 조건인 Compressibility 개념이 필요하다.
\(s\)-term approximation
먼저 벡터 \(x\)의 compression을 최대 s개를 제외한 나머지 성분을 0으로 만드는 것으로 생각할 수 있다. 이렇게 얻어진 벡터를 s-term approximation of \(x\) (\(s \ll N\))라고 부른다. 이 경우 벡터가 얼마나 잘 근사되었는 지를 다음과 같이 정의되는 error of best s-term approximation으로 측정할 수 있다.
For \(p>0\), the \(l_p\)-error of best s-term approximation to a vector \(x\in\mathbb{C}^N\) is
\[\sigma_s(x)_p := \inf\{ \|x-z\|_p,~z\in\mathbb{C}^N~\textrm{is s-sparse} \}.\]Remark 위의 infimum은 \(x\) component 중에서 절대값이 가장 큰 s 개의 entries를 가지는 s-sparse 벡터 \(z\)에 의해서 달성된다. 예를들어 \(x=(2,1,1,1)\)일 때 2-sparse vector \((2,1,0,0)\)와 \((2,0,1,0)\)는 infimum을 만족한다. 즉, infimum은 \(p\)값에 상관없이 달성 가능하지만 이를 만족하는 벡터가 유일하지는 않다.
방금 정의한 \(\sigma_s(x)_p\)를 이용하면 \(s\)가 증가할 때 best s-term approximation이 빨리 감소하면 \(x\in\mathbb{C}^N\)는 compressible 하다고 생각할 수 있다. 이 관점에서는 어떤 조건에서 best s-term approximation error가 빨리 감소하는지 생각해야 한다. 증명은 생략하고 다음의 Theorem을 살펴보자.
Theorem For any \(q>p>0\) and any \(x\in\mathbb{C}^N\) the inequality
\[\sigma_s(x)_q \leq \frac{c_{p,q}}{s^{1/p - 1/q}} \|x\|_p\]holds with
\[c_{p,q}:=\left[ \left(\frac{p}{q}\right)^{p/q}\left(1-\frac{p}{q}\right)^{1-p/q} \right]^{1/p} \leq 1.\]위 Theorem에 따르면 \(p>0\)이면 error를 컨트롤 할 수 있고, p가 0에 가까울수록 error가 빠르게 줄어든다다. 예를 들어 \((p, q) = (1,2)\)라면 아래와 같다.
\[\sigma_s(x)_2 \leq \frac{1}{2\sqrt{s}}\|x\|_1.\]\(s\)-significant components
compressibility를 이야기 하는 다른 방법으로 significant components의 수를 기준으로 삼을 수 있다. 즉, 다음의 값이 작으면 compressible 하다고 이야기한다.
\[card\{j\in[N]~ |~ |x_j|\geq t\}\]이 조건을 만족하는 벡터를 다루기 위해서 weak \(l_p\)-spaces를 도입한다.
Definition For \(p>0\), the weak \(l_p\) space \(w_p^N\) is the space \(\mathbb{C}^N\) equipped with the quasinorm
\[\tag{1} \| x \|_{p,\infty} := \inf \bigg\{ M\geq 0 ~|~ card\{j\in[N]~ |~ |x_j|\geq t\}\leq \frac{M^p}{t^p}~~\textrm{for all}~~t>0 \bigg\}.\]여기서 (1)이 quasinorm이기 위해서 Non-negativity와 Absolute homogeneity는 쉽게 확인 가능하고 나머지 마지막 부등호 조건은 다음의 부등식으로 주어진다.
\(p>0\) 이면
\[\| x^1 + \cdots + x^k \|_{p,\infty} \leq k^{\max \{1,1/p\} }(\|x^1\|_{p,\infty}+\cdots+\|x^k\|_{p,\infty})\]where \(x^1,...,x^k\in\mathbb{C}^N\).
(1)의 weak \(l_p\)-quasinorm을 좀 더 사용하기 쉬운 형태로 다시 표현할 수 있다.
\(p>0\) 이면
\[\|x\|_{p,\infty} = \max_{k\in[N]} k^{1/p}x_k^*\]where \(x^*\in\mathbb{R}_+^N\) denote the nonincreasing rearrangement of \(x\in\mathbb{C}^N\).
새로운 표현을 이용하면 \(l_p\)-norm과 직접 비교 가능하고
\[\|x\|_{p,\infty}\leq\|x\|_p,\]다음과 같이 error of best s-term approximation도 bound 할 수 있다.
Proposition For any \(q>p>0\) and \(x\in\mathbb{C}^N\), the inequality
\[\sigma_s(x)_q \leq \frac{d_{p,q}}{s^{1/p-1/q}}\|x\|_{p,\infty}\]holds with
\[d_{p,q}:=\left(\frac{p}{q-p}\right)^{1/q}.\]