Прва Шенонова теорема

Првата Шенонова теорема ги воспоставува границите на можната компресија на податоци, и ѝ дава практично значење на Шеноновата ентропија. Оваа теорема ја докажал Клод Шенон во 1948 година, и заклучил дека не е можно да се изврши компресија, а просечниот број битови по симбол да биде помал од ентропијата на изворот на дадените симболи или ќе дојде до губење на информација. Меѓутоа можно е да се врши компресија при што бројот на битови по симбол ќе биде приближен на ентропијата на изворот со мала веројатност за губење информација. Поточно, оваа теорема покажува дека со кодирање на секвенци од изворот со помош на код со одреден алфабет може сигурно со декодирање да се добијат изворните симболи.^[1]^[2]^[3]

Дискретен извор без меморија

Дискретен извор без меморија (Предлошка:Lang-en) чиј излeз е случајна променлива a, која зема реализации од конечен алфабет А=(а1, а2... ар) со веројатности P[i], i=1,2...n. Симболите се појавуваат по некој случаен распоред, во константни или променливи временски растојанија.

Кодирање

Код е преведувањње на низа влезни симболиу во низа симболи. Кодот е еднозначно декодабилен доколку не постојат два кодни збора со конечна должина кои чинат иста секвенца, поблаг критериум е ниеден збор да не е префикс на некој друг збор.

Позитивен став

За DMS со алфабет А и ентропија Н(А)=Н за секое N од множеството природни броеви пости еднозначно декодабилен код кој се состои од бинарни секвенци со должина $l_{n} [\vec{a}]$ , a е вектор од $A_{n}$ (n-торка од A) $< l_{n} > =$ Σ $P_{n} [\vec{a}] l_{n} [\vec{a}]$ $\leq$ $N H + o (N)$

каде сумата оди по $A_{n}$

Очекуваната должина на кодните зборови. о(N) претставува член кој со N расте поспоро од линеарно.

Негативен став

Не постои случај да

$< l_{n} > < N H$

Доказ

Позитивен став

Сите N-торки од $A_{n}$ може еднозначно да се кодираат со бинарни ${l_{n}}^{'}$ -торки доколку

$2^{l n^{'} - 1} < r^{N}$ $\leq$ $2^{l n^{'}}$

од што следува дека

${l_{n}}^{'} = N l d (r)$

Нека $A_{n}$ се подели на подмножества $S (N, e)$ и $\overline{S (N, e)}$

Како во лемата АЕР секој елемент од $S (N, e)$ може да се кодира со $l_{n}$

каде според АЕP тоа изнесува

$l_{n} = N (H + e)$

за сигурно да се добие префиксен код на секој елемент од $S (N, e)$ му се доделува 0, а на елемент од $\overline{S (N, e)}$ 1.

Просечната должина на вака добиен код е:

$< l_{n} > = (l_{n} + 1) P [\vec{a} \in S (N, e)] + ({l_{n}}^{'} + 1) P [\vec{a} \in \overline{S (N, e)}]$

$= 1 + (l_{n}) P [1 - \vec{a} \in \overline{S (N, e)}] + ({l_{n}}^{'}) P [\vec{a} \in \overline{S (N, e)}]$

$\leq 1 + (l_{n}) + ({l_{n}}^{'}) P [\vec{a} \in \overline{S (N, e)}]$

па се добива

$\leq N H + N e + 2 + N l d r σ^{2} / N e^{2}$

и за е= $N^{1 / 3}$ се добива

$< l_{n} > \leq N H + N^{2 / 3} + 2 + (N^{2 / 3} l d r + N^{- 1 / 3} l d r) σ^{2}$

па

o(N) $= N^{2 / 3} + 2 + (N^{2 / 3} l d r + N^{- 1 / 3} l d r) σ^{2}$

е функција која расте поспоро од линеарно и следи дека

$< l_{n} > = \sum_{A_{n}}^{} P_{n} [\vec{a}] l_{n} [\vec{a}] \leq N H + o (N)$

Негативен став

Се дефинира распределба

$Q_{n} [\vec{a}] = 2^{- l_{n} [\vec{a}]} / \sum_{A}^{} 2^{- l_{n} [\vec{a^{'}}]}$

и следи

$N H (A) = \sum_{A_{n}}^{} P_{n} [\vec{a}] * l d (1 / P_{n} [\vec{a}])$

$\leq \sum_{A_{n}}^{} P_{n} [\vec{a}] * l d (1 / Q_{n} [\vec{a}])$

$= \sum_{A_{n}}^{} P_{n} [\vec{a}] * l d \sum_{A}^{} 2^{- l_{n} [\vec{a^{'}}]} / 2^{- l_{n} [\vec{a}]}$

$= \sum_{A_{n}}^{} P_{n} [\vec{a}] l_{n} [\vec{a}] + \sum_{A_{n}}^{} P_{n} [\vec{a}] l d \sum_{A}^{} 2^{- l_{n} [\vec{a^{'}}]}$

познато е дека $< l_{n} > = \sum_{A_{n}}^{} P_{n} [\vec{a}] l_{n} [\vec{a}]$

$\sum_{A_{n}}^{} P_{n} [\vec{a}] l d \sum_{A}^{} 2^{- l_{n} [\vec{a^{'}}]} \leq 1$

според Крафт МакМилановата нееднаквост следи

$N H \leq < l_{n} >$

Наводи

Предлошка:Наводи

Литература

Предлошка:Наведена книга

Надворешни врски

FTN Novi Sad, Teorija informacija i komunikacija

↑ C.E. Shannon, "A Mathematical Theory of Communication Предлошка:Семарх", Bell System Technical Journal, vol. 27, pp. 379–423, 623-656, July, October, 1948
↑ David J. C. MacKay. Information Theory, Inference, and Learning Algorithms Cambridge. Предлошка:Page1.
↑ Предлошка:Harvnb

[Shannon-1] C.E. Shannon, "A Mathematical Theory of Communication Предлошка:Семарх", Bell System Technical Journal, vol. 27, pp. 379–423, 623-656, July, October, 1948

[MacKay-2] David J. C. MacKay. Information Theory, Inference, and Learning Algorithms Cambridge. Предлошка:Page1.

[Cover-3] Предлошка:Harvnb

[1]

[2]

[3]

Прва Шенонова теорема

Содржина

Дискретен извор без меморија

Кодирање

Позитивен став

Негативен став

Доказ

Позитивен став

Негативен став

Наводи

Литература

Надворешни врски

Прегледник

Прва Шенонова теорема

Дискретен извор без меморија

Кодирање

Позитивен став

Негативен став

Доказ

Позитивен став

Негативен став

Наводи

Литература

Надворешни врски

Прегледник

Пребарај