Sunday, February 19, 2012

Кратък аудио наръчник - глава 19 - психоакустика


Чуването не е изцяло механичен процес, но също и процес на усещане и възприятие. Когато човек чуе нещо, което по някакъв начин достига до ухото като механична вълна, пренасяна от въздуха и в ухото е преобразувана в нервни импулси. Тези импулси отиват до мозъка, където те биват възприето и обработени. От тук идват и много проблеми и разлики ва звученето (това как аз чувам едно неyо е различно от това което вие чувате и това идва от психичната нагласа на съзнанието, състоянието на мозъка и нервната система... от там и психо акустичен модел) проблеми при обработката на аудиото. За това е важно да се осъзнае че чуването зависи не само от ушите като приемници, то и от средното ухо, нервната система и мозъка на слушателя, и тези неща трябва да се вземат под внимание.

Ухото например, ухото разлага сигнала на съставните му тонове като част от целия процес на чуване и чрез базилиарната мембрана да ги преобразува в нервни импулси, като част от всичката информация остава нечуваема. MP3/Огг ворбис и другите компресии със загуби се възползват точно от това. Добре е да се знае че ухото като приемник има логаритмично-динамична реакция. Телефонната мрежа използва точно това свойство за да пренася сигналите през мрежата, и после да ги просвирва обратно. Още една особеност на нелинейната логаритмична реакция на ухото, е тази че при 2 тона които са близки един до друг, ухото освен че ги възприема като самостоятелни, възприема и разликата между тях като тон фантом - тон който е нещо средно между двата. На базата на принципа използван за работа с носещите честотни в едно радио от нелинеен усилвател. Подобни физиологични ефекти в ухото, които се получават заради устройството му се наричат физиологично-акустични, и сред хората е залегнало като психоакустичен модел, което реално погледнато също не е грешно.

Съществуват и реални психоакустични ефекти, когато например човек слуша съскащ, и пулен с пуканки запис запис на грамофонна плоча, човекът спира да възприема шумовете и се концентрира върху музиката. Човек, който прави това постоянно, и редовно, до такава степен свиква с този ефект че в края на записа, ако го попитат има ли шум, човекът няма да може да ви отговори. Това се нарича психо акустично маскиране. (Разликата е че при физиологично-акустичният модел всичко се определя от ухото, нервната система, и как и се подава сигнала, тук обаче говорим за обработването на сигнала след като вече е постъпил в мозъка, и това как мозъка го обработва. това е още една причина различните хора да чуват едно и съо нещо различно.)

Тази способност на мозъка да маскира подобни шумове, се използва в много технологии. В днешната цифрова ера, това се използва, за прикриване на дефекти при аудио компресия. Подобен ефект се получава, когато се използва процес за откриване на модел в постъпващият сигнал, точно както в електрониката, търси зависимости и модели в поведението на сигнала. когато информацията в подобен модел е малко, заедно с информацията, може да се чуе и шум или друг звуков ефект, който реално не съществува, което е признак че мозъка усеща недостига на информация и се опитва да отгатне и добави липсващата. Това се нарича фантомен психоакустичен ефект. Типичен пример за това е когато оператор, се напъва да чуе слаб морзов код, в шумен сигнал, той чува слаби писъци, отговарящи на точки и тирета, въпреки че те реално липсват. Подобен фантомен психоакустичен модел, може да изиграе важна роля в среда, когато хората са под стрес и с изострени възприятия, както като са в опасност, ухото чува че опасността е по-близо от колкото е в действителност.

Ограничения на възприятието
Човешкото ухо нормално чува диапазона 20 херца - 20 килохерца. Горната граница пада с възрастта и може да стигне до малко над 16 кхц (което не при всеки човек е така, защото зависи и от в средата в която човек е израснал, и в средата в която работи и от това каква работа извършва, аз например към датата на писане на материала съм на 28 годишна възраст, обаче горната ми граница на чуваемост е към 19500 херца чувам тези тонове слабо, но ако има някаква цикличност и модел го долавям и разпознавам. ако ми пуснете честотите от 2 отделни мелодии, няма да различа, коя мелодия коя е, но ще уловя разликите и ще направя разликата че са 2 различни от 2 различни мелодии). Ухото като орган не реагирана честоти под 20 херца, но могат да се приемат от тялото като усет за допир. Скорошни изследвания показват наличието на свръхзвуков ефект който се състои в това че сигнал над 20 килохерца, който не може да се чуе, се отразява на слушателя.)

Звуковата разделителна способност на ухото е около 2 херца.това значи че за да може ухото да направи разлика между два тона, двата тона трябва да имат разлика най-малко 2 херца. разбира се с допълнителни средства, могат да се чуят и по-малки разлики. Взаимодействието между два тона с малка разлика може да се чуе, като вариращо пулсиране.

Ефекта от въздействието на честота върху ухото е логаритмичен. Възприемането на тона като такъв е свързано с честотата като експоненциална функция. 12 тонната музикална скала е добра за целта. Тя се развива според това как се възприемат тоновете. Когато основната честота на нота се умножи по приблизително 2^\frac{1}{12} (Това е реалниат фактор, но е осреднена стойност, и леко варира според показателите), Резултатът е честотата на най-близкият по-висок полутон. Отивайки 12 ноти нагоре по скалата - цяла октава — е същото като умножаване на че стойността на честотата по 2^\frac{12}{12}, което си е същото като направо да удвоите честотата.

Резултата от това е че тази скала на полутоновете се използва като логаритмична скала. Има и други подобни скали, на основата на основата на изследване на човешкото възприятие, като скалата на Mel, и скалата на Барк. (Тези се използват за изучаването на възприятието но не в музикална среда), тези скали също са логаритмични.

интензитета на уважаемите честоти е огромен. Тъпанчетата на ухото са чувствителни към механичната страна на нещата, вариациите в налягането, като причина за трептене на мембраната. Най-ниският звук, който може да се възприеме е 0 децибела (dB), но максималният предел не е ясно обособен. Горният лимит е там където има реална опасност от наранявания в ухото или с потенциал за загуба на слуха. Същите тези лимити зависят и от времето през което ухото е изложено на тези нива на сила. Ухото може да възприема звучи от около 120 дб за кратки интервали от време без сериозни и постоянни последици, но редовно и продължително излагане на звуци над 80 децибела може да доведе до пълна или непълна глухота.

Още по-задълбочено изследване на минималното възприятие на човешкото ухо, показва че пределно минималното ниво при които ухото чува тон не е константа и зависи от честотата на въпросният то. С измерване на много честоти, може да се изгради грива на абсолютните чуваеми нива. Тези нива варират от човек до човек. Обикновено ако говорим за минималната чувствителност на ухото, ухото е най-чувствително към честотите в диапазона 1 - 5 херца. с възрастта тази граница се стеснява до малко над 2 херца, но това пак зависи от човек до човек, пак зависи от това в каква среда, е отраснал, живее и работи.
Абсолютната граница на слуха е най-ниската част на равна сила на различните честоти - Equal-loudness contours. Equal-loudness contours показват силата в децибели (dB), в интервала на чуваеми честоти, които се възприемат с еднаква сила. Equal-loudness contours са първоначално измерени от Флетчър и Мунсон в лаборатории белл през 1933 използвайки чисти тонове, и събраната информация се използвана за създаване на кривите на Флетчър-Мунсон. Заради напълно субективното чуване, разликите в това как двама души чуват, са създадени осреднени криви, които се базират са средно аритметичен статистически анализ, от измерванията върху много хора.

Робинсън и Дансън усъвършенствали процеса за да придобият нов набор криви набазата на източник отред в звукоизолирано, помещение без ехо. Новият набор данни, събрани от Бобинсън и Дансон, са използвани за създаването на кривите на Лобинос-Дансон, които са стандартизирани под исо стандарта ISO 226 през 1986 год. През 2003, ISO 226 бе редактиран като equal-loudness contour като са използвани данни от 12 независими прочувания в различни лаборатории.

Интерпретиране на звука
Човешкото ухо е образно казано спектрален анализатор, който различава отделните честоти в сигнала и ги обработва и кодира отделно без да проявява интерес към техните фази. На практика е е трудно но не е невъзможна да се чуе и фазата на сигнала. Inter-aural разлика във фазите, настъпва когато, разликата между двете ушие толкова голяма че вече се получава усещане че звука идва от дадена посока. Психоакустичното филтриране в нервната система спомага за точното определяне на посоката и е друга ВАЖНА особеност.

Маскиращи ефекти
В някои ситуации Ясно чуваем сигнал може да се маскира с отделен звук. Например нормален разговор, на спирката, може да стане нечуваем при натоварено и шумно движетие. Този феномен се нарича маскиране. Маскиране настъпва когато слаб звук бива напълно заглушен и става нечуваем от друг по-силен. Синият звук изкривява кривите на абсолютна чуваемост, и слабият инак нормално чуваем звук, става нечуваем защото попада под кривите на абсолютната чуваемост.

Ако два сигнала-звучат едновременно, и единият маскира другият тогава има симултантно (едновременно) маскиране. симултантното маскиране понякога бива наречено и честотно маскиране. Тоналността на един звук, честично определя свойствата му да маскира друг звук. синусоидален маскиращ сигнал, изисква по-висок интензитет да маскира шумоподобен сигнал, отколкото шумоподобен маскиращ сигнал да маскира синусоидален сигнал. компютърни модели, които изчисляват маскирането, предизвикано от звук, трябва да се съобрази със спектралните пикове както и с тоналността, както на маскиращият, така и на маскираният звук.

На подобен принцип, слаб звук, изсвирен веднага след силен не се чува, както и слаб сигнал веднага преди силния също не се чува, защото и в двата случая по-силният сигнал надделява над по-слабия. Тези процеси са известни като предходящо и последващо маскиране.

звуци фантоми
в диапазона на ниските честоти' тонове, могат да се чуят от ухото, въпреки че в аудио сигнала те не съществуват. Това е чист психоакустичен ефект, защото мозъка сам си създава тонове в ниския честотен диапазон, на основата на съществуващи тонове и полутонове и хармонични към тях. Този ефект се използва от комерсиалните уредби, да усилят и увеличат реакцията на комерсиалните продукти,когато има други ограничения които пречат това да стане. някога чудили ли сте се как става така че малки колонки вадят силен за категорията на колонките бас? Ето така го правят.

Психоакустиката и психоакустичните модели в софтуера.
Психоакустичните модели, осигуряват високо качество при компресията със загуби, като показват кои части от аудио сигнала могат да се премахнат, за да може хем да се намали обема, хем да се чува високо и равномерно качество, на остатъчният сигнал.

Психоакустиката може да се обясни как внезапно и силно пляскане с ръце може да е силно в библиотеката, и същото пляскане на улицата да е незначителен шум, който бихте пренебрегнали. Това е от полза при компресията, и с добро използване, на психоакустичните модели, файла може да се сведе до 1/10 - 1/12 от оригиналният си обем да има минимални загуби от към качество. Подобни степени на компресия са характерни за съвременните аудио формати - аудио компресия със загуби. Най-масовите, но далеч не всички формати са MP3, Ogg Vorbis, WMA, Musicam (използван за излъчване и предаване в някои държави), МРС, ААС, МР4 and ATRAC, компресията използвана при мини дисковете.

Психоакустиката се базира на ограниченията на ухото във възприемането на звуците, ограничения като:

* Лимит на високите честоти
* абсолютна граница на чуваемост
* темпорално маскиране
* симултантно - едновременно маскиране

Ухото не работи с пълната си чувствителност, когато подобни ограничения се използват за да се излъже, това позволява на компресията да премахне изцяло звуците извън чуваемият диапазон. с внимателно и преценено преместване на битове от интервалите които не се чуват, до интервала в който се чува с помощта на психоакустиката и използване на недостатъците на ухото, може да се постигне много високо качество на звучене при компресия със загуби.

Психоакустиката и музиката
Психоакустиката помага при откриването на много нови неща, свързани с аудио компресията и музиката, помагайки нивата на компресия да се увеличат а загубите да се намалят.

Други приложения па психоакустиката
Психоакустиката се развива на няколко фронта не само аудио и физиология но и математика и програмиране, не само за постигане на много високо ниво на достоверност, но и за отбранителни системи, но и за създаване на звукови оръжия които могат да причиняват временна дезориентация, зашеметяване, нараняване или да убият. За щастие, използвано на прсихоакиустиката за създаване на оръжия и средства за нараняване и убиване е силно ограничено, но масово се използва сред музиканти и творци, които искат да постигнал пълно възприятиена творбите си, котаго техничестите им средства не го позволяват.

No comments:

Post a Comment

Note: Only a member of this blog may post a comment.