STI, voor als je wilt weten hoe je de spraakverstaanbaarheid moet meten
Citation for published version (APA):
Poelsma, T. (1986). STI, voor als je wilt weten hoe je de spraakverstaanbaarheid moet meten. (IPO rapport; Vol.
546). Instituut voor Perceptie Onderzoek (IPO).
Document status and date:
Gepubliceerd: 01/01/1986
Document Version:
Uitgevers PDF, ook bekend als Version of Record
Please check the document version of this publication:
• A submitted manuscript is the version of the article upon submission and before peer-review. There can be important differences between the submitted version and the official published version of record. People interested in the research are advised to contact the author for the final version of the publication, or visit the DOI to the publisher's website.
• The final author version and the galley proof are versions of the publication after peer review.
• The final published version features the final layout of the paper including the volume, issue and page numbers.
Link to publication
General rights
Copyright and moral rights for the publications made accessible in the public portal are retained by the authors and/or other copyright owners and it is a condition of accessing publications that users recognise and abide by the legal requirements associated with these rights.
• Users may download and print one copy of any publication from the public portal for the purpose of private study or research.
• You may not further distribute the material or use it for any profit-making activity or commercial gain • You may freely distribute the URL identifying the publication in the public portal.
If the publication is distributed under the terms of Article 25fa of the Dutch Copyright Act, indicated by the “Taverne” license above, please follow below link for the End User Agreement:
www.tue.nl/taverne Take down policy
If you believe that this document breaches copyright please contact us at:
openaccess@tue.nl
providing details and we will investigate your claim.
Download date: 27. Mar. 2022
Rapport no. 546
STI, voor als je wilt weten hoe je de spraakverstaanbaarheid moet meten
T. Poelsma
Verslag van een TH-stage uitgevoerd door T. Poelsma
id.nr. 179750
Via het Instituut voor Perceptie Onderzoek bij het Natuurkundig Laboratorium NV Philips gedurende 15 maart t/m l mei 1986
Begeleider IPO: dhr. A. Houtsma
Begeleider Nat.Lab.: dhr. C. Knibbeler
Graag wil ik hierbij de groep akoestiek en lawaai bestrijding van het Natuurkundig Laboratorium van N.V.Philips Eindhoven bedanken voor de fijne samenwerking tijdens mijn stage.
In het bijzonder wil ik de heer C. Knibbeler bedanken voor de goede begeleiding en prettige samenwerking tijdens mijn stage.
van de spraakverstaanbaarheid, de STI-{Spraak Transmissie Index) meting.
Deze objectieve meting is ontwikkeld omdat de bestaande subjectieve metingen zeer duur zijn en veel tijd vergen.
De STI-meting is gebaseerd op het meten van signaal-ruisverhoudingen,
omdat de signaal-ruisverhouding een belangrijke factor van de verstaanbaarheid is. Voor het meten van de signaal-ruisverhouding wordt het spraaksignaal
vervangen door een testsignaal met eenzelfde frequentiespectrum en modulatie- verloop als dat van een gemiddelde stem. Dit testsignaal wordt in de te
onderzoeken ruimte uitgezonden door middel van een luidspreker. De luidspreker wordt geplaatst daar waar de spreker zich bevindt. Het testsignaal wordt ont- vangen door een microfoon welke is geplaatst op de luisterplaats. De modulatie- index van het testsignaal zal zijn afgenomen door onder andere stoorgeluiden, galm en echo's. Uit de afname van de modulatie-index wordt, via een reken- procedure, de spraakverstaanbaarheid bepaald.
Om de spraakverstaanbaarheid te meten blijkt dat de STI-meting een zeer goede methode is. De nauwkeurigheid van de ontworpen meetopstelling ligt binnen de
5%. Deze nauwkeurigheid is voor de spraakverstaanbaarheidsbepaling ruim voldoende.
De gebouwde meetopstelling voldoet niet helemaal aan de verwachtingen. Namelijk bij de octaafbanden boven de lkHz wordt het testsignaal te klein.
De {S/N) verhouding van het meetsysteem begint dan een rol te spelen, zodat de metingen niet meer representatief zijn.
1. Inleiding
2. De algemene beschouwing over de Spraak Transmissie Index 2.1. De relatie tussen de objectieve STI en de subjectieve
logatoomverstaanbaarheid 2.2. STI schematisch bekeken 2.3. STI theoretisch bekeken
3. Beschrijving van de meetopstelling 4. Computerprogramma voor STI-metingen 5. Nauwkeurigheid van de meetopstelling 6. STI-metingen in een auto en in een kamer
Konklusie
Literatuurlijst Bij lage 1.
Bijlage 2.
Bijlage 3.
Bijlage 4.
Bijlage 5.
De samenhang tussen de CMFT en de impuls- responsie h(t).
De samenhang tussen MTF en de galmtijd Bepaling voor de invloed van de signaal- onafhankelijke ruis en signaalafhankelijke ruis op de modulatie index
Overdrachtkarakteristiek van de gebruikte luidspreker
Amplitude berekening van het ontvangen signaal door middel van kruiscorrelatatie
blz. 1 4
6 7 10 12 16 19 20 22 23
24 25
26
27
28
1. Inleiding.
Communiceren is in ons dagelijks leven zeer belangrijk. Spreken is een van de belangrijkste manieren van communiceren en verder is visueel contact, geschreven schrift, voelen en ruiken ook belangrijk in onze dagelijkse communicatie. Bij al deze soorten communicatiesystemen kan men vijf delen onderscheiden ( zie fig.1 ).
boodschap
.
'
1
informatie
,
coderen'
i--.- '
bron
code code+storing
1
'
communicatie 1 kanaal
'storing
_' __ -i,
decoderen]boodschap
, -1
be stemmingfiguur 1.: communicatiesysteem
In dit verslag behandelen wij de spraak als communicatiemiddel. Wij kunnen de delen van het communicatiesysteem dan als volgt opvatten:
1) informatiebron onze hersenen
2) coderen onze stem
3) communicatiekanaal bijvoorbeeld de ruimte waarin we communiceren 4) decoderen onze oren
5) bestemming onze hersenen
Bij het decoderen komt er helaas een storirgbij de code. Hierdoor wordt het decoderen bemoeilijkt en/of wordt er fout gedecodeerd. Deze storing kan door verschillende oorzaken ontstaan, maar hebben één ding gemeenschappelijk namelijk dat ze de informatie overdracht doen afnemen.
Het meten van de verstaanbaarheid met sprekers en luisteraars geeft een directe en nauwkeurige maat voor de spraakverstaanbaarheid. Immers we meten de grootheid waarin we direkt geinteresseerd zijn.
Over het algemeen wordt voor het meten gebruik gemaakt van spraakmateriaal met een goed gedefinieerde redunantie zoals bijvoorbeeld bij logatomen het geval is. Logatomen zijn merendeels betekenisloze woorden, die bestaan uit een medeklinker-medeklinkercombinatie. Hierbij maakt men gebruik van lijsten met 50 verschillende woorden. Per lijst is ervoor gezorgd dat de frequentie van de voorkomende fonemen representatief zijn voor de taal. De methode is zeer tijdrovend, temeer daar voor een betrouwbare meting verschillende sprekers nodig zijn.
Uetligt voor de hand dat er gezocht is naar methoden waaraan de bezwaren van een lange meettijd niet kleven en waarbij de directheid van de subjectieve meting behouden blijft. Door French en Steinberg (1947) werd een methode voor- gesteld waarbij de signaal-ruisverhouding, in een aantal voor spraak relevante frequentiebanden, wordt getransformeerd naar de zogenaamde Articulatie Index
(AI). Deze methode werd door Kryter (1962) verder uitgebouwd en toegepast op transmissiekanalen. De toepassing van de AI ligt voor al bij spraakverbindingen waarbij ruis als storing optreedt. Storingen zoals signalen en echo's worden echter niet verdisconteerd.
Een meting waarbij storingen in het tijddomein (nagalm, echo's) wel worden ver- disconteerd werd ontwikkeld door Steneken en Houtgast (1973). Een uitbreiding van deze methode waarbij ook niet-lineaire eigenschappen van een transmissie- kanaal worden verdisconteerd, wordt gegeven door Steneken en Houtgast (1980).
Deze methode resulteerd in een index, de STI (Spraak Transmissie Index).
Het principe van de STI-methode is alsvolgt: Het uitgangspunt is een met spraak vergelijkbaar geluidssignaal. Per oktaafband wordt het spraaksignaal gesimuleerd door rose ruis als draaggolf, terwijl de intensiteit 100% gemoduleerd wordt met een. complex van lage modulatiefrequenties.
Dit signaal wordt (voor 100% in de intensiteit gemoduleerd) op de positie van de spreker de zaal ingezonden. De modulatiefrequenties van het testsignaal zijn van de grootte- orde van ongeveer 1Hz: dit komt overeen met het fluctuatieritme van op normale snelheid uitgesproken spraak. Op de posities van de luisteraar
blijkt de modulatiediepte van het testsignaal te zijn afgenomen door de akoestische filterwerking van de ruimte, ten gevolge van stoorsignalen (galm,echo's en achter- grond lawaai).
Uit eerder onderzoek is gebleken (lit.6.) dat juist het behoud van de modulatie- diepte in hoge mate bepalend is voor een goede spraakverstaanbaarheid.
Door nu voor elke draaggolf-frequentieband voor de reeks van modulatiefrequenties rondom 1Hz de modulatiediepte te bepalen, ontstaat er een volgende matrix:
modulatie
0,811,011,25
frequentie 1
in Hz 0,63 1, 6 2 2,5 3, 15 4,0 5 !6,3 8 10 12,5
octaafband
125Hz i
250Hz 1
,__ !
-- !
500Hz 1
1 ·-,---
!kHz 1
- ~ 2kHz
'.
·--
4kHz
- BkHz
i
Uit deze matrix kan met behulp van een rekenschema de STI worden bepaald. De STI kan waarden aannemen tussen de Oen 1. Een hogere STI-waarde komt overeen met een betere spraakverstaanbaarheid.
De STI willen we nu in een speciale ruimte bepalen. Deze ruimte is de auto. Deze ruimte vertoont zeer weinig echo en nagalm en het achtergrondlawaai is niet homo- een van samenstelling. De STI-waarde willen we kunnen meten in de auto om te controleren hoe goed de LAVR ( Lawaai Afhankelijke Volume Regeling) is ingesteld.
De LAVR is een regelschakeling in een autoradio. Deze LAVR regelt het volume van de autoradio zodat wanneer het lawaai in de auto toeneemt, het volume van de radio ook toeneemt en omgekeerd.
De toename van het volume bij toename van het lawaai is op het gehoor ingesteld.
De STI-meting moet nu aantonen dat dit goed gebeurd is.
Door Brüel & Kjëer is een RASTI meetapparaat op de markt gebracht. Dit meetapparaat is voor onze metingen in de auto niet bruikbaar omdat deze slechts metingen ver-
richt in de octaafbanden van 500Hz en 2kHz. Deze octaafbanden zijn niet respresentatie voor het autolawaai.
2. De algemene beschouwing over de Spraal Transmissie Index.
Bij communiceren met spraak kunnen er storingen optreden. Deze storingen kunnen in twee hoofdgroepen worden opgedeeld bijvoorbeeld:
stel dat twee personen in een bepaalde ruimte met elkaar spreken en in de ruimte is zeer veel lawaai( b.v. fabriekshal met veel machines, disco- theek) dan zal de spreker buiten een straal van twee meter zeer slecht te verstaan zijn ( de code wordt verdrongen door de storing).
Wanneer je echter op een stille zomeravond door het bos loopt kun je el-
kaar op een afstand van een 10-tal meters nO] goed. verst.aan (de storinq is zeer gering) . Wanneer we echter in een stille kerk zijn, die zeer veel galmt, zal de
spraakoverdracht van de spreker naar de luisteraar niet zo goed zijn als in
het stille bos. De spraak wordt verstoord door de galm van de voorafgaand woorden.
We hebben dus te maken met twee soorten storingen die wij als volgt definieren:
1) signaal onafhankelijke ruis: dit is ruis ( storing) welke wordt veroor- zaakt door andere bronnen dan de spreker.
2) signaal afhankelijke ruis: dit is ruis ( storing) welke wordt veroor- zaakt door de spreker zelf.
De hoeveelheid signaal afhankelijke ruis wordt bepaald door de ruimte (omgeving) waar wordt gecommuniceerd. De spraakverstaanbaarheid wordt bepaald door èe (8
/N) verhouding op de luisterplaats.
Deze ( /N) verhouding is direkt een maat voor de spraakverstaanbaarheid, en s wel als volgt:
STI (
8 /N) + 15 dB
(vergelijking 1) 30 dB
met ( /N) de signaalruisverhouding op de luisterplaats en als s
5/N) >15 dB dan (5/N)
=
15 dB en alsS /N) <-15 dB dan (5
/N)
=
-15 dBDe STI (Spraak Transmissie Index) kan dus liggen tussen O (= niet verstaan- baar) en 1 (= 100% verstaanbaar).
t
Om nu de STI ergens te bepalen zullen we een gemiddelde spraak moeten hebben ( bijvoorbeeld logatomen uitgesproken door een goede spreker zoals bij normale spraakverstaanbaarheidsmetingen) en daarvan de (
s
/N) verhouding van meten op de luisterpluats.Om dit spraaksignaal te genereren levert nogal wat praktische problemen op. We kunnen natuurlijk een "gemiddeld" spraaksignaal nabootsen.
Dit moet wel dezelfde eigenschappen bezitten als de uitgesproken logatomen zoals bij een normale spraakverstaanb~arheidsmeting.
Hierbij kijken we eerst na het spraakspectrum. Dit ziet er als volgt uit:
--
SOOHz
log ffiguur 2.:spraakspectrum
t
::, 11!
·.-1 ~
i:::
]
..Q 4-1 11!
.µ 11!
u 0
--
3Hz log f
figuur 2a : spraakmodulatiespectrum De spraak wordt ook gemoduleerd tijdens het spreken.Dit modulatiefrequentie- spectrum wordt weergegeven in figuur 3.
We kunnen dus het spraaksignaal simuleren door ruis te nemen en die spectraal te vormen volgens figuur 2. en deze te moduleren volgens figuur 2a.
2.1. De relatie tussen de objectieve STI en de subjectieve logatoomverstaan- baarheid:
Daar de STI beoogt een maat voor de spraakverstaanbaarheid te geven behoort bij een gegeven STI-waarde een bepaalde verstaanbaarheid. De waarde van de STI wordt bepaald door de nauwkeurigheid waarmee de objectief bepaalde STI de sub-
jectieve verstaanbaarheid voorspelt. Deze relatie is voor een groot aantal verschillende condities bemeten en is weergegeven in fig. J. Hierbij hebben Houtgast en Steeneken zich beperkt tot storingen zoals stoorlawaai, nagalm en echo's. De verticale spreiding om de getekende best-passende curve door de meetpunten geeft de voorspelkracht of nauwkeurigheid. De onnauwkeurigheid be- draagt 4,3% voor de meetpunten in fig. 3 . Door middel van een statistische toets is komen vast te staan dat het gedeelte van de spreiding veroorzaakt door de
STI-methode gelijk is aan het gedeelte veroorzaakt door de sprekers en luisteraars bij de subjectieve metingen
.,
5 0
"'
"0
5 J IJl c..
-
80
60
40
20
0 0
, ..
~
o•
•,)>1• • V
•IP
î
1 ;€. -~
u • +~u•
•:.t
0 ••
.·il·.
J r
10 fJ
Sli (¾)
V.-·
(0 = N + BP
= peakcl.
+ = AGC/Rev u = 5,6•/o
_,,.
Fw 3 .Hclatiun hetuecn the nbJcctit-e .',"'/"/ and l'lJ-1rnrd score (or /liï different transmi.,.,ion chann.-1.,. The di.,turbances 1n'rr' comhinatirms of handpas., limitin,:. noi.,e. pcah clippinµ. automatic µain contro/ and rc1·crheration. From referencc .j
2.2. STI schematisch bekeken.
Hieronder wordt een schematisch overzicht gegeven van de meetmethode zoals die door Houtgast en Steeneken is ontwikkeld ( zie Lit. 4,5,6 en 7).
Wij beschouwen spraak als een ruisachtig signaaL Dit wil zeggen,we nemen aan dat de reflextiesvan de wanden niet gecorreleeid zijn met het directe signaal.
Verder nemen we aan dat we te maken hebben met een difuus veld, dat het systeem lineair is, en dat het achtergrond lawaai (=de signaal onafhankelijke ruis) niet gecorreleerd is met het signaal.
Dit alles impliceert dat voor het microfoonsignaal geldt:
I . = I . + I . + I
mie direct reflexties lawaai
We zien dus dat we de intensiteiten moeten optellen.
We simuleren de spraak met behulp van ruis m,t hetzelfde vermogensspectrum dat gemoduleerd wordt met een sinus met frequent.. .... e f ( 0,63 Hz~f412,5 Hz).
We splitsen het spectrum in octaafbanden en •roor elke octaafband beschouwen we 14 verschillende modulatie frequenties ( zie fig. 4).
We meten voor elke combinatie ( octaafband en modulatie frequentie f ) de modu- latie index m.
mals functie van f noemen we de modulatie transfer functie , MTF(f)
We kunnen de modulatie transfer functie opdelen voor twee gevallen namelijk:
lawaai
f
--
verloop van m ten gevolge van lawaai
galm
m'l~ --...
---... ......
f
- '
verloop van m ten gevolge van galm
--
Uit de modulatie index ( die we krijgen voor elke combinatie van octaafbanden en modulatiefrequentie) . Bepalen we een equivalente (s/N) verhouding (hierin zit éus galm en lawaai in verwerkt)
(S /N) = 10 log m (f) 1 - m (f)
Met deze 98 ( 7 octaafbanden en 14 modulatie-frt:quenties) (5/N) verhoudingen wordt na een rekenprocedure de STI waarde bepaald.
j=l j=2 j=3 j=4 j=S j=6 j=7
oct=l25Hz oct=250Hz oct=SOOHz oct=lkHz oct=2kHz oct=4kHz oct=8kHz nivo=SOdB nivo=56dB nivo=59dB nivo=55dB nivo=47dB nivo=40dB nivo=32dB
i=l i=2 i=3 i::::;4 i=S i::::;6 i::::;7
f=0,63Hz f=0,8Hz f=1Hz f=1,25Hz f=1,6Hz
--
----····--··--f=2Hz f=2 r_SHz ____i=8 i=9 i::::;10 i=11 i=12 i::::;13 i=14
f=3,15Hz f=4Hz f=SHz f::::;6, 3Hz f=8Hz f::::;10Hz f=12,5Hz
---·-·
---- ---
---·-----· --·-- ---
·-I~
!\
A I~ l gem
r~i--,--,--r-r--;--/--:--1-,-1-r-+,
I / / / /
; / /
4~r~--_
1 I 1 , 1...__. , . /
/
/---.i----' / / / / /
I .
kanaal
t -
t - - storing
Figuur 4.: Schematische weergave van de STI-meting.
De rekenprocedure om de STI-waarde te bepalen ziet er alvolgt uit:
( /N) . . s
=
]. , J
A
10log I _ A
gem
7 14 (s/N)
= L
j=l
K. J 1
14
L
STI = (S /N) + 15dB 30dB
i=1
(s/N) . . is de (S/N) verhouding voor een octaafband j J.,J
en een modulatie frequentie i.
( /N) . . ) s en (s /N) = 15dB voor (s /N)
>
15dBen (s/N) =-15dB voor (s/N) <-15dB J.,J
K. J is de relatieve bijdrage voor elke octaafband. Zie tabel 1 hieronder:
octaafband 125Hz 250Hz ! 500Hz : lkHz 2kHz 4kHz
;
relatieve ( 1 ) 0, 13 1
o,
14 0, 11 0,12 ' 0, 19 0,17 bijdrage( 2 )
o,o
0,05o,
15 0,23 0,32 0,25(1) Relatieve bijdrage volgens Steneken en Houtgast (2) Relatieve bijdrage volgens de articulatie index.
BkHz
o,
14 tabel 1 0,02.3. STI theoretisch bekeken.
Een lineair systeem is te beschrijven door zijn impulsresponsie h(t) of door zijn complexe overdrachtsfunctie.
Een andere belangrijke grootheid in de signaaltheorie is de modulatie trans- ferfunctie MTF, of wel in zijn algemeenheid de complexe modulatie transfer- functie CMTF.
De CMTF van een overdrachtsysteem wordt alsvolgt gedefinieerd:
le. Een stationair witte ruissignaal (meteen gemiddelde van nul) wordt gemoduleerd met een signaal A
V ½
+½
sin 2n-
ft 1 - ½A2e. De gemoduleerde ruis wordt toegevoegd aan de ingang van het overdracht- systeem.
3e. De uitgangsspanning van het systeem wordt gekwadrateerd.
4e. De verkregen waarde van de complexe amplitude, van het gekwadrateerde uitgangssignaal met een frequentie van f , gedeeld door de gemiddelde waarde van het gekwadrateerde uitgangssignaal is gelijk aan de CMTF of wel m ( f ) .
Se. Bij weglating van de faseverschuiving, dus wanneer er alleen maar naar de grootte van het gekwadrateerde uitgangssignaal wordt gekeken verkrijgen we de MTF of wel m ( f )
In stap 4 is aangegeven dat de CMTF afhankelijk is van de complexe amplitude en de gemiddelde waarde van het uitgangssignaal. We kunnen dus de CMTF uit- drukken in de impulsresponsie van het systeem.
In bijlage 1 wordt een afleiding gegeven tussen de samenhang van CMTF en de impulsresponsie h(t). Deze is:
(10
CMTF
j h2 (t) e -jWt dt
=
_,.o _ _ _ _ _ _ _ _CIC (vergelijking 2)
J
h2 (t) dt0
De CMTF is de complexe fourier getransformeerde van de gekwadrateerde impulsresponsie gedeeld door zijn totale energie inhoud.
Voor een normale ruimte ( hiermee bedoelen we dat de nagalm volgens een e-macht verloopt en er geen discrete echo's zijn, zie lit.1.) zal de impulsrespontie er alsvolgt uitzien:
h (t)
=
e w (t) (vergelijking 3)met w (t) een sample functie van een stationair ruisproces.
Wanneer we vergelijking 3 in vergelijking 2 invullen dan krijgen we CMTF van een transmissiekanaal ( dit is afgeleid in bijlage 2).
-½
MTF= (l+ (wT/13,8)2
) (vergelijking 4)
Met T de nagalmtijd van de ruimte.Om de STI-waarde te bepalen hebben we
een modulatie index m(f) nodig welke afhankelijk is van signaal onafhankelijke ruis en signaal afhankelijke ruis.
In bijlage 3 is de afleiding gegeven voor bijdrage van deze twee ruis soorten aan de modulatie index m(f).
-½
sm ( f)
= (
1+ ( 2 "lT f'I'/ 1 3 , j) 2 ) • (1 + 1 0 - ( /N ) ) - l (vergelijking 5) Met Tin seconden, (5/N) op de luisterplaats in dB en f de modulatiefrequentie in Hz.
Wanneer we de STI-waarde willen bepalen moeten we voor elke octaafband het ge- middelde van m(f) bepalen en deze relatief geschaald optellen (zie tabel 1) en normeren (zie vergelijking 1).
Uit vergelijking 4 zien we dat wanneer we de CMTF kunnen meten ( dus zonder signaal onafhankelijke ruis) en de modulatie frequentie f weten hieruit dan de nagalmtijd T is te bepalen. Dit biedt dus een andere meetmethode om de nagalm- tijd te bepalen van een ruimte.
Wanneer we naar vergelijking 5 kijken en aannemen dat de nagalmtijd klein is ( zoals in de auto) dan is de benadering) voor de modulatie index:
We kunnen uit m (f) de signaal-ruisve:rnouding makkelijk bepalen. (Misschien is dit wel toepasbaar voor de regeling van de LAVR = Lawaai Afhankelijke Volume Regeling).
3. Beschrijving van de meetopstelling.
Voor de STI-meting is de volgende meetopstelling gebruikt.
t -
1
I
f
t ...
I
i
Jruisbron
spraakomhullend filter
modulator L - -- .
r-' --
ioctaafbandfilter[amplifier
luidspreker
microfoon
spanninggestuurde amplifier
kwadrator
1
Î ~
laagdoorlaatfilter
t -
figuur 5.:Meetopstelling voor STI-meting.
B&K type 1405
B&K type 1615
B&K type 2706;
attenuator 40dB, gain vol open,
voor 59 dB bij octaafband 500Hz dan rose ruis met een RMS-waarde van 2, 1 Volt over frequentie van 10 - 20000Hz.
B & K type 4134
computer HP 9000
serie
Voor de ruisbron is rose ruis genomen. Bij rose ruis is de energie-inhoud voor elke octaafband even groot.
figuur 6.: ruisspectrum van rose ruis
Het spraakspectrum wordt in stapjes ter grootte van een octaafband be- naderd. (zie figuur 7). Dit wordt tegelijk gedaan tijdens het moduleren
(software-matig wordt dus de modulatie amplitude voor elke octaafband aan- gepast, echter met het behoud dat de modulatie index 1 blijft van het uit- gezonden signaal)
fg
-~ C ::, Il!Q) :>
-~ C
"d .0 ~
4-l Il! Il!
.µ u
0
t
50 5659
55
-
4741
log f i n Hz
figuur 7.: benadert spraakspectrum
32
Na de modulatie met spraakomhulling wordt het signaal versterkt en met een luidspreker uitgezonden. De karakteristiek van de luidspreker zal echter geen recht frequentie spectrum vertonen. Deze is dan ook opgenomen in de dode kamer en verrekend.in de amplitude aanpassing tijdens het moduleren ( zie bijlage4).
Het uigezonden signaal wordt ontvangen door een microfoon en versterkt. Daaraan wordt het octaafband gefilterd.
Voor de kwadrator is een speciale spanningsgestuurde versterker geplaatst om de verzwakking die bij de modulator wordt toegevoerd voor het spraakspectrum te compenseren zodat de kwadrator altijd een even grote ingangsspanning krijgt.
Dit wordt gedaan om een goede signaal ruisverhouding te verkrijgen. Nadat het signaal gekwadrateerd is wordt het laag doorlaat gefilterd om de omhullende van het gemoduleerde signaal terug te krijgen. De computer wordt gebruikt om de signalen voor de modulator en de spanningsgestuurde versterker te genereren en voor de bewerking van het microfoonsignaal ( na kwadratering en LPF).
Uit het microfoonstgrraal wordt de modulatie index bepaald waaruit de waarde van STI kan worden berekend. Om de modulatie index te bepalen hebben we de gemiddelde waarde en de amplitude nodig van het microfoonsignaal. Het ge- middelde kunnen we bepalen door al de sampels van het signaal op te tellen en te delen door het aantal.
De amplitude van het modulatiesignaal moet op een aparte manier worden bepaald namelijk door de kruiscorrelatie te nemen van het microfoonsignaal met een sinus met een frequentie gelijk aan die van het microfoonsignaal (= modulatie frequentie) en de kruiscorrelatie van het microfoonsignaal met een cosinus met een frequentie gelijk aan die van het microfoonsignaal.
Deze twee waarden worden gekwadrateerd en opgeteld en de wortel genomen.
Dit is dan een maat voor de amplitude van het ontvangen gemoduleerde signaal.
Hieronder wordt de uitleg gegeven van de noodzakelijkheid van de twee kruis- korrelaties.
Wanneer we voor de twee octaafbanden van 31,SHz en 16kHz het signaal na de
kwadrator bekijken zal dit er uit zien zoals weergegeven in figuur 8 en figuur 9.
UlTGRNG KWRnPRTFP Ht,n ,PF,') • 1 0H;:
0CT-8RN0• ;1 ~ H?
i0.G . . - - - ,
figuur B.: Octaafband 31,SHz gemoduleerd met 10Hz
11TTr::.1=nu:: VL•IRnwRr;:- P M<",n-F'PF',"l • 1 Gl H-,.
r«~T-RR ►Jn • 1 F: ld.f,-
figuur 9.: Octaafband 16kHz gemoduleerd met 10Hz.
We zien dat de amplitude van het kruissignaal bij 31,5 Hz een veel groter amplitude heeft dan bij 16 kHz ( Dit komt omdat de energie inhoud voor elke octaafband even groot is omdat de bandbreedte bij 16kHz groter is dan bij 31,5Hz).
De amplitude van het modulatiesignaal blijft voor elke octaafband even groot.
De detectie van de amplitude bij de lage octaafbanden zal dus moeilijk gaan omdat het modulatiesignaal wordt verdrongen door de ruis. Wanneer we dit signaal gaan kruiscorreleren met het oorspronkelijke signaal dan kunnen we het
modulatiesignaal van de ruis scheiden.
Het ontvangen signaal zal een ::faseverschuiving hebben welke onbekend is en daarom wordt er gekorreleerd met een sinus en cosinus ( zie bjlage 5).
4. Computerprogramma voor STI- metingen.
Met het computerprogramma kunnen 4 verschillende metingen worden uitgevoerd namelijk:
1) STI-meting (lawaai+ galm) 2) STI-meting (lawaai)
3) meting plaatje modulatie 4) meting test
Hieronder volgt een beschrijving van de vier metingen die mogelijk zijn.
1) Bij de STI-meting (lawaai+galm) wordt een complete STI-meting uitgevoerd (zie bjlage 6).
2) Bij de STI-meting (lawaai) wordt een STI-meting uitgevoerd voor één modulatie frequentie. Deze wordt tijdens de meting gevraagd en kan naar eigen behoefte worden ingevuld
Het octaafband filter moet met de hand worden ingesteld op het commando van de computer.
Deze meting is veel korter dan 1) maar is alleen toepasbaar als de invloed van galm verwaarloosbaar is ten opzicht van de invloed van achtergrond lawaai (bij- voorbeeld voor communicatie-lijnen en de auto).
3) Bij de STI-meting plaatje modulatie kan een plaatje worden geplot van het ontvangen signaal. Tijdens de meting vraagt de computer om een terts band ( 1 tot 15).
Het octaafband filter wordt ingesteld met de hand naar <;.igen keuze. Met het verkregen plaatje kan men met de "hand" de modulatie index bepalen.
4) Met de testmeting kan men een testsignaal maken voor de modulator. Dit test- signaal heeft de volgende vorm:
J
1 + sin 2 ft U test= - - - -
2
A A
2 met A~ 10 Volt
De waarde van f moet tijdens de testmeting worden opgegeven en moet liggen tussen OHz en 25Hz.
In het hoofdmenu van tet prcgramma kunnen de volgende pc:1rameters worden aan- gepast:
1) het aantal perioden is vrij te kiezen door "A" (aantal per). Default is 10 (in het computerprogramma wordt een array ter grootte van 2000 plaatsen gereserveerd. Het maximaal aantal perioden is dan + 80 om nog een goede sinus te krijgen)
2) met "N" ( terts min) kan de tertsband worden aangegeven waarmee moet worden begonnen (Defaultwaarde 1)
3) met "X" (terts max) kan de tertsband worden aangegeven waarmee moet worden gestopt (Default waarde 14)
4) het signaal voor de spanning gestuurde versterker wordt standaard op output poort 2 gegenereerd. Het poortnummer is te veranderen door
"I"
(DAC
=
channel preamp)5)
Het signaal voor de modulator wordt standaard op output poort1
gegeneerd.Het poortnummer is te veranderen door "H" (DAC channel).
6) Het ontvangen signaal moet standaard op inputpoort 1 worden aangeboden.
Het poortnummer kan veranderd worden door "G" (ADC channel).
In het computerprogramma is een tabel opgenomen "COP.SPP.AAKDB". Dit is een tabel waarin de correcties voor het spraakspectrum in de db's voor elke octaafband kan worden opgegeven.
Deze tabel wordt gebruikt om de modulatie amplitude aan te passen en om de spanning voor de VCA te genereren.
In fig.10 wordt schematisch aangegeven hoe het computerprogramma is opge- bouwd.
STI meting lawaai + alm
!eerste metiri<L._
[aantal per.
lveranderd
---·---~-
Berekening van
wordt (½+½sin wt) sin wt
cos wt while oct 8
write: zet octaaf- bandfilter
genereer de spanning voor de VLO volgens de tabel CORSPRAAKDB For terts:= tertsmin to tertsmax do:
Berekening van de uitstuursnelheid van de modulatie signaal
g~nereer de spanning
½ + ½ sin wt I en ( lees het microfoon signaal in
- Bereken en display de modulatie index
van de tertsband terts!= terts+ 1 Bereken en display de (S/N) verhouding in de octaafband Bereken en display de STI waarde volgens Steeneken en de A.I.
-
TI meting
erste meting N
van
½ sin wt)
een terts
while oct 8;
zet octaaf 'bandfilter
genereer de spanning voor de VLO volgens de tabl CORSPRAAKDB
erekening van de uitstuursnelheid
I
van het modulatie signaalgenereer de spanning
V½
+ ½ sin wt\ en lees het microfoon signaal inBereken en display de modulatie index van de tertsband
;Bereken en display ide (S/N) verhouding
!in de octaafban.9 ____ _ 1
Bereken en display-rl de STI waarde volgen. s.
Steeneken en de A.I.
r··---
STOP
meting modulatie + plaatsj~--- _eerste N Ttin-9
r~:
r yBerekening van
wortel (½+½sin wt) sin wt
OJLW~t~---
tertsband
Berekening van de uitstuursnelheid van het modulatie si naal
,__
___
__.________
· · -genereer de spanning
1½
+½
sin wt' en lees het microfoon~Jgn~a=l-in=---~
!
Bereken en display de modulatie index'l~Q_i.s;_J.,,i;;;....1..à::IJ.Li:;1,UJ,,L_ _ _ ,
opslaan van de ingeleze waarden
Figuur 10.: Schematische weergave van het computerprogramma
jtestmeting
aantal per.
veranderd
NI ..
~ - - -
1 ..
Berekening van wortel (½ + ½ wt)
sin wt cos wt
, _ _ -·_----11-- ---·- --
1~~=:~:~~~~:~~~
t
erekening van i ts tuursne lhe.an het modula·
_ignaal _ rwhil-e stopiN
-- .. ~-=-]~---. -=-
u ~~~;3::~~;
y ~top=N _ ... ______ _ N
5·. Nauwkeurigheid van de meetopstelling.
Om een idee te krijgen van de nauwkeurigheid van de meetopstelling zijn er proefmetingen uitgevoerd. Bij de proefmeting werd het kanaal door een draadje vervangen zodat de modulatie index theoretisch 1 moet zijn. De metingen
( tot 168) zijn verricht voor een modulatie frequentie van 1Hz en 10Hz voor alle octaafbanden. De resultaten zijn in onderstaande tabel weergegeven.
1 f=lHz f=10Hz
Octaafband
gemid. 1 ~ m gemid.
~
m 1
125 1,0217 0,0353 1,00675
o,
11728250 1,0313 0,02040 1,000916 0,067219
1
500 1,01908 0,02335 1, 0063 0,05738 1
1
lk 1,02375 0,01058 0,9995
!
0,00339 1 12k 1,01908 ! 0,00415 1,0023 1 0,002904
! 1 i
4k 1,017
1
0,0054 1,0073 0,01517
8k 1,019 1 0,0032 0,9889
o,
011791 1 ' 1
l
1Voor elke octaafband zijn 12 metingen uitgevoerd. Het aantal perioden waar over is gemeten is 10. We zien uit bovenstaande tabel dat de totale af- wijking t.o.v. 1 voor m(f) kleiner is dan 5%. De standaardafwijking is voor de octaafband 125Hz en modulatie frequentie lOHz wel groot. Dit is niet erg
omdat het gemiddelde wel rond 1 ligt en bij een normale STI-meting worden er 14 waarden voor m(f) uitgemiddeld.
Bij de STI-meting (lawaai) wordt er maar een m(f) voor elke octaafband uit- gerekend. Wil men dan een goede nauwkeurigheid hebben dan moet men een modulatie frequentie kiezen die rond de 1Hz ligt.
Uit bovenstaande tabel zien we dat bijna alle waarden voor m(f) groter zijn dan 1. Dit komt omdat de nulinstelling van de kwadrator moeilijk is in te stellen.
Het is dus ook van groot belang dat de nul instelling van de kwadrator goed wordt ingesteld om geen offset op de modulatie index te krijgen. Verder is ook van belang dat de symmetrie van de modulatDr en kwadrator goed worden ingesteld.
Men kan de instellingen het beste doen door de ruisbron te vervangen door een sinusgenerator en het kanaal door een draadje.
6. STI metingen in een auto en in een kamer.
De metingen in de auto zijn verricht in een Citroen Gs special. Er zijn twee soorten metingen verricht namelijk:
1) Een STI-meting via de bestaande luidsprekers ( deze zijn in de deur ge- monteerd)
2) Een STI-meting waarbij de spreker wordt gesimuleerd door een losse luid- spreker.
De metingen in een kamer zijn verricht in de kamer die zich bevindt in het auto laboratorium.
Hier zijn ook twee soorten metingen verricht namelijk:
1) Een STI-meting via een P.A. systeem
2) Een STI-meting waarbij de spreker wordt gesimuleerd door een losse luid- spreker.
0,9 ( 1.
.>-
= - ~
0,8
.,,,. - ~~
/
\1-
0,7
î6 ~
m
1 2 3 4 5 6 7 8 9 10 13 ~12 13 14
tertsband
Figuur 11.: STI-meting in een Citroen Gs special met:
(1) Luidspreker in de deuren ( P.A. system) en microfoon op de bestuurders- plaats ( dB nivo 69 dB voor oct 500 Hz,
(2) Gesimuleerde spreker op de stoel naast de bestuurder en de microfoon op de bestuurdersplaats.
0,8
m
1
o,
70,6
-
0,5
-
0,4
---
0,3
1 2 3 4 5 6 7 8 9 10 11 _1_2 _ _ 1 ___ 3 14 Eertsband
Figuur 12.: STI meting in de kamer van het auto laboratorium
(1) STI meting net (P.A. system) nivo 69 dB voor octaafband van 500 Hz (2) STI meting met gesimuleerde spreker.
We zien voor figuur 12. dat de modulatie frequentie een sterke invloed heeft op de modulatie index er is dus veel galm en echo) echter bij
figuur 11. wordt de modulatie index weinig beïnvloed door de modulatie frequentie ( er is weinig galm en echo).
Wanneer we vergelijking 4 alsvolgt schrijven:
T
=
13,8 \f
_1_)2 f
V
m(f)2 -1
dan vinden we voor de nagalm Tijd T voor figuur 12 een waarde van 0,55 sec.
Let wel de m(f) in figuur 11 bestaat uit een gedeelte veroorzaakt door signaal onafhankelijke ruis.
Voor de berekening van de nagalmtijd moet de signaalonafhankelijke ruis nog wel worden afgetrokken van de totale signaal - ruisverhouding.
P.S. De STI metingen die zijn verricht met een gesimuleerde spreker zijn voor de octaafbanden van 125, 250, 500, 1 kHz verricht.
De andere octaafbanden zijn niet mee genomen omdat de (5
/N) verhouding van het meetsysteem nog te slecht is. Dit komt hoofdzakelijk door de gebruikte versterker
B & K 2706 welke nogal wat eigen ruis produceert.
Konklusie:
Om de spraakverstaanbaarheid te kunnen meten blijkt dat de STI-meting een zeer goede methode is. De nauwkeurigheid van de ontworpen meetopstelling, ligt binnen de 5% en dit is voor de STI- bepaling ruim voldoende.
De STI-meting is bedoeld voor spraakverstaanbaarheidsmeting maar wanneer men het amplitude- en modulatiespectrum aanpast dan is het ook voor andere soorten van informatie bruikbaar b.v. muziek.
Met de ontworpen meetopstelling kan men simuleren wat de invloed is van be- paalde ruissoorten op de STI en wat voor invloed b.v. emphase, filtering of versterking van het spraaksignaal op de STI-waarde heeft. Met STI-theorie kan er vooraf al bepaald worden wat met het spraaksignaal moet gebeuren om bijvoorbeeld in een auditorium de spraakverstaanbaarheid te vergroten.
Zelfs kan men met behulp van STI de bouwontwerpen van bijvoorbeeld kerken, theaters en auditoriums zo maken dat de spraakverstaanbaarheid optimaal is.
De meting voor de STI-bepaling is een (8
/N) verhouding meting.
Dit zal b.v. ook kunnen worden toegepast om het ruisniveau te bepalen in een rijdende auto waarmee dan de LAVR (Lawaai Afhankelijke Volume Regeling) mee kan worden aangestuurd. De gebouwde meetopstelling voldoet niet helemaal aan de verwachtingen namelijk bij de octaafbanden boven de 1kHz wordt het spraaksignaal te klein zodat de (8
/N) verhouding van het meetsysteem een rol begint te spelen.
Literatuurlijst:
1. M. R. Schroeder
Modulation Transfer Functions : Definition and Measurement Acustica Vol 49 1981 blz. 179- 182
2. K.D.Krijter
Methodes for de Calculation and use of the Articulation Index The Journal of the acoustical society of America
Vol 34 nummer 11 blz. 1689-1697
3. H,-K. Dunn and S.D. White
Statistical Measurement on Conversational Speech The Journal of the acoustical society of America Vol 11 1940 blz. 278-288
4. H.J.M.Steeneken en T.Houtgast
Het meten van de spraakverstaanbaarheid in zalen Polytechnisch tijdschrift 1980 blz. 8 - 13
5. T.Houtgast en H.J.M.Steeneken en R.Plomp
Predicting Speech intelligibility in rooms for the modulation transfer function. 1. general room acoustics
Acoustica Vol 46 1980 blz. 60-72
6. T.Houtgast en H.J.M.Steeneken
The modulation transfer function in room acoustics as a predictor of speech intelligibility
Acoustica Vol 28 1973 blz. 66 - 73
7. Bruël & Kjaer RASTI
Technical review no 3 1985
8. Prof. Dr. Ir. P. Eykhoff Stochastisc re signaal theorie THE diktaat no. 5510
Bijlage 1. De samenhang tussen de CMTF en de impulsresponsie h(t).
( zie literatuurlijst
1.)
We gaan er van uit dat het systeem wordtgeëxicitEerd door witte ruis ( met een statistisch gemiddelde van nul) die gemoduleerd is met een cosinus functie
s(t)
=
cosc.lJj-t.>.
n(t)met <n (t)> =O en
<'n (tl)
.
n (t2)) = k2ó
(t1 - t ) 2
met
S
(t1 - t2) de Dirac's delta functie en k de amplitude van het ruissignaal.Wanneer het systeem passief en lineair is, dan geldt voor het uitgangssignaal
00
r (t)
= j
h (tl) cos ~(t ; tl) ) • n (t - t 1) dt1
0
het kwadraat van r(t) kan worden geschreven als de dubbel intergraal:
als we hier van het gemiddelde nemen dan krijgen we:
00
<r2 <tv = k2
sh2
(tl) cos 2 (l.O(t -2 t1)) dt1 of0
k2 00 k2 00
<r2 (t>) =
J
h2J
h2 (tl) cos W(t - t 1) dt 2 (tl) dtl +2
10 0
Wanneer we dit in de complexe notatie schrijven krijgen we
k2 oO k2 jwt
'f'
<._r2 (t)>
=
Re (2 J
h2 (t1) dt1 +2
e j h2 (t1) e -jWtl dt 1)0 0
Hieruit volgt de definitie van de CMTF ao
m(w)
= J
h2 (t)e -jwt dt / '~ r
h2 (t) dt0
Bijlage 2. De samenhang tussen MTF en de galmtijd
Het intensiteitsverloop van een bron die wordt uitgeschakeld o p t = O verloop als volgt:
I
=
w a • e - ~ 4v tMet w het vermogen van de bron in Watts a de absorptie constante
met~- de absorptie coefficient van oppervlak s.
i i
en c de geluidssnelheid
De omhullende van de overdrachtsfunctie is:
h (t) w
= -
e a(t)
_ ac t 4v
0
2ac t
4v w 2
dt= (-) a
4v 2ac
en
J
r:P 2 -jWt w 2Jo, (
- - -2ac + J~ . ) th (t)e dt=(-) e 4v dt
a
0
CMTF = w 2
=(-) a
1 - - + 2ac
4v
1 2ac +j W 4v
jw
1 2ac 4V
MTF
l
CMTF1 = Ji+(
W4v ) 22ac ac
0
= 1
1 + jl,l/4v 2ac
- - - T
met e 4v
=
1000 voor I is 60 dB zwakker danJ 4vT ac 6,90775 1 dus MTF
Bijlage 3. Bepaling voor de invloed van de signaalonafhankelijke ruis en signaalafhankelijke ruis op de modulatie index ( zie literatuur 5) De modulatie-index wordt bepaald door de signaalafhankelijke ruis )galm) en de signaalonafhankelijke ruis (lawaai). Hieronder wordt wordt een afleiding gegeven hoe deze twee de modulatie-index beïnvloeden.
We definieren de volgende grootheden:
I. (t)
=
I.l l 1 + cos 2 Tf ft) De intensiteit van het gemoduleerde uitge- zonden signaal met m
=
1r
0 (t)=r
0 ( 1 + m(f) cos ( 2 Trf ( t - 9)) De intensiteit van het ontvangen signaal met modulatie index m (f)
m(f)
=
m(galm)* m(noise)met m(galm)de modulatie-index ten gevolge van de galm en m (noise) de modulatie-index ten gevolge van het lawaai
Wanneer er geen lawaai is , is de modulati-index m galm
Wanneer er lawaai wordt toegevoegd krijgen we
W T 2 -½
= (
1 + - - -) )13, 8 zie
bijlage 2
+ I
noise met I . de intensiteit van het ruissignaal noise
m . noise
want
=
IO (
(IO
1 + m galm cos
+ I noise . ) ( 1 +
10 log (
-?--
I noisedus m(f)
= (
1Q.) T 13, 8
( 2
nf c
t - 8) ) + I noise IOcos 2TTf (t - 0))
m galm
.
IO + I
noise
•
Deze karakteristieken moeten worden gebruikt voor de amplitude-aanpassing bij het moduleren .
•
,...
~
.... 1
•
. • r-,---,--.--.--.-"T---1
1
1
·t---,---t
___.I
11
l
.. -1
L
. ! 1
__ .1 _ _ _ _ - - - · - - - · -
-
---
i -------· .. ---1 \ ' 1
----·--- '
1.
1
1 1
1
1
' 1
__ ....___...J...
1
1 1
1 1 ;
. ,_ - ~
1 1
_...,__.__J_ --l- -
1 1 1
1 1 1
1 1 1
1 ! - } (
Bijlage 5. Amplitude berekening van het ontvangen signaal door middel van kruiscorrelaties.
De kruiscorrelatie wordt in het algemeen gegeven door:
r
xy (r) = T lim T 1.f
T X ( t - T) y (t) dt0
of in een beperkt meetinterval IU ('C)
= -
1T ~y T
j
T x ( t -r) y (t) dt0
Het ontvangen signaal noemen we x(t) en deze gaan we korreleren met een sinus en cosinus.
X ( t) = a Sin ( W t +
e )
+ n ( t) y (t)=
b sin Wtz (t)
=
b cos Wtn(t) is een ruissignaal met een statistisch gemiddelde van nul
<f
xy (t=0) = ;J (
T a sin ( l,J t + 9)0
T
b sin t + b n ( t ) sinWtJdt
T T
ab
2T
J-
o
cos ( 2Wt + &) dt + [ cose dt + 2 [ b n(t) sintvt dt)
als Teen even aantal perioden is, wordt (0)= ab
2
cose
zo geldt voor
lf
(0):ji;. (0)= abEven xz xz 2
2 2 (ab ) 2
lf
xy ( 0) +'11
xz ( 0) = 2_V'f~
(0) + 'fxz 2 (0)'
dus a- ~ b
sin è