Amazon, Apple & Google luisteren mee

Onlangs bleek uit duizend opnames die VRT ontving van een anonieme bron, dat Google mensen laat luisteren naar audio opnames en deze de opnames van notities voorzien om zo het algoritme voor stemherkenning te leren hoe er Nederlands gesproken wordt. In April 2019 bleek al dat Amazon een heel peloton mensen in dienst heeft die audio opnames te analyseren voor hetzelfde doeleinde. Ook Apple geeft toe dat ze audio opnames gebruiken voor analyse, alleen is hierover minder bekend.

Bewust?

Voor de duidelijkheid, zover bekend gaat het, in het geval van Google niet alleen om (semi-)bewuste opnames, ook om gevallen van audio opnames met gebruikers die niet een trigger-woord zoals “Hey Google” hebben gebruikt. Deze gebruikers staan er niet altijd bij stil, dat er op dat moment met ze meegeluisterd wordt. Van de 1000 opnames, waren dit er 153. Het kan natuurlijk zijn dat dit gebeurt wanneer iemand iets zegt dat lijkt op het trigger-woord. 

Google probeert in deze 153 gevallen, op deze manier het trigger-woord steeds beter te leren herkennen. Waardoor de Google Home, Google Home mini en Google Assistent app accurater kan activeren op 1 of meerdere stemmen in huis. Samen met de overige gevallen worden deze opnames met notities opgenomen in de dataset van het zelflerende algoritme van Google. 

Hoe werkt dat analyseren?

Als dit volgens een zogenoemde regressie methode gaat, werkt dit simpel gezegd als volgt. Geef een computer 10 plaatjes van een huis en zeg dat het een huis is. Bij het 11e plaatje is de kans groot dat de computer zal aangeven dat het een huis is. Zo ook met spraakherkenning:

  1. Kies het woord (of woord/zinscombinatie) wat je het algoritme wilt leren herkennen.
  2. Laat een menselijk oor naar deze audio opnames luisteren.
  3. Elke keer als hij of zij het gekozen woord herkent, maakt diegene een notitie met het gekozen woord op dat tijdstip.
  4. Het algoritme leest de notities en weet nu: “Okay, als exact dit audiopatroon ingesproken wordt, wordt het woord op de notitie bedoelt”.
  5. Als er 2 notities zijn met het gekozen woord en 1 notitie met een ander herkent woord, past het algoritme een kansberekening-methode toe om te kijken bij welke notitie het ingesproken audiopatroon het dichtst in de buurt komt.
  6. Hoe meer notities er zijn, hoe “slimmer” het algoritme wordt.

Je kunt je voorstellen dat er ontzettend veel zinscombinaties in verschillende dialecten met verschillende stemmen mogelijk zijn, om de Google Assistent of Google Home 1 actie te laten uitvoeren. Google zal dus op de een of andere manier aan deze informatie moeten komen. Immers, de gebruiker verwacht een zo optimaal mogelijke gebruikers ervaring.

Daarom worden de notities ook voorzien van andere herkenningspunten, zoals: welk geslacht, welke leeftijdscategorie, maar ook elke adempauze en interpunctie.

Privacy en toestemming

Alhoewel gebruikers van een Google smart speaker of Google Assistent-app akkoord gegaan zijn met het feit dat standaard alles opgenomen wordt (dit staat in de algemene gebruikersvoorwaarden),  staat er niet in dat er mensen (zelfs van externe bedrijven) die opnames achteraf aan mensen kunnen laten luisteren. Dit spreekt een eerder geplaatst Youtube filmpje van Google over dit onderwerp tegen. Hierin wordt beweerd door Google dat er niet afgeluisterd wordt. Ook al is het niet bewezen is dat Google rechtstreeks of direct meeluistert, wil VRT hier wel mee bewijzen dat er achteraf meegeluisterd wordt via een extern bedrijf die de notities aanbrengt.

Dit doen ze via https://crowdsource.google.com/, normaliter is dit een openbaar toegankelijke tool waarin jij als gebruiker Google (gratis) kan helpen om allerlei zaken te herkennen. In het geval van audio opnames heeft een gespecialiseerd bedrijf toegang tot een afgeschermd deel van deze tool.

De reactie van Google

Google heeft dit overigens eerder toegegeven, maar beweerde toen dat hun medewerkers vervormde opnames te horen kreeg, maar in Nederland, België en Luxemburg gebeurd dat volgens de anonieme bronnen van de VRT niet. Google vervangt de gebruikersnaam wel door een volgnummer en beweert slechts 0.2% van alle audio opnames te luisteren. VRT achterhaalde en aantal gebruikers aan de hand van de opnames en lieten ze aan ze horen.

De Belgische minister Philippe de Backer van Privacy wil in ieder geval een onderzoek inzake de AVG naar de manier van het analyseren van spraakcommando’s. Ook in Nederland heeft het hier en daar voor wat stof tot nadenken gezorgd. De vraag is wederom in hoeverre willen we onze privacy opgeven voor een goede gebruikerservaring.

Lees het hele VRT artikel en bekijk de verdiepende video’s hier.
Foto door Blaz Erzetic via Pexels

Lees hier hoe je meeluisteren door Google kan voorkomen.

(Visited 66 times, 1 visits today)

Laat een reactie achter

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *

Deze website gebruikt Akismet om spam te verminderen. Bekijk hoe je reactie-gegevens worden verwerkt.