Bij Wilfred Rubens kwam ik mezelf gisterenavond tegen als onderdeel van de introductie van een blogpost getiteld “Stemgestuurde digitale assistenten en leren“. In het bericht (dat je natuurlijk het beste ook zelf eerst even kunt lezen) reageert Wilfred op zijn beurt op twee online berichten, eentje getiteld “Hey, Google, Alexa, Siri and Higher Ed” van Ray Schroeder en de ander heet “Using Amazon Alexa for the Math Classroom” van Matthew Lynch.
Centrale vraag daarbij is eigenlijk hoe / of we als onderwijsinstellingen zouden moeten omgaan met de toegenomen belangstelling (ook in Nederland) voor spraakgestuurde assistenten zoals die Google, Siri van Apple en Alexa van Amazon.
Zoals Wilfred altijd doet, maakt hij een tamelijk zakelijke en objectieve samenvatting van de berichten. Dat is fijn, want zelf zou ik ze waarschijnlijk anders nooit gelezen hebben. Ray Schroeder bijvoorbeeld begint zijn verhaal met een vergelijking van hoe zijn 7 jaar oude kleinzoon het altijd van hem wint als er vragen beantwoord moeten worden. Waarom? Tja, je kunt het wel raden: die kleinzoon begint met “Hey Google….”. Halverwege het bericht komt hij dan uit bij:
How far away are we from a full synthesis of emerging capabilities to do original research and writing — all triggered by a voice command? Not far. And, one has to ask, how does the advent of this technology impact the way in which we teach? Do we need to re-examine our pedagogies in light of very smart assistants?
Daarna introduceert hij een nieuw fancy begrip: voice engine optimization (VEO) als tegenhanger van search engine optimization. Kortom, het bericht heeft echt alles in zich dat er voor zorgt dat sommige mensen het een super bericht zullen vinden (en een waarschuwing / signaal voor de te volgen weg) en anderen op hun achterste benen zullen staan als het gaat om weer zo’n technoloog die de toekomst van onze kinderen wil verpesten met een stuk niet onderzochte technologie.
Het artikel van Matthew Lynch steekt daar heel veilig tegenover af met een aantal voorbeelden van hoe je Alexa in de klas kunt inzetten.
OK, zoals gezegd: goed dat Wilfred het samenvat, want dat maakt het mogelijk om te kijken naar de punten die hij er uit haalt, dat maakt het voor mij een stuk gemakkelijker om inhoudelijk te reageren.
Is het slecht / voorbarig / slecht als onderwijsinstellingen experimenteren met spraakassistenten?
Nee.
Je zou er voor mij elke willekeurige technologie voor in de plaats kunnen zetten en het antwoord zou hetzelfde zijn. Op dit moment kan het niet anders. We zitten als onderwijs nog (lang) niet aan het stuur als het om dit soort ontwikkelingen gaat. Dus kunnen we niet anders dan de ontwikkelingen volgen en experimenteren. Het liefst met docenten. Maar dan niet vanuit de gedachte dat we morgen of over twee maanden allemaal zo’n kastje in de klas hebben of dat al onze studenten tegen hun computer zitten te praten. Dat is onzin.
Wel is het zo dat die studenten vaak vooral hun smartphone gebruiken voor bijna alles. Of dat daadwerkelijk via spraak is, zoals Ray Schroeder in zijn bericht claimt, dat durf ik te betwijfelen (“show me the numbers” zou ik zeggen), maar zoals je in mijn berichten hebt kunnen zien: spraak en tekst blijken zeker bij Google dicht bij elkaar te liggen. Google Assistant zorgt voor het spraak <-> tekst deel, systemen als Dialogflow maken natuurlijke taalverwerking (in tekst) heel laagdrempelig. En dan worden slimme dialogen ook opeens haalbaar. Al blijft het even afwachten of dat nu al slim is én of studenten die dan gebruiken. Want gewoontes kunnen heel erg ingesleten zijn.
Zo betrapte ik me er laatst op dat ik voor een probleem in Word (ben even vergeten wat het was) automatisch naar de browser ging om in Google te zoeken. Ik ben nou eenmaal gewend dat ik online veel en veel gemakkelijker een antwoord kan vinden op een probleem dan daarvoor het ingebouwde helpsysteem van een applicatie te gebruiken. Terwijl dat, in het geval van Word, al lang niet meer zo lijkt te zijn.
Daar aanbieden waar het zinvol is
Wilfred heeft het in zijn bericht over “gemak” en “gewin”, twee belangrijke voorwaarden voor de adoptie van een technologie. Ik vul die vragen iets anders in dan dat hij doet.
Lang, lang geleden was er al Dragon NaturallySpeaking.
Ik laat met opzet het filmpje van 2014 zien omdat het pijnlijk duidelijk maakt hoe in de kinderschoenen de tekstherkenning toen nog stond. De mevrouw weet, in het Engels, duidelijk articulerend perfecte herkenning te bereiken. En ook nu, het bedrijf en de software bestaan nog steeds, de Home Versie kost € 159,- (dat is net zo veel als 5 Google Mini’s tijdens Black Friday) en heeft nog steeds versienummer 13 (zoals die in het filmpje uit 2014). Maar hoewel het voor bepaalde beroepsgroepen absoluut goed werkt, zie ik mezelf (en ik heb het geprobeerd) op deze manier echt geen blogpost schrijven (ik zal niet “typen” zeggen). Dan is typen namelijk met afstand de snelste manier.
Op een klein beeldscherm, in situaties waarbij ik wél in de buurt ben van een apparaat dat me kan horen (en geloof me Google Home Mini luistert heel goed) en het stellen van een vraag in audio is sneller, ja dan wil ik wel geloven dat het meerwaarde heeft.
Maar daarmee kom ik ook terug bij mijn eerste punt: die inschatting is pas te maken door het testen van de technologie.
Voice Engine Optimization (VEO)
Wilfred stipt nog een ander punt aan dat ook door Ray Schroeder gemaakt wordt: op de desktop krijgt een gebruiker veel resultaten maar klikt meestal niet door naar pagina 2, dus jij wilt op pagina 1 staan. Bij een mobiele interface is het aantal resultaten al een stuk kleiner (kleiner scherm), dus is in de top 5 staan al belangrijker. Bij voice krijgt de vragensteller meestal maar 1 antwoord. En dat wil jij zijn.
Ik vind dat heel smal gedacht. Sowieso lijken me spraakgestuurde vraagsystemen juist geschikt voor directe vraag-antwoord situaties, dus met bij voorkeur 1 of slechts een paar antwoorden. Maar ik als student op zoek ben naar een universiteit, dan ga ik dat écht niet aan Siri of Alexa overlaten via een algemene “Vertel mij…” vraag. Wat ik wel verwacht is dat sites zoals bijvoorbeeld https://www.studiekeuze123.nl/ (was een van de eerste sites die ik in Google desktop vond toen ik een voorbeeld zocht) een app ontwikkelen voor Alexa of Google. Zodat ik kan zeggen “Hey Google, praat met de studiekeuzeadviseur” en je een spraakassistent krijgt die je door het keuzeproces heen kan leiden.
Dan hoef ik niet te navigeren door lange lijsten met ingebakken opties om van 3.053 keuzes uit te komen bij een acceptabel aantal, dan geef ik via een vraag/antwoord systeem de criteria op die voor mij relevant zijn en kom dan uit bij een behapbaar aantal van 3-5 opleidingen. Maar daarvoor hoeven de opleidingen zelf niets anders te doen dan nu. De informatie die ze aanleveren zal hetzelfde zijn.
Of je als onderwijsinstelling zélf een app wilt maken, dat is een andere vraag.
Het is gewoon onvermijdelijk
Hoewel ik niet geloof dat de wereld morgen op zijn kop staat, ben ik wel een kind van de Star Trek generatie.
En dan bedoel ik dat ook ik besmet ben met de veronderstelling dat alles, zo niet bijna alles, van wat we in die science fiction serie zien en zagen werkelijkheid kan worden. OK, het verdwijnen van geld en wereldvrede zijn dan wellicht uitdagingen die pittig zijn, maar het kunnen praten tegen een computer, dat was voor mij altijd een kwestie van tijd. En waar iedereen altijd riep dat computers dat nooit zouden leren of dat het nog decennia zou duren voordat het wellicht zou werken, zie je nu dat bedrijven enorme stappen maken.
Wel relevant vind ik dan de vraag of we het ok vinden dat dat alleen echt door een beperkt aantal heel grote bedrijven kan gebeuren die straks daarmee ook de toegang tot deze technologie controleren.
Interessante dilemma’s
Dit soort technologie levert heel interessante dilemma’s en discussies op. Als je de film Her uit 2013 nog niet gezien hebt, dan moet je dat zeker een keer doen.
En dan niet alleen vanwege de zwoele stem van Scarlett Johansson, een stem waarvan iedereen zich wel kan voorstellen dat je daar verliefd op zou kunnen worden. De film laat zien waar we over een paar jaar zouden kunnen zijn als de AI en de spraakherkenning zich blijven ontwikkelen in het tempo waarmee ze dat nu doen. Daarbij geeft de film (ik zal geen spoilers plaatsen) één mogelijke richting aan en eigenlijk ook wel een duidelijk waardeoordeel. Waarbij ik dan mijn vraagtekens plaats op basis van wat ik mogelijk acht.
En ook daarom moet het onderwijs deze ontwikkelingen volgen. Wij hebben immers de generaties in huis waarvoor dit nog meer dan voor onszelf werkelijkheid gaat worden en waarvan ik denk dat we die ook mede-eigenaar moeten maken. En dat gebeurt ook wel, of ik dat nou doe of iemand anders, dat maakt niet uit.
Cijfers…
Hoewel je dit soort cijfers best met een korreltje zout mag nemen zijn deze uitspraken van Nederlanders over het gebruik van spraakassistenten en automatisering in huis toch wel heel anders dan dat je zag bij bijvoorbeeld de introductie van de mobiele telefoon:
Naast het feit dat bijna tweederde (65 procent) van de consumenten aangeeft dat ze niet graag alle apparaten via spraak willen bedienen geeft iets minder dan de helft (49 procent) aan dat praten tegen apparaten een drempel opwerpt. Het overgrote deel (83 procent) van de Nederlanders prefereert menselijke hulp nog steeds boven digitale assistentie. Maar, drie op de tien consumenten kunnen zich wel voorstellen dat er in de toekomst mensen zullen zijn die gaan samenwonen met een robot. In het kader van de ouderenzorg zegt 62 procent dat Smart Home een goede manier is voor familie en verzorgers om ouderen in de gaten te houden.
En vanuit dat oogpunt en het gegeven dat ik echt niet de enige ben die met bv een Google Home Mini experimenteert mogen bedrijven zich wél ook nu al zorgen gaan maken. Bijvoorbeeld als het gaat om de manier en momenten waarop ze informatie aanbieden. Als ik ’s ochtends “Hey Google, goedemorgen” zeg, dan krijg ik netjes een “Hallo Pierre,…” terug (Google herkent alle huisgenoten aan hun stem) gevolgd door een weerbericht en een overzicht van het belangrijkste nieuws. Dat gebeurt door middel van het afspelen van de nieuwsbulletins van o.a. ANP Nieuws, Omroep Brabant Nieuwsupdate etc.
Welke dat zijn en in welke volgorde kan ik zelf instellen (zie afbeelding links). ANP Nieuws staat bij als eerste, bekend en heeft inhoudelijk goed bulletin. Daarna staat (nu nog) Omroep Brabant omdat ik in Brabant woon en hoopte zo na het landelijke nieuws ook een lokale update te krijgen. Maar als ik om 6 uur aan het ontbijt zit (of iets eerder) dan krijg ik voor Omroep Brabant het oude bulletin van 8 uur de avond ervoor. Oud nieuws dus, dan skip ik snel door.
En voor anderen die daarna volgen, komt het voor dat ze met exact hetzelfde item beginnen als ANP Nieuws. En ook dan is de kans op doorskippen naar de volgende (ik kan nog niet binnen een bulletin navigeren) heel erg groot.
Daar kun je Google de schuld van geven, maar eigenlijk ligt dit niet aan Google. Dit zijn keuzes en voorkeuren van mij als nieuwsconsument. Op de radio, in de auto (als ik daar zit) luister ik één bulletin op het moment dat het uitgezonden wordt. Hier heb ik meer flexibiliteit en als het aanbod die flexibiliteit niet volgt, dan missen ze mij als luisteraar. Dat zal ze nu niet altijd wat uitmaken omdat ze aan mij nu ook geen inkomsten hebben omdat de items zonder reclame zijn, maar op de langere termijn gaat dat toch problematisch worden.
Geduld
Dus als je je wel eens afvroeg waarom ik het geduld op kan brengen (en de tijd wil investeren) om de kennis op te doen om al die apparaten aan elkaar te koppelen dan hoop ik dat het je nu al wat duidelijker geworden is. Het is voor mij een manier om door de marketing en de hype heen te prikken. Om voor mezelf een beeld te krijgen hoe ver we inmiddels écht zijn. Om ideeën te krijgen over haalbaarheid, om zelf na te kunnen denken over ethische wenselijkheid. Om zelf controle te houden over en wellicht invloed te kunnen uitoefenen op mijn toekomst.
Neem ik Google, Siri en Alexa straks mee naar mijn werk? – mijn reactie op de blogpost van @wrubens over het gebrui… https://t.co/D7uMxbHxAM
Neem ik Google, Siri en Alexa straks mee naar mijn werk? https://t.co/To8M56zVSk
Interessante bespiegelingen. Jij schrijft o.a.:
”Sowieso lijken me spraakgestuurde vraagsystemen juist alleen geschikt voor dat soort directe vraag-antwoord situaties. Als ik als student op zoek ben naar een universiteit, dan ga ik dat écht niet aan Siri of Alexa overlaten.” Wat ik in de loop van de jaren geleerd heb, is dat mensen technologie niet altijd gebruiken zoals wij dat verwachten of hopen.
Ik vrees dus inderdaad dat mensen spraakgestuurd systemen niet alleen voor conversaties gebruiken, maar ook om direct een antwoord te krijgen.
Het onderwijs moet deze ontwikkelingen inderdaad kritisch volgen. Dat doe je ook door er zelf gebruik van te maken. Ik doe dat ook, maar anders dan jij. Ik verwacht op dit moment inderdaad geen Google Home Mini of Alexa aan te zullen schaffen. De kerstboom maak ik nog gewoon handmatig aan. Tegelijkertijd had ik een jaar geleden niet verwacht ooit duizend euro voor een smartphone te zullen neertellen. En raad eens wat ik gisteren bij Xando heb opgehaald… Niets is zo onbetrouwbaar als voorspellingen over hoe we om zullen gaan met technologie 😉