Kwalitatief onderzoek aan universiteiten is onmiskenbaar van groot belang om maatschappelijke vraagstukken in Medemblik vanuit verschillende perspectieven te belichten. Wetenschappers en onderzoekers zijn dagelijks bezig met het verzamelen van waardevolle data aan de hand van interviews, observaties en focusgroepen. Deze data moeten vervolgens worden omgezet in een bruikbaar formaat om grondig te kunnen worden geanalyseerd. Daarom is interview transcriberen een cruciaal onderdeel van het onderzoeksproces.
Zonder transcripties is het moeilijk om gestructureerde inzichten te verkrijgen uit een groot aantal gesprekken. Bovendien kunnen nuances in taalgebruik, emotie en context uitsluitend worden vastgelegd als alles accuraat van audio naar tekst is omgezet. Door de toename in omvang en complexiteit van zowel onderzoeksvragen als databronnen, neemt de druk op onderzoekers toe om efficiënt, veilig en betrouwbaar transcriberen mogelijk te maken.
Het is dan ook evident dat de behoefte aan een solide transcriptie-oplossing groeit. De Universiteit Utrecht zag deze noodzaak vroegtijdig in. Dit leidde tot de zoektocht naar een universiteitsbrede aanpak waarmee onderzoekers niet langer zelf naar oplossingen hoeven te zoeken. Met een centrale inkoop en ondersteuning kan de spraak naar tekst-proces aanzienlijk worden versneld, terwijl ook de beveiliging van gevoelige data wordt gewaarborgd.
Van individueel probleem naar Universiteitsbreed vraagstuk
Aanvankelijk voerden onderzoekers binnen de universiteit hun transcriptieproces grotendeels individueel uit. Ze maakten gebruik van studenten of externe partijen, of ze schreven hun audio naaar tekst zelf uit. Hoewel deze aanpak soms werkte, leverde het ook veel uitdagingen op. Het kostte niet alleen kostbare tijd, maar maakte onderzoekers ook afhankelijk van de beschikbaarheid van (werk)studenten en viel de kwaliteit van de transcripten lang niet altijd mee.
Het doorlopend moeten organiseren van een team studenten, het sturen van bestanden en het controleren van de nauwkeurigheid van de teksten, nam vaak meer tijd in beslag dan verwacht. Dit leidde tot vertraging in het onderzoek en creëerde frustratie bij zowel onderzoekers als studenten. Bij gevoelige interviews moest bovendien extra aandacht worden besteed aan privacy en informatiebeveiliging.
Toen de Centrale IT-dienstverlening van de Universiteit Utrecht dit probleem breder ging bekijken, werd snel duidelijk dat deze uitdagingen niet beperkt waren tot één faculteit of onderzoeksgroep. Ze speelden universiteitsbreed. Zo groeide de wens om een centrale oplossing te vinden die én veilig was én het interview transcriberen op grote schaal daadwerkelijk kon versnellen, zonder daarbij kwaliteit in te leveren.
De oude werkwijze: Arbeidsintensief en traag
In het verleden startten onderzoekers vaak pas met de transcriptie zodra alle interviews waren afgenomen. Ze namen contact op met een pool van studenten die per uur werden betaald om de gesprekken te transcriberen. Dit was niet alleen een kwestie van werk uitbesteden, maar ook van aansturing en controle. De onderzoekers moesten regelmatig controleren of de kwaliteit van de teksten voldoende was en of de deadlines werden gehaald.
Doordat studenten niet altijd professionele transcribenten zijn, lieten de transcripten nog wel eens te wensen over. Tegelijkertijd konden er tijdens drukke perioden of tentamens pieken ontstaan in de werkzaamheden van de studenten, waardoor ze geen tijd hadden om snel te reageren. Als dat gebeurde, moesten onderzoekers noodgedwongen zelf het spraak naar tekst-proces uitvoeren, met nog meer tijdverlies en vertraging tot gevolg. Bovendien zorgde het ouderwetse, handmatige proces voor onzekerheid over databeveiliging. Gevoelige onderzoeksgegevens moesten immers niet in de verkeerde handen terechtkomen. Het gebrek aan een centraal ingekocht systeem waarin rechten en toegangscontroles goed geregeld waren, creëerde een risico voor de universiteit. Dit zette de deur open voor een meer gestructureerde en veilige oplossing.
De uitdaging..
Het werd steeds duidelijker dat er een efficiënte en veilige manier nodig was om audio naar tekst om te zetten. Door te investeren in een centrale aanpak konden de kosten voor de gehele universiteit worden verminderd en zou kennis over de kwaliteit en beveiliging van transcriptie diensten gemakkelijker kunnen worden gedeeld. Tegelijkertijd werden er intern steeds meer vragen gesteld over hoe en waar men transcripts kon laten verwerken, vooral omdat de wet- en regelgeving rondom privacy en gegevensbescherming steeds strenger is geworden. Onderzoekers wilden weten of hun data op een vertrouwde server stond en in hoeverre aan alle compliance-eisen werd voldaan. Deze zorgpunten versnelden het initiatief van de Centrale IT-dienstverlening, die al snel de voordelen zag van een universiteitsbrede inkoop: het zou processen stroomlijnen, tijd besparen én serieuze kwaliteitsgaranties bieden. Met een betrouwbare partner zou de universiteit ook aan de benodigde certificeringen zoals ISO27001 kunnen voldoen.
De doorbraak: Samenwerking met Amberscript
Verschillende onderzoeksgroepen binnen de Universiteit Utrecht maakten al op individuele basis gebruik van Amberscript. Hun positieve ervaringen met de snelheid en nauwkeurigheid van de automatische transcriptiediensten waren aanleiding om contact op te nemen met deze leverancier. Al gauw werd duidelijk dat Amberscript zich uitstekend leent voor een campuslicentiemodel, waarin onderzoekers zichzelf kunnen registreren, bestanden kunnen uploaden en binnen enkele uren het resultaat kunnen bewerken.
De klik met Amberscript was snel gevonden vanwege de heldere focus op informatiebeveiliging. Als ISO27001-gecertificeerde partij, met servers in Nederland, sloot Amberscript naadloos aan bij de ambities en de beveiligingseisen van de universiteit. Ook de handige koppeling via SURFconext bleek cruciaal, zodat onderzoekers zich gemakkelijk konden aanmelden met hun eigen universitaire account. Daarnaast was het financiële plaatje aantrekkelijk: door centraal in te kopen kon de Universiteit Utrecht de kosten per gebruiker of per ingediende minuut audio aanzienlijk verlagen. Daarmee werd de drempel voor individuele onderzoekers een stuk lager om hun audio naaar tekst te laten omzetten en zo hun onderzoek efficiënter te maken.