Undersida under arbete eng

Summary

Nedan finns svar på vanliga frågor kring MMWAH. Om du inte finner svar på din fråga ber vi dig kontakt oss personligen på marrti.makinen@hanken.fi eller ines.frojdo@hanken.fi. Du kan även kontakta oss via Instagram.

Korpusen MMWAH står för the Multilingual Multimodal WhatsApp corpus at Hanken. Den är en kurerad textsamling som består utav WhatsApp chattar som förts bland finlandssvenskar i åldersgruppen 18-30.

Chattarna har frivilligt donerats till korpusen i och med språkforskningsprojektet Snabbmeddelanden på flera språk: fokus på WhatsApp i finlandssvensk digital kommunikation.

Korpusar utgör basen till majoriteten av modern språkforskning. De är textsamlingar som skapats enkom för forskning enligt vissa utgångskriterier, såsom texttyp, språk, eller genre.

Korpusar används även  inom datavetenskapen till NLP - natural language processing - som i tur möjliggör stora språkmodeller som används för ChatGPT och liknande applikationer.

Martti Mäkinen är projektledare vid pojektet och Ines Fröjdö är forskningsassistent. I projektets första period arbetade även Leyla Shojaeifard med oss på de tekniska lösningarna och datahantering.

Till följd av faktorer såsom språkminoritetstatusen förmår finlandssvenskar använda ett flertal språk i vår vardag och det krävs generellt en hög språkkompetens att navigera det finlandssvenska samhället. Svenskan i Finland varierar även stort mellan geografiska områden.

Digital kommunikation på plattformar, såsom WhatsApp, kombinerar drag från skriftligt och muntligt språkbruk. I traditionella sammanhang hör det till att finlandssvenskar följer skriftreglerna för standardsvenska och då faller de unika finlandssvenska dragen ofta bort. Däremot behåller vi ofta dessa drag i våra mindre formella konversationer i vardagen.

Det behövs data över användningen av svenska i Finland för att kartlägga och framförallt föreviga språket så som det används i nuläget. Språket förändras snabbt och utan forskningsmaterial går det inte att undersöka förändringarna eller trenderna i språket. Det finlandssvenska samhället är relativt litet och därför vill vi nå så många som möjligt i detta projekt

Korta svar: Jo!

Korta såsom långa WhatsApp chattar duger väl. Du behöver inte vara orolig kring innehållet i chattarna, för allt språkbruk välkomnas i MMWAH. Språkforskning centrerar kring hur människor utrycker sina tankar och idéer, dvs. själva innehållet får vara precis vad som helst. Konversationerna får handla om helt vardagliga saker; det är just det enklaste vardagspratet vi vill komma åt. 

Chatten kan innehålla multimodala element som bilder, videor eller ljudmeddelanden. Dessa anonymiseras precis som resten av materiaet.

Kompischattar, gruppchattar, sportlagschattar eller dylika är alla passliga för MMWAH-korpusen. Så länge vi kan kontakta de individuella chattdeltagarna för samtycke kan du donera vilken chatt du önskar. Deltagarantalet kan alltså ligga på allt mellan 2-20 deltagare. Det kan löna sig att dubbelkolla med de andra chattdeltagarna innan du skickar in din donation, så ökar chansen att donationen lyckas!

Även om syftet är att fånga finlandssvenskt språkbruk, betyder det inte att chatten nödvändigtvis måste vara på svenska. Språkblandningar är lika språkligt värdefulla. Förutsatt att forskargruppen på ett säkert sätt kan utföra anonymisering är alla språk och språkblandningar välkomna!

Vi samlar i första hand in språkdata från människor i åldergruppen 18 till 30. Det förorsakar inga hinder ifall enstaka deltagare faller utanför åldersgruppen. Chattdeltagarna bör dock vara minst 15 år gamla för att samtycka till att delta i forskningen.

Chatten får innehålla multimodala element såsom bilder, videor eller ljudmeddelanden. Dessa anonymiseras och/eller ersättas med kod.

Användare av den färdigställda korpusen kommer inte kunna identifiera de som donerat materialet i korpusen. Innehållet kommer vara pseudonymiserat (personnamn har bytts ut mot kodnamn) och anonymiserat (identifierbart innehåll raderats). 

Det är möjligt att återkalla ditt samtycke att delta i projektet. Ifall du ångrar ditt deltagande kan du kontakt oss och be att vi raderar materialet du skänkt eller de instanser där du är författaren bakom meddelanden. I samband med detta raderas även de enkäter och kontaktuppgifter vi samlat av dig.