Artificial intelligence, AI, is widely acknowledged to have atransformative impact on various industries. However, thistechnology is not without its limitations. One such limitationis the potential reinforcement of human biases withinmachine learning systems. After all, these systems rely ondata generated by humans. To address this issue, theEuropean Union, EU, are implementing regulationsgoverning the development of AI systems, not only topromote ethical decision-making but also to curb marketoligopolies. Achieving fair decision-making relies on highquality data. The performance of a model is thussynonymous with high-quality data, encompassing breadth,accurate annotation, and relevance. Previous researchhighlights the lack of processes and methods guiding theeffort to ensure high-quality training data. In response, thisstudy aims to investigate the limitations and opportunitiesassociated with claims of data quality within the domain ofdata collection research. To achieve this, a research questionis posed: What factors constrain and enable the creation of ahigh-quality dataset in the context of AI fairness? The studyemploys a method of semistructured interviews withindustry experts, allowing them to describe their personalexperiences and the challenges they have encountered. Thestudy reveals multiple factors that restrict the ability tocreate a high-quality dataset and, ultimately, a fair decisionmaking system. The study also reveals a few opportunities inrelation to high quality data, which methods associated withthe research landscape provides. / Att artificiell intelligens är något som kommer vända uppoch ned på många branscher är något som många experter äröverens om. Men denna teknik är inte helt befriad frånbegränsningar. En av dessa begränsningar är att ett systemsom använder maskininlärning potentiellt kan förstärka defördomar vi människor besitter. Tekniken grundar sig trotsallt i data, data som skapas av oss människor. EU harbestämt sig för att tackla denna problematik genom att införaregler gällande huruvida system som tillämpar AI skallutvecklas. Både för att gynna det etiska beslutsfattandet menockså för att hämma oligopol på marknaden. För att uppnåett så rättvist beslutsfattande som möjligt krävs det data avhög kvalitet. En modells prestanda är således synonymt meddata av hög kvalitet, där bredd, korrekt annotering ochrelevans är betydande. Tidigare forskning pekar påavsaknaden av processer och metoder för att vägleda arbetetmed att säkerställa högkvalitativa träningsdata. Som svar pådetta syftar denna studie till att undersöka vilkabegränsningar och möjligheter som gör anspråk pådatakvalitet i delar av forskningsområdet Data collection.Detta görs genom att besvara forskningsfrågan: Vilkafaktorer begränsar och möjliggör skapandet av etthögkvalitativt dataset i kontexten rättvis AI? Metoden somtillämpas i studien för att besvara ovanstående ärsemistrukturerade intervjuer där yrkesverksamma experterfår beskriva sina personliga upplevelser gällande vilkautmaningar de har ställts inför. Studien resulterar i ett antalfaktorer som begränsar förutsättningarna för att skapa etthögkvalitativt dataset och i slutändan ett rättvistbeslutsfattande system. Studien resulterar även i att peka påett antal möjligheter i relation till högkvalitativa data, sommetoder associerade med forskningslandskapet besitter
Identifer | oai:union.ndltd.org:UPSALLA1/oai:DiVA.org:miun-48856 |
Date | January 2023 |
Creators | Westerberg, Erik |
Publisher | Mittuniversitetet, Institutionen för kommunikation, kvalitetsteknik och informationssystem (2023-) |
Source Sets | DiVA Archive at Upsalla University |
Language | Swedish |
Detected Language | Swedish |
Type | Student thesis, info:eu-repo/semantics/bachelorThesis, text |
Format | application/pdf |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0013 seconds