-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathinleiding.tex
executable file
·51 lines (29 loc) · 6.15 KB
/
inleiding.tex
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
%%=============================================================================
%% Inleiding
%%=============================================================================
\chapter{\IfLanguageName{dutch}{Inleiding}{Introduction}}
\label{ch:inleiding}
In deze bachelorproef wordt onderzocht of Computer Vision API’s zoals Clarifai, Google Cloud Vision of Microsoft Computer Vision gebruikt kunnen worden om collectiemedewerkers te ondersteunen bij het beschrijven van cultureel-erfgoedobjecten. De digitale fotocollectie van het Huis van Alijn\footnote{~Voor meer info, zie \url{http://huisvanalijn.be/nl/collectie/fotoalbum}.} werd hiervoor als testcase gebruikt.
Dit onderzoek zal als case mee opgenomen worden in het cultureel-erfgoedproject \textit{Beeldherkenning in de registratiepraktijk} van FOMU\footnote{~\url{https://www.fotomuseum.be/}.}. In dit project wil het museum, samen met Datable\footnote{~\url{http://www.datable.be/}.} en PACKED\footnote{~\url{https://www.packed.be/}.}, onderzoek voeren naar de toepassing van Visual Recognition Services (of Computer Vision API’s) voor de basisregistratie en iconografische ontsluiting van erfgoedobjecten. Hiervoor maken ze gebruik van de eigen collectie, maar leveren ook Netwerk Oorlogsbronnen, MoMu en Erfgoedcel Brugge beelden aan~\autocite{Derveaux2019}.
\section{\IfLanguageName{dutch}{Probleemstelling}{Problem Statement}}
\label{sec:probleemstelling}
De Vlaamse musea lijden aan een historische achterstand m.b.t. het registreren van de eigen collectie~\autocite{Gatz2016}. Het registreren van collectiestukken bestaat onder meer uit het systematisch beschrijven van de historische context en de kenmerken waarmee het object kan geïdentificeerd worden, zoals de titel, een korte beschrijving, het soort object (schilderij, foto, standbeeld, stoel), afmetingen, gebruikte materiaal,... Dit is tijdrovend werk dat door domeinexperten gedaan wordt. Vooral formele en administratieve gegevens worden geregistreerd. Voor het beschrijven van inhoudelijke informatie zoals afgebeelde personen of objecten, emoties en sfeer ontbreekt het de musea aan tijd en personeel, terwijl dat net de informatie is die interessant is voor ontsluiting en onderzoek.
Daarnaast is er ook een digitalisering aan de gang waarbij steeds meer collectiestukken gedigitaliseerd worden. Ook deze digitale beelden moeten voorzien worden van metadata of tags. Het doorzoeken of vinden van die digitale beelden is immers moeilijk als je bij de zoekactie geen gebruik kunt maken van trefwoorden. Dit verschilt van digitale tekstbestanden, waarbij op basis van \textit{full text search} bestanden teruggevonden kunnen worden. Ook voor dit werk ontbreekt het de musea aan tijd en mankracht. Het gevolg is dat musea over steeds meer beelden beschikken die niet ontsloten of gebruikt kunnen worden.
Daarom willen we in deze bachelorproef onderzoeken of artificiële intelligentie (AI) de collectiemedewerker kan bijstaan in het beschrijven van de cultureel-erfgoedcollecties. Beeldherkenningssoftware is er de laatste jaren enorm op vooruitgegaan en wordt ook steeds eenvoudiger om te gebruiken.
\section{\IfLanguageName{dutch}{Onderzoeksvraag}{Research question}}
\label{sec:onderzoeksvraag}
De centrale vraag in dit onderzoek is of Computer Vision API’s gebruikt kunnen worden voor het (inhoudelijk) beschrijven van cultureel-erfgoedcollecties. Aan de hand van één gekozen API zal nagegaan worden of het ingebouwde model voldoende is voor de beschrijving van de beelden en of het eenvoudig is om de beeldherkenningssoftware te trainen indien de beschrijving van het ingebouwde model niet voldoet.
We willen hierbij ook te weten komen of de software eenvoudig in gebruik is zodat museummedewerkers zelf de API’s kunnen gebruiken om hun beelden te \textit{taggen}. Gebruiksgemak zal daarom een belangrijk aspect zijn voor de keuze van de API. Een ander belangrijk aspect is de aanwezigheid van goede documentatie en tutorials.
\section{\IfLanguageName{dutch}{Onderzoeksdoelstelling}{Research objective}}
\label{sec:onderzoeksdoelstelling}
Het onderzoek zal uitgevoerd worden op een deel van de fotocollectie van het Huis van Alijn. Het Huis van Alijn is het museum van het dagelijkse leven en beschikt over een grote fotocollectie die het dagelijkse leven in de twintigste eeuw documenteert.\footnote{~\url{http://huisvanalijn.be}.} Samen met Huis van Alijn zullen er use cases geformuleerd worden waarvoor beeldherkenning ingezet kan worden.
We focussen ons in de eerste plaats op fotocollecties omdat we vermoeden dat de Computer Vision API’s hier het best op scoren. Een \textit{proof of concept} zal opgezet worden om de beelden te laten taggen en de beeldherkenningssoftware te trainen. Vervolgens zullen we een vergelijking maken tussen de metadata van de beelden die aangeleverd worden door de API en de metadata van de beelden zoals ze door de museummedewerker aangeleverd werden.
Met dit onderzoek wordt de haalbaarheid van het gebruik van Computer Vision API’s in de erfgoedsector onderzocht. Tevens zijn de use cases gekend waarvoor beeldherkenningssoftware een goede partner is.
\section{\IfLanguageName{dutch}{Opzet van deze bachelorproef}{Structure of this bachelor thesis}}
\label{sec:opzet-bachelorproef}
De rest van deze bachelorproef is als volgt opgebouwd:
In Hoofdstuk~\ref{ch:stand-van-zaken} wordt een overzicht gegeven van de stand van zaken binnen het onderzoeksdomein, op basis van een literatuurstudie.
In Hoofdstuk~\ref{ch:methodologie} wordt de methodologie toegelicht en worden de gebruikte technieken besproken om een antwoord te kunnen formuleren op de onderzoeksvragen.
In Hoofdstuk~\ref{ch:resultaten-ingebouwd-model} worden de resultaten besproken van het loslaten van een ingebouwd model van de Computer Vision API op gedigitaliseerde dia's en foto's van het Huis van Alijn.
Vervolgens gaan we een stap verder en wordt een eigen model gemaakt en losgelaten op diezelfde beelden van Huis van Alijn. In Hoofdstuk~\ref{ch:resultaten-custom-model} worden de resultaten hiervan geanalyseerd.
In Hoofdstuk~\ref{ch:conclusie}, tenslotte, wordt de conclusie gegeven en een antwoord geformuleerd op de onderzoeksvragen. Daarbij wordt ook een aanzet gegeven voor toekomstig onderzoek binnen dit domein.