Archive for the ‘Thesis’ Category
Thesis: Nieuwe technologieën aanwenden om de drempel met de virtuele wereld te verlagen
Posted by Fréderic Cox in Thesis, c-md, school on June 2nd, 2009
Hoe kunnen de fysieke wereld en de virtuele wereld verbonden worden? Op die vraag probeerde ik de afgelopen maanden een antwoord te vinden. Het werd uiteindelijk een lange reis doorheen papers, boeken, thesiscoachings en het resultaat kan u hier bewonderen. Veel leesplezier!
Beeld
Posted by Fréderic Cox in Thesis, c-md, school on April 22nd, 2009
Het is me gelukt! Ik, als grote en fervente blogger, heb het volgehouden om meer dan een maand niets van mij te laten horen. Hiep nog eens hiep en hoera!
Onzin natuurlijk… Het is gewoon ontzettend druk en verscheidene blogposts (zoals deze) staan al eventjes in de wachtkamer.
Waar ik mij dan mee bezig gehouden heb? Enerzijds met mijn thesisonderzoek en experimenten maar anderzijds met het thesisabstract en een beeld. Een beeld zeg je? Jawel, een zelfgemaakte afbeelding waaruit blijkt waar ik met deze thesis over handel.
Makkelijk was zo’n beeld maken niet. Niet enkel omdat ik geen fervente designer ben (maar laat dat geen excuus zijn), vooral omdat iets simpel overbrengen vaak net héél moeilijk is. Je moet goed afwegen wat je precies wil duidelijk maken en zo op een manier je thesis stileren en in een afbeelding gieten.
Wat het dan uiteindelijk geworden is? Digitale extra’s toevoegen aan de fysieke wereld om zo bepaalde content makkelijker tot bij onervaren gebruikers te brengen of voor ervaren gebruikers de werkruimte uit te breiden.

Let it go
Posted by Fréderic Cox in Thesis, c-md, school on April 21st, 2009
Soms zijn er van die dingen waar een mens technische geek als ik zich kan in vastbijten en die hij niet kan loslaten. Toen ik hoorde dat er een API beschikbaar was om gezichten te herkennen in Flash was ik wild enthousiast! Na verder onderzoek stootte ik op Deface en Marilena. Meteen proberen maar.. en op een avondje had ik deze demo nagemaakt.
Heel leuk die gezichtsherkenning, alleen herkent dit enkel gezichten. Begrijp me niet verkeerd dat is wat we willen maar het herkent geen unieke gezichten. Er zal dus wel een gezicht herkend worden maar wie dat precies is daar hebben we geen flauw idee van.
Dit was een tegenvaller voor mij (ondanks het feit dat het herkennen van een gezicht al een groot wauw effect veroorzaakt heeft) en ik nam er niet zomaar genoegen mee. Ik ging op zoek naar de achterliggende technieken die gebruikt werden.
Marilena is eigenlijk een Actionscript 3 (Flash) versie van OpenCV Object Detection. Dit is een ontwikkeling van Intel om objecten te herkennen in een afbeelding of videoframe. Het kan dus meer dan puur gezichten herkennen en is vooral populair in de C++ wereld.
Ik was gebeten door de microbe en zag een heleboel mogelijkheden om objecten te herkennen uit de fysieke wereld zonder RFID nodig te hebben. Ik ging dus dieper in in het OpenCV gebeuren. Om objecten te laten herkennen heb je (liefst zo veel mogelijk verschillende) afbeeldingen nodig van het object dat je wilt herkennen (positive images) en een heel deel afbeeldingen die dat object niet bevatten (negative images). Hiermee kan je dan een heuse database maken waaruit je een haar classifier moet bouwen. Dit is een groot xml bestand (voorbeeld: dit is de classifier voor neusherkenning). Dat XML bestand bevat dus een resem waarden die vergeleken worden met een afbeelding en OpenCV geeft dan de coördinaten terug van de locatie van het object in die afbeelding.
Aangezien wiskunde niet mijn allersterkste vak was op school en ik geen C++ ervaring heb ben ik hier toch maar wijselijk gestopt. De ROI is te laag om hier mee verder te gaan. Als ik bijvoorbeeld een simpele appel zou willen herkennen zou ik dus een duizendtal positieve en negatieve afbeeldingen moeten verzamelen, en zelfs als het dan lukt om een perfecte classifier te bouwen heb ik nog altijd maar een appel te herkennen, geen specifiek merk of wat dan ook…
Dit resulteert in het feit dat de markers momenteel nog steeds de beste manier zijn om een object te herkennen voor Augmented Reality.
Experiment RFID
Posted by Fréderic Cox in Thesis, c-md, school on March 10th, 2009
Onder nieuwe technologieën hoort ook Radio Frequency Identification thuis, meer bekend als RFID. Met deze technologie is het mogelijk om informatie op te slaan over een bepaalde afstand op kleine objecten die “tags” worden genoemd. De kracht bij RFID zit in het feit dat deze tags meermaals herschreven kunnen worden wat ze dus veel geschikter maakt dan bijvoorbeeld barcodelezers. Bovendien moeten de tags voor het scannen niet gesorteerd worden en gebeurt dat scannen ook nog eens razendsnel. Volgens het boek RFID Essentials (Bill Glover, Himanshu Bhatt 2006) is RFID de ideale oplossing voor het aangekondigde “Internet of Things“.
RFID tags bevatten dus digitale gegevens (identificatie) over fysieke objecten…u begrijpt dat ik dit voor mijn thesis niet links kan laten liggen! En dus was het tijd om een experiment te voeren en te onderzoeken hoe RFID in de praktijk kan gebruikt worden.
Daarvoor heb ik eerst veel gezocht naar mogelijke manieren (zowel hardware als software) om RFID-gebruik beter te leren kennen. Ik zocht een ideale mix tussen technische mogelijkheden en gebruiksvriendelijke eenvoudigheid. Via promotor Niels Hendriks kwam ik bij de Mir:ror terecht. Dit leek mij een zeer toegankelijke manier om RFID te testen en dus bestelde ik na het lezen van de informatie op hun site en enkele reviews de mir:ror via de online shop (Ik detecteer hier web2.0 ingrediënten!).
Na enkele dagen werd het mir:ror pakket hier geleverd en kon ik beginnen met experimenteren. Op zich was er niets spectaculair om uit de doos te halen…een drietal Ztamp:s (oftewel RFID’s) die dienen om fysieke objecten identificeerbaar te maken, iets wat leek op een onderlegger voor een koffietas met usb kabel en een CD met de nodige software op.
Na het aanmaken van een online account kon ik de software installeren op mijn PC. Al snel bevestigde ik de eerste Ztamp op een fysiek object. Mijn HTC Touch Pro kreeg de uiteindelijke eer om welkom geheten te worden door de text-to-speech functie van de mir:ror wanneer ik het apparaat erop liet rusten. Bij het wegnemen van de PDA werd nog even het weer van de dag vermeld.
U merkt het al, er zijn ontzettend veel mogelijkheden in gebruik van de mir:ror en bijhorende ztamps. Zo kan je niet alleen nieuwsfeeds of weerberichten laten voorlezen bij bepaalde acties maar kan je ook zelfgeschreven scripts uitvoeren op PC/Mac. Denk bijvoorbeeld aan het openen van een presentatie, het opzetten van een film of muziekje of het openen van een URL. Ook handig is het versturen van berichten naar services als twitter en facebook. Het interessante hieraan is dat een fysieke actie een virtuele actie teweegbrengt en zo beide werelden dus in combinatie stelt met elkaar.
Enig nadeel ondervond ik wel tijdens het tonen van deze mir:ror tijdens de tussentijdse presentatie. Hier thuis werkte alles perfect maar tijdens de laatste coaching merkte ik al dat de mir:ror soms niet goed werkte. Ik wist niet meteen een oorzaak tot uit verder onderzoek bleek dat je wel een degelijke internetverbinding moet hebben tijdens het gebruik. En dat is iets wat in Genk niet echt voorhanden is…
Augmented Reality in Flash
Posted by Fréderic Cox in Thesis on February 15th, 2009
Bij wijze van experiment heb ik deze namiddag Augmented Reality in Flash/Flex onder de loep genomen. Na een lange zoektocht naar mogelijkheden ben ik uiteindelijk gestoten op de FLAR Toolkit. Dat is een AS3 versie van de populaire en zéér degelijke ARToolkit. Bedoeling was dat ik een bepaald patroon op een uitgeprint A4 blad ging vervangen door een 3D kubus of bol. Via Mikko Haapoja kwam ik op een uiterst duidelijke tutorial terecht. Ik probeerde de demo die hij had opgezet maar merkte meteen dat de standaard ingesloten marker (het patroon op het A4 blad dat herkend zou moeten worden) niet duidelijk herkend werd. Daarom heb ik in Photoshop zelf een patroon gemaakt. Het opzetten van de demo was vrij simpel gezien de actionscript achtergrond die ik al had en mijn beginnerskennis van Papervision3D kwam ook van pas. Na het maken van het .pat patroonbestand via deze .air applicatie kon ik aan de slag.
Het viel me meteen op dat het hele proces nogal processorintensief is. Op zich geen héél grote verbazing maar het vreemde is wel dat hoe dichter je het a4 blad bij de webcam houdt hoe vloeiender het beeld (en ook het 3D model) gerendered worden. Dat is zeker iets om verder naar te kijken. Wat me ook nog stoorde was het feit dat er altijd een beetje verschil zat tussen de locatie van het patroon en de locatie van de 3D container (die alle 3D content omvat).
Nadat eerst het patroon vervangen werd door een 3D kubus besloot ik om een stapje verder te gaan. Het zou namelijk leuk zijn als op het papier een video zou afspelen. Een kwartiertje later was het resultaat er door gebruik te maken van een Plane en het VideoStreamMaterial.
Ook hier echter weer hetzelfde fenomeen, hoe dichter het papier bij de webcam gehouden werd hoe vlotter de video speelt. Voorts leek de FLAR Toolkit ook wat problemen te hebben met de richting van de video (die nogal vaak wijzigt ook als het papier stil ligt).
Voorlopige video (excuses voor de mindere kwaliteit):
Untitled from Fréderic Cox on Vimeo.