Kunst en humor / Techniek · 17/09/2010

Waar houdt de wereld op?

Pas geleden zag ik een plaatje dat me realiseerde waarom het helemaal niet zo makkelijk is om grenzen van een systeem aan te geven. Het plaatje stond in een artikel dat de geschiedenis van geautomatiseerde objectherkenning door computers beschreef.

Wij mensen herkennen bij het zien van een foto direct wat het is zodra we het zien (een auto, een fiets, een telefoon, een schaap, etc.). Daaraan gekoppeld zien we ook de functie van het object (eten, iets om op te zitten, vervoeren, bellen, op te eten/scheren/aaien etc.). We kunnen zien door onze kennis van verhoudingen en perspectief hoe groot iets is en of het ver weg of dichtbij staat. Tot slot kunnen we ook nog eens relaties tussen objecten herkennen (koffie in een beker, beker staat op  de tafel). Best knap toch?

In het begin van de jaren 60 is aan het MIT door Larry Roberts begonnen met het door computers te laten herkennen van drie-dimensionale blokken. En dat lukte! Deze aanpak was een aardig begin, maar de echte wereld is toch héél anders dan de wereld in een laboratorium.

Tussen de vroege jaren 1960 en 2010 is de rekencapaciteit vertigvoudigd en de pixel-resolutie is ook niet achter gebleven. Heden ten dage maakt de wetenschap van objectherkenning inmiddels gebruik van willekeurige beelden van flickr of eigen digitale vakantiekiekjes inplaats van geometrische blokken. Het is erg interessant om de plaatjes te zien van de analyse door computersystemen van de foto’s in ojecten en de relaties ertussen. Hede ten dage kunnen computers al plaatjes herkennen en zelfs “achter de foto kijken”. Dit alles gebaseerd op de wetmatigheden uit de jaren 60: “the perception of solid objects is a process which can be based on the properties of three-dimensional transformations and the laws of nature” (Larry Robert, 1965)

In een paper dat dit jaar is gepubliceerd, beschrijven enkele wetenschappers hoe ze een computersysteem enkele natuurkundige wetmatigheden meegegeven hebben, zoals:

  • De eerste wet van Newton: “Een voorwerp waarop geen resulterende kracht inwerkt, is in rust of beweegt zich rechtlijnig met constante snelheid voort.”
  • Een ondersteunend object moet voldoende kracht hebben om het bovenliggende object te dragen.
  • Alle objecten in de wereld moeten eindige volumes hebben en kunnen elkaar niet penetreren.

Ze hebben die wetten en allerlei moeilijke algoritmen losgelaten op 250 ‘vakantiekiekjes’. Aansluitend hebben ze de computer een beschrijving laten geven van de objecten en de relatie tussen die objecten. Het resultaat is best grappig:

Klik op de plaatjes voor een vergroting

De computer is zeker niet feilloos, maar zoals je ziet herkent de computer onder meer wat de grenzen van objecten, maar ook of het object (de boom) ergens voor of achter staat, en welke objecten allemaal ondersteund worden door de grond of dat objecten elkaar ondersteunen. Het herkent zelfs of iets poreus (bladeren) is of juist vast (mensen, boten, auto’s, huizen).

Echter als je de vele foto’s bekijkt, zijn het juist de vele foutjes die het concept interessant en leerzaam maken omdat hiermee duidelijk wordt dat het soms helemaal niet zo eenduidig is wat de relaties tussen objecten zijn.

In de wereld van de GWW moeten we vaak vragen beantwoorden als: Is een lantaarnpaal nu onderdeel van een wegsysteem, of is het onderdeel van het systeem “openbare verlichting”? Of generieker:

  • Wat is het wegsysteem eigenlijk?
  • Waar ligt de grens?
  • Welke onderdelen zijn wel en geen onderdeel van dat (weg)systeem?
  • Welke systemen zijn onderdeel van elkaar en welke systemen staan ‘naast’ elkaar?

De oplossing ligt vaak in de doelstelling van de analyse, maar zijn zeker niet altijd eenduidig.

Computersystemen kunnen nog geen rekening houden met doelstellingen van analyses, maar toch is het leuk om te zien.

%d bloggers like this: