Islandske korpusser

Ud fra samarbejdet med Uwe Quasthoff opstod ideen om et islandsk korpus, ”Íslenskur orðasjóður”, på internettet, tilsvarende den tyske ”Deutscher Wortschatz”. Den islandske ”Wortschatz”, der har det islandske universitetsbiblioteks internetarkiv fra efteråret 2005 som tekstgrundlag, indeholder i alt 14.581.297 sætninger, 238.395.162 tekstord og 4.010.065 forskellige ordformer.