Das Projekt Wortschatz Leipzig / Deutscher Wortschatz (bzw. dessen internationale Ausprägung "Leipzig Corpora Collection") sammelt regelmäßig (meist jährlich) frei verfügbare Dokumente im Internet und bereitet diese auf. Das Ergebnis sind korpusbasierte Wörterbücher und Korpora für über 250 Sprachen, in denen zu jedem Wort statistische Angaben, Beispielsätze und Links zu verwandten Wörtern enthalten sind. Das Angebot zählt zu den umfangreichsten Informationssystemen zur deutschen Sprache und stellt für viele weitere Sprachen die jeweils größten frei verfügbaren Datenmengen bereit.