到目前为止,在语言学习方面最广泛使用的语料库是COCA (the Corpus of Contemporary American
English)。COCA是唯一一个庞大、新近且体裁均衡的语料库。拥有体裁均衡的语料库是极为重要的,因为语言学习者常常不知道一个单词或短语在母语者听来是否过于正式或非正式。如果他们在用英语进行书面或口语表达时,错误地使用了这个单词或短语,就可能听上去很奇怪。
举两个简单的例子,学习者可能在学术论文里使用如a lot of NOUN这样的单词或者短语(这个语境下最好使用several NOUN),或者他们可能在和朋友对话时使用seldom,虽然这个词在母语者听来不仅过时而且过于正式。同样地,一个单词的意思和用法在不同体裁中有很大区别,比如chair或者chain在小说和学术英语里的搭配词(临近的单词)。
许多语言学习者能从单词或短语的多模式信息中获益,比如发音、图像、视频和对应他们母语的翻译。English-Corpora.org拥有唯一能连接到如此多种类的外部资源的语料库,而且它在很多方面都十分有用。当你浏览一个单词的"语境中关键词"Keyword in Context (KWIC)时,只需点击一下,即可获得各种各样的资源,它们能帮你找到那些你可能不认识的单词的相关信息。