LCMC语料库是一个100万词次(按每1.6个汉字对应一个英文单词折算)的现代汉语书面语通用型平衡语料库。起先建立时,它是作为英国经社研究委员会资助项目Contrasting Tense and Aspect in English and Chinese的部分成果。肖忠华最初的设想是要将其建成同FLOB和FROWN对应的现代汉语语料库。筹建这样的一个语料库的另一个动因是:尽管已经有很多汉语语料库存在,但却没有一个完全免费对公众开放的平衡的汉语语料库
对朗文常用词汇3000进行了进一步的排序:
1.分别单列出“口语”中最常使用的前1000,2000,3000的单词,每部分进一步按书面语的词频排序。
2.对于在口语词汇中未出现的,书面语中的前1000,2000,3000的剩余单词,也随后列出。
往往越基本的词汇词义越多,使用也更灵活,当然也最重要,让我们把最多的时间花在最重要的单词上。
百度 yuxiangdui
注:
S = Spoken English W = Written English
1,2,3分别表示词频前1000,2000