经济学原理

2016年全年经济学人超3百万词汇词


Simon

《纽约时报》和《经济学人》都是绝佳的英语学习资料。我在上周发表了年全年《纽约时报》超5千万单词词频统计(附高频词下载)后,很多朋友都非常开心,其中很多人留言要求《经济学人》的高频词资源。我手头刚好也有去年全年的《TheEconomist》资源,统计起来也不算麻烦。

1,

不同于《纽约时报》的每日出版,《经济学人》是周刊,年一共出版了52期,同样的方法,我将这52期期刊全部转成TXT文档,然后直接做词频统计,结果如下图:

TE在去年全年一共产出了个单词,其中不重复的词汇为个。严格意义上来讲,不重复单词数要更低一些,因为这里将单词的不同形式分开计算,比如apple和apples是被当成两个不同的单词的。

在这份包含个单词的表单中,高频词集中了大部分虚词,它们很大一部分在原文中是在短语中存在的,排名前20名的单词和《纽约时报》相似。另一方面,《经济学人》低频词所占比率远远高于《纽约时报》,这份表单2/3的词汇出现频率在5次以下,将这部分低频词删除之后,词汇量锐减为个。不知道这是不是也印证了《经济学人》更喜欢用生僻词的普遍印象。

同样地,自己写程序用有道词典API导入解释,如图:

这份单词表保留了所有词频大于5的单词,一共个词汇。经过热心网友的验证,你可以将此词汇表导入有道词典,然后在手机上记忆,具体教程可以参见上一篇帖子。

2,

刚才提到,高频词汇表中最前面的主要都是虚词,这其中很大一部分组成了短语,包括介词短语和动词短语,这也部分解释了为什么词频表前20名中有相当多介词出现。这些短语在功能上往往等同于动词,而且使用频率,重复度极其高。但由于词频统计将这些短语拆分成独立的单词进行统计,所以词频表无法反应出高频短语的使用情况。

介于此,我将排名前20位中的介词逐一取出,然后查找各个介词的常用搭配(collocations),按照出现的次数排序。以on为例,下图显示了它和accord作为常用搭配在《经济学人》中的所有句子,表格的最前是和on最常见的固定搭配,按照次常见度排序。如此一来,你就可以通过阅读例句更加直观地学习短语。

我总结了前20名中的6个介词,包括

年的一件大事当属美国选举,在竞选最如火如荼的时候,川普和希拉里也几乎霸占了全世界媒体的版面。我以川普和希拉里作为关键词,分别统计了围绕在这两个名字所出现的最高频率的词汇(忽略了无实意的词汇),这从某个侧面也能反映出《经济学人》的







































北京治疗白癜风一次多少钱
白癜风怎样快速治疗



转载请注明:http://www.deudeguo.com/jykb/422.html


当前时间: