主页 > 医学前沿 >

【Science】文化组学

这个时代是一个组学的时代,现在哈佛大学分析了1800-2000年以前4%的图书,提出了文化组学

Quantitative Analysis of Culture Using Millions of Digitized Books
http://www.sciencemag.org/content/early/2010/12/15/science.1199644

Michel JB, Shen YK, Aiden AP, Veres A, Gray MK; The Google Books Team, Pickett JP, Hoiberg D, Clancy D, Norvig P, Orwant J, Pinker S, Nowak MA, Aiden EL. 2010. Quantitative Analysis of Culture Using Millions of Digitized Books.Science. 2010 Dec 16. [Epub ahead of print]
http://www.ncbi.nlm.nih.gov/pubmed/21163965


We constructed a corpus of digitized texts containing about 4% of all books ever printed. Analysis of this corpus enables us to investigate cultural trends quantitatively. We survey the vast terrain of "culturomics", focusing on linguistic and cultural phenomena that were reflected in the English language between 1800 and 2000. We show how this approach can provide insights about fields as diverse as lexicography, the evolution of grammar, collective memory, the adoption of technology, the pursuit of fame, censorship, and historical epidemiology. "Culturomics" extends the boundaries of rigorous quantitative inquiry to a wide array of new phenomena spanning the social sciences and the humanities.

CFS.pdf (1594.25k) 在线查看 上文附件

CFS1.pdf (2723.03k) 在线查看 Google为文化研究开放数字版图书
http://www.sciencemag.org/content/330/6011/1600.full

CFS2.pdf (180.0k) 在线查看 数码化书籍开拓了“文化经济学”的领域
http://www.sciencemagchina.cn/highlights101217.aspx

书籍是我们文化基因重要的一部分,也是我们一代又一代传递下去的信息。"文化经济学"以量化来研究人类文化的演化,如此例,以书籍作为前代的一个"化石记录"。在这里,我们以视觉方式来表示在当代英文书籍出现的单词,每单词的大小是其在出版书籍中出现的频率。

想象一下一个人如果阅读每一本出版过的书究竟可以获取多少资讯。 尽管要读那样多的书对任何一个人都是不可能的,一组研究人员已经将519万5769册书数码化(这大约占所有出版过的书总量的4%),而他们的计算分析为人们描绘出了一个相当生动的有关世界在过去的数百年中是如何变化的画面。 Jean-Baptiste Michel及其同事将这一实验称作“文化经济学”。

他们说,他们的研究可为形形色色的领域提供资讯,这些领域包括语法的演化、集体的记忆、技术的采纳、对名声的追求、审查制度的效果以及历史流行病学等——在此仅略举一二。 这一研究组的成员选择将焦点放在1800-2000年间的英语语言的变化上。 他们追踪的有文化变迁,如战争和奴隶制,是如何与语言学的变化--或者说我们用来描绘这些文化变迁的字词的变化--联系在一起的。 Michel及其同事所分析的英语字比如何字典中所含的字都要多;他们发现某些字随着时间从我们的词汇表中消失了,而另外有些字则慢慢变得流行起来。

他们通过测定某人名字的出现频率来追踪一个人的名声,他们确认,人们现在要比以前任何时候都更加出名,但他们也比 过去任何时候都更快地被人忘却。 同样地,通过分析字词和名字在不同时期在世界不同地区的出现情况,研究人员能够发现镇压的模式(例如,在***德国),并显示了在将来可用来快速发现审查制 度受害者的策略。 最后,Michel及其同事猜测,类似的文化经济学调查可披露疾病、内战、性别斗争、饮食、科学与宗教的趋势 —— 同样地,这也只是略举一二而已。 在组学时代,下面的研究还采用原始的研究方法!

遴选文化符号不能漠视大众标准
http://nf.nfdaily.cn/nfdsb/content/2011-01/05/content_19019358.htm

阅读本文的人还阅读:

Science上去年5月关于RNA

【bio-news】大家看看sci

作者:admin@医学,生命科学    2011-01-05 11:42
医学,生命科学网