020-82510583
优登生物
广东省广州市番禺区福龙路999号钻汇大厦5楼
kefu@ydsci.cn
本文摘编自加菲尔德博士在中科院所做报告的记录稿,大家对于加菲尔德博士这个名字可能没怎么听说过,但是你一定听说过SCI,加菲尔德博士在1963年建立了世界著名的科学引文索引SCI数据库,随后又建立了社会科学引文索引SSCI和艺术与人文引文索引A&HCI,在回答中谈了一些他对SCI应用的看法。
主持人:老师们,同学们早上好!非常欢迎大家来到现场参加这次与“SCI之父”加菲尔德博士面对面的活动。
今天的活动将采取比较特别的形式,加菲尔德博士将坐在这里与大家分享SCI的诞生以及过去半个世纪里的发展,并从他个人的角度来谈一谈SCI在世界科研以及中国科研发展中扮演的角色。加菲尔德博士还将谈到文献情报学和科研评价的一些新发展和新趋势,以及对这些发展和趋势的看法。比如大家都非常关心,现在很流行的H指数。
我们第二部分时间是留给现场观众提问的,希望到场的老师和同学们充分利用这个机会。因为加菲尔德博士虽然曾经来过中国,但是面对这么多的老师和同学还是第一次。
加菲尔德博士简介
“SCI之父”加菲尔德博士(Dr. Eugene Garfield)是美国著名的情报学家和科学计量学家,美国科学信息研究所(Institute for Scientific Information, 简称ISI,现为汤森路透科技集团)的创始人及汤森路透科技集团的终身名誉董事长。加菲尔德博士于1963年建立了世界著名的科学引文索引(Science Citation Index,简称SCI)数据库,随后又建立了社会科学引文索引(Social Sciences Citation Index,简称SSCI)和艺术与人文引文索引(Arts & Humanities Citation Index,简称A&HCI)。加菲尔德博士是美国信息科学与技术学会的前任主席,Annual Reviews的常务理事和Research! America的常务理事,他同时还担任The Scientist期刊的总裁。他研制的引文索引不仅开创了一种新的检索途径,增加了一种新的检索工具,而且为文献计量学、科学计量学等学科的发展开辟了道路。
下面由我先向加菲尔德博士提几个问题:
主持人:老师和同学们非常关心的一个问题是,50年前利用引文进行科学文献检索这个思路是如何诞生的?这在当时是非常超前的,您能不能简单回顾一下,您当时是怎么想到这种新的检索方式的?
加菲尔德博士:最早的时候我在1951-1953年之间参加了一个大学的项目,主要是做信息检索方面的研究,那时候信息检索的研究就相当于我们今天所说的网络搜索引擎。但当时这个系统非常不好用。在当时,新的文章发表之后出现在检索工具里要三年之后,非常滞后,我们针对这个问题想发明一个更好的检索系统,这个检索系统主要面向医学的问题。我们主要研究的对象是综述性的期刊。当时我们发现,在法律系统当中做一些案子,律师说这个人有没有罪的时候会引用之前的类似案例。所以从中我得到了一个很好的启示,一个问题的来龙去脉可以通过这种文件之间引证和被引证之间的关系呈现出来。而几十年前所流行的却是可控词检索,即叙词检索,学医学的人都知道PubMed中的叙词表。1954年我去图书馆系又进修了一个学位,在这个期间基于引文的理念对引文进行了深入地探索,做出了一个专业的检索系统。最后基于整体的引文索引的文章发表在1955年。我要强调的是到今天SCI的主要作用仍然是一个文献检索工具,而评估科技研究成果只是SCI的衍生功能之一。今天除了基于SCI的科学引文索引数据库外,还有很多基于引文的分析型数据库,这些具有深入分析性的评估数据库,在某种意义上具有评估研究影响力的作用,但是永远要记住SCI它的主要功能是用于检索的。
主持人:SCI的影响是非常大的,您能不能谈一下在科学研究过程中它扮演的角色是什么?
加菲尔德博士:我刚才已经说过它是一个检索工具,科研工作人员利用这个检索工具的主要目的是什么?主要是在你的学科范围当中做一些对过去重要文件的检索和回顾。大家知道我们如果在期刊上发表文章,期刊要求这篇文章一定是创新的,是没有人做过的。那就应该要检索,证明这个文章是没有做过而且是创新的,包括做一些文献综述。现在一些人在文献检索这方面太懒惰了,做了实验赶快就发表,但是没有给期刊编辑、给自己一个很好的依据——过去的研究做到了什么程度?我在过去研究之上又有哪些创新性?在专利问题上,如果没有创新性就不具有专利性。SCI数据库提供了一个非常好的文献资源帮助科研人员检索文献,撰写完整的文献综述。
主持人:您在1955年发表的那篇重要论文代表了文献情报学的一个里程碑。现在已经过去了半个多世纪,请问最近几年文献检索方面有什么新的进展和新的趋势,您对这些新进展和新趋势有什么看法?
加菲尔德博士:1955我写那篇文章的时候,只是一个像建议书的文章,一直到10年之后才发展成SCI检索工具,大家真正能看得到利用起来的这个检索工具,就是今天熟知的的引文索引SCI。我写完这个论文后的几年里关于引文索引的进展都不是很大。后来当时有一个诺贝尔化学奖的得主给我写信,他的亲笔信现在在我的网站上还可以看到,信上说,“加菲尔德博士,我看到了你1955年发表的文章,现在已经是1958年了,几年过去了,我为什么没有看到你的引文索引呢?”当时我还跟美国的一些学会联系过,让他们帮助赞助,但是当时被拒绝了。还是这位诺贝尔奖得主赞助我继续研究的。到出版的时候又出现了问题,我的东西被拒绝出版,当时是扔掉,还是出版出来做一个很好的检索工具呢,我犹豫了一阵子,最后我决定自己成立小公司,就是ISI。当时非常冒险把这个SCI出版出来。大家还要记住SCI的成功不仅仅是SCI一个检索工具,而且还源于像图书馆老师特别熟悉的,很多科研工作者也知道的工具Current Contents。当时新期刊出版不可能很快拿到,我们就把各个学科集合在一起,集合各个学科就是一个检索工具。我到中国的时候,发现有很多的盗版,而这些盗版发现比美国的正版都做得好,其实我并不在乎,因为盗版是对我的最大恭维。关于引文索引的论文发表几年之后,到1964年正式出版引文索引SCI,当时美国的图书馆还不接受它,因为当时比较保守。经过好多年之后,大家开始慢慢熟识SCI这个检索工具,也开始认可它。
最早的SCI只是用手工打印的,到后来稍稍有了一些改进,用磁带,通过检索联系到SCI的检索部分,到最后又把SCI放到光盘上。当时我就提出这是很大的突破,检索就更容易,现在只需要几秒钟,过去则要用很长时间。所以计算机的发展推动了引文索引的发展。大家应该特别注意相关记录,检索到一篇文章之后,这篇文章后面有这篇文章引用了哪些文章,这些文章还被哪些人引用过。大家一定要参考相关记录,它可以帮助你找到领域中跟你的研究最相关的一些文献。
主持人:今天来到现场有很多各个研究所和大学学报的老师,还有一些出版社的老师,所以我想替他们问一个问题。中国讲打造高水平的学术期刊已经讲了好几年,现在公认的是还有很大的差距,您能不能谈一下中国期刊现在离国际一流的高水平期刊还有多远,能不能给一个综合的评价?
加菲尔德博士:这个问题我要想一下,因为我并不经常读中国的期刊。不过至少我读过一本中国期刊《中国科学》,那还是在60年代,我从这个期刊当中了解到一些中国的科研,特别是胰岛素的合成。不过现在我并不读中国的期刊,哪怕中国出的英文期刊。但是在我看别的发达国家的期刊时,看到中国作者发表了很多文章,我发现现在中国把最好的文章都发表在国外的期刊上,这个是没有办法控制的。因为大家都想把文章发表在著名国际期刊上,大家都把科研成果公布在国际化、有很高影响力的期刊上。
一个期刊想成为国际期刊的话,一定要有好的文章。好的文章是什么?一定要是原创型的文章,现在中国期刊所面临的问题是没有吸引到这些最好的作者和最好的科学研究发表在中国本土的期刊上。但是中国本身,中国科研工作者本身并不缺乏创新型的思想,只是我们把这些研究成果发表在其他一些期刊上,所以区域性的期刊包括本土性的期刊影响力就不像国际期刊影响力那么高。你们最主要是要吸引最好的科研工作的成果发表在期刊上。这个问题不止在中国一个地区、一个国家发生,比如在日本,大家也是把好的论文发表在国际上,被整个国际共同体认可的期刊上。再重述一下,在谈到国际期刊的时候,一定要吸引最好的论文。很多国外期刊的拒稿率是很高的,不是投了什么我都发表。还有就是你投到这个最好的期刊上被拒绝,但是不代表你这篇文章最后发表不了。你可以发表在比著名期刊再低一些的期刊上。
我有一些文章是关于对于诺贝尔奖得主或者诺贝尔级别的科学家的检索统计结果,可以在我的网站上看到。每年只有少数诺贝尔获奖者,但是提名有很多,他们有一个共性,就是他们发表文章的篇数并不是很多,但是引文频次是普通科学家引文的30-50倍。高影响力科学家的贡献是什么?这些科学家发表的重要文章叫经典引文。每一个诺贝尔奖得主都会发表几篇这样的经典引文。
我做过一些专访性的评论文章,对这些高引文的作者进行采访,也都在我们网站上。这些诺贝尔奖得主也好,获得提名的科学家也好,他们在性格上有一些共性,就是永不言弃、坚韧不拔,非常坚持自己的观点。科学家一般都是比较保守的,总是持怀疑态度,当一个新东西出现的时候是不容易被其他科学家接受的。所以作为科学家要经常发表你的论文,要在共同体中有你的声音,要经常到处演讲、到处宣讲,这样才能被大家所接受。
主持人:您刚才提到对诺贝尔奖获得者的引文统计,您有没有想过通过这样一种方法预测诺贝奖?
加菲尔德博士:这个事情其实我们已经讲了四十多年了,也想到过怎么才能预测诺贝尔奖。其实我们不能够预测,预测是非常精确地指出就是这个人,这个课题一定能得奖,这样肯定的叫预测,但是我们只能是预报或预想,总之不可能那么精确地预测。如果你知道今年的诺贝尔奖评选委员会给哪一个领域发奖的话,就容易预测得多,因为哪个领域里谁做得最好是比较容易找到的,但是没有人知道诺贝尔奖的具体评选过程是怎么样的,也不知道今年他们会把奖颁给哪个领域,所以真的很难预测。我在过去几十年当中做了很多统计预测方面的工作,就是用引文分析发现了很多高被引论文,这些都是有可能得奖的。一篇文章发表后如果在3-6个月之内得到非常多的关注,评价非常高的话,这个就会被成为经典引文,这样一些论文都有可能成为诺贝尔奖候选论文之一。
在我的合作者和我共同做的研究当中,经济学领域预测诺贝尔奖还是比较准确的,因为在经济学当中如果不大量的发表文章,如果没有得到大量点评引用是无法被承认的,因此经济学是一个特殊的领域。
主持人:刚才您也谈到到这么多年来在SCI发展当中产生了一些衍生品,比如现在流行的影响因子被应用到评价科技期刊,还有对个人的评价,比如H指数,能不能请您谈一下对这些评价工具有什么看法?您是很乐意看到这种现象,还是有其他的想法?
加菲尔德博士:首先谈谈H指数。这个H指数从产生到现在已经有5到6年的时间,讨论它的文章有很多,为什么它这么受欢迎呢?一个原因就是你非常容易能够得到个人或者其他人的H指数,但是它用来评价个人却不很准确,首先要看作者的名字是不是完整或者准确。其次,应该把这个作者放到他的小领域中去排名,看他的位置百分比是多少,是在顶尖的1%,还是平均水平,等等。其实H指数能代表的结果跟我30多年来所研究的其他指标是相关的,比如某个人的总的被引频次。H指数不很准确但是非常快,不是非常理想的指标。但是基于H指数有很多修正性的H指数更准确一些。期刊影响因子是一个非常好的指数来评估期刊。但是大家还是要牢牢记住,文章即使发表在影响因子很高的期刊上也并不能保证获得很好的引文量。一本期刊中有少数论文的引用量非常高,但是有大量的文章引用量很少或者根本没有被引用。所以用影响因子来评估某一个人的论文是不合理的,但是可以来评估一个期刊的影响力。
现场的老师和同学提问:
祖广安(中国自然科学基金委员会科学基金杂志部执行主任):非常荣幸能够见到加菲尔德博士,我在自然基金委期刊部工作,很早对您就仰慕。我们接触到SCI是从1996年开始,就是和汤森路透科技与医疗集团的一些人员交往,后来每年都有一些来往,不光是我们基金委,还有国内其他基金委员会都收益很大。
我说一下SCI引进来对我们工作的一些帮助,同时也提出一些问题。在帮助方面,我们每年也资助一些中国的期刊,我们在选刊的时候,主要用总引用频次做评估,而不是影响因子,这是借鉴了SCI的引用数据。另外引进SCI期刊对中国也很有帮助,对中国期刊的国际化很有帮助。国际期刊怎么做?关于国际期刊很多人都很困惑,尤其在20、30年前。70年代中国有个电视剧叫《编辑部的故事》,剪剪贴贴就发表了,过去办刊就是这么做,但是看了SCI之后就知道怎么做、怎么办了。虽然对SCI有不同的看法,但对我来说毕竟是走向国际化的思路。
第二个,基金委在选择和筛选人才方面,SCI的数据库给我们很大帮助。起码能把这些人的情况放在我们这儿,最后怎么决定是另外的问题,这是一个帮助。再后来经过跟SCI的一些员工交流,增加了一个自引率的数据,这对中国科学的健康发展来说起到一个很大的帮助。
加菲尔德博士:谢谢。
祖广安:自从SCI进入国内,国内对SCI的褒贬就不一。最大的问题是在前十年,国内很多高校研究所评价研究人员的业绩时,就是用SCI的文章发表数量来进行奖励。中科院发育所有的同志就跟我说,他们是以影响因子算奖金的,影响因子是1就是1000元,《自然》、《科学》的影响因子是30多就是3万多元。在北大的黑板上我也看到过给SCI的文章给予奖励,奖励不等。不管怎么说,国家自己没有评价标准的情况下,SCI算一把尺子,当然怎么用是各个研究所自己的问题。
我现在再提出几个问题。就是SCI是非常定量地做工作,比较严谨,但是这是不是也可能产生问题?我举一个例子,《自然》上前些年发表了人类基因组测序的文章,这是一个比较典型的多作者文章。当时这个文章轰动国际,有200多个专家研究组都在里面,当时大家也比较关注。但是两年之后,SCI和《自然》分别统计这篇文章的引用时,结果《自然》统计的数跟SCI差很大,当然《自然》也对SCI进行了攻击,SCI也进行了辩驳。另外我们以中国为例,每年有些人不遗余力发表SCI文章,就是为发表而发表。我们每年在SCI上面发表文章最多的人,实际上并不是在这个领域最优秀的人,他们的学术水平并不是很高,他们这些人是为发表文章而发表文章,而这些人并不代表真正的中国的最高水平。
还有一点,有些进入SCI的中国期刊有两个名字,比如一个是英文的,一个是拼音的,结果SCI就把它当作两个刊物来统计引用量,本来中国期刊的引用量就比较低,再这么一分散,影响因子就更低了。我们提出你们应该给每个期刊一个编号,就好象书都以ISBN为编号,论文都已DOI为编号一样,这样就不会搞混了。用期刊的名字很有问题。今后SCI还有一些需要改进和完善的地方。
加菲尔德博士:您提的这些问题,我可以帮助传递给汤森路透科技与医疗集团,但是理论上ISI我已经不负责任了,20年前我就把它卖给汤森路透科技与医疗集团了。但是我可以向汤森路透科技与医疗集团转达来中国听到的这些情况。我建议在座的各位如果遇到同样的问题,发现一些差错的话尽快跟汤森路透科技与医疗集团联系,请不要迟疑,相信问题一定会解决。
但是SCI背后的机制是没有问题的,只是凡是数据库,凡是有人参与的,都多多少少有一定的错误和误差,这个是可以理解的。刚才有老师提出建议,比如期刊有两个刊名一起使用,那在期刊入选SCI的时候就要跟SCI强调,作者在发表论文的时候,在之后列出参考文献的时候,有时候不用英文名字而是用汉语拼音,这时候要告诉SCI用两个名字可能会比较混乱。如果大家都来控制这种误差,一起来做这个工作,一定会做好的。
至于利用期刊影响因子来评估个人,还有给科研人员压力、给科研人员奖励的问题。首先大家要意识到一点,尽管这篇文章发表在很好的期刊上,比如《自然》、《科学》,它可能永远没被人引用过,而这些期刊上很多一般的文章也只被引用过几次,而只有少数文章引用是特别多的。所以引用期刊影响因子来评估每个人的科研表现和科研能力,包括他个人的评估、奖金也好、赞助也好都是不合理的。大连下星期一有一个文献计量学方面的国际会议,我会给一个关于学术评估的演讲。用一个百分比排序的指数。这个指数指得是你在某一个领域当中,如果要评估你个人成就、论文表现影响力,首先你得跟同领域的对比,不能跨学科比。所以这个是基于某一个学科发表在某一年的论文,然后从高到低进行一个排序。从单篇影响力跟这个学科同年的论文的影响力比较,是排在1%或者是5%。
把作者发表在各个小学科的论文一起拿来做评估是不准确的,要评估一个人,要在同一个领域当中评估,要集中在小的领域当中。这其实不是今天存在的问题,这个问题已经很老了,在40多年前已经开始了。美国大学的管理人员、校长,他们在评估大学的老师能不能得到终身教职的时候就碰到过这个问题。比如你在大学工作六年了,给不给你终身职位?所以评估一个人能不能拿到终身职位的时候,也会利用SCI数据库来作为评估的标准,但是严格的来说这个标准不能评估个人的研究。首先你要划出一组你的同行,你的领域,不能不划出一个领域来,就说你的影响是什么。要集中在一个学科当中,看你在这个学科当中的位置是什么?这样才能辅助你合理地利用这个工具,做出比较有根据的评估。
记者:其实对SCI这些年可以说中国科学界非常重视,甚至可以说有点爱恨交加,特别是这些年SCI的利弊在中国讨论非常多,因为现在在中国已经成为一个基本的科学评价指标。比如有一个项目书,就写着项目的目标是要在五年内发表150篇文章。很多课题都写着要多少篇SCI文章。中国研究生要毕业的话要发表几篇SCI文章才能毕业。以至于有的中国研究生都把它叫做Stupid Chinese Idea。作为“SCI之父”您觉得怎么样理性看待SCI的体系,怎么样才是科学和合理的?
第二个问题,您刚才讲到在不同的领域,影响因子是不一样的。应该计算不同领域科学家的排位,这样一套算法实现起来是不是很复杂?
加菲尔德博士:百分比排序是不是很复杂?一点都不复杂,这个理念五年前就提出来了,有一篇文章。而且下一周在大连我会重复这个原则,一点也不复杂,大家可以随意来应用它。问题是现在很多科研管理者很懒惰,就希望一个数字能解决所有的评价问题——单独给我们一个数字,快但不合理。比如在美国,评估老师是不是能成为终身教授的时候,理想的情况是,已经成为终身教授的这些人坐在一起,把这位老师的论文拿来一篇一篇的读,他到底是好的还是不好的?是要经过同行来评议的。但是现在老师们包括我的一些朋友都会说,我太忙了,我没有时间。所以在这种情况下要一个量化的指数,而且不是多个而是一个。现在中国评估的标准非常像35年前意大利的情况,因为在30多年前意大利有政治斗争,人际关系不好平衡,当时政府说把SCI拿来,因为它是一个国际标准数据库,用它来评估我们科研人员。在世界上许多国家也是这样做。但是它并不合理。评估人也好、评估期刊也好,有很多不同指标,包括我下周在大连要提的那个指标,很多管理人员要求是一个,快的,很多人拿一把尺子就衡量,这样是不对的,我们要有综合的评估指标。
针对你刚才的问题,研究生发表几篇SCI文章才能毕业,我想要看是哪个大学?研究生、博士生发表论文在美国是很普遍的,研究生在美国经常是先发表论文,把论文作为博士论文的一部分发表出来,这是很普遍的,但是你真正说要怎么评估这篇论文的水平呢?你光看SCI收录没有意义,因为被收录的有影响力大的期刊,还有影响力低的期刊,而且尽管你发表在影响力大的期刊上,有没有被引用呢?所以这要看发表之后三到五年被引用的次数是多少。但是不可能等到学生毕业两到三年再给成绩啊。所以发表论文是不是强制性的,这确实要看你具体的学校和领域,并不是完全不合理,因为这在西方是很普遍的、合理的,博士生就是要发表论文。
以前有本书已经提到过这个讨论。我来举一个例子,比如明年有100篇论文在SCI上面发表,可能说有50%的作者以后肯定不会再发表。因为这50%的人就是拿个博士学位,因为他毕业要发表一些论文,然后等学习合格了走上社会找到合适的工作,这个工作不一定是搞研究,不一定是搞学问,可能是其他的工作,这样就不用写论文了。所以这个问题你要怎么看。你非得强制这个学生在博士生毕业的时候要发表SCI的论文,这是不是不太合理呢?但是如果学校想提高学生的质量,博士生的质量,发表一篇SCI的文章总比你什么都不发表要好。归根到底还是要看是哪个大学。当然这个标准在中国合适不合适,怎样算合适,那还需要中国自己来做决定。
希望你们有机会参加大连的会议,我可以介绍我在百分比排序方面研究的合作者给大家认识,你们可以再邀请这位专家来北京告诉您是怎么做的。我的这位合作者非常了解统计方面的理论、数学方面的一些原理,所以欢迎大家跟他研讨。
祖广安:刚才我提到对科研人员的奖励,那时候为了鼓励大家在国外发表文章,有用影响因子来奖励的这种政策。后来我们国内也改变了,也使用引用频次等其他指标,而且现在科研人员的待遇大幅度提高,一些高级研究员都能达到20、30万年薪,高的时候能达到百万,这时候对文章进行奖励的情况已经是过去的事了。所以我刚才说的是十多年前SCI吵得最凶的情况,而不是目前。这个我要澄清一下,免得您带着对中国的错误印象离开中国。
同学:加菲尔德博士您好,我是来自科学员的一名研一的硕士研究生。我的第一个问题是在学习一门学科和研究一个问题的时候,非常想了解这个学科的研究历程和未来的发展方向,我想问一下SCI这个数据库除了提供一些引用频率较高的文献之外,怎么能够掌握一门学科的发展历史和现状,还有研究方向?
第二个问题,加菲尔德博士提到SCI文献,而传统的图书馆也提供文献索引的功能。想问加菲尔德博士SCI和图书馆之间的关系。随着SCI的发展壮大,有没有一天会完全取代图书馆?谢谢您!
加菲尔德博士:先回答你的第二个问题,SCI能不能取代图书馆?答案是不能。为什么不能?因为SCI是二次文献库,也就是它包括了很多期刊、论文,它提供信息,但并不是全文,所以还是需要全文库,SCI只是一个工具让你找到更多的文献和论文,接下来要找全文,全文在哪里?在图书馆,当然也可以在网络上。同时你还需要一些其他书籍,也在图书馆,图书馆还提供咨询服务。随着高速网和计算机的发展,实体图书馆的功能跟过去相比是减低了,只不过转变为另外一种工作方式,SCI不能取代图书馆的服务。
第一个问题。你怎么了解学科发展的历史、趋势?热点问题在哪里?你应该试用一下我这些年开发的一个软件,叫做Histcite。我从1964年就开始做了。你要研究一个课题的时候,首先要知道这个领域当中的一些著作也好,文章也好,就是核心的论文,也就是我们常常说高被引论文、划时代的论文,你把它作为起点。在数据库中,看这篇文章引用了哪些文章,这篇文章发表之后又被哪些文章引用,就是查新和查旧两个方向都要查。还有我前面提到过相关记录,这都是扩展完善文献的一个基础。你把这些文章输入进去后,就形成一个文献网和图表会告诉你特定时期关于这个课题的论文呈现在什么地方。它是免费试用的,在我的网站上可以找到,www.histcite.com.
主持人:好的,今天的提问就结束了,让我们以热烈的掌声感谢加菲尔德博士精彩的演讲,也感谢岳卫平博士非常精彩的翻译。
本文摘编自加菲尔德博士2009年在中科院所做报告的记录稿。
译者:岳卫平,汤森路透集团中国区首席科学家
来源:科学网