比特币、盗版、黑客技术:深度揭秘Sci-Hub背后的论文出版江湖

  • A+
所属分类:学术文献 科研助手

翻译 | AI科技大本营(rgznai100)

参与 | 顾洪美

编辑 | 波波

【AI科技大本营导读】做AI离不开学术论文,特别是离不开刷arXiv。arXiv预印版的论文甚至还直接引爆了Yoav Goldberg和Yann LeCun去年那场轰动性的深度学习大论战:一方指责arXiv论文简直就是学术领域的“跑马圈地”;另一方则反驳说“跑马圈地”的论文也不是完全没有意义。

尽管arXiv论文只是未经过同行评审的预印版,但是没有它,深度学习领域如此火爆的学术交流几乎就不可能发生。因为arXiv之前,往往要花数十美金才能读到一篇论文,高高在上的付费墙就是这么霸道。钱,在任何时候都是阻碍学术交流的最大因素。这一点正是亚历珊德拉·艾尔巴金(Alexandra Elbakyan)创立Sci-Hub的原因。

毕竟预印版论文,大家自会直接打开arXiv;但正式发布的论文,往往是第一时间,大家是先去找到Sci-Hub的最新网址。根据《科学》杂志最新分析,Sci-Hub上包含了经过同行评审的所有正式论文的69%,可以满足研究人员99%的论文需求,因为其余没有上传的31%论文似乎大家都不怎么想看。

其中,世界学术出版巨头爱思唯尔(Elsevier)超过97%的论文均可通过Sci-Hub免费获取,这在2015年引发出一场针对Sci-Hub的诉讼,最终罚金高达1500万美元。但科学界的“海盗女王”并未就此屈服,作为一名信息安全专业出身的学生,艾尔巴金黑客意识超强,她不停地换网址、四处藏匿,并启用比特币来躲避监管。诉讼之后的重中之重,则是如何避免被美国法院引渡。

有人说这是赤裸裸的盗版行为,有人说这是推倒学术出版付费墙的起点。无论如何,这都是一场极为精彩的战斗。

比特币、盗版、黑客技术:深度揭秘Sci-Hub背后的论文出版江湖

6400万篇论文、13块硬盘,科学界“海盗女王”最初所盘踞的巢穴,只是俄罗斯高等经济学院的一间狭窄宿舍。与她同住的还有另外三名学生,以及一只来自喵星的主子。

艾尔巴金现在仍是一名学生,也是一位程序员。对于未来,她正酝酿各种不同的想法;平时,她还喜欢撰写神经系统科学方面的博客。

“你已经被起诉了。” 2015年6月,亚历珊德拉·艾尔巴金收到了这样一封来自Elsevier公司的邮件,它当今世界最大的学术出版巨头之一。没过多久,该公司又起诉了另一家盗版网站Library Genesis的管理人员。

比特币、盗版、黑客技术:深度揭秘Sci-Hub背后的论文出版江湖

艾尔巴金用俄语这样回忆:“当时被起诉时,我记得LibGen的管理员还跟我说过一句类似‘好吧……我们有大麻烦了’的话。我没法把它完美地翻译成英语,更贴切一点可能就是‘这可糟透了,我们要玩完了’。”

不过,即便收到了被起诉的邮件,艾尔巴金的表现依旧出人意料的淡定,她继续工作。毕竟诉讼是在美国,而她已经搬到了塔吉克斯坦。眼下,她还有很多更为紧迫的事情需要处理,比如:整理宗教研究项目的文件,在Kontakte(俄罗斯版的Facebook)上撰写言辞犀利的博文,参加线上的各种女权活动,以及创办一项在T恤衫上印染科学图案的sciencey-print业务,等等。

▌Sci-Hub就是要挑战黑心的学术出版业

世界领先的科技及医学出版公司爱思唯尔(Elsevier)拥有超过2500种期刊,覆盖科学研究中所有可能的领域。该巨头对于上述的Sci-Hub和LibGen这两个网站相当不满。因为每读一篇论文,读者们平均要向爱思唯尔支付31.50美元(约合200人民币)的费用,而他们通过这两个网站却可以免费获取到论文,这就断了学术出版巨头的财路。

2015年这场诉讼,使得艾尔巴金及其经营模式成为了全球的焦点。但该诉讼相当于一场免费的宣传,使Sci-Hub变得更加强大,并成为全球最大的学术资源开放获取网站。短短六年时间,Sci-Hub转身成为一个主宰者,在科研领域发挥着不可替代的作用:它所托管的6450万份论文,已经占到全球所有已发表论文的三分之二,任何人都可以免费获取。

不过,随着Sci-Hub越来越受欢迎,学术出版商却愈发感到焦灼,毕竟Sci-Hub是在直接断他们的财路。于是,出版商们开始激烈对抗盗版行为,他们还向互联网服务提供商(ISP)施压以监控读者们的隐私。除此之外,开放获取(Open Access)运动也成为他们的眼中钉,因为该运动提倡研究论文人人都可以免费获取,这明显是要砸他们的饭碗。

Sci-Hub为人们重新讨论学术研究到底归谁所有提供了一个契机,媒体、学术圈、互联网活动人士纷纷对此展开讨论,甚至就连出版商们也加入了进来。不过,英语世界的这场讨论唯独缺少了Sci-Hub创始人艾尔巴金的声音。媒体的头条新闻简单将她描述为女版“互联网之子(亚伦·斯沃茨,Aaron Swartz)”,径直忽略二者之间的重大差异。现在,尽管艾尔巴金处在互联网学术版权争论的风口浪尖,但大多数人就连她到底是谁都还不知道。

学术论文付费墙为何令人痛恨?

艾尔巴金说:“我第一次接触科学性文章的整理与分享工作是在2009年。”作为俄罗斯科学院的一名研究生,她遇到了全球所有学生都会遇到的障碍:付费。因为大多数的科学期刊,必须付费之后才能读到相关文章。况且,文章的价格越来越高。

要花多少钱?确切的数字很难算出来。根据美国研究型图书馆协会(ARL)的研究,图书馆期刊订阅的费用从1990年到2013年间仅增长了9%。但《图书馆杂志》的年度调查报告却指出,这只是因为ARL的数据收集方式发生了变化。《图书馆杂志》表示,期刊订阅费用“在现实中生活中正飞速上涨”。《图书馆杂志》的记录显示,美国化学期刊的年度订阅费用平均为4773美元;费用最便宜的订阅是普通科学期刊,每年只需花费1556美元。如此高昂的价格令大多数人都无法读到相应的研究成果,而那些原本能获取到相关期刊的机构,由于资金消耗越来越大,机构本身也越来越难地维持下去。 用《图书馆杂志》的话说,“过去20年来一直订阅期刊的人都清楚,图书馆预算膨胀的罪魁祸首就是期刊订阅价格的持续攀升。”

一般来说,各大高校学术期刊的订阅费用通常在50万至200万美元之间。即便是作为世界最富有的大学,哈佛大学也在2012年表示将无力承担期刊费用的持续上涨,特别是它的两家出版商6年内就把费用提高了145%。德国康斯坦茨大学在2014年便已放弃订阅爱思唯尔学术期刊,原因是其报价5年内上涨了30%。

比特币、盗版、黑客技术:深度揭秘Sci-Hub背后的论文出版江湖

因为版权在手,学术出版巨头们有恃无恐地认定,他们可以温水煮青蛙般地长期提价。据研究,目前全球超过半数的研究论文已被五大学术出版巨头所垄断:里德爱思唯尔集团(Reed-Elsevier)、英国布莱克威尔出版公司(Wiley-Blackwell)、施普林格出版社(Springer)、泰勒弗朗西斯集团(Taylor&Francis),第五家不是美国化学学会就是Sage出版社(基于不同的指标)。相比于此,1973年的前五大出版商所拥有的论文份额则仅为20%。这还只是自然科学和医学方面的学术出版恶化情况;社会科学方面的学术版权则恶化更甚。1973年,前十大文章中仅有一篇出自于五大出版商,而今这一比例早已过半了。而对有些领域,比如心理学,其71%的论文皆出自五大出版商之手。

与此同时,出版商的市值和利润也在大幅增长。以爱思唯尔母公司RELX集团为例,其市值为350亿美元,其中科学出版部门的利润率高达39%,与科技圈最赚钱的苹果差不多,远超利润率仅为3%的亚马逊。

如果你想访问收费墙背后的论文,合法读到它的唯一途径就是付费。哈佛大学开放获取项目(Open Access Project)的主管彼得·萨博(Peter Suber)这样表示。不过,其中也有一个灰色地带:你可以向作者索要副本。(大多数学者都会给你。)除了向作者索要副本或者免费拿到发表在开放获取期刊上的论文,另外一个不错的选择就是下载开放存取库的预印版论文,比如康奈尔大学的arXiv.org。

开放获取得人心

萨博是开放获取运动最大的鼓吹者之一。他是2002年布达佩斯开放获取倡议声明的原创设计师之一,该声明确立了开放获取概念中最受认可的定义:“公共互联网上的免费可获得性”,其中共享研究成果的唯一障碍在于作者“对其作品完整性及其认同权与引用权的控制”。此外,该声明还确立了开放获取运动的使命,即让公开获取平台成为未来十年内大众默认的文章发布方式。

如今,付费墙依旧高耸。但是,开放获取运动激励人们创造出了数以千计的开放获取型期刊,其中就包括PLOS(公共科学图书馆)。同时,该运动也促使许多出版商允许科学家们将研究成果上传至开放存取库(比如,目前开放获取论文最大的合法来源arXiv.org)。不得不说,这场运动非常成功,就连政府也表现出了支持的迹象。例如2013年,奥巴马政府就要求联邦政府机构所资助的一切研究,其副本必须在出版后的12个月内上传到免费存储库内。

比特币、盗版、黑客技术:深度揭秘Sci-Hub背后的论文出版江湖

许多像艾尔巴金这样的学生只会给某项研究报告的作者发送电子邮件,或者用#ICanHazPDF#标签在Twitter上发布文章信息,以此期待能有人发给他们一份免费的副本。诸如此类的方法,包括在arXiv上四下搜寻,往往包含太多的运气成分,未必真能帮到手头的研究。因此,当艾尔巴金面对着一道又一道的付费墙时,她不禁开始思考如何直接避开它们。

艾尔巴金树理想

艾尔巴金一直关注着开放获取运动,她自2008年以来就一直是MIT OpenCourseWare的忠实粉丝,该项目通过互联网开放了MIT的所有课程。除此之外,她也一直对神经科学,特别是对从神经学家转行作家的莫·康斯坦迪(Mo Costandi)(《卫报》神经哲学博客的长期负责人)的文章非常感兴趣。艾尔巴金确信,那些未曾开发出来的潜力就隐藏在人的大脑中。她特别喜欢“全球大脑”的想法,这是未来学家提出的一个想法,受到了神经科学的启发,即一个智能网络可以促进信息的存储和传输——实时驱动人与人之间的交流——神经元之间相互交织在一起,相辅相成,不断相互促进。

艾尔巴金说:“自那时起,我就开始思考脑机接口这样的概念,它能与人的头脑相连接,和计算机网络的连接方式一模一样。”她想知道的是,如果人的头脑可以跟鸟类的连接起来,我们是否真能体验到翱翔的感觉呢?

起初,这些只是哲学性思考。但接下来,神经接口促使人们以前所未有的速度共享信息,甚至跨越着语言的障碍,艾尔巴金对此深有感触。“后来,我将这个想法的内容进行了扩展,既包含能将人直接以神经元的形式相连接的硬接口,也包含诸如我们每天都在使用的对话类型的软接口。”相比于形式,艾尔巴金更加关心的是功能与作用:她想要的是一个全球性大脑。对她来说,付费墙似乎就像是阿茨海默症患者脑中的斑块,阻塞住了信息的流动。

她的灵感略带民族主义的倾向。艾尔巴金研究了诸多俄罗斯神经未来主义思想家的著作,包括弗拉基米尔·伊万诺维奇·韦尔纳茨基(Vladimir Ivanovich Vernadsky)等人。2011年,她曾试图创建一种俄语版的PLOS类型开放获取期刊,但未能吸引到足够多的科学家。随后,艾尔巴金甚至还向有着俄罗斯硅谷之称的斯科尔科沃创新中心提出过该申请。

比特币、盗版、黑客技术:深度揭秘Sci-Hub背后的论文出版江湖

可以说,政治理论为艾尔巴金不断演进的开放获取哲学提供了新的发展空间。共产主义是一种无政府社会模型,倡导以平等和公正的方式对资源和机会进行计量,最终却从未成功实施过。然而,这对艾尔巴金来说是一个特别诱人的概念。 共产主义的集体理想与科学方法的理想交织在了一起。毕竟,科学依赖于共享的数据。正如科学家们常说的那样,历史上最伟大的科学发现都站在巨人的肩膀上:科学界的前辈们不断分享着其丰富的研究成果。对于艾尔巴金来说,科学只有在科学家们毫无保留地贡献其研究成果时才会走向繁荣。

根据艾尔巴金的说法,共产主义和科学有着共同的使命,她将其称为“科学共产主义”。这是她从20世纪美国社会学家罗伯特·默顿(Robert Merton)那里借用的一个概念。罗伯特·默顿创立了科学社会学,将对科学的研究视为为一种社会实践。(默顿创造了诸如“自我实现预言”、“行为榜样”以及“非意图后果”等诸多有影响力的术语。)其中,对艾尔巴金影响最大的当属默顿的“规范”,他认为这是科学的决定性特征:普遍主义,无利害关系,有组织的怀疑主义,当然还有共产主义。(在采访中,她仍然很快地便引用到默顿的话,宣称:“在资本主义经济下,学术圈所崇尚的共产主义与技术圈的‘私有财产’定义是不相融和的。”)

艾尔巴金的科学共产主义理念反映了西方民主与信息开放之间的关系。她的知识信念提醒着艾尔巴金,坚持认为应当对大众实现完全不受限制的访问路径。最后,她总结说,在当今时代下,科学家可以直接借助互联网平台发布其研究成果,也可以通过无付费开放获取期刊进行发布,传统出版商不可避免地会走向衰落。

对于像艾尔巴金和萨博这样的开放获取运动的积极分子,由于大多数研究都是由政府出钱资助的,因此付费期刊基本上使大多数科学研究成为了二次付费产品,首先由纳税人付钱购买,其次再由科学家付钱购买。

学术论文应该免费

总体而言,科学出版已经成为一个日益固化,收费飙升,且利润率越来越大的市场。因此,许多科学家、学生以及新闻记者都认为学术盗版是一个必然会出现的问题。由此也引发着另外一个问题:出版商究竟为学术论文增加了什么价值?

理查德·万·诺登(Richard Van Noorden)在2013年曾在《自然》杂志上发表过一篇文章,探讨过这个问题,并且指出开放获取期刊会迅速崛起。开放获取期刊杂志在20世纪80年代末和90年代存在少量的数字化出版物。其中,许多资料均来自付费墙刊物,是科学家、企业家和编辑们共同努力的成果,他们受到开放获取运动的启发,创办了自己的出版物。在短短几十年的时间里,这些期刊上的资料占到了所有已发表研究(含有数字对象标识符)的28%。数字对象标识符在本质上是一种用于研究的URL。正如文章指出的那样,无论接受与否,许多开放获取的出版商会向科学家收取一定的费用——通常从几百美元到大约两千美元——用于处理文章。

相比之下,即使需要一定的文章处理费用,标准出版商一般情况下所要收取的费用也要少得多。作为回报,他们会寻找审稿人,检查剽窃情况,然后再进行编辑和排版,通常会添加某些图表图形,或者将文件转换为XML等标准格式,并添加一定的元数据。他们会对与研究有关的印刷品和数字格式的副本进行分类。通常,他们的新闻部门,尤其是有声望的期刊的新闻部门,运作机制十分良好。他们会发布通俗易懂的新闻稿,并帮助记者与专家取得联系,严格执行时滞期,媒体可以在该时滞期对研究进行审查并在其上线前拟好报道的内容,这会激励像The Verge这样的出版平台去报道更多的研究内容。

由于涉及的编辑、平面设计师和技术专家等人员庞大且耗资巨大,许多出版商也做原创新闻和评论。“但并不是每个出版商都会做同样的选择,不会都投入相同的精力或雇用那么多昂贵的专业人员,”万·诺登在《自然》杂志上的文章中写道:“例如,PLoS ONE的大部分编辑都是在职科学家,而且该杂志并没有诸如拷贝与编辑的功能。”据估计,美国《国家科学院院刊》等出版巨头每篇文章的内部成本约为3700美元。与此同时,《自然》杂志表示,会将每篇文章的价位重新设置在30000美元至40000美元左右——如果科学家们去开放获取平台的话,出版巨头等要付出的代价将十分巨大。

收取费用并不是开放获取期刊的唯一盈利模式,萨博表示:70%的开放存取期刊不会这样做。此外,在很大程度上要归功于来自像萨博一样的开放获取活动家的压力,许多期刊才允许科学家将他们的作品存放在如arXiv等的知识库中。另一方面,艾尔巴金希望,政府可以优先考虑开放获取平台需要利用的研究经费。

比特币、盗版、黑客技术:深度揭秘Sci-Hub背后的论文出版江湖

关于出版商为学术论文增加了什么价值这个问题,是爱思唯尔与艾尔巴金起诉案件的焦点。《纽约时报》曾经发问:“所有的研究论文都应该免费吗?”当《科学》杂志与艾尔巴金共同合作绘制Sci-Hub的用户统计数据时,发现Sci-Hub下载量的四分之一来自全球34个最富有的国家。

艾尔巴金认为,Sci-Hub是必然要用到的工具,其在贫穷国家的大量用户似乎也印证了她的观点。负责分享联盟(Coalition for Responsible Sharing,简称CRS)的发言人詹姆斯·米尔恩(James Milne)表示,有来自富裕国家的25%的用户认为Sci-Hub是一个非常方便的工具。负责分享联盟代表着大型出版商的利益。(当我联系爱思唯尔对这个故事发表评论时,出版社推荐我联系米尔恩。)CRS最初是由五个出版巨头组成的小圈子——Elsevier、ACS、Brill、Wiley和Wolters Kluwer——用于打压科学家社交网站Researchgate,使其取消700万份未经授权的文件。

Sci-Hub勇做学术出版“海盗”

在艾尔巴金成为科学界的海盗之前,她是一位有理想有抱负的哲学家兼计算机程序设计专家。“我甚至在上学之前就开始编程,”艾尔巴金说。刚踏入大学校门,她就开发了一个项目,该项目最终成为Sci-Hub的前身:一个绕过收费墙的脚本,利用麻省理工学院的订阅计划下载神经科学类书籍。“它的运行方式与Sci-Hub并不完全一样,但是结果却相同:绕过付费墙并下载到神经科学类书籍。”艾尔巴金常常在她经常光顾的俄罗斯生物学论坛(molbiol.ru)上与其他用户分享这些书籍,而molbiol.ru恰恰为Sci-Hub的首次亮相奠定了基础。

艾尔巴金说:“Sci-Hub已经能够自动完成我需要完成的工作。”Sci-Hub以一种有组织的方式发展起来了,最终使得用户只需点击按钮即可下载需要的文件。用户喜欢非常Sci-Hub。Sci-Hub在整个论坛中立即泛滥开来——不过它还需要花费更长的时间才超越论坛。

比特币、盗版、黑客技术:深度揭秘Sci-Hub背后的论文出版江湖

俄罗斯对知识产权的保护非常匮乏,这使其早已成为主要经济体中最大的盗版枢纽之一,这对于艾尔巴金创造Sci-Hub来说是一个优势。但她很快便发现,自己正关注着俄罗斯和哈萨克斯坦对盗版的态度。多年来,关注的焦点一直是娱乐,但现在迅速地转向了学术盗版问题。艾尔巴金认为必须进行信息共享,而新的反盗版法律却为她带来了沉重的一击:在哈萨克斯坦,非法共享文件者会遭到惩罚,最高可被判处五年有期徒刑。在这种情况下,她感觉唯一负责任的选择就是自己加入到战斗中来。

当艾尔巴金在2011年启动Sci-Hub时,她说:“这是一个副项目。”在Sci-Hub没有存储下载文章的情况下,艾尔巴金就对其进行操作。每次申请阅读或下载论文时,都会通过某所大学的订阅计划下载一份新的副本。它会在六个小时后自动删除。由于某种原因,如果无法通过某所大学的服务器访问到这篇论文,可以切换至另一所大学的服务器进行下载。

2012年,她与LibGen建立了合作关系。自此,LibGen才开始对文档进行存档。LibGen要求艾尔巴金上传Sci-Hub正在下载的文章。紧接着,在2013年,Sci-Hub在中国的受欢迎程度开始爆发,她开始将LibGen作为离线存储库。艾尔巴金没有下载并删除新的文件副本或购买昂贵的硬盘驱动器,而是重新调整了Sci-Hub以检查LibGen是否有用户请求的文件副本。如果LibGen中有用户请求的文件副本,她会将其从档案中删除。

上述工作一直进行的非常顺利,直到域名LibGen.org崩溃,删除了艾尔巴金收集的4万篇论文。这很可能是由于其中一名管理员死于癌症的缘故。“我的一个朋友此时建议我积极在Sci-Hub上收集捐款,”她说:“我开始在Sci-Hub上进行众筹活动以购买额外的驱动器,并且很快就拥有了属于我自己的由LibGen收集的数据库副本,大约有2100万篇论文。其中,这些论文中约有100万份是通过Sci-Hub平台上传到LibGen数据库的。据我所知,其他的论文来自从黑网上下载得到的数据库。”从那以后,LibGen的数据库成了艾尔巴金唯一的备用数据库。

艾尔巴金不愿意透露太多关于她如何获得这么多论文的信息。但她告诉我说,大部分论文是利用各大图书馆和高校的订阅计划得来的,并且透漏,她已经“获得”大约400所大学的访问权限。

很有可能,艾尔巴金获得的网页访问证书来自于泄露的登录信息,以及各大高校薄弱的安全保护措施。美国马凯特大学的一位官员声称,其已掌握Sci-Hub通过网络钓鱼行为获取网页访问证书的证据。然而,艾尔巴金坚决地否认了这一点,并且她在之前就曾表示,许多学者甚至主动提供了他们的登录信息。这就可以解释,Sci-Hub如何“直接从出版商那里”下载得到某些文章,正如艾尔巴金之前声称的那样。

学术出版业强硬打压反而成就Sci-Hub

直到2013年,艾尔巴金才面临第一个重大障碍。那时,爱思唯尔向PayPal发送书面通告,而此前她正是通过PayPal收集的捐款。根据出版社后来提供的证词,当时,爱思唯尔已经意识到Sci-Hub向一些学生支付费用以获取其所在大学的网络访问证书。而且,PayPal已经数次向艾尔巴金转账,用于购买代理服务器,这将允许Sci-Hub以学生的身份进行身份验证。在出版社向PayPal发出通告之后,PayPal停用了她的帐户。

当爱思唯尔第一次向艾尔巴金发出攻击时,出版商已经严肃地向互联网服务提供商以及各种支付服务施压了,强制实施隐私权。但是,这并不是出版商第一次使用如此强硬的手段。事实上,爱思唯尔在学术出版商中一直处于领先地位。

2008年,爱思唯尔阻止了一项国际盗版行动,一名越南企业家向众多学者出售数字版期刊的副本。出版商会通过自身的力量或者借助某个或某些行业组织的力量,如美国出版商协会等,向国会推行一些法律条文,以便出版商更为容易地控制ISP、搜索引擎和DNS服务,阻止盗版行为接入相关网站——或者,迫使广告商及各种支付服务提供商停止对版权违规者的支持。

从出版商的角度来看,这是十分有道理的,通过增强自己的执法权力来保护知识产权。这些法案引发了许多支持他们的公司的强烈反对,但同时,诸如爱思唯尔这样的个人学术出版商却被大家忽视了。

同年,AAP(美国出版商协会的简称)和爱思唯尔纷纷选择支持一项法案并进行游说,该法案旨在阻止政府允许机构通过开放获取期刊发布文章的要求。这将会有效地扼制NIH 在2005年的授权,即由该机构资助的所有研究都需要在12个月内提交给开放存取库一份副本。

同年晚些时候,各大出版商不断上涨的价格及其对限制性法律的支持激励了近17000名科学家承诺坚决不在其期刊上发表文章。面对如此强烈的冲击,爱思唯尔改变了其立场。尽管抵制运动迅速崛起着,但最终随着时间的发展渐渐消散,对出版巨头爱思唯尔并没有造成实质性的影响。

爱思唯尔的努力也不仅限于游说政府实施更为严格的法律。在针对艾尔巴金之前的几个月,爱思唯尔帮助其他17家出版商关闭了盗版学术信息库Library.nu。2012年至2013年间,Elsevier和美国出版商协会(AAP)游说并反对实施了三项法案——《联邦研究公众获取法案》(Federal Research Public Access Act)、《对公共科学的公共获取法案》(Public Access to Public Science Act)和《公平获取科学技术研究的法案》(Fair Access to Science and Technology Research)——所有上述法案都强制要求那些由联邦政府资助的研究的论文成果在一段时间后存入开放存取库。

比特币、盗版、黑客技术:深度揭秘Sci-Hub背后的论文出版江湖

2015年,爱思唯尔以3750万美元的价格起诉了盗版网站AvaxHome。而后,英国出版协会(爱思唯尔是其成员之一)、美国出版商协会(爱思唯尔与协会的其他出版商联系密切)和美国化学学会(ACS)也成功地对一系列电子书盗版行为颁发了禁令——包括 AvaxHome、LibGen、Ebookee、Freebookspot、Freshwap、Bookfi和Bookre等——强制ISP阻止用户的访问。后来,爱思唯尔还曾试图强制互联网安全服务商Cloudflare交出能够识别LibGen和Bookfi运营商的日志。

爱思唯尔最终没有得到它想要实施的法律:这些法律允许其对ISP、支付服务商及其他互联网中介机构进行施压,限制那些被指控盗版的网站。实际上,它在一步步地为后人设定着类似事件的诉讼先例。

负责分享联盟的米尔恩表示,爱思唯尔并不反对开放获取。“我可以自信地说,负责分享联盟的所有成员(包括爱思唯尔在内)都在接纳开放获取,”米尔恩说。(但是,他拒绝回答任何针对某个出版商的所有问题。)每个联盟的成员都有自己的开放获取期刊,他们也都允许科学家们向开放获取档案库中上传一份预印副本及未经同行评审的论文。

米尔恩表示,联盟中各出版商的种种行动均表明了其对非法以及未经授权的共享行为的反对。在爱思唯尔和美国化学学会(ACS)起诉Researchgate之前,他们曾试图利用长达两年的时间说服该网站采用其拟定的“文章共享自愿原则”,该原则允许科学家对文章进行分享——但是只能在其研究组之间进行分享,文章的元数据没有改变,出版商无法收集准确的文章分享数据。

在起诉Sci-Hub之前,爱思唯尔曾试图从技术上阻止艾尔巴金。出版商认为,他们在执行版权声明方面一直很有耐心,特别是考虑到,正如米尔恩告诉我的,他们的销售团队听说“个体机构与联盟”刻意抬高ResearchGate和类似Sci-Hub这样的盗版网站的身价,以求在价格谈判中获得支配权。

Sci-Hub迅速发展的影响力和声望使艾尔巴金成为了诸多出版社的眼中钉。尽管如此,在爱思唯尔出版集团对艾尔巴金提起诉讼时,她早已化身为肩负着某种使命的女人。对于艾尔巴金来说,Sci-Hub不再只是一个“副项目”,即将包含更大的意义。

“通过LibGen,我认为有可能会积累1000万篇科学文章,”她说。在那之后,她想:为什么不将所有在交叉引用数据库中出现的科学性文章下载下来呢?现在,由于PayPal密切关注着她,她转而利用比特币捐款的形式来维持Sci-Hub的发展。

艾尔巴金曾经在俄罗斯国立研究大学修读公共管理硕士课程(艾尔巴金告诉我,她本希望借助这次机会使其长久以来所期待的生活得到“升级”)。她希望这段求学生涯能够让她影响到互联网信息共享的立法。但在2014年,艾尔巴金就离开了俄罗斯国立研究大学,并且感到非常失望。

她转而参加了宗教研究学硕士课程,研究古代社会如何对待信息分配。无论是来自古代社会的种种启示,还是古代社会对“信息公开”的态度,亦或是艾尔巴金对“公共管理不是我想要走的方向”的感觉,都让她对Sci-Hub加倍努力。

艾尔巴金为Sci-Hub的数据库创建了多个备用副本。她从头开始重写了Sci-Hub的代码,以便用户可以自动下载论文。现在,一旦用户向Sci-Hub发出请求查找某篇文章,该网站就会检查每个大学的代理服务器,直到找到可以下载该文件的代理服务器,并且自动下载这篇文章。他们不必通过Sci-Hub人工手动浏览各大出版商的网站来查找文章。

艾尔巴金公然反抗着爱思唯尔出版集团。艾尔巴金先前的爱好成为了她的关注焦点,没有什么能够让她放弃将Sci-Hub变成开放获取的巨头这一目标。

克里姆林宫意外关闭Sci-Hub

直到那时,克里姆林宫才无意间完成了爱思唯尔所无法做到的事情:它让Sci-Hub关闭了——至少在俄罗斯关闭了。在克里姆林宫颁布孤立主义政策后,引发了科学家和艾尔巴金之间激烈的争论,她自己亲手关闭了Sci-Hub。

2015年5月,为了将俄罗斯与外国势力隔离开来,克里姆林宫将俄罗斯唯一的私人基金单位兼科学研究推广单位——朝代基金会(Dynasty Foundation)——贴上了“外国代理人”的标签并予以关闭。与许多科学团体不同,艾尔巴金对于变化是非常开心的。然而,她的反应激起了来自其对手的网络欺凌,促使她关闭了俄罗斯的Sci-Hub。

在王朝基金会(Dynasty Foundation)事件发生前三年左右,克里姆林宫通过了一项法律,规定任何外国资助的机构在严格意义上都不能参加与“科学、文化、艺术、医疗保健、慈善事业”有关的活动以及其他众多活动,凡事参与上述活动的均会被贴上“外国代理人”标签。这项法律阻止了众多组织开展其政治活动,并为所有其他相关组织发送了危险的信号。

慈善机构、非政府组织和许多社会科学家纷纷谴责这项法律,并拒绝注册。他们争辩,法律中关于“政治活动”的描述十分模糊,并且这项法律还会削弱重要的国际合作力量。对此,克里姆林宫在2014年对这项法律做出了修改,为各个组织贴上了标签,不管组织是否愿意。截至去年7月,已有88个组织被贴上“外国代理人”标签。这项法律引发了人权组织的抗议,称这是对言论自由权和LGBTQ权利的沉重一击。

比特币、盗版、黑客技术:深度揭秘Sci-Hub背后的论文出版江湖

王朝基金会成立于2002年,创始人是德米特里·基闵(Dmitry Zimin),他是一位深受众人爱戴的慈善寡头,其工作甚至在几周前刚刚荣获俄罗斯政府颁发的“忠于科学”奖项。按照美国的标准,王朝基金会并没有那么雄厚的资金。2015年,其预计的研究经费预算仅为760万美元。但是在俄罗斯,王朝基金会一家独大,是对科学研究最有力的私人基金单位。

然而,王朝基金会一直以来都在积极参与教育事业:资助研究,支持高中科学课程,以及培养科学教师等等。为了继续进行同样的工作,该基金现在不得不小心翼翼地对待教育系统,以免做出任何会被克里姆林宫视为政治活动的事情。

通过王朝基金会,基闵也在支持着他的另一个组织——自由任务基金会(Liberal Mission Foundation ,简称LMF)。它实际上是一个智囊团,从自由主义的角度在俄罗斯的学校里帮助推行现代化政治科学的教育计划——其中也包括艾尔巴金的学校。从表面上来看,这显然是十足的“政治活动”。虽然基闵是俄罗斯公民,但他却将用于支持王朝基金会的资金存在了国外的银行中——这是其被贴上“外国代理人”标签重要的原因。(基闵在接受《纽约客》的采访时说:“俄罗斯政府也把钱存在国外。”很可能是因为克里姆林宫拥有数十亿美元的债券。)基闵的“外国”资金,再加上王朝基金会与LMF的关系,为政府的“外国代理人”标签提供了借口。

尽管如此,由于种种原因,基闵还是很有趣的。他不仅参加了2012年在莫斯科举行的反普京抗议活动,还支持出版自由。2014年,基闵的有线电视公司Beeline被政府强迫终止Dozhd频道。Dozhd是俄罗斯唯一一家重要的自由主义独立电视新闻台。基闵说:“我认为每个人都明白这不是Beeline的决定。”后来,他继续资助了众多独立的新闻媒体机构。

政府从未将上述事件列为将王朝基金会和LMF标记为“外国代理人”的原因,尽管基闵过去的行为确实让克里姆林宫有所怀疑。不管怎样,基闵决定关闭王朝基金会,以使LMF从“外国代理人”名单中除名。

许多科学家对王朝基金会的关闭纷纷表示抗议,但艾尔巴金却不理解这种愤怒。在她看来,王朝基金会——尤其通过资助LMF——已经传播了“反对普京和俄罗斯当局的宣传”。艾尔巴金描述了基闵在王朝基金会的工作情况,认为该组织本身即有“反共”性质,尽管她也讲不清具体的原因。艾尔巴金说,王朝基金会和Sci-Hub“在意识形态上相悖”,并且认为王朝基金会在某种程度上是Sci-Hub的资本主义形式。

“我非常了解这个基金会,它曾参与到我当时正在求学的高等经济学院中。”艾尔巴金说。于是,她开始撰写文章,用以呈现王朝基金会支持有自由主义倾向团体的种种实例。艾尔巴金声称,自己不想“为任何一方辩护”。但是,她撰写的那些帖子读来令人吃惊,只是在维持表面上的客观罢了。在其笔下,艾尔巴金将王朝基金会的支持者称为“王朝派”,重新分享了由国家控制的媒体机构编写的与王朝基金会有关的负面文章,甚至还分享了旨在让基闵处于公然地怀疑状态的PS后的照片,

比特币、盗版、黑客技术:深度揭秘Sci-Hub背后的论文出版江湖

不久之后,发生了一件奇怪的事情。Sci-Hub的vKontakte团队的前成员称,开放获取信息的拥护者艾尔巴金将他们列入了黑名单。

“他们开始对我进行人身攻击,而且手段十分低端,咒骂我,传播关于我的虚假信息,还说我疯了等等。”于是,艾尔巴金将他们加入了黑名单。

Sci-Hub的vKontakte团队的许多前成员表示,艾尔巴金这样做只是因为他们选择支持王朝基金会。Nesmeyanov研究所的一位科学家德米特里·佩列卡林(Dmitry Perekalin)表示,在Sci-Hub和王朝基金会之间,艾尔巴金要求她的团队投票选出二者哪一个对俄罗斯科学更为有利。“我写道,这是一个两难的选择。结果立即遭到禁止。”佩列卡林在vKontakte上发表的某篇文章中如是说。最终,艾尔巴金将俄罗斯的Sci-Hub关闭了几天(但是许多人仍然可以通过虚拟专用网进行访问)。

诉讼事件:爱思唯尔要钱,ACS要命

王朝基金会在俄罗斯的风波刚过去不久,艾尔巴金就发现,爱思唯尔在海外起诉了她和LibGen。

“面对这样一家资金雄厚且富有影响力的大公司,我觉得我不可能赢。”艾尔巴金说。她并没有与起诉案件作斗争,而是选择了远离。暂且不论钱的问题,“如果我提供相关文件的话,很可能会暴露我或者我所在建筑物的位置。”

爱思唯尔的诉讼属于民事案件,因此,对引渡到美国的当事人进行审判是不合法的。不过,艾尔巴金却担心被引渡。“我确实知道一些先例,黑客们离开俄罗斯或乌克兰来到欧洲或美国,最终被意外逮捕。”但是,她引用的是德米特里·祖巴卡(Dmitry Zubaka)异国被捕的故事。德米特里·祖巴卡因为针对亚马逊的网络攻击而遭到刑事指控,与艾尔巴金指控案的性质不同。尽管如此,自2010年访问哈佛并发表演讲后,她没有再返回美国的打算。

法庭记录显示,爱思唯尔一直在与艾尔巴金玩猫捉老鼠的游戏,并与各大高校合作,阻止她访问Sci-Hub用于访问各大高校期刊的代理器。爱思唯尔的技术人员能够识别出许多与大学计算系统相关的源IP地址,这些IP地址看起来都很可疑。他们提醒相关机构上述存在的违规行为,以便学校限制可疑的代理凭证。然而,艾尔巴金已经渗透了太多的大学,并不是每所学校都拥有如此先进的技术。

爱思唯尔逐渐关闭了艾尔巴金用来访问爱思唯尔数据库(Science Direct)的学生账户。这样做,爱思唯尔“大大减少了”她获取文章的机会。在Sci-Hub的Twitter页面上,艾尔巴金甚至对此十分抱怨,称“由于最近大量帐户关闭,我们不得不限制最大用户量,尤其是外国人。”她必须优先考虑 “前苏联国家”用户的访问权限。“中国和伊朗的用户访问权限被禁止了一段时间,因为Sci-Hub无法提供足够多的来自这些国家的请求。 不仅如此,她也使美国人无法访问Sci-Hub(除了那些使用VPN的人)——部分原因是由于下载请求量太多,还因为她想避免成为诉讼的目标。

接下来,艾尔巴金改变了她的策略。正如爱思唯尔的技术人员所证明的那样,Sci-Hub并不是直接利用大学代理服务器访问爱思唯尔的存储库,而是利用这些服务器获取授权令牌。然后,Sci-Hub利用该令牌从一个不同的IP地址连接到爱思唯尔的存储库——不需要一直使用少量相同的IP地址来访问并下载如此大量的论文。在出版商向艾尔巴金提起诉讼时,仍然没有找到任何有效的解决方法。 但是,爱思唯尔发现了一个对盗版进行施压的有力举措,这将会为另外的出版商彻底遏制住Sci-Hub奠定良好的基石。

爱思唯尔在六月份获得了1500万美元赔偿金。由于诉讼中的禁令,艾尔巴金在Sci-Hub.org和Sci-Hub的Twitter帐户中失去域名——但根据艾尔巴金的说法,正是由于媒体的报道,促使Sci-Hub的用户量提高了10倍。

“我对诉讼的结果感到失望,”她说,“公众舆论及现代社会的立场与司法决定不一致,对我来说是一个打击。”就支付的金额而言,艾尔巴金表示,即使她想支付也拿不出1500万美元,因为她每月只能从捐款获得‘几千美元’。她可能对自己的收入少算了许多。据2017年PeerJ的一项研究估计,截至2017年8月份,Sci-Hub拥有价值268000美元的未使用比特币。(尽管艾尔巴金公开表示不同意这一估计,但她没有说自己拥有多少比特币,并且声称确切的数额需要保密。)尽管如此,由于艾尔巴金没有居住在美国,所以不能强迫其支付这笔费用。“我由衷地感到受宠若惊,别人对我的项目评估如此之高,”她说。

比特币、盗版、黑客技术:深度揭秘Sci-Hub背后的论文出版江湖

一周后,艾尔巴金发现她被再次起诉,这次起诉是由科学协会和美国化学学会(ACS)共同发起的。等了很长时间后,诉讼还是来了。ACS的出版物是Sci-Hub最受欢迎的刊物之一。迄今为止,Sci-Hub拥有ACS所有研究成果的98.8%的副本。直到十一月,当ACS获得480万美元赔偿金时,她承认自己并没有跟进案件。

但是事实证明,ACS比爱思唯尔更加强大——不仅赢得了诉讼,而且还由此颁发了一条禁止,即所有互联网搜索引擎、网络托管和互联网服务提供商、域名注册商以及域名注册管理机构停止参与任何帮助Sci-Hub运营的活动——杜绝盗版——如果可能的话。

许多法律与技术积极分子立即对这则禁令提出了谴责,如电子前沿基金会(EFF)等。联邦基金会表示,这简直太过分了,与之前的一个先例极其类似:由于这条禁令,美国化学学会从理论上讲可以强制任何被视为帮助Sci-Hub的服务。美国EFF的高级律师米奇·施托尔茨(Mitch Stoltz)表示,通过关闭被指控的网站来强制互联网中介机构执行上述版权声明,可能会使得版权持有人滥用侵权禁令。如果一个网站可以在没有任何疏忽的情况下“听从命令而消失”,那么版权所有者就没有动力保持头脑清醒、谨慎行事了。即使一个网站只是有另外一个侵权网站的宣传广告或链接,或者出于无意拥有一些未经授权的版权作品的副本,也有可能不能幸免。如果这样的话,让包括版权持有者在内的所有人都可以完全禁止某一网站,会更加容易一些。

计算机与通信行业协会(CCIA)是一家技术性的非营利组织,其成员包括谷歌、Intuit、优步、微软等,他们甚至联合提交了一份反对ACS禁令的意见书——就像爱思唯尔当初在其诉讼案中试图获得某条禁令一样——要求法庭上述禁令予以废止。

ACS的禁令并不是第一个用于封锁网络的命令——但ACS表示,它不会刻意纠缠那些没有“主动积极参与”Sci-Hub活动的互联网服务提供商或搜索引擎。然而,这条禁令却带给互联网服务提供商越来越大的压力。通过迫使互联网服务提供商拒绝访问要封锁的网站,进而阻止网站拥有自己的维基百科页面,政府已经封锁了一众盗版网站。上述提到的美国出版商协会和英国出版商协会,其针对多个电子书盗版网站的诉讼也迫使各大网络服务提供商纷纷放弃访问这类网站。今年早些时候,好莱坞组织联盟迫使澳大利亚互联网服务提供商停止访问数十个盗版网站。

去年在美国有一个具有里程碑意义的案例,《华盛顿邮报》称之为“可能会让所有互联网提供商担心的版权案例”,法院认定互联网服务提供商 Cox(其Abuse Group的前负责人甚至竟然在一封电子邮件中写道:“去你妈的DMCA法案 !!!”)公然无视应当作出努力来打击盗版的责任。因此,它不符合《数字千年版权法》(Digital Millennium Copyright Act,简称DMCA)的所谓“安全港湾”保护条款,该条款赋予对为制止盗版行为做出充分努力的互联网服务提供商以法律豁免权。正是由于没有这种保护,在于音乐版权集团BMG的诉讼中,Cox败诉。此前,BMG集团聘请了第三方机构,向Cox用户收取费用,而Cox被指控访问盗版网站。

艾尔巴金表示,在ACS做出裁决之后,其中一些Sci-Hub的域名(.ac、.io和.cc)就停止工作了。作为回应,她用Twitter告诉其用户如何改变他们的设置以避开封锁区域。她说:“了解如何解决域名封锁问题是非常有用的。”但是,从那时起,艾尔巴金也失去了Sci-Hub的.bz域名——她在vKontakte上宣布“资本家已经开始阻止Sci-Hub的域名,所以该网站可能无法在常规地址下进行访问。”

“我不赞成开放获取的非法手段,”哈佛大学的彼得·萨博表示,“在Sci-Hub存在的大部分时间里,我都竭尽全力将自己与它分离开来,因为它为开放获取带来了负面的影响。”然而,萨博也表示,Sci-Hub并没有离开。艾尔巴金对此表示赞同。她是有备用域名的,并且已经对文章库做了备份。据她介绍,即使ACS强迫搜索引擎中断其搜索结果,也无济于事:Sci-Hub的引荐来源只有25%是通过搜索引擎进行的。

Sci-Hub有着“科学海盗湾”之称;海盗湾本身在它最终屈服之前被突袭了两次。“如果我个人没有发生任何事情,那么我自然会尝试继续进行Sci-Hub项目,”艾尔巴金说。如果发生什么不幸,虽然她的期刊和机构订阅网络可能会丢失,“该项目的主要资源,即大量的科学文章,早已全都发布在互联网上了。”

艾尔巴金正面临着艰苦的战斗。ACS尚未明确表示其定义中的“积极参与”的标准。如果Sci-Hub的Twitter页面再次被撤下,将会妨碍Sci-Hub和ACS当前的域名打击斗争。

版权持有者陆续树立着更为有说服力的先例,不断迫使互联网服务提供商执行其版权纠纷方案,其他出版商可能纷纷效仿。当下,特朗普政府已经扩大了互联网服务提供商对用户的监视权。同时,旨在防止互联网服务提供商在速度、连通性和访问权限方面存在偏见的互联网中立法案,也被废除,这意味着互联网服务提供商可能会在执行盗版方面获得更多的自由裁量权。这些政策变化使Sci-Hub在美国更加脆弱。但是,如果Sci-Hub在美国进一步受到限制的话,不仅会对该网站本身造成打击,也会对众多使用它的“资本家”用户造成打击。

尽管如此,艾尔巴金(和萨博)计划继续照常工作。尽管出版商不断游说,但是萨博将会继续致力于推动开放获取期刊和知识库的扩张。艾尔巴金计划再次躲避各种诉讼,玩任何她必须玩的猫捉老鼠游戏。

“假开放”救不了学术出版业

至于出版商们,他们的注意力似乎正在转向众多科学家。

自2015年以来,对于文章共享问题,包括美国化学学会和爱思唯尔在内的许多出版商均推出了STM自愿原则:针对研究人员和社交网站的一系列规则,供科学家分享他们的研究成果。最近,在最大的出版商中,至少有九家正积极宣传howcanishareit.com。该网站旨在为科学家如何分享他们的研究提供指导。

乍一看,这些举措像是增加了研究的可及性。仔细研究之后,出版商所宣传的漏洞便十分明显了:对于其提到的自愿性原则,主要侧重于让研究人员仅仅在合作研究小组内共享论文,而不是大众。

Howcanishareit.com为科学家如何分享他们的研究提供建议,但是在学术社论的链接中也会提及开放获取期刊。同样地,任何科学家允许将预印本上传到存储库的事项,都会体现到个体出版商的合同中。其中,出版商发布了其认可的系列营利性知识库和学术合作网络(SCN),但是像PeerJ、arXiv和bioRxiv这样的主要非营利开放获取知识库却不在其列。总的来说,这个网站看起来像是在“教育”科学家远离传统保守的开放获取基础设施,但其最终的目的,要么就是限制文章分享,要么就是将用户重定引回其盈利平台。

像萨博这样的合法开放获取活动人士,不同意上述对开放获取的限制行为。“开放获取的好处来自于与公众进行分享,也来自所有想要阅读、引用、应用或依靠相应的研究成果的人,不能仅仅限于SCN。”他说。

这些运动可能会侵蚀合法开放获取运动的基础:科学家们选择分享其研究成果的意识。另一方面,艾尔巴金不会受到影响。反对Sci-Hub的法律宣传运动——通过史翠珊效应(Streisand effect)——反而使该网站比大多数主要的存储库更为众所周知,而艾尔巴金也比萨博等合法开放获取支持者更为出名。美国化学学会(ACS)针对Sci-Hub的禁令所带来的威胁,变相地加大了对诸如EFF这样的网络活动家组织的支持力度。EFF认为,该网站“存在一个严重的问题:那些无法负担昂贵的订阅费用的人,他们没有机会访问学术数据库,无法利用尖端的科学研究。”

这种努力可能会适得其反。它没有解决科学家们对付费墙的失望,付费墙正影响着他们的工作进度。与此同时,Sci-Hub一直在掀起各种浪潮,可能会进一步扩大公众和科学共同体的范围。尽管艾尔巴金可能正在危险的水域航行,但出于对学术出版业的失望,目前还没有什么能够阻止那些理想主义科学家将下载论文的登录凭据交到Sci-Hub的海盗女王手里。

原文链接:

https://www.theverge.com/2018/2/8/16985666/alexandra-elbakyan-sci-hub-open-access-science-papers-lawsuit

参考信息:

https://www.zmescience.com/other/feature-post/sci-hub-effects-academic-publishing/

http://www.cailiaoniu.com/93695.html

weinxin
我的微信公共号
我的微信公招扫一扫

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: