经常有人问我说,想要搭建一个生物信息分析的平台,问需要什么配置,是不是去电脑城买了最新款的i7处理器,多配置几条内存条,在买几块硬盘就组装好了生物信息分析平台,使用很少的钱,就可以得到很高的配置。其实我在之前的推文中已经强调过了个人电脑PC,工作站,服务器是不相同的。
什么是服务器
什么是服务器呢。根据名字,服务器是用来提供服务的机器,你可以简单理解为一台计算性能更强的电脑,但其实二者还是有很多不同的。虽然你当然可以用自己组装的电脑完成很多分析,但个人电脑和服务器还是不同的,可以说是民用和军用的区别。
服务器,顾名思义,就是用来提供服务的。像我们访问的很多网站,后台都是有很多服务器在提供服务。其实我们自己使用的笔记本电脑叫做个人电脑PC,peronal computer,个人电脑与服务器最大的区别就是个人电脑一般就你一个人用,而服务器对外提供服务,可以很多人一起使用。比如我们是如何访问一个网站的呢,个人客户端发送一个请求到服务器,服务器端收到这个请求就开始进行处理,可以很多人同时提供请求,服务器并行处理。但是这个请求也不是无限的,比如服务器一次只能处理1百万个请求,那么一次出现1千次请求,服务器就处理不了就会卡顿或者拒绝请求。这就是为什么经常某某明星结婚了,出轨了,离婚了上了微博热搜榜,服务器就卡顿了,这就是无聊吃瓜群众太多,同一时间给服务器发送请求获取信息,服务器处理不了就瘫痪了。包括春运火车票等都是同样的道理。
那么做生物信息为什么要使用服务器呢。
第一:计算资源大,因为生物数据很大,需要非常大的计算量,而个人电脑一般情况下是完成不了的。比如一般人笔记本 也就是8G内存或者16G内存。而一些分析, 比如拼接一个真菌的基因组,有可能需要100G内存,个人电脑是根本完成不了的,你说我不着急,让笔记本慢慢处理,这不是能用时间换空间的问题,如果内存不够,就是完成不了。
第二:在做生物数据计算的时候,需要频繁的去读写磁盘,这对笔记本的磁盘是不太好的,那服务器的磁盘就没问题吗,当然不能这么绝对说服务器的磁盘就永远不坏。只不过服务器的磁盘一般做成raid阵列,不仅能够提高磁盘读写效率,更重要的是可以进行容错,比如一块磁盘坏了,数据还可以回复,个人电脑就不太容易了。
第三:服务器一般可以连续运行,不用关机,如果突然宕机或者关机那就是重大事故了,比如微信或者支付宝后台服务器突然死机了,那将损失惨重。在做生物信息分析的时候,有一些分析非常 耗时,比如拼接一个大的基因组,可能需要10几天,你不能10几天让笔记本电脑一直不关机运行吧,下班了还开着盖子捧着走。那可以设置盒盖之后继续运行吗,但是万一不小心断掉了,那么就功亏一窥了。
综上原因,我们还是非常强烈推荐大家做分析的时候使用服务器来做。如果你非得抬杠说自己只提取几条序列,瞬间就完成了,当然是可以在自己电脑上完成了。