祁旻下线之后正吃着外卖,就听到门口传来一阵脚步声,扭头看见陈林友和王馨回来了。
两个新生这回看到祁旻在实验室,倒也不再拘束:“哟,师姐,吃外卖呢?”
她对于这种管自己实验室老板叫“师姐”的称呼方式没什么意见,所以也应了一声:“是啊,食堂那不是人多么。”
“真是,食堂太挤了。”王馨凑过来看了看祁旻碗里的东西,“师姐,这是什么呀?好吃么?”
祁旻看了一眼小票:“这是叫……多兰冒菜。还行吧,就是油有点儿大。”
“那师姐,我们下午干什么呀?”王馨接着问道。
祁旻有些奇怪,她不都说了要学Python么?难道去吃个午饭就学完了?“你俩Python看了没?”
“哦……那个呀……那不是去图书馆也能学嘛?”王馨有些迷惑地问道,“在实验室没有实验了吗?”
“你们传代的细胞要过夜生长之后才能看。”祁旻平和地说,“咱们生物信息学实验室一般也不会整天整天地做湿实验,处理数据和写代码还是有很多工作量的。”
她这么说之后,两个一年级学生就乖乖地回到自己的座位上Python了。因为都已经是读博的人了,祁旻也就没有再具体地给他们安排学习任务,只是发邮件告诉他们周日要开个小会,检验一下他们的语言学得怎么样了。
——
之后祁旻又打开Jupyter看了一眼,全尺寸类脑体的生成代码一切正常,此时正在占用“雨云”中35%的计算资源。
祁旻的类脑体项目在“雨云”超级计算中心使用计算资源是采用动态的分配方式,分配给她的计算资源理论上无上限,但却要根据当时计算中心课题组使用“雨云”的情况进行调整。虽然她是与周晓姗研究员合作,但“雨云”总要优先满足自己课题组的需求。
因此即使现在“雨云”计算资源的总利用率还没达到一半儿,但由于计算中心的课题组优先占用了闲置资源,分配给类脑体项目的计算资源也只有这么些。
当然35%的“雨云”已经非常快了,真正在世界上能排得上名次的超级计算机还真不是大学里自己的小玩意儿能比得了的。不过祁旻还是在想,或许她可以想办法多要一点儿计算资源,这样没准儿在过年之前她就能把文章重新投出去。
祁旻正想着找个什么理由跟周晓姗研究员提一下儿,仿佛是心有灵犀一般,微信上立刻就收到了柯栎的消息。
“你的项目怎么样了?还需要我的号么?”柯栎在微信上问道。
祁旻有些奇怪他突然这么问一句,也没个前言后语,但转念想怕不是他的RNA结构预测算法又出了什么问题,正需要她来“互相帮助”呢。
“周老师同意我用‘雨云’了。”祁旻回复道,又接着打字,“你不用跑代码吗?”
这回回应她的是柯栎的语音通话申请。
“怎么了?”祁旻接起来问道,“RNA结构预测算法出毛病了?”
“唉,你都猜着了。”柯栎有些不好意思地说,“其实也不是大事儿,就是……我拿公司做深度测序测出来的序列分析,发现了一些奇怪的结果。”
“发给我看看。”祁旻说道。
柯栎从微信上把他跑出来的一组奇怪结果发给祁旻,祁旻从电脑上打开压缩包,看了一眼这十几条序列,也没瞧出个所以然来。
“这几条怎么了?”祁旻问道。
“你等会儿,我这儿正在给你发结构预测结果。”柯栎说道,“行了……你看这几条玩意儿,怎么长得这么奇怪呢?”
祁旻点开他新发的压缩包,打开了其中一条序列对应的预测结果图。这RNA的确长得够怪,其实有一部分看起来好像还挺规则,但剩下的部分简直像是压根儿无法形成稳定二级结构一样。
“你这是mRNA吧?”祁旻问道,“你是不是忘了除mRNA了?”
“不会吧……我是用的别人TRIM好的数据。”柯栎犹豫地说,“怎么除mRNA?”
“你把序列MAP回基因组上,再把MAP到编码区的部分都删掉就行了。”祁旻说道。
“哦……”柯栎似懂非懂地答应了一声,又问道,“但我这个应该是已经除过mRNA的数据了,rRNA和tRNA也除过了。”
不是mRNA又应该是有功能的RNA,但是二级结构近乎无定形……祁旻突然想到:“你没去内含子吧?”
真核生物存在RNA的剪切,某些具有功能的RNA在体内是剪切之后才能发挥作用的。这剪切之前的RNA和剪切之后的RNA二级结构当然会有所差异。
“你等等……”祁旻在Jupyter上开了一个新PY文件,导入柯栎给她的这十几条序列,用已有的基因MAPPING包把它们MAP到人类基因组上,果然发现其中好几条都MAP到了同一位点上,只不过有的缺了这几段儿,有点缺了那几段儿,显示出它们事实上是处于剪切过程不同阶段的同一功能性RNA的前体。
祁旻把结果发过去,柯栎一下儿就看明白了:“哦……原来这都是前体啊。”
看来他虽然在信息学技术方面不太在行,但生物学的基础还是有的。
“真太谢谢了……若不是你,我还真看不出来这到底哪儿出了问题。”柯栎连忙道谢道,“对了……我这个结构预测占不了多少计算资源,用实验室自己的主机跑代码也一样,要不你把我的号也拿去用吧——我老板对自己实验室的人特大方,我们实验室的号能优先用5%呢。”
5%这个数值听起来不大,但对于“雨云”的总计算能力而言,这也是相当可观了。而且对于祁旻现在正在用的35%而言,5%也是七分之一呢。
“那我就大方用了。”祁旻笑着说道,“到时候我发了SCIENCE,致谢里得单给你另起一行。”
“那是,要是我这个课题发了NATURE,肯定也得着重感谢你啊。”柯栎也笑道,“礼尚往来嘛。”
“要不你等我先发了SCIENCE,你再发NATURE。”祁旻开玩笑道,“咱俩这文章发表时间稍微错开点儿,免得媒体报道起来赶不上趟儿。”
一般人都是“学术互吹”,他们这个“学术自夸”还是挺让人觉得新鲜。实验室里两个一年级新生听到祁旻这么说,忍不住在一旁笑起来。
祁旻挂了微信通话,对正坐在自己位置上憋笑的陈林友和王馨开玩笑道:“你俩别嫉妒人家。我能不能发SCIENCE先别说,你们在这实验室好好干,要是我真发了SCIENCE,那肯定带上你俩的名字。”
“谢谢师姐!”两个新来的博士生立刻点头。
王馨还接着开玩笑道:“师姐你再说一遍,这我得录下来做证明。”
“做啥证明,我能直接给你写个条儿,一目了然。”祁旻故意说道。
这听起来很大方,实际上仔细想想,也不过是实验室PI发文章带上学生的常规操作。再说,毕竟陈林友和王馨这俩也算是她这个类脑体课题组的成员了,课题发文章肯定得带上他俩。
两个新生这回看到祁旻在实验室,倒也不再拘束:“哟,师姐,吃外卖呢?”
她对于这种管自己实验室老板叫“师姐”的称呼方式没什么意见,所以也应了一声:“是啊,食堂那不是人多么。”
“真是,食堂太挤了。”王馨凑过来看了看祁旻碗里的东西,“师姐,这是什么呀?好吃么?”
祁旻看了一眼小票:“这是叫……多兰冒菜。还行吧,就是油有点儿大。”
“那师姐,我们下午干什么呀?”王馨接着问道。
祁旻有些奇怪,她不都说了要学Python么?难道去吃个午饭就学完了?“你俩Python看了没?”
“哦……那个呀……那不是去图书馆也能学嘛?”王馨有些迷惑地问道,“在实验室没有实验了吗?”
“你们传代的细胞要过夜生长之后才能看。”祁旻平和地说,“咱们生物信息学实验室一般也不会整天整天地做湿实验,处理数据和写代码还是有很多工作量的。”
她这么说之后,两个一年级学生就乖乖地回到自己的座位上Python了。因为都已经是读博的人了,祁旻也就没有再具体地给他们安排学习任务,只是发邮件告诉他们周日要开个小会,检验一下他们的语言学得怎么样了。
——
之后祁旻又打开Jupyter看了一眼,全尺寸类脑体的生成代码一切正常,此时正在占用“雨云”中35%的计算资源。
祁旻的类脑体项目在“雨云”超级计算中心使用计算资源是采用动态的分配方式,分配给她的计算资源理论上无上限,但却要根据当时计算中心课题组使用“雨云”的情况进行调整。虽然她是与周晓姗研究员合作,但“雨云”总要优先满足自己课题组的需求。
因此即使现在“雨云”计算资源的总利用率还没达到一半儿,但由于计算中心的课题组优先占用了闲置资源,分配给类脑体项目的计算资源也只有这么些。
当然35%的“雨云”已经非常快了,真正在世界上能排得上名次的超级计算机还真不是大学里自己的小玩意儿能比得了的。不过祁旻还是在想,或许她可以想办法多要一点儿计算资源,这样没准儿在过年之前她就能把文章重新投出去。
祁旻正想着找个什么理由跟周晓姗研究员提一下儿,仿佛是心有灵犀一般,微信上立刻就收到了柯栎的消息。
“你的项目怎么样了?还需要我的号么?”柯栎在微信上问道。
祁旻有些奇怪他突然这么问一句,也没个前言后语,但转念想怕不是他的RNA结构预测算法又出了什么问题,正需要她来“互相帮助”呢。
“周老师同意我用‘雨云’了。”祁旻回复道,又接着打字,“你不用跑代码吗?”
这回回应她的是柯栎的语音通话申请。
“怎么了?”祁旻接起来问道,“RNA结构预测算法出毛病了?”
“唉,你都猜着了。”柯栎有些不好意思地说,“其实也不是大事儿,就是……我拿公司做深度测序测出来的序列分析,发现了一些奇怪的结果。”
“发给我看看。”祁旻说道。
柯栎从微信上把他跑出来的一组奇怪结果发给祁旻,祁旻从电脑上打开压缩包,看了一眼这十几条序列,也没瞧出个所以然来。
“这几条怎么了?”祁旻问道。
“你等会儿,我这儿正在给你发结构预测结果。”柯栎说道,“行了……你看这几条玩意儿,怎么长得这么奇怪呢?”
祁旻点开他新发的压缩包,打开了其中一条序列对应的预测结果图。这RNA的确长得够怪,其实有一部分看起来好像还挺规则,但剩下的部分简直像是压根儿无法形成稳定二级结构一样。
“你这是mRNA吧?”祁旻问道,“你是不是忘了除mRNA了?”
“不会吧……我是用的别人TRIM好的数据。”柯栎犹豫地说,“怎么除mRNA?”
“你把序列MAP回基因组上,再把MAP到编码区的部分都删掉就行了。”祁旻说道。
“哦……”柯栎似懂非懂地答应了一声,又问道,“但我这个应该是已经除过mRNA的数据了,rRNA和tRNA也除过了。”
不是mRNA又应该是有功能的RNA,但是二级结构近乎无定形……祁旻突然想到:“你没去内含子吧?”
真核生物存在RNA的剪切,某些具有功能的RNA在体内是剪切之后才能发挥作用的。这剪切之前的RNA和剪切之后的RNA二级结构当然会有所差异。
“你等等……”祁旻在Jupyter上开了一个新PY文件,导入柯栎给她的这十几条序列,用已有的基因MAPPING包把它们MAP到人类基因组上,果然发现其中好几条都MAP到了同一位点上,只不过有的缺了这几段儿,有点缺了那几段儿,显示出它们事实上是处于剪切过程不同阶段的同一功能性RNA的前体。
祁旻把结果发过去,柯栎一下儿就看明白了:“哦……原来这都是前体啊。”
看来他虽然在信息学技术方面不太在行,但生物学的基础还是有的。
“真太谢谢了……若不是你,我还真看不出来这到底哪儿出了问题。”柯栎连忙道谢道,“对了……我这个结构预测占不了多少计算资源,用实验室自己的主机跑代码也一样,要不你把我的号也拿去用吧——我老板对自己实验室的人特大方,我们实验室的号能优先用5%呢。”
5%这个数值听起来不大,但对于“雨云”的总计算能力而言,这也是相当可观了。而且对于祁旻现在正在用的35%而言,5%也是七分之一呢。
“那我就大方用了。”祁旻笑着说道,“到时候我发了SCIENCE,致谢里得单给你另起一行。”
“那是,要是我这个课题发了NATURE,肯定也得着重感谢你啊。”柯栎也笑道,“礼尚往来嘛。”
“要不你等我先发了SCIENCE,你再发NATURE。”祁旻开玩笑道,“咱俩这文章发表时间稍微错开点儿,免得媒体报道起来赶不上趟儿。”
一般人都是“学术互吹”,他们这个“学术自夸”还是挺让人觉得新鲜。实验室里两个一年级新生听到祁旻这么说,忍不住在一旁笑起来。
祁旻挂了微信通话,对正坐在自己位置上憋笑的陈林友和王馨开玩笑道:“你俩别嫉妒人家。我能不能发SCIENCE先别说,你们在这实验室好好干,要是我真发了SCIENCE,那肯定带上你俩的名字。”
“谢谢师姐!”两个新来的博士生立刻点头。
王馨还接着开玩笑道:“师姐你再说一遍,这我得录下来做证明。”
“做啥证明,我能直接给你写个条儿,一目了然。”祁旻故意说道。
这听起来很大方,实际上仔细想想,也不过是实验室PI发文章带上学生的常规操作。再说,毕竟陈林友和王馨这俩也算是她这个类脑体课题组的成员了,课题发文章肯定得带上他俩。