PO文学

第58章 论文打假
章节错误/点此举报

小贴士:页面上方临时书架会自动保存您本电脑上的阅读记录,无需注册
    重生2008:从助教逆袭为院士 作者:佚名
    第58章 论文打假
    关於这个问题,吴辰早已经有了想法。
    “你有没有想过,为什么已经过去这么久,aβ*56还是只能由西尔万的实验室合成,以至於1克样本就要300万美元?”
    “难度太大了。”
    姜楠说。
    aβ*56是一个病变蛋白,只存在於阿尔兹海默症患者体內,提取过程非常繁琐,並且成功率很低。
    与其花费巨大风险去提取,还不如直接购买样品。
    “所以这就是医药类论文是造假重灾区的一个重要原因啊。”
    吴辰说。
    听到他的调侃,姜楠忍不住又是一个白眼,但却没有反驳。
    不过她也懒的再问了,反正吴辰说不出一周就会有结果。
    这一点上,她还是相信对方的。
    到家后,姜楠一进门,就发现父母正坐在客厅里等自己。
    看著他们八卦的眼神,她忍不住一阵扶额。
    -----------------
    在姜楠努力陈述自己还不想恋爱,两人只是同事关係时,吴辰已经到家了。
    简单洗漱了一下,又把吴淑芬餵饱,他便打开电脑,找到了那篇著名的论文:
    《a specific amyloid-β assembly in the brain impairs memory》。
    中文名是《大脑中一种特定的β淀粉样蛋白组装体损害记忆》,第一作者西尔万。
    通读了一遍论文后,吴辰果然发现了几个问题。
    首先是图1中,aβ*56的蛋白电泳条带图有造假痕跡。
    不过让他一点一点的去抠图分析,那是不可能的。
    这没有一两个星期是做不下来的,他不会在这件事情上浪费这么久。
    所以他选择用图像分析的方法来做,这样就能非常轻易的检查出图像的拼接问题。
    於是他基於opencv,快速编写了一个图像特徵分析算法,来计算每条条带的灰度分布和背景噪点的標准差。
    如果图像涉嫌造假,那么这两个值的差异会非常大。
    (请记住 读小说上 101 看书网,????????????.??????超讚 网站,观看最快的章节更新)
    除此之外,为了更具有信服力,他又单独用canny算子检测了条带边缘。
    如果是拼接的图片,那么边缘肯定会有像素级的断裂痕跡,与正常条带的连续边缘差別很大,也可以作为实锤证据之一。
    除了对图像本身分析外,还需要对实验数据进行处理。
    吴辰先將论文中实验小鼠的逃避潜伏期(escape latency)提取出来,然后计算了它的变异係数cv。
    其中,逃避潜伏期是指生物实验时,实验动物从进入水迷宫,到成功爬上隱藏平台所需的时间。
    正常小白鼠的时间,肯定要比注射了aβ*56蛋白的时间要短。
    將两个算法在启明一號上运行起来后,吴辰觉得有点饿,就去给自己煮了一包泡麵。
    15分钟后,数据结果刚好出来。
    当然这是基於他opencl架构的电脑,如果是其他人的电脑,是不可能这么快计算出结果的,时间至少要多十几倍。
    检查一番后,吴辰发现计算结果果然如自己所料,存在大量的造假痕跡。
    第一张图经过扫描后,一眼就可以看出aβ*56条带的背景噪点,和其他条带完全不是一个画风。
    很明显就是拼接上去的。
    而实验数据就更离谱了。
    论文中正常小白鼠的cv仅为3%,远低於標准值15%,数值极不合理。
    就像一场满分100的期末考试,班级的平均分竟然是95。
    这种方差的离散值,在常理计算中是不可能的。
    有这两份数据,基本就可以实锤西尔万的这篇论文造假了。
    但吴辰並不满足於此。
    因为这篇论文的问题,实际上在业內已经有过討论了。
    最主要的一个问题,就是有多个实验室在尝试合成aβ*56时,都以失败告终。
    但这篇文章是发表在《自然》上的,而且西尔万的老师还是在阿尔兹海默症研究领域內的大牛卡伦.阿什,所以大家更多的时候都在怀疑自己。
    或者说,就算这篇论文中的数据有问题,那也没法证明aβ*56是无效的。
    因为阿尔兹海默症患者体內的β淀粉样蛋白確实產生了病变。
    问题的核心,在於到底是aβ*56引起了阿尔兹海默症,还是阿尔兹海默症引发了aβ*56蛋白的產生。
    要证明这个问题,就像是辩证先有鸡还是先有蛋一样。
    但吴辰也有自己的解决方案,那就是用支持向量机svm和rosetta(一个用於蛋白质结构建模的软体),来预测aβ*56的特性。
    因为他记得一个关键点,就是后世已经证明,aβ*56蛋白极不稳定,其特性根本不可能导致阿尔兹海默症。
    有了思路后,吴辰从系统提供的全量医药资料库中,找出了10万条已知稳定性的蛋白序列,然后將序列特徵中的疏水指数、胺基酸电荷和二级结构作为算法的输入特徵,来训练svm模型。
    预测的结果,就是aβ*56热稳定性。
    除此之外,还需要用rosetta来预测 aβ*56的三维结构。
    不过这一次的计算量,就不是几张图片解析那么容易了。
    初步预估的计算时间在两天以上。
    確认算法运行稳定后,吴辰便將它丟在一边,开始了今日份的学习。
    “系统,启动深度阅读状態!”
    【深度阅读状態已开启】
    今天吴辰选择的论文都是关於doc2vec(段落向量,与word2vec相比更进一步,类似段落和单字的区別)的。
    因为在下周六去京大讲座时,他想和百度知识部门的人討论数据获取的事情。
    如果word2vec打动不了他们的话,那么doc2vec他们肯定会心动的。
    -----------------
    接下来的几天,日子就这样平稳的过去。
    算法运行中途出现一次参数偏差,不过经过调整后很快就解决了。
    最终吴辰在周四的晚上得到了想要的结果。
    数据清晰的显示,aβ*56的热力学稳定性极差。
    满分10分的標准,它仅仅达到了1.2的分数。
    同时它的生理环境半衰期还小於三个半小时,过后便会分解为没有独立生物活性的aβ42二聚体。
    所以最终的结论很明显。
    aβ*56蛋白,根本就无法作为阿尔兹海默症药物靶点。
    吴辰將分析报告整理一番后,发送到了姜楠的邮箱。
    他相信她会理解的。
    看了看时间,已经是凌晨一点多,该睡觉了。
    说好的再不熬夜,结果每次都因为这样或那样的事情耽误。
    他將手机静音,然后给床头的机械闹钟设定了早上六点后,就立即陷入了沉眠。
    但他不知道的是,半小时后,他的手机几乎被打爆。
    -----------------
    “楠楠,还是打不通电话吗?”
    江东药厂的实验室里,姜鸿约、来淑嫻以及一大群实验人员竟然都在。
    虽然已经快凌晨两点,但此刻根本没有一个人有睡意。
    所有人都红著眼睛盯著姜楠看。
    “打不通。”
    姜楠嗓音沙哑的回答。
    “这……”
    姜鸿约也很焦躁。
    明天他就要和赛默飞公司签购买aβ*56样本的合同了。
    结果刚刚姜楠收到吴辰的邮件,说这是一个骗局?
    就在眾人一筹莫展之际,姜楠突然將手机揣进兜里。
    “我去他家找他。”
    说罢,她不顾眾人诧异的目光,连白大褂也来不及脱,就大步走出了实验室。
上一页        返回目录        下一页

温馨提示:按 回车[Enter]键 返回书目,按 ←键 返回上一页,按 →键 进入下一页。