时间:2020-08-09 16:49:04来源:互联网
人类基因组中成千上万个基因中的每个基因都有一个唯一的名称和字母数字代码(称为符号),科学家使用它来协调他们的研究。尽管在DNA-RNA领域中一切都好了一段时间,但在过去的一年多一点时间里,由于Microsoft Excel继续将符号读取为日期,因此重命名了约27个人类基因。
现在,这个问题并不像人们想的那样令人惊讶。科学家经常使用Excel来跟踪其工作,但是,此电子表格软件的默认设置是为更普通的应用程序设计的-例如实际跟踪日期。因此,当科学家在电子表格上键入基因的字母数字符号时,例如MARCH1(这是“膜相关的无环CH型手指1”的缩写),Excel会将其转换为1月1日。
这不仅使工作人员感到沮丧,而且很危险,因为它可能破坏科学家现在必须手动整理并还原的数据。这也是一个相当普遍的错误,也影响了同行评审的科学工作。
一个研究名为“基因名称错误是广泛存在于科学文献”检查3,597一起发表的论文共享的基因数据,发现大约五分之一曾受Excel中的错误。
没有简单的方法可以解决此问题,因为Excel没有为您提供关闭自动格式设置的选项。避免这种情况的唯一方法是更改每个单独列的数据类型。但是,这仍然适得其反。尽管科学家可以纠正自己的错误,但是只要其他人在Excel中打开相同的电子表格,这些错误就会被重新引入。
科学家发现唯一方便的解决方法来自负责规范基因名称的科学机构-HUGO基因命名委员会或HGNC。HGNC本周发布了新的基因命名指南,其中包括影响数据处理和检索的符号。
HGNC说,现在,将牢记Excel的自动格式命名方式来命名人类基因及其表达的蛋白质。因此,MARCH1变为MARCHF1,SEPT1变为SEPTIN1等。HGNC将保留旧符号和名称的记录,以免造成混淆。
HGNC协调员Elspeth Bruford告诉The Verge,过去一年中27个基因的名称已更改,但该指导原则仅在本周才正式宣布。
布鲁福德说,他们已经与研究机构进行了磋商,以讨论拟议的更新,并且还通知了专门在新变化生效时发表了这些基因的研究人员。
正如布鲁福德所解释的那样,基因命名的艺术在很大程度上受到共识的推动。HGNC必须意识到受工作影响最大的人的个人需求-就像更新字典的词典编辑一样。
HGNC的重点是实际问题,例如最大程度地减少混乱。因此,他们必须确保基因符号唯一,基因名称简短而具体。这些名称不能使用下标或上标,并且只能包含拉丁字母和阿拉伯数字,并且不得拼写名称或单词,尤其是冒犯性的单词或单词。
布鲁福德说,重命名基因的决定并不罕见。过去已经重命名了许多可以读作名词的基因符号,以避免在搜索过程中出现误报。像-CARS已更改为CARS1,WARS已更改为WARS1,而MARS已更改为MARS1。为了避免侮辱,其他一些被更改。
以临床医生必须向父母解释孩子的特定基因有突变的情况为例,布鲁福德举了一个以果蝇中的同等基因命名的基因名称“头箱同系物(果蝇)”的例子。为了避免冒犯,将其更改为“ hdc同源物,细胞周期调节剂”。
尽管在科学界看来事情相对平静,但有关重命名基因的决定提出了疑问。最大的问题似乎是-为什么重命名人类基因比改变Excel的工作方式更容易?
在微软公司与遗传学界之间的斗争中,为什么科学家们退缩呢?
尽管Microsoft没有对此发表评论,但Bruford的理论是,“这不值得改变”,因为这是Microsoft Excel的有限用例。Microsoft几乎没有动力对仅在一个社区中广泛使用的软件中的特定功能进行重大更改。
微软是否整合了这一变化还有待观察,但是科学家们等待Excel来解决问题没有任何意义。科学家已经找到了长期解决方案。电子表格和软件一样瞬息万变-但是这些基因将会存在,所以给它们起的名字就像名字一样起作用,而不是日期。
声明:文章仅代表原作者观点,不代表本站立场;如有侵权、违规,可直接反馈本站,我们将会作修改或删除处理。
图文推荐
2021-11-01 11:09:53
2021-11-01 10:09:53
2021-11-01 09:09:52
2021-11-01 08:09:53
2021-10-31 19:09:53
2021-10-31 18:09:53
热点排行
精彩文章
2021-11-01 11:10:09
2021-11-01 10:10:07
2021-11-01 09:10:06
2021-11-01 08:10:09
2021-10-31 19:10:05
2021-10-31 18:10:06
热门推荐