众所周知,语言大模型通过学习大量文本数据,掌握理解和识别语言的能力,引领了新一轮革命。近日,科学家将生命科学中的细胞的DNA序列、基因表达等属性视为一种细胞“语言”,基于这种细胞“语言”开发出了人工智能细胞大模型。
人的一生中有时会遇到心情不好、压力大、想太多造成睡不着、睡不好的情况。科学来讲,这种由情绪刺激或外界压力引起的短期睡眠障碍被称为情绪性失眠。短暂的情绪性失眠尤其常见,其实80%的人都曾经历过这种情况。复旦大学黄志力课题组与袁向山、李文生等科学家,不仅找到了诱发情绪性失眠的关键神经元,还想出了办法给它加上一道“锁”。
基于国际科技创新中心网络服务平台科创热榜每日榜单形成的一周科技记忆,我们推出《一周前沿科技盘点》专栏。今天,为大家带来第九十六期。
1《Nature Methods》丨细胞“语言”大模型和人类语言大模型有什么区别?
scFoundation模型及下游应用场景
众所周知,语言大模型通过学习大量文本数据,掌握理解和识别语言的能力,引领了新一轮革命。科学家将生命科学中的细胞的DNA序列、基因表达等属性视为一种细胞“语言”,基于这种细胞“语言”开发出了人工智能细胞大模型。
近日,清华大学自动化系张学工、电子系/AIR马剑竹和百图生科宋乐合作,建立了一个名为scFoundation的细胞大模型。该模型基于5000万个细胞的基因表达数据进行训练,拥有1亿参数,能够同时处理约20000个基因。作为基础模型,它在“虚拟药物试验”等多种生物医学下游任务中表现出卓越的性能提升,提供了人工智能在单细胞研究中的新范式。
细胞“语言”与自然语言不同,存在着特征高维度、取值连续且稀疏等难点。为此,研究团队针对性设计模型架构,使scFoundation的值编码模块可直接将连续的基因表达值转化为向量,并通过设计一个基于Transformer的非对称模型架构,在保持参数规模不变的同时幅提高了计算效率。考虑到单细胞数据质量存在明显差异的特点,研究团队还设计了一种由低质量数据恢复高质量数据的预训练任务,进一步增强了预训练模型对不同来源下游数据的适应能力。
在实际应用中,scFoundation模型支持“开箱即用”和“微调”两种模式。在“开箱即用”模式下,得益于其独特的预训练任务,该模型能直接用于提升细胞数据的质量,在不需要进一步调整的情况下便可达到或超越现有方法的效果。此外,用户可以利用scFoundation提取细胞的预训练表征,该表征可以用于识别细胞类型特异基因模块和转录因子,并可广泛应用于“虚拟药物试验”等下游任务中。经实验测试,利用scFoundation模型可显著提升细胞癌症药物反应、细胞扰动实验等任务的性能。在“微调”模式下,scFoundation在细胞类型标注等任务上的表现远超传统方法。目前模型权重及代码已开源,同时也提供了模型API供在线轻量使用。
原文链接:https://www.nature.com/articles/s41592-024-02305-7
2《Cell Discovery》丨翻来覆去睡不着觉?给这个神经元加把“锁”试试
情绪性失眠的神经机制。给予小鼠不同的情绪性刺激可激活PMv中LepR神经元,引起小鼠觉醒增加;化学遗传学抑制PMv中LepR神经元可以消除情绪刺激所诱发的觉醒升高。
人的一生中有时会遇到心情不好、压力大、想太多造成睡不着、睡不好的情况。科学上讲,这种由情绪刺激或外界压力引起的短期睡眠障碍被称为情绪性失眠,表现为难以入睡、维持睡眠困难或早醒,并伴有白天疲劳、注意力不集中和情绪不稳定等症状。短暂的情绪性失眠尤其常见,其实高达80%的人都曾经历过这种情况。
复旦大学黄志力课题组与人体解剖组织胚胎学系袁向山、李文生等科学家,不仅找到了诱发情绪性失眠的关键神经元,还想出了办法给它加上“一道锁”。前乳头体腹侧核(PMv)是脑内整合嗅觉刺激信息的重要核团。PMv中存在着大量表达瘦素受体(LepR)的神经元,LepR神经元可以被化学信息素特异性激活。通过实验,研究人员发现激活LepR神经元可以模拟情绪性失眠的发生,而抑制PMv中的LepR神经元,则可缓解小鼠情绪诱导的失眠症状。这些发现揭示了PMv中LepR神经元在情绪性失眠中的关键作用,不仅为理解情绪与睡眠之间的复杂关系提供了新线索和新视角,也为开发治疗情绪性失眠的新方法奠定基础。
原文链接:
https://www.nature.com/articles/s41421-024-00676-x
3《Advanced Materials》丨降低光波导放大器商用成本,这项技术“一箭双雕”
稀土掺杂光波导放大器作为补偿各类光损耗的重要光子器件,在集成光子芯片中应用广泛。这类器件一般采用激光器作为泵浦源,依靠稀土离子的本征吸收与辐射跃迁来实现光放大。然而,激光器泵浦容易造成波导的热损伤以及稀土离子的上转换发光,器件的商用化配套成本较高,且在硅光芯片中无法灵活放置。上述问题使得稀土掺杂光波导放大器在平面光子集成中的规模化应用受限。
厦门大学电子科学与技术学院张丹团队与黑龙江大学化学化工与材料学院许辉团队合成钕配合物Nd(TTA)3(XPO),通过有机配体与中心稀土钕离子的分子内能量传递作用,实现了钕离子在两个近红外波长1.06 µm和1.31 µm的高效发光。此外,他们还设计并制备了条形和倏逝波型两种结构的硅基光波导器件,以低功率发光二极管替代传统激光器作为泵浦源,在1.06 µm波长处实现了22.5 dB/cm的光增益,这是目前有机光波导放大器在该波长的最高增益报道;同时,器件在1.31 µm波长处获得了8.4 dB/cm的光增益,这也是该类器件在光通信O波段实现高增益光放大的首次突破。
这项研究将分子内能量传递理论与LED泵浦技术相结合,首次实现器件在一个低功率LED泵浦下的近红外波段双波长的高增益,可谓“一箭双雕”。该研究大幅降低光波导放大器的商用化成本,适应密集波分复用技术的发展趋势,推动了有机光波导放大器在硅光互联与集成的产业化发展。
原文链接:
https://doi.org/10.1002/adma.202209239
4《Chemical Engineering Journal》丨癌症标志物新型、超灵敏诊断工具来了
COF-SAHRS传感器的构建及人体血液样本中的检测应用
凝血酶与恶性肿瘤相关,促进肿瘤的发展、转移和血管生成。凝血酶(Thr)的超灵敏检测对癌症诊断而言有重要意义。东南大学公共卫生学院王进团队开发了一种新型、简便、超灵敏检测凝血酶的电化学适体传感器(COF-SAHRS)。顾名思义,该传感器由单发夹DNA的响应系统(SAHRS)和共价有机框架(COF)介导的电化学生物传感器的创新结合所得。
在最优条件下,COF-SAHRS传感器具有较低的检测限(0.17 pM),线性范围为10 pM至20 nM。在凝血酶加标回收实验中,回收率为95.4% ~ 104.8%,验证了这种分析方法的准确性。通过对50例癌症患者的血液分析显示,晚期癌症患者的凝血酶水平显著高于早期癌症患者,表明所开发的电化学适体传感器为临床研究中癌症和相关蛋白质生物标志物的检测提供了一种可行的诊断工具。
原文链接:
https://doi.org/10.1016/j.cej.2024.151224
5《science》丨“滑”出反转,“滑”出耐疲劳
统铁电和新型滑移铁电的疲劳特性对比示意图
铁电材料具有可通过外场进行调控的自发极化,被认为是实现类脑智能器件和存算一体架构的理想材料体系。实现稳健可重复的“读”和“写”循环操作是铁电器件应用的必要前提。然而,铁电材料在经历反复极化切换后,极化只能实现部分翻转,这就导致铁电材料失效,即铁电疲劳。这是因为当铁电材料在外场循环加载过程中,电极化翻转的同时伴随了缺陷电荷的迁移。在外场长时加载下缺陷会进一步聚集成团簇,而缺陷团簇对铁电畴有强烈的钉扎效应,使得铁电畴的移动活性被限制。一旦畴界被钉扎住,极化就难以翻转,进而导致铁电器件疲劳失效。虽然这一问题早在1953年就已被发现报道,但至今仍未得以全面解决。
电子科技大学光电科学与工程学院刘富才团队发现新型滑移铁电体具有天然的耐疲劳特性。滑移铁电与传统铁电材料的离子位移机制明显不同。在电场的作用下,滑移铁电范德华层状材料的层与层之间会产生整体滑移、电荷转移,面外极化翻转。滑移铁电器件在经历高达百万次的疲劳测试后,器件的转移特性曲线、动态及静态电学输运曲线几乎不发生变化,简而言之就是具备优异抗疲劳特征。相比常规铁电材料,在很小电场作用下滑移铁电即可通过层间滑移实现极化翻转,如此小的电场不足以造成带电缺陷迁移。此外,由于二维材料的范德华层状结构,缺陷难以跨越层间进行移动,也更加难以聚集,因此不会产生铁电疲劳。该项研究成果为解决铁电材料疲劳问题提供了理想解决方案,也为铁电材料在非易失性存储器、存算一体器件及类脑计算芯片等新颖器件中的应用提供了新选项。(专栏作者 李潇潇)
原文链接:
https://www.science.org/doi/10.1126/science.ado1744