主菜单 (移动)-块

主菜单块

谢弗实验室

Janelia7_blocks-janelia7_secondary_menu | 块
更多信息在此实验室登陆页面
Custom_misc-custom_misc_lab_updates | 块
节点: field_content_header | entity_field
当前研究
点: field_content_summary | entity_field

我们实验室的主要目标是能够快速可靠地从大量神经组织中提取详细的结构和连接。从生物学角度来说,这种能力可以用来详细理解神经系统是如何工作的; 找出它是如何发育成成年的; 并比较不同的动物和基因变异。

节点: 主体 | 实体 _ 字段

重建包括电子显微镜照片的自动分析,然后是手动校对。校对步骤涉及相当多的手工工作,占重建所花费的大部分工时。这使得它成为我们能够重建的生物体大小的限制因素。

需要几个步骤来改善大型生物神经系统的重建:

基于通信和编码理论的技术,用软决策和全局优化取代有限范围的硬决策。

将生物学知识纳入重建过程。这些信息大部分来自遗传学和光学显微镜技术,它们在返回的数据的类型、尺度和分辨率方面非常不同。这些完全不同的数据必须在有助于重建之前进行协调。基于集成电路设计和验证图形系统的工程经验,提高用户界面和人工校对的生产率。

采用和适应为芯片设计开发的技术进行神经重建。一个由许多人处理一个共同问题的项目,有数百万个组件,将涉及许多因素,而不仅仅是算法。使用现有工具的方法、使用的数据库、分工,甚至像命名惯例这样的世俗细节,都会对拟议重建规模的项目产生很大影响。芯片设计者在这些问题上有相当丰富的经验,我们应该利用这些经验。此外,还有许多潜在的途径尚未被充分探索,以确定它们是否会有所帮助。

所有这些改进,以及更多尚未考虑的改进,将是必要的,因为总体目标是神经系统的重建和理解, 其中许多比任何尝试都要大几个数量级。这样的努力是有希望的,因为在电气工程 (EE) 中已经取得了生产率的提高,处理了大致相似的部件结构和它们之间的连接。在电子工程领域,生产率的大幅提高 (50 倍或更多) 是通过一系列较小的创新获得的,我预计在这里会有类似的过程。

基于概率的重建基础设施

现在所有的重建决策都是二进制的 -- 要么两个区域是同一个细胞的一部分,要么不是。在相邻区域中检测到的两个特征要么是连接的,要么不是连接的。重建过程的其余部分源于这些决定的结果。

然而,这种方法扔掉了大量的信息。找到潜在的结构将需要重新审视一些早期的分类决定。直觉上,推翻一个可疑的决定比一个非常可靠的决定好得多。在通信理论等领域,这种直觉可以被量化和分析。因此,例如,您的手机使用 Viterbi 解码等技术,在整个过程中传播不确定性,以找到最有可能的整体结果。

第一步是用概率术语表达被检测对象之间的关系。然后,诸如用于纠错码的置信传播等算法可以用来找到最有可能产生已知测量的底层结构。这可以应用于重建的所有阶段: 两个相邻特征是同一神经元的一部分的可能性有多大?在两个连续部分中检测到的特征属于同一生物结构的几率有多大?同样,概率结构提供了一个简单的方法来增加生物和人类的输入。它还提供了一种方法来集中校对不确定性最大的区域,或者消除歧义的收益最高的区域。

必须开发的主要机制是链接图的增量和实时维护,它定义了如何将每个图像中检测到的特征组合成神经元等生物元素。例如,当一个人校对说两个结构肯定是同一个细胞的一部分时,这些变化应该在重建的其余部分传播, 当系统试图找到包含这些新数据的配置时。

整合生物学知识

最初重建的许多改进可以通过将生物知识纳入重建过程来推动。自高尔基体时代以来,神经元类型的不同拓扑结构、大小和形状就已经为人所知。从最近的 EM 重建和结合复杂光学显微镜的基因技术来看,这一知识正在迅速提高。这些已知神经元类型的描述必须以机器可读的形式输入,这样软件就可以自动对它遇到的许多神经元进行分类,并识别出它无法识别的神经元。校对之前,每个神经元然后得到一个标签,这取决于最接近的匹配 (和匹配的置信度)。校对后,我们有更多关于每个神经元的定量数据 -- 这将允许我们更新模板并使未来的匹配更加准确。

此外,从部分重建中,我们知道一些类型的神经元以各种方式相关联 (例如,在同一束中相邻,在同一层终止)。这也可以用来帮助重建。还有更普遍的生物学原理 -- 线粒体完全包含在细胞内,每个细胞恰好包含一个细胞核 -- 这有助于重建。这些也可以在概率框架内处理。

一旦我们识别并标记了所有神经元,下一步就是找到它们之间的所有联系 (突触)。现在这是由生物学家和校对人员根据现有的 EM 照片完成的,突触的外观取决于所研究的动物。这一步需要自动化来处理更大的感兴趣的系统。

最终的链接应该包括我们能检测到的所有生物元素。尽管主要目标是神经元和突触,但细胞内其他机制的位置也可能很重要。我们应该将这些额外的结构与最终的神经元结构联系起来,而不仅仅是找到并移除线粒体和囊泡。

提高校对工作效率

校对是目前重建过程中的限速步骤,而且可能会一直如此,因为图像采集和计算机分析等其他任务很容易并行 (因此可以根据需要加快速度, 仅受预算限制)。在组织和改进在大型数据集上执行的交互式图形任务方面有相当多的知识和经验。这可以应用于校对软件。技术包括记录和重建用户会话,确定用于各种任务的时间的统计方法,相关错误率的测量,以及检查不同输入和显示设备效果的人体工程学研究。可以改进的领域包括视觉线索的使用,如颜色、亮度、间距、文本与图形输入、定制、现实与符号显示以及菜单和命令结构。新用户学习的简易性和专家用户的生产力对于这个应用程序都很重要。

即使没有正式的研究,很明显这个过程可以通过,例如,简单的神经元类型标记和使用颜色来指示重建状态而得到很大的改进。同样,概率基础设施应该被用来通过整体影响来对用户决策进行排序,并根据最佳可用信息重新评估尚未校对的领域的决策。

使用芯片设计的工程经验

一个像重建苍蝇大脑那么大的项目 (大概 10000万个连接) 需要的不仅仅是算法。它将需要很多人,可能分布在多个站点。这提出了许多与科学问题无关的工程问题。

工作是如何划分的?数据存储的方式和位置,以及如何防止两个用户对同一数据进行冲突更改?如何处理软件修订?需要什么网络连接,如果网络中断会发生什么?当一个合作者需要另一个人工作的结果时,他们看到了什么 -- 可能正在进行的最新版本,或者一些以前稳定的版本?如果他们需要,他们如何选择?即使是看似次要的问题,如命名约定,如果不尽早考虑,也会造成严重破坏。

芯片设计遇到了所有这些问题,以及许多其他相关的问题。30-40亿美元的电子设计自动化 (EDA) 行业中有很大一部分致力于解决这种性质的问题。随着重建项目的扩大,他们应该学习那些努力使用类似规模和复杂系统的人的经验。这些问题的许多解决方案已经在集成电路领域得到了应用,无论是直接还是通过类比,都可能适用于神经重建。

更具投机性的改进

上述改进几乎肯定会奏效,我们首先攻击它们。然而,改进重建进程还有许多其他可能性,这些可能性更具推测性,但可能会有所帮助,我们也在调查这些可能性。其中许多已经在Dmitri Chklovskii's(HHMI,Janelia) 组,包括层析或倾斜视图,相同样本的组合光学和电磁成像,以及按类型标记突触。如果采用这些方法,将需要研究将新数据结合到重建过程中的最佳方法。