突破性光子芯片提升深度神经网络性能
Brief news summary
麻省理工学院的科学家和合作者开发了一种革命性的光子芯片,通过光学方法增强深度神经网络的计算,克服了之前的限制。这款先进的芯片可以在不到半纳秒的时间内以超过92%的准确率执行机器学习任务,挑战传统的电子硬件。它采用商业技术制造,包含互联模块以形成光学神经网络,允许扩展性并易于与电子系统集成。这一突破承诺在激光雷达、科学研究和电信等领域实现更快速和更节能的深度学习应用。 该芯片利用非线性光学功能单元(NOFUs)进行非线性操作,大幅降低能耗。在训练后,其准确率达到超过96%,采用类似CMOS技术的方法,展示了其大规模生产的潜力。研究团队计划进一步增强芯片的能力,并探索新算法以最大化光学计算的优势。这个创新项目获得了美国国家科学基金会、美国空军科学研究办公室和NTT研究的资助。深度神经网络模型变得如此之大和复杂,以至于它们挑战了传统电子计算硬件的能力。光子硬件使用光进行计算处理,提供了一种更快速且节能的替代方案,但由于某些神经网络计算的限制,性能有所下降。 来自麻省理工学院和其他机构的研究人员开发了一种新型光子芯片来解决这些问题。这种完全集成的光子处理器能够在芯片上光学地执行所有关键的深度神经网络计算。该芯片在半纳秒内完成了一项机器学习分类任务的计算,准确率达92%,与传统硬件相当。 该芯片使用商业代工工艺构建,具有形成光学神经网络的互连模块,预示着未来电子应用的可扩展性和集成性。这一进步可以提升深度学习的速度和能效,对激光雷达、天文学、粒子物理和电信等领域有益。 该系统能够在纳秒级别内以光学方式完成神经网络操作,显著加快了速度。研究负责人Saumil Bandyopadhyay强调了速度和效率对模型性能的重要性,以及创新应用和算法的潜力。 研究团队包括麻省理工学院的校友和教授如Alexander Sludds、Nicholas Harris、Darius Bunandar和Dirk Englund,该研究发表在《自然光子学》上。 光学神经网络涉及执行线性代数(如矩阵乘法)的互联节点层,这对于数据转换至关重要。非线性操作如激活函数使网络能够学习复杂模式。2017年,开发了一种用于矩阵乘法的单个光子芯片,但非线性操作需要将光学数据转换为电信号,消耗大量功率。 为了解决这一问题,研究人员设计了集成电子和光学的非线性光学功能单元(NOFU),用于芯片内的非线性操作。他们的光学神经网络由三层设备组成,用于线性和非线性功能。 新系统将神经网络参数编码为光,由可编程分束器处理矩阵乘法。非线性操作由NOFU执行,NOFU使用光电二极管有效地将光学信号转换为电流。这种光学领域处理极大地减少了延迟和能耗。 通过实现低延迟,系统能够在芯片上高效训练深度神经网络,称为原位训练,这通常在数字硬件中耗费大量能量。光子处理器在训练中达到了超过96%的准确率,推断中达到超过92%,在半纳秒内完成计算。 电路采用与CMOS芯片相同的工艺制造,可能实现低误差的大规模生产。未来的工作将专注于将设备与现实电子产品集成,并开发利用光学优势的算法,以实现更快、更省能的训练。 该研究得到了美国国家科学基金会、美国空军科学研究办公室和NTT研究机构的支持。
Watch video about
突破性光子芯片提升深度神经网络性能
Try our premium solution and start getting clients — at no cost to you