傳統成像技術長期面臨一個核心矛盾:單透鏡系統在單次曝光中只能形成單一焦平面,導致相機不得不在大光圈、景深和分辨率之間反復權衡。這種物理限制使得復雜場景拍攝時,要么犧牲清晰度,要么依賴后期處理。近日,卡內基梅隆大學研究團隊提出突破性方案——通過光學與算法協同創新,構建出全球首個具備像素級獨立對焦能力的成像系統,相關成果獲國際計算機視覺大會(ICCV2025)最佳論文榮譽提名。
該系統的核心突破在于將傳統焦平面升級為可編程的焦曲面。研究團隊開發的Split-Lohmann計算透鏡通過組合立方相位板與空間光調制器(SLM),實現了對不同像素區域焦距的獨立控制。這種特殊結構如同為每個像素配備專屬光學元件:當光線穿過立方相位板時,其折射路徑被初步調制;隨后空間光調制器通過編程對特定區域的光線進行二次聚焦,最終形成三維空間中動態適配的焦距分布。實驗數據顯示,該系統在保持大光圈(f/2.0)條件下,可同時捕捉深度跨度達10米的場景,且各區域分辨率損失小于5%。
算法層面,研究團隊提出雙模態自動對焦框架。對比度探測法(CDAF)通過迭代優化策略,將傳統窮舉式掃描的對焦次數從數百次縮減至十余次,對焦速度提升30倍;相位探測法(PDAF)則利用雙像素傳感器實現視差計算,可在0.1毫秒內完成深度定位。兩種算法協同工作,使系統既能處理靜態場景的精細對焦,也支持動態場景的實時追蹤。測試視頻顯示,原型機在21幀/秒的拍攝速率下,可穩定跟蹤快速移動物體的同時保持背景清晰。
這項技術正在多個領域展現應用潛力。自動駕駛場景中,系統可同時識別近處行人與遠處車輛,避免傳統相機因對焦切換導致的環境感知延遲;顯微成像領域,厚樣本的立體結構無需逐層掃描即可完整呈現,為活體細胞觀測提供新工具;安防監控方面,全場景持續清晰成像能力可消除監控死角;醫療機器人手術中,實時動態對焦能確保器械操作與組織影像的精準匹配。研究團隊已為關鍵技術布局全球專利,并正在開發消費級原型設備。
該成果的底層邏輯源于光路可逆原理。研究團隊將此前在VR顯示領域開發的Split-Lohmann多焦面技術逆向應用于成像系統,通過"光學輸入-算法輸出"的閉環設計,實現了從信息呈現到信息捕捉的范式轉變。這種跨學科創新為計算成像開辟了新路徑,其像素級焦距控制能力或將重新定義光學系統的設計邊界。















