智譜近日宣布開源其自主研發的AI Agent核心模型AutoGLM,這一舉措被業界視為推動智能設備交互方式變革的重要里程碑。該模型首次實現了“Phone Use”能力,即通過屏幕理解與模擬人類操作,自主完成外賣下單、機票預訂等需要多步驟交互的復雜任務,其操作流暢度與穩定性已通過實際場景驗證。
此次開源計劃為硬件開發者與系統集成商提供了完整的技術解決方案。基于AutoGLM,開發者可在安卓設備上快速構建具備屏幕感知能力的AI助手,實現點擊、滑動、輸入等擬人化操作。目前,該模型已覆蓋微信、淘寶、抖音等50余款主流中文應用的核心功能,其自動化流程設計與此前引發熱議的“豆包手機”演示效果高度相似,但開源特性使其具備更廣泛的適配潛力。
技術架構層面,智譜開放了多層組件:包括預訓練的核心模型、Phone Use能力框架、配套工具鏈,以及可直接運行的Demo工程。針對安卓系統,項目提供了適配層代碼與開發示例,確保技術方案能快速落地。所有代碼采用Apache-2.0協議開源,模型部分則遵循MIT協議,開發者可自由修改或拆分使用組件,甚至基于現有框架進行深度定制。
隱私保護是本次開源項目的核心優勢之一。智譜強調,AutoGLM支持本地化部署與云端協同兩種模式,用戶可自主選擇數據存儲位置,確保操作記錄與個人信息始終處于可控范圍。這種設計既滿足了企業級用戶對安全性的要求,也為個人開發者提供了靈活的技術實驗環境。
開源資源包中包含詳盡的技術文檔與快速入門指南,幫助開發者快速掌握模型調用方法。GitHub倉庫(github.com/zai-org/Open-AutoGLM)已上線完整代碼庫,涵蓋模型訓練腳本、應用適配接口及多場景測試用例。開發者可基于現有框架開發垂直領域應用,例如醫療掛號助手、銀行事務自動化等,進一步拓展AI手機的生態邊界。
行業分析師指出,AutoGLM的開源將顯著降低AI手機的技術開發門檻,加速智能設備從“功能疊加”向“原生交互”的演進。通過開放核心能力,智譜正在構建一個由開發者共同參與的技術生態,這種模式或將成為未來智能終端競爭的關鍵變量。















