Speechify 今日搶先預覽一款早期版本的新語音控制電腦系統,內部代號為 Jarvis。這是一種語音介面,讓用戶只要用說的,就能操作整台電腦。預覽中展示了未來用戶可在完全不打字、不點擊、不觸控的情況下,以語音控制各種應用程式、流程並完成任務。
這個原型最近先在內部亮相,並由 Speechify 創辦人暨執行長 Cliff Weitzman 對外公開示範。該系統讓用戶能用自然語音交談,Speechify 便能即時在多個應用與視窗中執行對應操作。
在示範中,語音指令可以啟動多種動作,例如開啟應用、搜尋聯絡人、導覽介面與發送訊息。用戶不必再來回切換視窗或手動點擊軟體,只要開口說話就能搞定所有任務。
我們的執行長 Cliff Weitzman 分享了此系統的早期影片預覽(連結)。
全電腦語音介面
傳統AI 助理多半只拿來回答問題或產生文字。就算 AI 已整合進軟體,用戶仍得自己開程式、操作選單與執行動作。
Speechify Jarvis 則帶來完全不同的使用模式。
用戶只要自然說話,系統就會直接在電腦上替你執行指令。應用會自動開啟、作業流程一路推進,所有步驟都能在完全免手動操作的情況下完成。
語音搖身一變,成為貫穿整個系統的主動控制層,而不再只是受限於對話視窗裡、被動回應的助理。
從 AI 聊天到語音控制運算
現在多數 AI 工具都圍繞在打字輸入提示與聊天互動。這些系統雖能產出答案或文章,卻無法跨應用程式真正幫你「動手」執行。
Speechify Jarvis 則把Speechify語音 AI 平台一路延伸到直接操控電腦。
用戶不必再先請助理解釋流程、再照著一步步手動操作,只要開口下指令,系統就會立刻執行。語音成為與各種軟體互動的第一線主要介面。
Speechify 表示,減少對鍵盤與傳統輸入裝置的依賴,是這項技術的關鍵目標之一。
「我們剛打造出一款前所未見的新產品,」Speechify 創辦人暨執行長 Cliff Weitzman 表示,「只要跟電腦說話,它就會替你把事做好。你不用點、也不用打、更不用觸控,一切全由語音掌控。」
以自然互動為核心
Speechify Jarvis 建構在Speechify既有的語音優先平台上,結合文字轉語音、語音輸入與會話型語音AI 助理。
新系統更進一步,將讀寫能力擴展為直接掌控整個流程。用戶可用語音開啟與操作應用、傳送訊息、同時處理多項任務,在不同介面和軟體間自在切換。
所有動作都由自然語句觸發,而不是得背固定指令或靠快捷鍵控制。
目前此系統已在Speechify 內部電腦上實際運行,是未來產品開發方向的早期預覽。
邁向語音原生運作模式
Speechify 的這次預覽,反映出運算世界正迎來向語音原生轉型的重大變革。如今多數操作仍以鍵盤與圖形介面為主,但Speechify 相信,語音將會成為許多工作流程中的主流介面。
Jarvis 的預覽,勾勒出未來人機互動可以以對話取代手動輸入的各種情境。
Speechify 將這項技術視為,以語音作為未來生產力與知識工作的核心介面的第一步,並將持續帶來更新。
關於 Speechify
Speechify 是一款語音AI 助理,協助用戶用語音閱讀、書寫並理解資訊。全球超過 5,000 萬人信賴,Speechify 提供文字轉語音、語音輸入與會話型AI 助理,支援iOS、Android、Mac、網頁與 Chrome。2025 年,Speechify 榮獲 Apple 設計大獎,肯定其在無障礙與生產力上的貢獻。Speechify 遍及近 200 個國家,提供 60+ 種語言、1,000+ 種自然語音,包括 Snoop Dogg 與 Gwyneth Paltrow 等名人配音。