Speechify, Jarvis 음성 컴퓨터 제어 시스템 미리보기 공개

Speechify가 오늘 초기 버전 미리보기로 Jarvis라 불리는 새로운 음성 기반 컴퓨터 제어 시스템을 선보였습니다. 이 음성 인터페이스는 사용자가 말만으로 컴퓨터 전체를 조작할 수 있게 해 줍니다. 이번 미리보기에서는 사용자가 타이핑, 클릭, 터치 없이 앱을 제어하고, 작업을 처리하고, 워크플로 전반을 탐색하는 미래의 모습을 보여줍니다.

이 프로토타입은 최근 내부 시연 후 Speechify 창립자이자 CEO인 Cliff Weitzman이 대중에게 공개했습니다. 사용자가 자연스럽게 말하면 Speechify가 실시간으로 다양한 앱과 창에서 명령을 실행합니다.

시연 영상에서 음성 명령은 앱 열기, 연락처 찾기, 인터페이스 이동, 메시지 보내기 등을 수행합니다. 창을 전환하거나 직접 조작하지 않고도 사용자는 오직 음성만으로 대부분의 작업을 끝낼 수 있습니다.

본 시스템의 초기 영상 미리보기는 CEO Cliff Weitzman이 여기에서 공유했습니다.

컴퓨터 전체를 위한 음성 인터페이스

기존의 AI 어시스턴트는 주로 질문에 답하거나 텍스트를 생성하는 데 초점을 맞춥니다. 소프트웨어에 AI 도구가 내장돼 있어도 여전히 사용자가 직접 앱을 열고 메뉴를 둘러보며 조작해야 합니다.

Speechify Jarvis는 전혀 다른 방식을 제시합니다.

사용자가 자연스럽게 말하면 시스템이 컴퓨터 안에서 곧바로 명령을 실행합니다. 앱이 자동으로 열리고, 워크플로가 순서대로 진행되며, 별도 조작 없이 작업이 완료됩니다.

음성이 단순 대화용 보조도구를 넘어, 운영 환경 전체를 제어하는 능동적인 레이어가 됩니다.

AI 챗에서 음성 제어 컴퓨팅으로

대부분의 AI 도구는 입력 프롬프트와 채팅 인터페이스 중심으로 설계돼 있습니다. 이 시스템들은 답변이나 텍스트 생성은 가능하지만, 실제 앱을 직접 제어하진 못합니다.

Speechify Jarvis는 Speechify의 음성 AI 플랫폼을 한 단계 확장해, 직접적인 컴퓨터 제어까지 연결합니다.

어시스턴트에게 지시해 놓고 사용자가 따로 작업하지 않고도, 말하는 즉시 시스템에서 실행되도록 할 수 있습니다. 음성이 소프트웨어와 상호작용하는 주된 인터페이스가 되는 셈입니다.

Speechify는 이를 키보드나 기존 입력 도구에 대한 의존을 줄이려는 더 큰 목표의 일부라고 설명합니다.

“우리는 아무도 만들어 본 적 없는 것을 방금 만들었습니다.”라고 Speechify 창립자 겸 CEO인 Speechify의 Cliff Weitzman은 말합니다. “컴퓨터에게 말하면 나머지는 알아서 처리합니다. 클릭, 타이핑, 터치 없이 목소리 하나로 모든 걸 컨트롤합니다.”

자연스러운 상호작용 중심 설계

Speechify Jarvis는 Speechify의 기존 음성 중심 플랫폼 위에 텍스트 음성 변환, 음성 타이핑 받아쓰기, 대화형 음성 AI 어시스턴트 기능을 결합해 구현됐습니다.

새 시스템은 읽기, 쓰기를 넘어 직접 워크플로 제어까지 확장합니다. 사용자는 자연스러운 말만으로 앱 실행, 내비게이션, 메시지 전송, 창 전환, 소프트웨어 환경 제어를 할 수 있습니다.

동작은 구조화된 명령어나 단축키가 아닌, 평소 대화하듯 말하는 음성으로 실행됩니다.

이 시스템은 현재 Speechify 내부에서만 컴퓨터에 구동되고 있으며, 향후 제품 개발을 위한 초기 미리보기에 해당합니다.

음성 기반 운영 모델을 향해

Speechify의 이번 미리보기는 음성 기반 컴퓨팅으로의 큰 변화를 보여 줍니다. 지금은 키보드와 그래픽 인터페이스가 표준이지만, Speechify는 음성이 다양한 업무에서 핵심 인터페이스가 될 것으로 보고 있습니다.

Jarvis 미리보기는 사용자가 직접 입력하는 대신 대화를 통해 컴퓨터와 상호작용하는 미래 가능성을 보여 줍니다.

Speechify는 이 기술이 생산성과 지식 노동 전반의 핵심 인터페이스로 음성을 적용해 가는 초기 단계라고 설명하며, 앞으로 더 많은 업데이트를 예고했습니다.

Speechify 소개

Speechify는 음성 기반 AI 어시스턴트로, 사람들이 목소리로 정보를 읽고, 쓰고, 이해하도록 돕습니다. 전 세계 5천만 명 이상이 신뢰하며, Speechify는 텍스트 음성 변환, 음성 타이핑 받아쓰기 및 대화형 AI 어시스턴트 기능을 iOS, 안드로이드, 맥, 웹, 크롬 등 다양한 플랫폼에서 제공합니다. 2025년 Speechify는 접근성과 생산성 부문에서 Apple 디자인 어워드를 수상했습니다. 전 세계 거의 200개국에서 사용되며, 스눕독과 기네스 팰트로 등 유명인의 목소리를 포함해 60개 언어, 1,000+개의 자연스러운 음성을 지원합니다.