- AI 음성 비서는 기술과의 상호작용을 혁신적으로 변화시키지만, 기존 음성 비서와의 대화는 기계적이고 어색함을 느낄 수 있음
- 인간 대화의 미묘하고 감정적인 부분을 이해하고 적응하는 데 어려움
- 완전한 오픈 음성 비서가 이렇게 구현되면 어떨까 ?
- 실시간으로 사용자 요청에 응답하고, 자연스러운 목소리와 공감, 감정 지능을 갖춤
- 이전 대화의 장기적 맥락을 이해하고, 여러 사람의 대화와 중단, 확인, 생각하느라 멈추는 것도 처리
- 소비자 하드웨어에서 완전히 로컬로 작동
BUD-E (Buddy for Understanding and Digital Empathy) 개발
- LAION은 ELLIS Institute Tübingen, Collabora, Tübingen AI Center와 협력하여 BUD-E를 개발
- 낮은 대기 시간을 가진 기본 음성 비서 개발로 시작하여 2024년 1월 현재, 300~500ms의 대기 시간을 달성
- 더 큰 모델을 사용하여 300ms 미만의 응답 시간이 가능할 것으로 기대
BUD-E 개발 로드맵
- 기본 모델과의 대화도 지금까지 본 것들보다 훨씬 자연스러움
- 하지만 여전히 해결해야 할 문제와 개발해야 할 기능들이 많음
- 대기 시간 감소 및 시스템 요구 사항 최소화
- 자연스러운 대화와 응답의 자연스러움 증가
- 며칠, 몇 달, 몇 년에 걸친 대화 추적
- 음성 비서의 기능성과 능력 향상
- 다중 모달 및 감정적 맥락 이해 향상
- 사용자 인터페이스, 지속적 통합, 쉬운 패키징 인프라 구축
- 다중 언어 및 다중 스피커로 확장
대화형 인공지능의 미래 구축을 위한 협력
- BUD-E 개발은 다양한 커뮤니티의 집단적 노력이 필요한 지속적인 과정임
- 오픈소스 개발자, 연구자, 열정적인 사람들이 BUD-E의 개별 모듈을 개선하고 성장에 기여하도록 초대함
- 자연스럽고 직관적이며 공감적인 대화를 나눌 수 있는 인공지능 음성 비서를 함께 만들 수 있기를 바람