나의 접근성 스택과 Wayland에서의 미래
(nocoffei.com)- Wayland 전환은 X11 기반 입력 접근성 도구를 끊어, 일부 사용자에게 컴퓨터와 직업 생활 자체에 접근하는 수단을 잃게 만듦
- Talon Voice는 음성 인식, 스크립팅, Python으로 앱 전환·받아쓰기·브라우저 조작·스크롤을 손 없이 가능하게 함
- gaze_ocr와 Cursorless는 OCR·시선 추적·구문 트리 참조를 결합해, 앱 협조 없이 화면 조작과 코딩 범위를 넓힘
- Wayland에는 Talon이 필요한 윈도 관리, 입력 자동화, 마우스 위치 지정, 클립보드, 화면 읽기를 위한 공통 표준 API가 부족함
- Talon 주 개발자는 공개 릴리스의 Linux 지원 제거를 예고했고, GNOME·KDE·wlroots 전반의 API 구현은 커뮤니티 과제로 남음
Wayland 전환이 입력 접근성을 끊는 문제
- KDE Plasma는 2027년 초 X11 지원 제거를 발표했으며, X11에 의존하는 접근성 도구 사용자는 약 9개월 뒤 현재 데스크톱 환경을 계속 쓰기 어려워짐
- 접근성 논의는 시각 제한이나 실명 사용자를 위한 출력 접근성에 집중되기 쉽지만, 컴퓨터에 명령을 전달하는 입력 접근성도 동등하게 중요함
- Ehlers-Danlos Syndrome 진단 이후 손목과 손가락을 쓰는 작은 근육들이 손상되어 키보드와 마우스 사용이 어려워졌고, 전문 물리치료로 손 사용 일부를 회복했지만 전체 근무일을 버티기엔 부족함
- Linux 데스크톱이 Wayland 전용으로 이동하면, 손을 거의 쓰지 않고 컴퓨터를 조작하게 해주는 현재 도구들이 필요한 수준의 시스템 통합을 얻지 못함
- Wayland 전환은 단순한 디스플레이 서버 교체가 아니라, 일부 사용자에게 컴퓨터와 직업 생활에 접근할 수단을 잃게 만드는 변화가 됨
Talon Voice가 제공하는 손 없는 입력 환경
- Talon Voice는 빠르고 정확한 음성-텍스트 ML 모델, 전용 스크립팅 언어, Python을 결합해 사용자가 애플리케이션 조작 방식을 직접 확장할 수 있게 함
- Talon은 애플리케이션이 접근성 통합을 제공하지 않아도 우회적으로 조작할 수 있게 하며, 이런 방식은 적대적 접근성(adversarial accessibility) 으로 표현됨
- talonhub/community 스크립트 모음은 Talon을 실용적으로 만들기 위해 먼저 설치하는 핵심 구성요소이며, 사용자의 필요에 맞춰 손으로 작성된 수만 줄의 코드로 구성됨
- Talon으로 가능한 작업:
- 작업 표시줄에서 마우스로 고르는 대신 애플리케이션 포커스를 음성으로 전환함
- Dictation Mode로 텍스트를 작성하며, 원문 대부분도 Talon으로 작성됨
- 브라우저용 Rango extension을 사용해 브라우저를 완전히 손 없이 조작함
- 긴 산문 작성 시 D-Bus를 통해 외부 음성-텍스트 프로그램인 dsnote를 호출하는 자체 스크립트를 사용함
- 어떤 입력 장치를 써도 스크롤 동작이 지속적으로 아프기 때문에, 쉿 하는 소리로 스크롤함
- 향후 Talon에 발 페달을 통합하는 방안도 고려됨
gaze_ocr와 화면 직접 조작
- gaze_ocr는 OCR로 화면 내용을 읽고, 화면 위 객체를 직접 클릭할 수 있게 하는 Talon 확장임
- Linux에서는 OCR 백엔드가 기본 제공되지 않지만, RapidOCR을 연결해 사용할 수 있었음
- 시선 추적기를 함께 사용하면 사용자가 실제로 보고 있는 위치를 바탕으로 화면의 텍스트를 구분할 수 있음
- 60초 소개 영상은 https://youtu.be/qkFy66WF3bU에서 볼 수 있음
- gaze_ocr는 애플리케이션 쪽 통합이 전혀 없어도 상호작용할 수 있어, 애플리케이션 비협조 환경에서도 작동하는 접근성의 대표적인 예가 됨
Cursorless와 음성 기반 코딩
- Cursorless는 Visual Studio Code 확장으로, 소스 코드의 구문 트리를 인식한 표현과 각 토큰 위의 hat을 사용해 음성으로 토큰을 참조하게 함
- 텍스트 데모는 Xe Iaso의 Cursorless 설명에서 볼 수 있음
- talonhub/community의 여러 프로그래밍 언어 음성 작성 지원과 결합하면, 완전히 손을 쓰지 않고 코드를 작성할 수 있음
- 예를 들어 문장의 시작으로 이동하려면 “Cursorless” 위의 hat 색상과 문자 위치를 보고 “pre pink cap”처럼 말해 해당 문자를 참조함
- 이 방식은 Talon의 음성 철자 체계를 사용함
- Cursorless는 기존 키보드 기반 편집기나 음성 기반 편집기보다 강력한 작성 방식을 제공하며, 업무에서 쓰는 소프트웨어를 위해 별도 구현까지 작성할 정도로 핵심 도구가 됨
- Talon 전체의 가치는 장애를 보완하는 수준을 넘어, 컴퓨터와 상호작용하는 더 새롭고 강력한 방법을 제공하는 데 있음
Wayland에서 Talon이 깨지는 이유
- Linux 데스크톱은 40년 이상 된 X11에서 Wayland로 이동 중이며, FOSS 데스크톱 커뮤니티는 Wayland를 미래로 선택함
- Talon은 기본 작업을 수행하기 위해 윈도 매니저와 컴포지터에 깊게 통합되어야 하지만, Wayland는 이 동작들을 수행할 표준 수단을 제공하지 않음
- 가장 기본적인 텍스트 입력 자동화조차 “진짜 Wayland 방식”으로는 불가능해 보이며, X11의 사실상 표준 입력 자동화 도구인 xdotool의 관리자가 이를 조사했지만 혼란스러운 결론에 이르렀음
- Talon에 필요한 범위는 텍스트 입력을 넘어 윈도 관리, 마우스 위치 지정, 클립보드 관리, 화면 읽기까지 확장됨
- GNOME에서는 가능하지만 KDE에서는 아니거나, wlroots에는 이미 구현되어 있다는 식의 답은 충분하지 않음
- 교차 플랫폼 개발자가 GNOME, KDE, wlroots, Smithay 기반 Niri 같은 여러 컴포지터를 대상으로 별도 구현을 작성해야 하는 것은 비현실적임
- 어떤 컴포지터도 Talon에 필요한 전체 API 표면을 구현하지 않는다는 점이 핵심 제약임
Talon의 Linux 지원 제거 방향
- Talon의 주 개발자인 Aegis는 X11이 사라지고 사용자가 작동하지 않는 환경으로 전환되는 상황에서, 공개 릴리스에서 모든 Linux 지원을 곧 제거하겠다고 선언함
- Talon은 무료와 유료 계층으로 나뉘며, 유료 계층은 당분간 X11 지원을 유지함
- 공개 릴리스에서 Linux 지원을 제거하는 결정은 무료 사용자가 설치 후 Wayland 환경에서 작동하지 않는다는 사실에 놀라는 부담을 줄이려는 목적과 연결됨
- 이 결정은 악의가 아니라 2027년 Linux 데스크톱을 지원할 수단이 없다는 실용적 판단에 기반함
- Linux 데스크톱을 지원할 방법이 없으면, 가능한 답은 Linux 데스크톱 지원 자체를 제거하는 것이 됨
커뮤니티가 맡아야 하는 과제
- Aegis가 Linux에서 Talon을 살리고 싶은 사용자들에게 요구한 조건:
- 어떤 이유로도 Aegis와 Wayland 지원을 논의하지 않음
- 커뮤니티가 모여 Talon에 필요한 전체 API 표면을 GNOME, KDE, wlroots에서 성공적으로 구현함
- 그 이후에 Talon의 새 Wayland 백엔드가 검토될 수 있음
- 이 과제는 커뮤니티가 접근하기 어려운 문제로 남아 있으며, Wayland 생태계는 사용자가 겪는 문제에 친절하지 않은 것으로 묘사됨
- xdg-session-management protocol은 최초 풀 리퀘스트부터 완료까지 6년이 걸림
- 최근 병합된 ext-zones protocol은 병합까지 2년 이상이 걸렸고, 초기 개념을 만들기 위한 여러 해의 연구개발 기간은 여기에 포함되지 않음
- 처음에는 유지보수자들이 입력 접근성 요구를 알지 못해 해결이 지연된다고 봤지만, 과거 메일링 리스트와 논의 기록을 읽은 뒤에는 “아무도 이야기하지 않는다”는 상태 자체가 자기충족적 결과처럼 보이게 됨
Wayland 생태계 참여의 어려움
- 과거 논의에서 두 가지 대응이 특히 문제로 남음:
- 이러한 대응과 wayland-protocols의 상태는 추가 소통만으로 해결될 수 있다는 기대를 크게 약화시킴
- Wayland 생태계는 참여를 요구하면서도, 접근성 요구를 무시하거나 작은 진전을 위해 수년의 전일제 노동을 요구하는 구조처럼 보임
- 입력 접근성 문제가 공개적으로 충분히 논의되지 않는 이유는, 시도해도 의미가 없어 보이기 때문이라는 결론에 가까워짐
- Talon 개발자가 Linux 데스크톱을 가망 없는 대상으로 보고, 살릴 가능성을 커뮤니티에 넘긴 배경도 이런 맥락에서 이해됨
Linux 데스크톱을 떠나고 싶지 않은 이유
- Linux 데스크톱은 계속 사용하고 싶은 환경이며, Plasma 데스크톱, 원하는 게임 지원, 필요한 개발 도구, 새 하드웨어 블록을 위한 최신 도구 등을 제공함
- 광고, 나쁜 UI 재설계, 곳곳에 주입된 AI가 없는 깨끗한 경험도 Linux 데스크톱을 유지하고 싶은 이유임
- Fireborn의 지난해 글처럼, Wayland는 성장했고 이제 기여하려고 노력할 수밖에 없음
- 필요한 것은 접근성 요구, Talon이 그 요구를 어떻게 채우는지, Wayland 전용 미래가 왜 이를 충족하지 못하는지를 명확히 알리는 것임
- 앞으로 나아갈 방법을 아는 사람이 있다면, 입력 접근성 사용자를 도울 수 있는 상황임
인간 입력 장치의 가능성과 한계
- Talon과 관련 기술을 6개월 동안 사용하면서, 전통적인 키보드와 마우스를 쓸 수 없는 상황에서도 생활과 작업을 이어갈 수 있었음
- 키보드와 마우스 중심 사고에서 벗어나자 인간 입력 장치의 가능성이 훨씬 넓다는 점이 드러남
- 현대 컴퓨터는 화면의 모든 문자를 ML 모델로 스캔하고, 사용자가 어떤 문자를 보고 있는지 추적해, 1초 안에 해당 텍스트를 직접 클릭하는 수준의 입력 방식을 가능하게 함
- 특수 키보드인 Svalboard도 곧 별도 글로 다룰 예정이며, 이 장치는 3년 전에는 존재하지 않았음
- Talon은 계속 개선되고 있으며 이미 매우 많은 명령이 제공되고, 충분하지 않을 때 직접 명령을 작성하는 방법도 마련되어 있음
- 이런 새로운 입력 방식을 직접 시도하려면 현재로서는 Wayland를 사용하지 않아야 함
댓글과 토론
Lobste.rs 의견들
-
이 길고 장황한 글은 약자를 공격하려는 의도가 아니라, 정말로 크고 어려운 문제를 해결하기 위해 이야기할 적절한 사람을 찾으려는 것임
본인이 그런 사람일 수 있거나 그런 사람을 안다면 연락해주면 좋겠음
예전에 lobste.rs에 올라왔던 글도 있음: https://lobste.rs/s/o0x7rb/your_mouse_free_setups
그때 제안들 덕분에 Talon과 Svalboard를 처음 알게 되어 매우 고마움- 이 글이 KDE 채팅방들에 공유됐음. 뭔가 보장할 수는 없지만, 사람들이 상황을 알고 있음
이 스택에서 일하는 건 아니지만 정말 미안하고, KDE 쪽 공간에서 이 문제가 더 알려지도록 최선을 다해보겠음. 알맞은 지식을 가진 누군가가 상황을 개선할 수도 있음
다시 말하지만 보장할 수는 없지만, 우리가 듣고 있고 분명 돕고 싶다는 점은 알려주고 싶음
관심 있는 사람은 Matrix 채널로 들어오면 됨:#kde-accessibility:kde.org,#kwin:kde.org
추가로, 누군가 Talos 개발 쪽에 Wayland에서 동작하게 하는 방법을 문의했지만 Talos 개발자는 “Wayland is not supported.”라고 답했다고 함
- 이 글이 KDE 채팅방들에 공유됐음. 뭔가 보장할 수는 없지만, 사람들이 상황을 알고 있음
-
이 글이 정부 소프트웨어 조달 의사결정권자에게 전달될 수 있을지 궁금함
적절한 사람이 “보조 입력 사용자가 곧 지원되는 접근성 경로를 잃게 되므로 EN 301 549/Section 508 기준상 Ubuntu나 Red Hat 같은 Wayland 기반 Linux 데스크톱 배포를 인증할 수 없다”는 이메일을 보내면, 지금의 교착 상태를 깨는 데 꽤 도움이 될 수 있음- 그런데 실제로 Linux 데스크톱을 대규모로 쓰는 정부가 있긴 한가 싶음
요즘은 Linux 접근성을 개선하는 아주 간접적인 방법으로, 어떤 조직이 정부에 Linux 데스크톱을 팔아 돈을 벌려고 시도하는 게 필요하다고 봄. 그렇게 하려면 접근성 문제를 해결해야 할 가능성이 큼
지금 세계 정세라면 정부가 Apple과 Microsoft에 덜 의존하도록 만드는 사업으로 돈을 벌려는 곳이 나올 줄 알았음
UNIX 관련 접근성의 많은 발전도 Sun이 정부에 데스크톱을 팔던 시기에 나왔던 것으로 이해하고 있음
- 그런데 실제로 Linux 데스크톱을 대규모로 쓰는 정부가 있긴 한가 싶음
-
나도 원글처럼 EDS 진단을 받았지만 12살 때였음. 아무도 이 병이 악화될 거라고 말해주지 않았고, 오히려 “시간이 지나면 그냥 사라질 것”이라고 들었음
시간이 흘러 지난 1년 동안 손의 근력이 줄어들고 있고, 신경학적 문제로 여러 번 오해받을 정도가 됨
손 없이 쓸 수 있도록 시스템을 설정해야 하는 시간이 줄어들고 있다는 걸 알고 있음. Wayland 합성 관리자가 표준이 되고 X가 밀려나는 걸 보면서, EDS가 있는 다른 친구가 추천해준 Talon을 배울 의욕이 무너지고 있음
아직 할 수 있을 때 지원을 만드는 데 도와보고 싶었지만 어디서 시작해야 할지 모르겠고, 신경 쓰는 사람이 거의 없는 것처럼 느껴짐. 이 상황은 정말 괴로움- 이 감정이 너무 절실하게 와닿음. 진단을 받고 두 달이 지나서야 결국 결심하고 X11로 넘어갔음. 그전에는 Wayland에서 Speech Note를 쓰며 터치패드로 천천히, 고통스럽게 조작하고 있었음
“구식” 아키텍처로 돌아가서 진짜 접근성 시스템을 쓸 수 있게 된 건 엄청난 진전이었고, 더 빨리 하지 않은 게 후회됨. Linux 데스크톱 접근성의 미래가 어떻게 되든, 지금 당장 Talon을 써보는 게 좋음
근력에 대해서는 지금은 불가능하게 들리겠지만 회복은 가능하고, 빨리 시작할수록 나음. 앞서 말했듯이 몇 달간의 집중 물리치료 뒤 손을 부분적으로 다시 쓸 수 있게 됐음. 회복은 몇 달 단위로 추적했고, 전년도에 잃었던 지점들을 역순으로 되찾는 식의 진전을 봤음
그러니 치료를 빨리 시작할수록 더 빨리 회복할 수 있음. 최종적으로 그게 어떤 의미가 되든 말임. 나도 아직 그 여정 위에 있고 아마 계속 그럴 것임
미국에 있다면 도와줄 수 있는 물리치료사를 찾기 위해 이 사이트를 봐보면 좋음: https://www.ehlers-danlos.com/eds-echo-healthcare-professionals/
아무 물리치료사에게 가면 안 됨. EDS 환자를 치료할 준비가 되어 있지 않아서 문제가 나아지기보다 악화될 수 있음
진단과 치료를 받기까지의 개인적인 과정은 DM이나 다른 플랫폼에서 더 공유할 수 있음. 원하면 연락해도 됨
- 이 감정이 너무 절실하게 와닿음. 진단을 받고 두 달이 지나서야 결국 결심하고 X11로 넘어갔음. 그전에는 Wayland에서 Speech Note를 쓰며 터치패드로 천천히, 고통스럽게 조작하고 있었음
-
많은 사람에게 영향을 주는 문제를 제기해줘서 고마움
다만 한 문장은 빠졌으면 했음: “중요한 건 그 쓰레기장 같은 코드베이스를 더는 아무도 건드리고 싶어 하지 않고, Wayland가 FOSS 데스크톱 커뮤니티가 선택한 미래라는 점이다”
freedesktop, Red Hat, GNOME, 당신이나 나 모두 전체 FOSS 데스크톱 커뮤니티를 대표해 말할 수는 없음. 이 커뮤니티는 단일체가 아니고, 물론 여러 메아리 방은 있음
어떤 사람들이 믿게 만들려는 것만큼 정서와 동의가 만장일치라고 보지 않음. 몇몇 주요 프로젝트는 아직 결정하지 않은 듯하고, 완전히 Wayland로 가서 X를 버리겠다고 약속한 것도 없음. 이미 결론 난 것처럼 여기는 건 돌에 새겨진 사실이 아님
그렇다고 Linux를 포기하고 BSD로 가야 한다면 아쉬울 것 같음- 원글의 문장은 사실임. Xorg 유지보수자들이 실제로 “그 쓰레기장 같은 코드베이스에서 물러났고”, 누가 그만두라고 강요한 게 아님
이것은 FOSS의 do-ocracy가 가진 구체적인 단점임. 어떤 일을 하고 싶어 하는 사람이 충분하지 않거나, 그 비용을 낼 수 있고 낼 의향이 있는 사람이 충분하지 않으면 그 일은 일어나지 않음
누구든 Xorg 포크를 유지보수하고 배포해서 불씨를 살릴 수 있는 건 맞지만, 아직 그런 일이 일어나지 않았다는 사실 자체가 “전체 FOSS 데스크톱 커뮤니티를 대신해 말한다”고 봄
BSD들도 Wayland 지원을 추가하고 있고, 내가 알기로 유지보수되는 포크를 발표한 BSD 프로젝트는 없음. 그리고 XLibre를 실행 가능한 포크로 보지는 않음
아직 큰 신체적 장애를 겪지 않는 특권이 있다는 걸 인정하고, 원글의 상황에는 공감함. Talon이 필요로 하는 수준의 접근 권한은 KWin 플러그인으로 구현하는 편이 더 나을 수도 있어 보임
하지만 Talon이 비공개 소스라 평가하기 어렵고, 유지보수도 꽤 까다로워질 것 같음
- 원글의 문장은 사실임. Xorg 유지보수자들이 실제로 “그 쓰레기장 같은 코드베이스에서 물러났고”, 누가 그만두라고 강요한 게 아님
-
Wayland의 제약을 어느 정도는 알고 있었지만, 가벼운 사용자로서는 작은 특이점들만 겪었고 이런 종류의 문제를 직접 다룬 적은 없었음
이 글이 실제로 변화를 만들 수 있는 사람들 사이에서 인식 확산에 기여하길 바람
도달 범위를 넓히기 위해 인터넷의 다른 곳에 이 글을 재게시해도 괜찮은지 궁금함. 약자를 공격하려는 의도가 전혀 아니라는 원래의 단서를 명확히 포함하고, 사람들에게 성난 대응은 넣어두라고 안내하겠음 -
Talon이 인상적임. 이런 게 가능하다는 걸 전혀 몰랐음
표의문자 언어들도 상황이 비슷함. 결국 Wayland 도입은 일부 지역에서 벽에 부딪히거나, 이 문제를 고쳐야 할 것임 -
이 문제가 European Accessibility Act 맥락에서 논의될 수 있을지 궁금함
법안 문구에는 익숙하지 않지만, 운영체제 접근성이 핵심 부분이라는 건 알고 있음. Linux가 준수하려면 해결해야 하는 문제로 개발자들과 Sovereign Tech Agency, NLNet 같은 유럽 자금 지원 기관과 이야기해볼 수 있을 듯함- 미국의 ADA가 EU 접근성 규정보다 훨씬 강하고 훨씬 오래됐던 것으로 기억하지만, 그래도 Red Hat이 미국 정부에 판매하는 걸 막지는 못했음
-
Talon은 써본 적 없지만, 피아노 서스테인 페달 같은 MIDI 장치를 작은 전달 프로그램으로 다른 입력으로 바꿔 쓰는 건 꽤 쉽게 해봤음
하드웨어도 꽤 싸고 선택지도 많아서, 약간의 연결 코드만 있으면 창의적으로 재활용할 수 있음. 고려해볼 만함- 주제와는 조금 별개지만, 맞춤형 입력 장치는 접근성에서 흥미로운 방향일 수 있고, 이미 오픈/DIY 키보드 같은 커뮤니티도 있음
ploopy 트랙볼도 발로 조작하는 변형을 만들 수 있을 것 같음. 더 큰 볼과 감도 조절이 필요하고, 버튼은 재설계해야겠지만, 가장 단순하게는 분리형 키보드처럼 다른 발로 별도 버튼 패드를 누르는 방식도 가능함
- 주제와는 조금 별개지만, 맞춤형 입력 장치는 접근성에서 흥미로운 방향일 수 있고, 이미 오픈/DIY 키보드 같은 커뮤니티도 있음
-
“작년에 X11의 사실상 표준 입력 자동화 도구인 xdotool 유지보수자가 이걸 어떻게 할지 조사하다가 혼란스러워하며 떠났다”는 부분에 대해, 올해 다시 시도해서 꽤 많은 진전을 냈음
예를 들면 https://hachyderm.io/@whack/116554328265192238 이 있음. 지금은 여러 데스크톱 환경에서 자동 테스트를 하는 관련된 부가 작업을 하고 있는 것 같음 -
Wayback이 단기나 중기 임시 우회책이 될 수 있을지 궁금함
- 그 용도에는 맞지 않음. Wayback의 용도는 Window Maker 같은 X11 전용 데스크톱을 Wayland 위에서 실행해, 거의 유지보수되지 않는 Xorg 서버를 소프트웨어 스택에서 제거하는 것임
Alpine 쪽 사람들이 주도하고 있는데, 아직 Wayland로 전환하지 않은 창 관리자들을 버리지 않으면서 Xorg 패키징을 중단하고 싶어 하기 때문임
원글이 말하는 건 Plasma와 Gnome이 각자의 X11 세션 지원을 제거하는 문제임
- 그 용도에는 맞지 않음. Wayback의 용도는 Window Maker 같은 X11 전용 데스크톱을 Wayland 위에서 실행해, 거의 유지보수되지 않는 Xorg 서버를 소프트웨어 스택에서 제거하는 것임