기존의 AI 가이드라인 방식이 AI에게 올바른 행동을 유도하기 위한 도덕 교육(학습)을 시키는 것과 같다면
사용자가 적대적 공격 기법을 통해 탈옥을 시도하는 순간 그 사용자의 신호를 강제로 차단하는 커널 수준의
스위치를 만들어보는 것에는 어떻게 생각하시는지 여러분께 의견을 묻고싶습니다.
기존의 AI 가이드라인 방식이 AI에게 올바른 행동을 유도하기 위한 도덕 교육(학습)을 시키는 것과 같다면
사용자가 적대적 공격 기법을 통해 탈옥을 시도하는 순간 그 사용자의 신호를 강제로 차단하는 커널 수준의
스위치를 만들어보는 것에는 어떻게 생각하시는지 여러분께 의견을 묻고싶습니다.