1P by pjhkorea | ★ favorite | 댓글 5개

기존의 AI 가이드라인 방식이 AI에게 올바른 행동을 유도하기 위한 도덕 교육(학습)을 시키는 것과 같다면
사용자가 적대적 공격 기법을 통해 탈옥을 시도하는 순간 그 사용자의 신호를 강제로 차단하는 커널 수준의
스위치를 만들어보는 것에는 어떻게 생각하시는지 여러분께 의견을 묻고싶습니다.

댓글과 토론

여기서 말하는 커널이 운영체제 커널인지 CUDA 커널인지 LLM 시스템 인스트럭션을 커널이라 칭하는건지 모호하네요.

https://github.com/PJHkorea/value-system-kernel
대충 뼈대만 잡아놨는데
위험한 단어들의 벡터 값이 적재된 메모리 주소를 관리하면 어떨까 해서요

CUDA 커널쪽입니다

프로그램짜심?

하나 짜놓긴했는데
영 마음이 안가서요
일단 뼈대만 만들어놨어요