LLM 생성 제출물은 금지되어야 한다

(lobste.rs)

1P by GN⁺ 2달전 | ★ favorite | 댓글 1개

사이트에 LLM 생성 글을 올렸을 때의 처리 논의는 많지만, 허용 여부를 정한 명확한 정책은 없다고 봄
정기적으로 LLM 생성 글을 게시하는 사용자는 사이트에서 차단해야 한다는 입장임
제출 페이지에 “LLM 생성 글은 여기서 허용되지 않는다”는 알림을 표시하자는 제안이 나옴
명확한 정책과 알림은 LLM 생성 글을 플래그할지 댓글로 대응할지를 둘러싼 논쟁을 줄일 수 있음
핵심은 LLM 생성 제출물을 허용하지 않는다는 명시적 기준을 세워 커뮤니티 대응을 단순화하자는 것임

GN⁺ 2달전 [-]

Lobste.rs 의견들

가끔 저품질 글이 새어 들어오더라도 괜찮아 보임. LLM 생성 콘텐츠 금지를 명시적으로 두면, 이상적으로는 댓글에서 다툴 예외 조항 없이, 첫 페이지의 잡글을 줄이고 반복 위반자를 금지할 명확한 근거가 생김
대체로 동의함. 직접 쓸 수고도 하지 않은 글이라면 읽고 싶지 않음
다만 LLM 생성 문장을 완벽하게 식별하는 방법은 모르겠고, 올린 글이 생성됐을 수도 있다는 이유만으로 사람이나 출처가 금지되는 건 마음에 들지 않음. 가끔 em dash를 쓴다는 이유로 LLM을 썼다는 의심을 받은 적도 있는데, 이미 25년 넘게 써오던 방식임
- 가끔 생기는 오탐은 무관용 정책만 아니면 큰 문제가 아니라고 봄. 원문은 운영진 재량으로, 저품질 글을 반복해서 올리는 패턴에 대응해 금지하자는 뜻으로 읽힘
  저품질 글 감지가 완벽하지 않다는 이유로 정책 자체를 못 만들면 안 됨. 실수는 가끔 있겠지만, 웹을 뒤덮고 사람이 쓴 글을 밀어내는 LLM 생성 쓰레기에 반드시 역압을 걸어야 함
동의함
보통은 LLM 생성 글인지 꽤 명확하고, 글 자체에 밝히지 않았더라도 작성자가 자기 사이트 다른 곳에서 LLM 사용을 적어둔 경우도 봤음. 그러면 판단이 더 쉬워짐
커뮤니티의 저품질 감지 감각도 꽤 정확해 보임. 실제로는 아닌데 작성자가 LLM을 썼다고 큰 댓글 스레드에서 몰아간 경우는 기억나지 않음. 아무도 구분 못 하면 그냥 구분 못 하는 것임
정말 애매한 경우에는 선의를 가정해도 괜찮음. 문제를 일으키는 건 대개 너무 뻔히 보이는 글이고, 아무도 감지 안 되게 LLM 글을 최대한 많이 끼워 넣으려고 lobsters를 속이는 상황은 아님
LLM 생성 기사를 정말 싫어하고 사라졌으면 함. 이런 극단적 사례는 명확하고 식별도 쉬울 가능성이 높으며, 없애는 걸 싫어할 사람은 극히 드물다고 봄
다만 누군가 LLM 생성 커밋을 일부 받아들인 소프트웨어를 제출했다면 어떨까. 또는 전부 LLM으로 만들었지만 그 과정을 분석 글로 문서화했다면 어떨까. 이런 반론은 일부러 악마의 변호인을 해보는 것이지만, lobsters 안에도 허용 범위의 스펙트럼이 있다는 건 분명함
LLM이 조금이라도 닿은 콘텐츠를 전부 금지하는 건 받아들여지기 어렵다고 봄. 가장 널리 받아들여질 답은 카르마 불이익 없는 플래그일 가능성이 큼. “내 기준에선 생성물이니 주의”라는 신호를 뒤따라 보는 사람에게 남기는 방식임. 지금 큰 댓글 스레드들이 사실상 그 역할을 하고 있고, 댓글 싸움을 줄이면서 콘텐츠 노출에 대한 신호도 줄 수 있음
- 제시한 다른 시나리오들은 다른 범주이고, 구분도 꽤 명확함. 지금과 다르게 다루고 싶다면 새 스레드를 열면 됨
합리적으로 보임. 자기 생각을 정리할 시간을 들이지 않는 사람이면, 내가 왜 읽을 시간을 들여야 하나 싶음
주장을 다듬거나 문법을 확인하려고 챗봇을 러버덕처럼 쓰는 건 괜찮음. 특별한 탐지까지 필요하다고 보진 않고, 커뮤니티 구성원의 기대와 명백한 경우의 삭제면 충분함
마음에 들지 않는 글에 곧바로 “LLM 저품질 글!”이라고 외치기는 아주 쉬움. 그러면 어떻게 될까. 주제에 맞으면서 내가 동의하는 글도, 동의하지 않는 글도 보고 싶고, 그게 건강함
글을 어떻게 “저품질”로 평가할지는 확신이 없음. 명백한 예도 있지만 애매한 예도 있음. 작성자가 우연히 LLM이 자주 따라 하는 특정 문체를 쓰기 때문에 정당한 글이 허술해 보일 가능성도 있음
“authored by” 제출물에서 제출자의 전반적 허술함을 보는 방식은 공정할 수도 있음. 명백한 저품질 글을 꾸준히 올리면 작성자를 허술하다고 표시하고, 운영진이 “그만하라”고 연락한 뒤 멈추지 않으면 금지하는 식임
누군가를 통해 제출된 “허술한 글”도 똑같이 계산해야 할지는 모르겠음. 소프트웨어가 계속 저품질로 보이는 글을 제출하는 사람의 게시 능력을 금지하지는 않고 일시적으로 식히는 정도는 가능해 보임. 하지만 모든 제출자가 글의 출처를 방어하지 못하면 금지되는 구조는 즐겁지 않을 것임
- 모든 규칙이 미끄러운 경사는 아님. 실제로 명백한 LLM 저품질 글이 있고, 그런 것만으로도 조정 대상이 되기에 충분함
  LLM 저품질 글 작성이 얼마나 반사회적인지 과소평가하는 듯함. 지금도 그런 명백한 사례들이 AI 유행을 탄 사람들이 올려줘서 첫 페이지에 며칠씩 떠 있음
- 불에는 불로 맞서서 LLM 저품질 글 탐지기를 쓰면 됨
관련 글: https://lobste.rs/s/wee21u/this_is_written_by_llm_comments_should_be
예시:
https://lobste.rs/s/ojvhq9/coding_is_thinking_why_i_still_write_code
https://lobste.rs/s/eaxtmb/claude_for_legal_suite_plugins_for_legal
https://lobste.rs/s/fvqkke/new_claude_code_programmatic_usage
LLM 생성 텍스트는 필터링하거나 플래그를 달 수 있어야 한다는 데 동의함
문제는 LLM 생성 글이지만 실제로는 주제에 맞는 경우 “주제 벗어남”으로 라벨링하면 모순적으로 쓰일 수 있다는 점임. 예전에도 새 플래그 옵션이 논의된 적이 있음. 예: https://lobste.rs/s/po97lh/new_tag_suggestion_genai_assisted
여전히 https://lobste.rs/s/rkjpob/proposal_add_ai_generated_as_flag_reason 에서 논의된 것처럼 “주제 벗어남” 플래그를 남용하기보다 새 플래그 옵션이 더 낫다고 봄
- 피드백을 받아들임. 표현이 나빴음. 금지되어야 함
  필터링 가능하거나 플래그 가능하다는 건 별로 중요하게 보지 않음. 그걸 올리는 사용자는 사이트에서 제거되어야 함. 플래그나 태그는 실제 조치로 이어지지 않으면 낭비임
가치 없는 예시만 골라 말하는 것 같지만, https://lobste.rs/s/hfnps5/osmand_s_faster_offline_navigation 의 LLM 생성 텍스트는 전반적으로 쓰레기 품질이어도 실제로 주제에 맞는 고유 내용도 들어 있음
- 아님. 가능한 범위 안에서 LLM 생성 텍스트는 어떤 것도 올라오지 않길 바란다는 얘기임. 스팸으로 투표한 사람들을 보면 됨. 내가 봤다면 나도 그중 하나였을 것임
이제 모든 형태의 대시는 불법임
- 왜 사람들이 em dash를 결정적 증거처럼 여기는지 모르겠음. 예를 들어 Pandoc의 HTML 출력은 Markdown --에서 em dash를 생성함
우려점: 텍스트가 LLM 생성인지 완벽한 정확도로 알기는 쉽지 않음. 다만 대부분의 경우는 명백함
가끔은 어떤 방식으로든 “중요”하거나 “주목할 만한” 글이 LLM 생성일 수 있음. 예를 들면 CopyFail 보고서가 있음
제안: LLM 생성 콘텐츠는 영향 큰 보안 취약점 같은 예외적 상황을 제외하고 금지해야 함. 텍스트가 LLM 생성인지 판단할 때는 보수적으로 접근해 경계 사례에는 의심보다 이익을 줘야 함. “예외적 상황”은 운영진 재량으로 두거나, 정책이 발전하면서 해당 조건 목록을 정하고 반복 개선할 수 있음

답변달기

LLM 생성 제출물은 금지되어야 한다

함께 보면 좋은 글 β

댓글과 토론

Lobste.rs 의견들