주석에 욕설이 있는 코드는 욕설이 없는 코드보다 품질이 더 좋습니다.
(blog.desdelinux.net)- 카를스루에 공과대학교 산하 이론 컴퓨터 과학 연구소의 학생인 Jan Strehmel이 발표한 연구.
- 욕설이 포함된 3800개 이상의 저장소와 욕설이 없는 7600개 이상의 저장소를 수집.
- C/C++ 코드 품질 측정 도구인 SoftWipe을 사용해 코드의 품질을 측정하고, 다양한 통계적 방법을 통해 분석함.
- 그 결과, 욕설이 있는 코드의 품질이 평균적으로 더 높은 것을 확인함.
- 욕설의 사용이 코드의 복잡성에 감정적으로 관여를 하고 있으며, 비판적으로 코드를 분석해 더 나은 코드를 생성한다는 가설.
- 하지만 연구 검토에서는 욕설과 코드 품질의 연관은 찾기 힘들며, 연구의 대표성이 부족하다고 비평함.
퀘이크의 벡터계산 알고리즘 코드가 생각나네요.
float Q_rsqrt( float number )
{
long i;
float x2, y;
const float threehalfs = 1.5F;
x2 = number * 0.5F;
y = number;
i = * ( long * ) &y; // evil floating point bit level hacking
i = 0x5f3759df - ( i >> 1 ); // what the fuck?
y = * ( float * ) &i;
y = y * ( threehalfs - ( x2 * y * y ) ); // 1st iteration
// y = y * ( threehalfs - ( x2 * y * y ) ); // 2nd iteration, this can be removed
return y;
}
‘욕을 잘하면 제대로 교육을 못 받았을 것’이라는 통념과 달리 욕을 잘 구사할 경우 어휘력이 상대적으로 뛰어나다는 연구 결과가 나왔다." - https://www.mk.co.kr/news/society/7115122
욕설을 잘 하는 사람들이 어휘력이 높다는 연구도 있습니다. '아니' 라는 표현만 하는 사람과 '아니'와 '아니 ㅅx'을 구분해서 둘 다 쓰는 사람이 있다면, 후자가 더 어휘력과 표현력이 뛰어난거 같긴 하네요.
동료의 코드를 보고 욕을 못 참을 만큼 뛰어난 실력을 가진 사람이 코드를 짜서 그런 거 아닐까요
아니면 코드에 욕을 박아놔도 누가 뭐라 할 수 없는 실력이 있는 사람이 코드를 짜서 ㅋㅋ
저도 이렇게 생각합니다. 어지간한 수준으론 어딜 감히 코멘트에 욕을... 스스로 검열할 것 같아요. 수준이 뛰어난 몇몇 프로그래머 중 절제가 안되거나 절제를 일부로 안하는 소수만 욕을 남길 것 같습니다. 원문 코멘트를 보면 토발즈 언급도 있네요ㅋㅋ
기본적으로 연구에서도 욕설과 코드 품질에 상관관계는 있지만, 인과관계는 없어 욕설을 한다고 코드 품질이 좋아지는 건 아니라고 말합니다.
그리고 아직 결론을 내기엔 좀 이르고, 연구가 더 필요하다는 말도 있고요.
해커 뉴스 쪽에서도 찬반 논쟁이 많네요. 누구는 진짜 그런 것 같다고 하고, 누구는 아니라고 하고...
댓글 중에 안전한 환경(억압되지 않는)에서 욕설을 하게 되며, 그런 환경에서 더 나은 코드 품질을 만들어낸다는 말도 있고...
또 욕을 하면 감정적으로 좀 풀리기 때문에 코드 품질에 더 집중할 수 있다는 말도 있네요.
이게 맞는 말인지는 잘 모르겠지만, OpenJDK에도 욕설이 있다고 하네요.
논문에 대한 AI 요약
PDF는 오픈 소스 코드에서 욕설 사용이 코드 품질과 관련이 있는지에 대해 논의합니다.
이를 조사하기 위해 저자는 GitHub에서 욕설이 포함된 3800개 이상의 C 저장소와 욕설이 없는 7600개 이상의 C 저장소를 크롤링했습니다.
저자는 SoftWipe라는 도구를 사용하여 저장소의 코드 품질을 코딩 표준 준수에 따라 정량화했습니다.
결과는 통계적 검증을 기반으로 욕설이 포함된 저장소가 욕설이 없는 저장소보다 훨씬 높은 코드 품질 점수를 보였습니다.
저자는 욕설 사용이 프로그래머의 감정적 참여와 코드의 철저한 분석을 나타내어 더 나은 품질을 이끌어낸다고 가설을 세웠습니다.
그러나 상관관계는 인과관계를 의미하지 않으며, 욕설은 자동으로 코드 품질을 향상시키지 않는다는 점을 저자는 인정합니다.
이 연구는 흥미로운 초기 결과를 제공하지만, 저자는 더 큰 데이터셋(포함된 C++ 코드 및 욕설의 보다 정확한 식별)을 얻고,
코드 품질 결과에 대한 코드 라인, 별점 및 욕설의 수의 영향을 더 자세히 조사하는 것이 더 많은 통찰력을 제공할 수 있다고 언급합니다.
요약하면, 이 연구의 주요 결과는 오픈 소스 C 코드에서 욕설 사용과 높은 코드 품질 점수 사이에 통계적으로 유의한 상관관계를 발견했다는 것입니다.
그러나 저자는 이 상관관계의 이유와 실용적인 함의를 더 잘 이해하기 위해 추가적인 연구가 필요하다고 주의를 줍니다.