GN⁺: 유전자 연구 논문의 5분의 1, Microsoft Excel (2016)로 인한 오류 포함
(science.org)- Microsoft Excel의 자동 서식 기능이 많은 문제를 일으키고 있음
- 새로운 연구에 따르면, 주요 과학 저널에 게재된 유전학 논문의 5분의 1이 이 프로그램의 오류를 포함하고 있음
- 오류는 주로 스프레드시트에서 유전자 이름이 자동으로 날짜나 숫자 값으로 변경될 때 발생함
- 예를 들어, _Septin-2_라는 유전자는 일반적으로 _SEPT2_로 줄여 쓰이지만, Excel에서는 2-SEP로 변경되어 2016년 9월 2일로 저장됨
- 연구자들은 이 문제를 해결하기 위해 Excel 열을 텍스트로 서식 지정하거나 Google Sheets로 전환할 것을 권장함
GN⁺의 정리
- 이 기사는 Microsoft Excel의 자동 서식 기능이 유전학 연구에 미치는 영향을 다루고 있음
- 유전자 이름이 날짜나 숫자로 잘못 변환되는 문제를 해결하기 위해 텍스트 서식 지정이나 Google Sheets 사용을 제안함
- 유전학 연구자들에게 중요한 정보로, 데이터 정확성을 유지하는 데 도움이 됨
- 유사한 기능을 가진 다른 스프레드시트 프로그램으로는 Google Sheets가 있음
Hacker News 의견
-
Excel의 자동 변환 기능으로 인해 데이터가 잘못 변환되는 문제에 대한 불만
- 과학적 표기법으로 인식된 문자열이 숫자로 변환됨
- 고유 위치 코드가 잘못 변환되어 데이터가 손상됨
- Microsoft가 이러한 문제를 해결하지 않고 변명만 한다는 비판
-
도구 사용에 대한 의견
- 도구를 제대로 사용하지 않는 사용자들을 비판
- 더 나은 도구를 배우거나 전문가의 도움을 받아야 한다는 주장
-
스프레드시트의 산술 우선순위 버그에 대한 불만
- 수학적 관례와 맞지 않는 결과를 반환함
- 예를 들어,
-3^2
를 입력하면-9
가 아닌9
를 반환함
-
독일 속담 인용
- "나쁜 일꾼은 항상 도구를 탓한다"는 속담을 인용하며 Excel에 감사함을 표현
-
자동 날짜 읽기 기능 비활성화 불가에 대한 불만
- 사용자가 이 기능을 비활성화할 수 없다는 점을 비판
-
Excel의 다기능성에 대한 비판
- 하나의 소프트웨어가 너무 많은 기능을 하려고 한다는 문제 제기
- 그럼에도 불구하고 Excel이 여전히 유용하다는 의견
-
미국 우편번호 문제
- 뉴잉글랜드 지역의 우편번호가 0으로 시작하는데, 이 0이 제거되는 문제
-
과학 논문에서의 유전자 이름 오류 문제
- Excel이 유전자 기호를 날짜로 잘못 변환하는 문제
- 예를 들어, SEPT2가 '2-Sep'로, MARCH1이 '1-Mar'로 변환됨
-
로그 파일 스크래핑 문제
- awk 스크립트로 타임스탬프를 변환하는 과정에서 발생한 문제
- 내부적으로 부동 소수점을 사용하여 결과가 잘못 반올림됨
- Visidata에서 데이터를 페이지로 넘길 때도 같은 문제가 발생했으나 간단한 해결책이 있었음