▲GN⁺ 2024-08-30 | parent | ★ favorite | on: 파이썬 데이터프레임 라이브러리 Ibis, Pandas 와 Dask 백엔드를 폐기(ibis-project.org)Hacker News 의견 NaN은 0/0의 결과로, 값이 존재하지만 정확히 알 수 없음을 의미함 NULL은 특정 위치의 값을 알 수 없음을 의미함 NaN과 NULL의 구현이 다르지만 완전히 무관하지 않음 Python의 None은 NaN과 NULL과 다름 pandas보다 더 나은 컴퓨팅 엔진이 많음 기존 코드베이스와 서드파티 통합 때문에 pandas를 계속 사용함 작은 데이터 작업에는 pandas가 충분히 적합함 최근 몇 달 동안 새로운 프로젝트에서 pandas를 ibis로 대체함 ibis의 문법이 pandas보다 더 유연함 연산 체이닝이 코드 스니펫을 더 이식 가능하게 만듦 Duckdb 백엔드가 매우 빠름 커뮤니티가 매우 활발하고 친절함 ibis를 동료들에게 홍보 중임 pandas의 멀티 인덱스 기능이 가장 강력함 열에도 사용할 수 있음 새로운 도구들이 이 기능을 어떻게 처리할지 확신이 없음 Polars를 고려해봤는지 궁금함 그룹에서 pandas를 싫어해서 Polars를 표준으로 사용 중임 pandas는 새로운 유형의 열에 확장 가능함 Polars가 이를 지원하는지 확실하지 않음 Ibis의 가치는 DuckDB를 사용할 수 있다는 점이 아님 새로운 도구가 나와도 문법이 계속 작동함 Ibis에 대해 많이 들어본 적이 없음 pandas에서 벗어나면 Ibis를 시도할 가능성이 낮아짐 새로운 프레임워크가 pandas/numpy에서 벗어나고 있지만, 호환성과 엣지 케이스가 해결될 때까지 기다릴 예정임 몇 밀리초 더 기다려도 상관없음 pandas의 라이브러리 API가 항상 직관적이지 않음 NaN/None 문제가 있지만 이는 사소한 불편함임 pandas를 사용하는 이유는 통합된 생태계 때문임 json 파일, csv 파일, python dict 등에서 데이터를 읽고 plotly로 시각화할 때 pandas가 편리함 Ibis가 pandas 데이터프레임과 호환된다면 백엔드에 크게 신경 쓰지 않음
Hacker News 의견
NaN은 0/0의 결과로, 값이 존재하지만 정확히 알 수 없음을 의미함
pandas보다 더 나은 컴퓨팅 엔진이 많음
최근 몇 달 동안 새로운 프로젝트에서 pandas를 ibis로 대체함
pandas의 멀티 인덱스 기능이 가장 강력함
Polars를 고려해봤는지 궁금함
pandas는 새로운 유형의 열에 확장 가능함
Ibis의 가치는 DuckDB를 사용할 수 있다는 점이 아님
Ibis에 대해 많이 들어본 적이 없음
pandas의 라이브러리 API가 항상 직관적이지 않음
pandas를 사용하는 이유는 통합된 생태계 때문임