LabPlot: 무료, 오픈 소스, 크로스플랫폼 데이터 시각화 및 분석
(labplot.org)- LabPlot은 다양한 데이터 시각화 및 분석 기능을 제공하는 무료 소프트웨어임
- CSV, SQL, Excel(xlsx), JSON 등 여러 데이터 형식을 지원하여 데이터 불러오기가 쉬움
- LabPlot을 활용하면 과학적 분석과 시각화를 한 번에 진행할 수 있음
- 크로스플랫폼 지원으로 Windows, macOS, Linux 등 다양한 운영체제에서 사용 가능함
- 오픈 소스 기반이므로 누구나 자유롭게 확장과 커스터마이즈가 가능함
LabPlot 소개
- LabPlot은 무료 오픈 소스이며 다양한 플랫폼에서 동작하는 데이터 시각화 및 분석 툴임
- 사용자는 과학적 플로팅 및 데이터 분석 업무를 하나의 앱에서 효율적으로 처리할 수 있음
데이터 가져오기 및 호환성
- LabPlot의 첫 단계는 다양한 형식의 데이터 가져오기임
- 지원하는 데이터 형식에는 CSV, Origin, SAS, Stata, SPSS, MATLAB, SQL, JSON, 바이너리, OpenDocument 스프레드시트(ods), Excel(xlsx), HDF5, MQTT, Binary Logging Format(BLF), FITS 등 다수 존재함
- 이러한 형식 지원으로 데이터 통합과 초기 작업이 빨라지는 장점이 있음
요약
- LabPlot은 크로스플랫폼 지원의 과학적 데이터 시각화 및 분석 도구로, 사용자가 다양한 데이터 포맷을 빠르게 불러와 효율적으로 다룰 수 있게 도움을 줌
- 오픈 소스 특성상 사용자가 직접 기능 확장과 맞춤화가 가능한 이점이 있음
Hacker News 의견
-
차트나 그래프 도구가 이제는 아주 평범한 소모품처럼 여겨지는 현상이 신기함, 1988년 말에 Deltagraph를 처음 개발했을 때에는 Postscript와 Illustrator 출력을 타깃으로, 엄청나게 다양한 그래프와 옵션을 담아 전 세계적으로 표준처럼 사용되었음, 특히 인쇄용으로 많이 쓰였음, 90년대 중반엔 개발만 맡고 퍼블리셔에게 판매된 후, 팬데믹 때까지 25년간 소유주가 여럿 바뀌면서도 C로 작성한 원본 소스코드 기반으로 계속 운영되었음, 지금쯤 그 코드가 얼마나 난장판이었을지 상상도 안 됨
- 그런데도 여전히 차트/그래프 시장이 충분히 평범화되거나 범용화되진 않은 느낌임, 대부분의 직장인들은 구식의 상용 솔루션(Tableau, HW 엔지니어링에서는 JMP, 그리고 SAS나 Excel 등)을 씀
-
SciDavis를 오랫동안 사용했고, 전에 QtiPlot도 시도했었음, 기회가 되면 Origin도 사용했음, SciDavis가 투박한 데다 자주 튕기곤 했지만 원하는 작업에는 큰 문제는 없었음, 그래프 스타일 설정에 애를 좀 먹었고, 스타일 복사는 불편했음, 최근 LabPlot을 써봤는데 csv 파일에 datetime 데이터가 있을 땐 고급 옵션과 수동 설정을 해도 날짜 및 시계열 포맷을 제대로 인식하지 못하는 문제가 있었음, 문서 사이트는 유튜브 동영상 모음인데, 영상을 보며 메뉴얼을 찾을 필요가 없어 별로임, 개발자들이 전통적인 문서도 꼭 만들어야 함, SciDavis의 포크 버전인 AlphaPlot도 있는데, 여전히 yyyy-MM-dd hh:mm:ss.zzz 날짜 문제 등 자체 과제가 있음, 그래도 쓸만한 툴임, 배치 처리나 여러 그래프를 자동 생성하고 재현성 있게 하고 싶으면 gnuplot을 사용함, 학습 곡선은 가파르지만 스크립트를 몇 번 써보면 자기만의 템플릿을 만들 수 있고, 유용함, 오픈소스 움직임이 이 분야에도 있어 항상 더 많은 선택지가 생기는 건 좋음
LabPlot 메뉴얼 링크 -
ggplot 같은 툴은 세부 조정하려면 손이 많이 가지만, 그만큼 유연성도 훌륭함, 다만 예를 들어 가속적 종단 연구 데이터로 피험자별 반복측정 spaghetti plot을 그리거나, 고정효과 plot을 그리려 하면 대부분의 솔루션이 한계가 생김, 참고로 내가 만든 plot 예시가 있음
플롯 예시- 나는 생물통계학자인데, 복잡한 종단 연구 디자인을 볼 때마다 정말 좋아함, 예전 교수님이 이런 상황에서 cross-sectional과 longitudinal 효과 분해나 Lord’s paradox 이야기를 하셨는데 아직도 Lord’s paradox는 완벽히 파악하지 못한 상태임
-
보기에는 정말 멋짐, 하지만 ‘이게 왜 matplotlib이나 다른 인기있는 차트툴보다 더 좋은지’ 설명 섹션이 있었으면 함, 기능 리스트는 봤으나 직접 비교표를 머릿속에서 조합하는 데 부담이 있음, 매력적인 점이 많아 보이지만, 시간을 투자해서 새로 배워볼만한 가치가 있는지 알 수 있도록 사례연구 같은 게 있었으면 진짜 좋겠음
-
여기 많은 노력이 들어간 건 분명함, 하지만 이미 Julia, Matlab, R, Python, Excel 등에서 실험실 코드와 연동되어 있다면 굳이 이 도구를 써야 하는 동기가 뭐가 있는지 혼란스러움, 특정 커뮤니티에서 유행하는지 궁금함
-
아마도 Origin처럼 일부 과학 커뮤니티에서 인기 있는 상업용 도구 역할을 FOSS 방식으로 대체하려는 목적임, 다른 소프트웨어(예: 계측 SW)가 이미 데이터를 만들어 줬고, 그걸 빠르게 플롯으로 시각화하고 간단한 곡선 피팅 등을 GUI로 처리하고 싶을 때 유용함, 만약 이미 언급한 언어와 라이브러리로 데이터 처리에 익숙하다면 굳이 이 도구가 필요할 이유는 없음
-
나는 딱 이 도구의 타깃 유저일 듯함, R, Python, Maxima, MATLAB/Octave를 오가며 데이터를 보통 CSV로 넘기는데, 도구마다 인터페이스가 제각각이라 번거로움, Jupyter도 그리 좋아하지 않아서 이게 더 편하면 Jupyter 대체로도 써볼 수 있을 것 같음
-
내 경험상 프로그래밍이 비생산적이거나 편하지 않은 사람들도 꽤 있음, 나는 Python을 주로 쓰지만, 회사엔 JMP 라이선스도 많고 대부분의 엔지니어는 Excel을 만족스럽게 씀, 근데 내가 작업하는 데 걸리는 시간은 남에게 보여주지 않음, 그리고 이런 사람들은 오픈소스나 명성 없는 프로그램엔 여전히 경계심이 있음, 이런 도구라면 혼자 시험삼아 써보고 충분히 괜찮을 때만 상사한테 ‘이거 쓸만하다’고 말할 수 있는 옵션이 될 것임
-
실제 현장 사례를 하나 들면, 발사체 프로젝트 엔지니어로 근무하며, 시험 및 비행마다 발생하는 텔레메트리 데이터 프레임을 CSV나 TSV 등 엄청 큰 파일로 쌓음, 수백 개 변수의 시계열 그래프를 빠르게 시각적으로 돌려보며 이상 유무를 즉시 찾아야 하고, 여러 번 확대‧이동해서 필요한 내용을 캡처해 문서에 넣기도 함, 때론 극도의 상세한 포인트(비트 단위, 샘플 단위)로 확대해 예외 케이스까지 잡아야 하는데, 이벤트가 언제 어디에 있을지 미리 알 수 없으니 속도가 생명임, 서로 다른 단위의 여러 변수 플롯을 한꺼번에 띄워 상관관계도 봐야 하고, 팀 단위로 분석할 때 즉석에서 시각화도 요구됨, 주파수나 통계 분석(피리어도그램, 로그/세미로그, PDF 등)도 필요함, 플롯에 마커나 설명도 빠르게 추가하고, 레이블이나 포맷도 WYSIWYG로 바꾸고 싶음, 그리고 메뉴 한 번만에 FFT나 필터 적용과 시각화까지 다 되어야 함, Python/Jupyter로 일일이 텍스트로 조작하는 건 이런 워크플로우에선 시간적으로 너무 비효율적임, LabPlot이나 우리가 쓰던 응용프로그램에선 이런 작업을 거의 실시간으로 할 수 있었음, Excel도 스프레드시트 인터페이스 덕에 가까운 기능은 있지만, 시계열 플롯 만들기 위해 일일이 셀, 축, 그래프 정의, 플롯 확장, 레이블 포맷 등을 지정하다 보면 한 달 내내 분석만 하게 됨, 이런 응용프로그램은 댓글, 메타데이터 등이 데이터 파일에 포맷된 주석 형태로 삽입되어 있어서 빠른 작업이 가능했고, 대용량 파일도 디스크와 메모리 수준에서 버퍼링해 즉각 반응성을 줌, 이런 특수 워크플로우엔 LabPlot이나 유사 도구가 정말 필수임
-
아직 이 툴은 안 써봤지만, 데이터를 드래그&드롭으로 시각화할 수 있다면 기존 도구들에 아주 훌륭한 보완재가 될 것 같음
-
-
아마 이게 프로젝트 Github임
프로젝트 Github- 이건 Github 미러이고, 실제 개발은 KDE GitLab에서 주로 진행 중임
KDE GitLab 공식 개발 저장소
- 이건 Github 미러이고, 실제 개발은 KDE GitLab에서 주로 진행 중임
-
HN hug of death 발생인지 궁금함
-
S3 버킷 및 기타 클라우드 오브젝트 스토리지 연동 지원이 추가되면 정말 도움이 될 것 같음, Iceberg 지원도 요즘 인기가 많으니 포함되면 좋겠음
-
현재 지원하는 데이터베이스가 SQLite뿐이라 아쉬움, 직접 데이터베이스 또는 REST API에 바로 연결하고 싶었는데, 파일을 내보내고 다시 불러들이는 절차가 너무 번거로움
-
LabPlot 메뉴얼에는 다양한 DB 지원이 언급되어 있음
LabPlot SQL 연동 메뉴얼
Qt5.15 데이터베이스 드라이버 목록
혹시 다른 주제를 말하고 있는 것인지 궁금함 -
SQLite는 충분히 훌륭하고 써드파티 REST API 솔루션도 있으니 큰 문제는 아닌 것 같음
-
-
이게 Metabase나 Superset의 데스크탑 버전 같은 포지션인지 궁금함