GN⁺: 그래프 마이닝 라이브러리
(github.com/google)- 본문은 Google Graph Mining 팀이 개발한 도구들을 포함하는 프로젝트인 Graph Mining Library에 대해 논의합니다.
- 이 도구들은 그래프 구조를 본질적으로 가지거나 그래프 문제로 공식화 될 수 있는 데이터 마이닝 및 머신 러닝 문제를 해결하기 위해 설계되었습니다.
- 이 라이브러리는 수십억 개의 에지를 가진 그래프를 처리할 수 있는 공유 메모리 병렬 클러스터링 알고리즘을 포함하고 있습니다.
- 이 알고리즘들은 "Poly-Logarithmic Depth에서의 Hierarchical Agglomerative Graph Clustering", "Parallel correlation clustering을 통한 Scalable community detection", "Affinity Clustering: Hierarchical Clustering at Scale", 그리고 "Distributed Balanced Partitioning via Linear Embedding" 등 여러 연구 논문을 기반으로 합니다.
- 각 논문과 관련된 저장소의 특정 섹션에 대한 링크가 제공됩니다.
- 질문이나 의견이 있을 경우, 사용자들은 저장소에 이슈를 생성하도록 권장됩니다.
- 본문은 또한 Bazel을 설치하고 예제를 실행하는 방법을 안내하는 빠른 시작 가이드를 제공합니다.
Hacker News 의견
- 소셜 네트워크의 부상과 함께 그래프 마이닝이 10년 전에 인기를 끌었습니다.
- 기하학적 학습, 그래프와 다른 구조에서의 머신러닝 형태, 또한 잠재 디리클레 할당 모델(LMMs)이 더욱 널리 퍼지기 전까지 인기가 있었습니다.
- 데이터베이스 시스템인 Arangodb는 NetworkX, DeepGraphLibrary, cuGraph, PyG 등 다양한 그래프 라이브러리와 머신러닝 프레임워크와의 통합을 포함합니다.
- 소프트웨어 빌딩과 테스팅을 자동화하는 도구인 Bazel을 사용하여 라이브러리를 어떻게 구축하는지에 대한 질문이 있습니다.
- 라이브러리는 그래프 기반 클러스터링 알고리즘을 통합하기 위해 래퍼 또는 확장 라이브러리와 통합될 수 있습니다.
- 대규모 그래프 처리 시스템인 Pregel과 라이브러리의 관계에 대한 질문이 있습니다.
- 라이브러리의 잠재적인 용도와 응용 예제에 대한 설명 요청이 있습니다.
- 라이브러리는 C, C++, Starland로 작성되었으며, Starland이 무엇인지에 대한 질문이 있습니다.
- Basic Linear Algebra Subprograms (BLAS) 및 Linear Algebra Package (LAPACK)와 유사하게 그래프 알고리즘에서의 표준화를 요구하는 목소리가 있습니다.
- 일부는 라이브러리가 이상 탐지를 위한 통계 그래프 마이닝에 사용될 수 있기를 희망했습니다.