PyGWalker 0.3 is released! Check out the changelog for more details. You can now active duckdb mode for larger datasets with extremely fast speed.
PyGWalker는 판다스 데이터프레임 (및 폴라 데이터프레임)을 Tableau 스타일의 사용자 인터페이스로 변환하여 Jupyter Notebook 데이터 분석 및 데이터 시각화 워크플로우를 간소화할 수 있습니다.
PyGWalker (즐겁게 발음하는 "Pig Walker"와 같이 발음됩니다)는 "Python binding of Graphic Walker"의 약자로 이름이 지어졌습니다. 이는 Graphic Walker와 Jupyter Notebook (또는 다른 Jupyter 기반 노트북)를 통합하여 Tableau의 대체 오픈 소스 유형을 제공합니다. 이를 사용하면 데이터 과학자들은 간단한 드래그 앤 드롭 작업으로 데이터를 분석하고 패턴을 시각화할 수 있습니다.
Test를 위해 Google Colab, Kaggle Code 또는 Graphic Walker Online Demo를 방문하여 테스트해보세요!
R을 사용하는 것을 선호하신다면 GWalkR을 확인해보세요!
Kaggle에서 실행 | Colab에서 실행 |
---|---|
pygwalker를 사용하기 전에 pip 또는 conda를 사용하여 패키지를 설치해야 합니다.
pip install pygwalker
참고
초기 시험을 위해
pip install pygwalker --upgrade
로 설치하여 최신 릴리스와 버그 수정을 최신 상태로 유지하거나pip install pygwalker --upgrade --pre
로 최신 기능과 버그 수정을 얻을 수 있습니다.
conda install -c conda-forge pygwalker
또는
mamba install -c conda-forge pygwalker
더 많은 도움말을 보려면 conda-forge feedstock을 참조하세요.
pygwalker 및 판다스를 Jupyter Notebook에 가져와 시작하세요.
import pandas as pd
import pygwalker as pyg
기존 워크플로우를 변경하지 않고 pygwalker를 사용할 수 있습니다. 예를 들어 다음과 같이 데이터프레임을 로드하고 Graphic Walker를 호출할 수 있습니다.
df = pd.read_csv('./bike_sharing_dc.csv')
walker = pyg.walk(df)
df = pd.read_csv('./bike_sharing_dc.csv')
walker = pyg.walk(
df,
spec="./chart_meta_0.json", # 이 json 파일은 차트 상태를 저장하며, 차트를 완료할 때 수동으로 저장 버튼을 클릭해야 합니다. 'autosave'는 미래에 지원될 예정입니다.
kernel_computation=True, # `kernel_computation=True`로 설정하면 pygwalker가 계산 엔진으로 duckdb를 사용하며, 더 큰 데이터셋(<=100GB)을 탐색할 수 있습니다.
)
이제 Tableau와 유사한 사용자 인터페이스를 사용하여 변수를 드래그 앤 드롭하여 데이터를 분석하고 시각화할 수 있습니다.
Graphic Walker로 수행할 수 있는 멋진 작업:
- 다른 차트 유형으로 마크 유형을 변경하여 다른 차트를 만들 수 있습니다. 예를 들어, 라인
-
차원의 값으로 나누어진 여러 하위 뷰를 만들려면 행 또는 열에 차원을 추가하여 패싯 뷰를 만들 수 있습니다. 규칙은 Tableau와 유사합니다.
-
데이터 탐색 결과를 로컬 파일에 저장할 수 있습니다.
자세한 지침은 Graphic Walker GitHub 페이지를 방문하세요.
- Jupyter Notebook
- Google Colab
- Kaggle Code
- Jupyter Lab (작업 중: 아직 일부 작은 CSS 문제가 있음)
- Jupyter Lite
- Databricks Notebook (버전
0.1.4a0
부터) - Visual Studio Code용 Jupyter 확장 (버전
0.1.4a0
부터) - Hex Projects (버전
0.1.4a0
부터) - IPython 커널과 호환되는 대부분의 웹 응용 프로그램 (버전
0.1.4a0
부터) - Streamlit (버전
0.1.4.9
부터),pyg.walk(df, env='Streamlit')
을 사용하여 활성화됨 - DataCamp Workspace (버전
0.1.4a0
부터) - ...더 많은 환경에 대한 이슈를 제기하십시오.
$ pygwalker config --help
usage: pygwalker config [-h] [--set [key=value ...]] [--reset [key ...]] [--reset-all] [--list]
Modify configuration file. (default: /Users/douding/Library/Application Support/pygwalker/config.json)
Available configurations:
- privacy ['offline', 'update-only', 'events'] (default: events).
"offline": fully offline, no data is send or api is requested
"update-only": only check whether this is a new version of pygwalker to update
"events": share which events about which feature is used in pygwalker, it only contains events data about which feature you arrive for product optimization. No DATA YOU ANALYSIS IS SEND.
- kanaries_token ['your kanaries token'] (default: empty string).
your kanaries token, you can get it from https://kanaries.net.
refer: https://space.kanaries.net/t/how-to-get-api-key-of-kanaries.
by kanaries token, you can use kanaries service in pygwalker, such as share chart, share config.
options:
-h, --help show this help message and exit
--set [key=value ...]
Set configuration. e.g. "pygwalker config --set privacy=update-only"
--reset [key ...] Reset user configuration and use default values instead. e.g. "pygwalker config --reset privacy"
--reset-all Reset all user configuration and use default values instead. e.g. "pygwalker config --reset-all"
--list List current used configuration.
자세한 내용은 참조하세요: How to set your privacy configuration?
- PyGWalker Paper PyGWalker: On-the-fly Assistant for Exploratory Visual Data Analysis
- Graphic Walker에 대한 자세한 자료
- RATH (작업 중인 항목): 인공 지능 기반 자동화를 통해 데이터 처리, 탐색 및 시각화 워크플로우를 재정의하는 오픈 소스 자동 탐색 데이터 분석 소프트웨어입니다. 더 많은 정보를 보려면 Kanaries 웹 사이트
및 RATH GitHub를 확인하세요!
- Streamlit에서 시각 분석 앱을 빌드하기 위해 pygwalker 사용하기
- 문제가 발생하거나 지원이 필요한 경우 Slack 또는 Discord 채널에 참여하세요.
- pygwalker를 이러한 소셜 미디어 플랫폼에서 공유하세요: