Skip to content

Commit

Permalink
Ajout de l'outil PYR2PYR
Browse files Browse the repository at this point in the history
  • Loading branch information
Dolite committed Nov 28, 2022
1 parent 7e1b869 commit 5ecb041
Show file tree
Hide file tree
Showing 11 changed files with 761 additions and 5 deletions.
57 changes: 57 additions & 0 deletions .github/workflows/build-and-release.yaml
Original file line number Diff line number Diff line change
@@ -0,0 +1,57 @@
name: Build and release

on:
push:
tags:
- '**'

jobs:

build:

runs-on: ubuntu-latest

steps:
- uses: actions/checkout@v3

- name: Set up Python 3.8
uses: actions/setup-python@v4
with:
python-version: "3.8"
cache: 'pip'
cache-dependency-path: '**/setup.py'

- name: Install dependencies
run: |
sudo apt update
sudo apt install python3-rados
python -m pip install --upgrade pip
python -m pip install --upgrade pip setuptools wheel
- name: Build wheel
run: |
VERSION=${{ github.ref_name }} python setup.py bdist_wheel
- name: Create Release
id: create_release
uses: actions/create-release@v1
env:
GITHUB_TOKEN: ${{ secrets.GITHUB_TOKEN }}
with:
tag_name: ${{ github.ref }}
release_name: Release ${{ github.ref_name }}
body_path: CHANGELOG.md
draft: false
prerelease: false

- name: Add wheel package to release
id: upload-release-asset
uses: actions/upload-release-asset@v1
env:
GITHUB_TOKEN: ${{ secrets.GITHUB_TOKEN }}
with:
upload_url: ${{ steps.create_release.outputs.upload_url }}
asset_path: ./dist/rok4tools-${{ github.ref_name }}-py3-none-any.whl
asset_name: rok4tools-${{ github.ref_name }}-py3-none-any.whl
asset_content_type: application/zip
8 changes: 3 additions & 5 deletions .gitignore
Original file line number Diff line number Diff line change
Expand Up @@ -68,8 +68,9 @@ instance/
# Scrapy stuff:
.scrapy

# Sphinx documentation
docs/_build/
# documentation
html/


# PyBuilder
target/
Expand Down Expand Up @@ -117,9 +118,6 @@ venv.bak/
# Rope project settings
.ropeproject

# mkdocs documentation
/site

# mypy
.mypy_cache/
.dmypy.json
Expand Down
27 changes: 27 additions & 0 deletions CHANGELOG.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,27 @@
# Outils ROK4 Python

## Summary

Cette release contient le premier outil de la suite Python PYR2PYR. Il utilise la [librairie Python du projet](https://github.com/rok4/core-python).

## Changelog

### [Added]

* Outil PYR2PYR de copie de pyramide : copie d'une pyramide d'un stockage à une autre. Contrôle les signatures MD5 si présente dans le fichier liste. Fonctionne en plusieurs modes :
* 3 pour la recopie : master, agent et finisher
* 2 pour l'aide : example et check

<!--
### [Added]
### [Changed]
### [Deprecated]
### [Removed]
### [Fixed]
### [Security]
-->
95 changes: 95 additions & 0 deletions README.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,95 @@
# Outils Python

Ce projet contient des outils de gestion des pyramides de données, écrits en Python.

- [Compilations](#compilations)
- [Outils](#outils)
- [Documentation](#documentation)
- [Installation](#installation)
- [PYR2PYR](#pyr2pyr)
- [Fonctionnement](#fonctionnement)
- [Configuration](#configuration)


## Compilations

### Outils

`VERSION=1.0.0 python setup.py bdist_wheel`

### Documentation

```sh
pip install json-schema-for-humans pdoc3 jsonschema2md
mkdir html
generate-schema-doc bin/*.schema.json ./html/
```

## Installation

Récupération des artefacts sur GitHub :

* [Fichier Wheel des librairies](https://github.com/rok4/core-python/releases)
* [Fichier Wheel des outils](https://github.com/rok4/pytools/releases)

Installation dans un environnement :

```sh
sudo apt install python3-rados
python -m venv --system-site-packages venv
source venv/bin/activate
pip install rok4lib-<VERSION>-py3-none-any.whl
pip install rok4tools-<VERSION>-py3-none-any.whl
```

Installation système :

```sh
sudo apt install python3-rados
sudo pip install rok4lib-<VERSION>-py3-none-any.whl
sudo pip install rok4tools-<VERSION>-py3-none-any.whl
```

## PYR2PYR

PYR2PYR est un outil de copie d'une pyramide d'un stockage à un autre. Il est possible de filtrer les dalles transférée en précisant une taille limite sous laquelle les données ne sont pas recopiées. La copie des dalles est parallélisable. Si des signatures MD5 sont présente dans le fichier liste, elles sont contrôlées après recopie.

Un exemple de configuration est affichable avec la commande `pyr2pyr.py --role example` et l'appel `pyr2pyr.py --role check --conf conf.json` permet de valider un fichier de configuration. Le fichier de configuration peut être un objet, auquel cas le chemin doit être préfixé par le type de stockage (exemple : `s3://bucket/configuration.json`)

### Fonctionnement

Une copie complète d'une pyramide implique l'utilisation de l'outil avec les 3 modes suivants, dans cet ordre (tous les modes utilisent le fichier de configuration) :

1. Rôle `master`
* Actions : génération des N TODO lists, déposé dans un dossier précisé dans la configuration (peut être un stockage objet).
* Appel : `pyr2pyr.py --role master --conf conf.json`
2. Rôle `agent` :
* Actions : lecture de la TODO list depuis le dossier de traitement et recopie des dalles. La fourniture externe d'un fichier du travail fait (option `--done`) permet une reprise sur erreur si la copie s'arrête au milieu.
* Appel (un appel par TODO list) : `pyr2pyr.py --role agent --conf conf.json --done /tmp/done.X.list --split X`
3. Rôle `finisher` :
* Actions : lecture des TODO lists pour écrire le fichier liste final et écriture du descripteur de la pyramide en sortie.
* Appel : `pyr2pyr.py --role finisher --conf conf.json`

![Enchaînement PYR2PYR](./docs/pyr2pyr.png)

### Configuration

Possibilités de contenu du fichier JSON (généré à partir du schéma JSON avec `jsonschema2md bin/pyr2pyr.schema.json /dev/stdout`)

- **`logger`** *(object)*: Logger configuration.
- **`layout`** *(string)*: Log format, according to logging python library. Default: `%(asctime)s %(levelname)s: %(message)s`.
- **`file`** *(string)*: Path to log file. Standard output is used if not provided.
- **`level`** *(string)*: Log level. Must be one of: `['DEBUG', 'INFO', 'WARNING', 'ERROR', 'CRITICAL', 'NOTSET']`. Default: `WARNING`.
- **`from`** *(object)*: Pyramid to copy.
- **`descriptor`** *(string)*: Path to pyramid's descriptor to copy.
- **`to`** *(object)*: Pyramid to write.
- **`name`** *(string)*: Output pyramid's name.
- **`storage`** *(object)*
- **`type`** *(string)*: Storage type. Must be one of: `['FILE', 'S3', 'CEPH']`.
- **`root`** *(string)*: Storage root : a directory for FILE storage, pool name for CEPH storage, bucket name for S3 storage.
- **`depth`** *(integer)*: Tree depth, only for FILE storage. Minimum: `1`. Default: `2`.
- **`process`** *(object)*: Processing parameters.
- **`directory`** *(string)*: Directory to write copies to process, FILE directory or S3/CEPH prefix.
- **`parallelization`** *(integer)*: Parallelization level, number of todo lists and agents working at the same time. Minimum: `1`. Default: `1`.
- **`follow_links`** *(boolean)*: Do we follow links (data slabs in others pyramids than the 'from' one). Default: `False`.
- **`slab_limit`** *(integer)*: Minimum slab size (if under, we do not copy). Minimum: `0`. Default: `0`.
Empty file added bin/__init__.py
Empty file.
20 changes: 20 additions & 0 deletions bin/pyr2pyr.example.json
Original file line number Diff line number Diff line change
@@ -0,0 +1,20 @@
{
"logger": {
"level": "INFO"
},
"from": {
"descriptor": "file:///data/pyramids/STATES.json"
},
"to": {
"name": "world/states",
"storage": {
"type": "S3",
"root": "pyramids"
}
},
"process": {
"directory": "s3://bucket_temp/pyr2pyr",
"parallelization": 3,
"slab_limit": 123456
}
}
Loading

0 comments on commit 5ecb041

Please sign in to comment.