Agregacje 3

Kilka przykładowych agregacji korzystających z danych zipcodes oraz imieniny opisano w Aggregation Framework Examples.

Zaliczenie, deadline czwartek, 2014-11-20, 08:00 CEST

Dane należy wpisać według schematu (całość w jednym wierszu):

1. [Nazwisko, Imię](link do repozytorium z rozwiązaniem zadania 1 na GitHub).
   [Tytuł](link do repozytorium z rozwiązaniem zadania 2 na GitHub),

Acewicz-Hepfner, Patryk
Banecka, Kamila
Banecki, Daniel
Bednarczyk, Marek
Bieliński, Marcin
Bławat, Adam
Bonczkowska, Magdalena
Borkowski, Maciej
Cimoch, Jarosław
Czechowicz, Kacper
Dargacz, Mateusz
Drozdowski, Adrian
Ekiert, Łukasz
Gałka, Łukasz
Grycko, Marcin
Horoszko, Marcin
Janowski, Arkadiusz
Józwiak, Roman
Kamiński, Jakub
Karolczak, Jakub
Kąkol, Jan
Kłeczek, Piotr
Komorowski, Szymon
Koźmiński, Marcin
Kożuch, Adam
Kucharski, Maciej
Kulas, Piotr
Kuźnik, Mateusz
Kwiatkowski, Dominik
Lamkiewicz, Krzysztof
Latoszewski, Adam
Latoszewski, Krzysztof
Ławicki, Patryk
Makulec, Krzysztof
Miotk, Mateusz
Miś, Maciej
Nowak, Wojciech
Nowicki, Jakub
Ossowski, Marcin
Piotrkowski, Łukasz
Rękawek, Szymon
Sałata, Jakub
Sarzyńska, Magdalena
Sienkiewicz, Daniel
Skałkowski, Michał
Soliński, Damian
Synowczyk, Piotr
Szklarska, Milena
Szymanek, Tomasz
Wittbrodt, Łukasz
Zakrzewski, Patryk
Zalewski, Marcin
Zdunek, Kamil

Egzamin, deadline czwartek, 2015-01-08, 08:00 CEST

Przykłady z MapReduce lub agregacji w Elasticsearch.

Simple Rules for Reproducible Computations

Provide public access to scripts, runs, and results:

Version control all custom scripts:

avoid writing code
write thin scripts and use standard tools and use standard UNIX commands to chain things together.

Avoid manual data manipulation steps:

use a build system, for example make, and have all results produced automatically by build targets
if it’s not automated, it’s not part of the project, i.e. have an idea for a graph or an analysis? automate its generation

Use a markup, for example Markdown, to create reports for analysis and presentation output products.

And two more rules:

Record all intermediate results, when possible in standardized formats.
Connect textual statements to underlying results.

Różne rzeczy

Do automatycznego wygenerowania spisu treści w zadaniach można użyć narzędzia Table of Contents Preprocessor.
Jak sobie radzić z nieczystymi committami?

Big Collections

Stanford Large Network Dataset Collection by Jure Leskovec: Online Reviews (Amazon, Movies, Beer)
GetGlue and Timestamped Event Data (ok. 11 GB); próbka 100 jsonów getglue101. Dane pochodzą z lat 2007–2012 – tylko filmy i przedstawienia TV. Przykładowe aggregacje: ilu jest różnych użytkowników w danych? jakie jest 10 najpopularniejszych filmów i przedstawień TV? ile jest różnych akcji?

Name		Name	Last commit message	Last commit date
Latest commit History 27 Commits
data		data
images		images
projects		projects
.gitignore		.gitignore
Aggregations_2.6.md		Aggregations_2.6.md
Aggregations_in_JS.md		Aggregations_in_JS.md
Git_Pull_Requests.md		Git_Pull_Requests.md
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Agregacje 3

Zaliczenie, deadline czwartek, 2014-11-20, 08:00 CEST

Egzamin, deadline czwartek, 2015-01-08, 08:00 CEST

Simple Rules for Reproducible Computations

Różne rzeczy

Big Collections

About

Releases

Packages

Languages

jcimoch/aggregations-3

Folders and files

Latest commit

History

Repository files navigation

Agregacje 3

Zaliczenie, deadline czwartek, 2014-11-20, 08:00 CEST

Egzamin, deadline czwartek, 2015-01-08, 08:00 CEST

Simple Rules for Reproducible Computations

Różne rzeczy

Big Collections

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages