{rfName}
A

Indexat a

Llicència i ús

Altmetrics

Grant support

We appreciate all anonymous reviewers at Middleware'22, who provided insightful feedback that makes this paper much stronger. This work has been partially supported by EU (No. 825184) and Spanish Government (No. PID2019-106774RB-C22). Marc SanchezArtigas is a Serra Hunter Fellow.

Anàlisi d'autories institucional

Sanchez-Artigas, MarcAutor (correspondència)Eizaguirre, German TAutor o coautor

Compartir

Publicacions
>
Conferència publicada

A Seer Knows Best: Optimized Object Storage Shuffling for Serverless Analytics

Publicat a:Proceedings Of The Twenty-Third Acm/Ifip International Middleware Conference, Middleware 2022. 148-160 - 2022-01-01 (), DOI: 10.1145/3528535.3565241

Autors: Sanchez-Artigas, Marc; Eizaguirre, German T

Afiliacions

Univ Rovira & Virgili, Tarragona, Spain - Autor o coautor

Resum

Serverless platforms offer high resource elasticity and pay-as-you-go billing, making them a compelling choice for data analytics. To craft a "pure" serverless solution, the common practice is to transfer intermediate data between serverless functions via serverless object storage (IBM COS; AWS S3). However, prior works have led to inconclusive results about the performance of object storage, since they have left large margin for optimization. To verify that object storage has been underrated, we design a novel shuffle manager for serverless data analytics termed Seer. Specifically, Seer dynamically chooses between two shuffle algorithms to maximize performance. The algorithm choice is based on some predictive models, and very importantly, without users having to specify intermediate data sizes at the time of the job submission. We integrate Seer with PyWren-IBM [31], a serverless analytics framework, and evaluate it against both serverful (e.g., Spark) and serverless systems (e.g., Google BigQuery). Our results certify that our new shuffle manager can deliver performance improvements over them.

Paraules clau

I/o optimizationObject storageServerless computingShuffle

Indicis de qualitat

Impacte bibliomètric. Anàlisi de la contribució i canal de difusió

Des d'una perspectiva relativa, i atenent a l'indicador de impacte normalitzat calculat a partir del Field Citation Ratio (FCR) de la font Dimensions, proporciona un valor de: 2.9, el que indica que, comparat amb treballs en la mateixa disciplina i en el mateix any de publicació, el situa com un treball citat per sobre de la mitjana. (font consultada: Dimensions Jun 2025)

Concretament, i atenent a les diferents agències d'indexació, aquest treball ha acumulat, fins a la data 2025-06-23, el següent nombre de cites:

  • WoS: 6
  • OpenCitations: 5

Impacte i visibilitat social

Des de la dimensió d'influència o adopció social, i prenent com a base les mètriques associades a les mencions i interaccions proporcionades per agències especialitzades en el càlcul de les denominades "Mètriques Alternatives o Socials", podem destacar a data 2025-06-23:

  • L'ús d'aquesta aportació en marcadors, bifurcacions de codi, afegits a llistes de favorits per a una lectura recurrent, així com visualitzacions generals, indica que algú està fent servir la publicació com a base del seu treball actual. Això pot ser un indicador destacat de futures cites més formals i acadèmiques. Aquesta afirmació està avalada pel resultat de l'indicador "Capture", que aporta un total de: 3 (PlumX).

Anàlisi del lideratge dels autors institucionals

Hi ha un lideratge significatiu, ja que alguns dels autors pertanyents a la institució apareixen com a primer o últim signant, es pot apreciar en el detall: Primer Autor (Sanchez Artigas, Marc) i Últim Autor (Eizaguirre Suárez, Germán Telmo).

l'autor responsable d'establir les tasques de correspondència ha estat Sanchez Artigas, Marc.