Citación de datos

La citación de datos es la provisión de referencias exactas, consistentes y estandarizadas a conjuntos de datos, de la misma forma que se proporcionan referencias bibliográficas a otras fuentes publicadas como artículos de investigación o monografías. Típicamente, se utilizan identificadores de objetos digitales (DOIs) que llevan a un sitio web que contiene los metadatos para el conjunto de datos y el conjunto de datos mismo.[1][2]

Un ejemplo de citación de datos

Un artículo de 2011 reportó una incapacidad para determinar qué tan a menudo se hace citación de datos en ciencias sociales.[3]

Otros artículos publicados entre 2012 y 2013 informaron que la citación de datos estaba volviéndose más común, pero la práctica no era estándar.[4][5][6]

En 2014 FORCE 11 publicó la Joint Declaration of Data Citation Principles que cubren el propósito, función y atributos de la citación de datos.[7]

En octubre de 2018 CrossRef manifestó su apoyo a la iniciativa de catalogar conjuntos de datos y de recomendar su citación.[8]

Una popular revista orientada a datos informó en abril de 2019 que en lo sucesivo usaría la citación de datos.[9]

Un artículo de junio de 2019 sugirió que el aumento en la citación de datos hará esta práctica más valiosa para todo el mundo, porque fomentará el intercambio de datos y aumentará el perfil de las personas que los compartan.[10]

La citación de dato es un tema emergente en las ciencias de la computación, y ha sido definido como un problema computacional.[11]​ De hecho, citar datos presenta retos significativos a los computólogos. Los problemas principales a enfrentar están relacionados con:[12]

  • el uso de modelos de datos y formatos heterogéneos, por ejemplo, bases de datos relacionales, valores separados por comas (CSV), Extensible Markup Language (XML),[13][14]Resource Description Framework (RDF);[15]
  • la transitoriedad de los datos;
  • la necesidad de citar datos a diferentes niveles de granularidad, es decir, citas profundas;[16]
  • la necesidad de generar automáticamente citas a datos con granularidad variable.

Véase también

editar

Referencias

editar
  1. «Data citation». 
  2. Ball, A., Duke, M. (2011). ‘Data Citation and Linking’. DCC Briefing Papers. Edinburgh: Digital Curation Centre. Available online: http://www.dcc.ac.uk/resources/briefing-papers/
  3. MOONEY, Hailey (April 2011). "Citing data sources in the social sciences: do authors do it?". Learned Publishing. 24 (2): 99–108. doi:10.1087/20110204. S2CID 34513423.
  4. Edmunds, Scott C.; Pollard, Tom J.; Hole, Brian; Basford, Alexandra T. (2012-07-02). "Adventures in data citation: sorghum genome data exemplifies the new gold standard". BMC Research Notes. 5 (1): 223. doi:10.1186/1756-0500-5-223. ISSN 1756-0500. PMC 3392744. PMID 22571506.
  5. "Out of Cite, Out of Mind: The Current State of Practice, Policy, and Technology for the Citation of Data". Data Science Journal. 12: CIDCR1–CIDCR75. 2013. doi:10.2481/dsj.OSOM13-043.
  6. Mooney, Hailey; Newton, Mark P. (2012). "The Anatomy of a Data Citation: Discovery, Reuse, and Credit". Academic Commons. Columbia University. doi:10.7916/D8MW2STM.
  7. Data Citation Synthesis Group (2014). Martone, M. (ed.). "Joint Declaration of Data Citation Principles". San Diego: Force11 Scholarly Communication Institute. doi:10.25490/a97f-egyk.
  8. Lin, Jennifer (4 October 2018). "Data citation: let's do this". Crossref.
  9. "Data citation needed". Scientific Data. 6 (1): 27. 10 April 2019. doi:10.1038/s41597-019-0026-5. PMC 6472333. PMID 30971699.
  10. Pierce, Heather H.; Dev, Anurupa; Statham, Emily; Bierer, Barbara E. (4 June 2019). "Credit data generators for data reuse". Nature. 570(7759): 30–32. doi:10.1038/d41586-019-01715-4. PMID 31164773. S2CID 174809246.
  11. Buneman, P., Davidson, S. and Frew, J. (2016). ‘Why data citation is a computational problem’. Communications of the ACM, September 2016, Vol. 59 No. 9, pp. 50-57. https://doi.org/10.1145/2893181
  12. Silvello, G. (2018). ‘Theory and Practice of Data Citation’. Journal of the Association for Information Science and Technology (JASIST) (AIS Review), vol. 69 issue 1, pp. 6-20, 2018. Available online (open access): https://onlinelibrary.wiley.com/doi/full/10.1002/asi.23917
  13. Buneman, P. and Silvello, G. (2010). ‘A Rule-Based Citation System for Structured and Evolving Datasets’. IEEE Bulletin of the Technical Committee on Data Engineering, Vol. 3, No. 3. IEEE Computer Society, pp. 33-41, September 2010. Available online: http://sites.computer.org/debull/A10sept/buneman.pdf
  14. Silvello, G. (2017). ‘Learning to Cite Framework: How to Automatically Construct Citations for Hierarchical Data’. Journal of the Association for Information Science and Technology (JASIST), Volume 68 issue 6, pp. 1505-1524, June 2017. Available online: http://www.dei.unipd.it/~silvello/papers/2016-DataCitation-JASIST-Silvello.pdf
  15. Silvello, G. (2015). ‘A Methodology for Citing Linked Open Data Subsets’. D-Lib Magazine 21 (1/2), 2015. Available online: http://www.dlib.org/dlib/january15/silvello/01silvello.html
  16. Buneman, P. (2006). ‘How to Cite Curated Databases and how to Make Them Citable’. In Proc. of the 18th International Conference on Scientific and Statistical Database Management, SSDBM 2006, pages 195–203, 2006.