Pamela Vízner es Consultora de AVP / Pamela Vízner is a Consultant for AVP
Como comunidad enfrentada a la responsabilidad de preservar la memoria de nuestras respectivas organizaciones, nos ha tocado una tarea difícil. Casi la de adivinos. Cuando hablamos de la preservación y de proteger y poner a disposición “para siempre” nuestra historia - en el medio que sea se haya originado, papel, objetos, audiovisual, etc. - dichas palabras nos quedan grandes. Hay mucha incertidumbre en ese “para siempre”. Sin embargo, hemos sido capaces de encontrar juntos poco a poco la respuesta a nuestras necesidades, y seguimos construyendo en esa dirección. Las comunidades son de suma importancia en nuestro quehacer, y cómo hemos dado forma a nuestra disciplina a pesar de esa incertidumbre. ¿Será que un enfoque comunitario es la respuesta a nuestras necesidades en preservación digital?
Lo que es cierto es que ya no podemos arrancar de ella: terminamos con materiales digitales ya sea para poner en acceso en sistemas modernos, como resultado de procesos de digitalización, y como adquisiciones de materiales nativos digitales. No hay escapatoria, encontrar formas de preservar nuestro legado digital es inminente.
Si bien hace unos diez años como comunidad aún no sabíamos con certeza si la digitalización era el medio definitivo de preservación, hoy lo aceptamos como un estándar. Pero no está exento de desafíos: ¿qué significa la preservación digital?, ¿qué implica?, ¿qué tipo de tecnología necesito?, ¿qué elementos deben estar presentes?
En el caso de Latinoamérica tenemos un gran camino por recorrer. No sólo tenemos que enfrentar la digitalización de gran parte de nuestro patrimonio - algunos de ellos en gran peligro de perderse si no tomamos acciones inmediatas, como es el caso del video magnético - sino que además debemos encontrar formas de subirnos pronto al tren de la preservación digital. Muchísimas organizaciones en nuestra región aún no toman medidas al respecto: el origen de esta inactividad es múltiple y no está relacionado sólo con los recursos económicos (eso es cierto también en organizaciones en otras latitudes). Y es que la preservación digital es un esfuerzo multidisciplinario, transversal y organizacional importante.
El apoyo de la comunidad es fundamental para conocer cómo otras organizaciones han enfrentado este desafío y aprender de los errores y experiencias. Pero también para buscar aliados en estas tareas titánicas. Así es como han surgido iniciativas como la preservación digital distribuida, un modelo que funciona activamente en algunas partes del mundo. La PDD es un modelo basado en la colaboración, distribución de las tareas básicas de preservación y almacenamiento digital compartido y geográficamente disperso. ¿Será posible que este modelo sea una respuesta para llevar adelante esta tarea en nuestra región? Al menos tenemos ya varios ejemplos de los que podemos aprender. Entonces, ¿qué hemos aprendido de los modelos tradicionales? ¿Qué hemos aprendido de los sistemas distribuidos existentes?
Quisiera comenzar por hacer una revisión rápida de qué tareas y responsabilidades implica la preservación digital en la actualidad para ponernos en perspectiva. Entender los requerimientos de la preservación digital en un contexto amplio nos permitirá mirar y evaluar los sistemas de preservación digital distribuidos con una visión objetiva y clara.
También quisiera hablar brevemente sobre el modelo general de preservación digital distribuida que espero sirva para comprender a grandes rasgos el modelo y los desafíos que intenta resolver.
Finalmente, realizaré un pequeño análisis de las consideraciones necesarias - desde mi punto de vista y en base a lo expuesto anteriormente - en relación a la viabilidad de la aplicación exitosa de este modelo en nuestra región. Como les dije, espero esto abra la conversación y que a partir de esto surjan preguntas.
A menudo en nuestro trabajo como consultores nos toca derribar los mitos de la preservación digital. Mucha gente piensa que la preservación digital es igual a la adquisición de almacenamiento robusto y un sistema tecnológico que lo administre. Sin embargo, hay muchísimos más detalles detrás de un programa de preservación digital efectivo, que aunque relacionados, no necesariamente constituyen tecnología. De hecho, un gran porcentaje depende de las personas. Si no lo han hecho aún, los invito a revisar el blog post de mi colega Kara Van Malssen, titulado: “El lado humano de la tecnología”, que habla precisamente de este tema.
Un programa de preservación digital requiere de mucho más que una tecnología, aunque ésta es sin duda importante. De forma muy general, algunos de los requerimientos necesarios para que un programa de preservación digital sea exitoso incluyen:
- Políticas: que creen un marco de referencia para las actividades de preservación digital, administración y acceso.
- Documentación: que ofrezca claridad en la aplicación de procesos, flujos de trabajo y responsabilidades asignadas.
- Almacenamiento: que entregue entornos seguros y confiables además de copias de respaldo y dispersión geográfica.
- Administración: que permita un desarrollo fluido de las actividades de preservación y mantenga la sustentabilidad del programa,
- Planificación: que entregue claridad sobre las metas del programa y los caminos propuestos para lograrlas,
- Personal: especialmente dedicado a estas tareas y con las competencias necesarias para la administración y realización de tareas específicas,
- Sistemas (varios): que permitan cumplir con las tareas necesarias y que interactúen con otros sistemas y/o usuarios de forma adecuada,
- Estándares: que permitan evaluar el estado del programa, identificar debilidades, e implementar mejoras.
En nuestro trabajo en AVP, a menudo nos basamos en estándares y marcos de referencia que nos permiten evaluar el estado de los programas de preservación digital de nuestros clientes o bien su preparación para la implementación de uno. De forma principal, utilizamos el marco OAIS, la norma ISO 16363, y los Niveles de Preservación Digital del NDSA.
El modelo OAIS - más de alguno de ustedes lo debe conocer - es un marco de referencia para el desarrollo de sistemas de archivo, más allá de detallar con precisión las actividades requeridas, establece actores (personas, entidades), roles, responsabilidades y funciones para lograr la preparación de contenido, ingesta, archivo y administración continua. Es además adaptable al contexto de cualquier organización.
Los Niveles de Preservación NDSA son una serie de recomendaciones estructuradas en niveles de profundidad ascendente que permiten a una organización evaluar y establecer mejoras para el crecimiento y fortalecimiento de un programa de preservación digital. Es una herramienta muy útil para quienes comienzan a embarcarse en la creación de un programa.
Por otro lado, la norma ISO 16363 fue desarrollada como un método de evaluación para repositorios digitales confiables, basado en OAIS, y que define áreas y métricas específicas. Es tremendamente detallado, pero ofrece una meta a largo plazo, tanto de forma general como específica, para la creación de un programa verdaderamente robusto.
Enfocándonos en dicha norma, podemos encontrar más detalles sobre el tipo de requerimientos específicos para la preservación digital:
Además de los ya mencionados anteriormente, encontramos requerimientos como:
- Definición de actores: que permiten asignar roles y responsabilidades claras, como también expectativas y performance.
- Establecimiento de procesos de revisión: que ayudan a mantener el programa actualizado y asegurar la sustentabilidad, enfrentando de forma oportuna las dificultades o cambios internos y/o externos.
- Transparencia: que permite mantener la documentación e información necesaria visible para quienes la necesiten.
- Auditorías Internas: que permiten evaluar y mejorar el programa.
- Sustentabilidad financiera: que asegura los recursos económicos necesarios para la continuación del programa a largo plazo.
- Contratos y Licencias (Derechos): que definen las condiciones de uso y acceso - tanto internos como externos - de los elementos preservados.
- Planificación de Preservación: que entrega un plan de acción claro para las actividades presentes y futuras.
- Administración de Información: que permite guardar la información necesaria para poder acceder a los contenidos (información de representación) y para poder comprenderlos (información descriptiva).
- Administración de Acceso: que permite controlar quiénes pueden o no acceder a los objetos.
- Mitigación de Riesgos: que identifica riesgos a futuro y propone planes para su mitigación.
- Administración de Objetos Digitales: que corresponde a las variadas actividades realizadas para la mantención de los objetos digitales. Éstas incluyen:
- Ingesta o adquisición de contenido.
- Creación de Paquetes (conocidos como SIP, AIP y DIP en OAIS)
- Procesos básicos: como checksum o sumas de verificación, creación-extracción de metadatos, asignación de identificadores, registro de actividades y cambios.
Esta porción es la que a menudo se confunde con la definición de preservación digital. Como podemos ver, corresponde sólo a una pequeña porción de los requerimientos.
Si miramos en más detalle, nos daremos cuenta que una gran parte de estos requerimientos tienen relación con la documentación y la definición de políticas que regulen finalmente las actividades que ocurren en nuestros sistemas tecnológicos. El propósito de la existencia de esta documentación no sólo apoya la transparencia y regulación del programa completo, sino que además ayuda a los actores involucrados a entender cuál es su rol y a entender su participación dentro de éste, haciendo más fluida la interacción entre entidades, sistemas y personas.
Ahora que tenemos una idea clara del esfuerzo que implica la preservación digital, podemos hablar un poco sobre los sistemas de preservación digital distribuidos (PDD).
El sistema de PDD es un modelo que surge a partir de la preocupación de organizaciones - mayormente con recursos económicos limitados - por preservar contenido precisamente aprovechando al máximo sus recursos para el almacenamiento y administración de objetos digitales. Dado que la preservación digital requiere de respaldos mantenidos en distintas locaciones geográficas, el sistema PDD fue ideado para permitir la colaboración entre organizaciones de forma de cumplir con este requerimiento de forma efectiva, segura pero también económica.
Un sistema PDD tiene centros o “nodos” en donde se almacena y administra la información digital.
Los sistemas PDD tienen dos modalidades:
- aquellas en las que los miembros de la organización funcionan como participantes, nodos y administradores al mismo tiempo,
- aquellas en donde algunos participantes funcionan como miembros y nodos al mismo tiempo, permitiendo además a otras organizaciones unirse sin necesidad de almacenar contenido de forma local. En este modelo, los participantes se agrupan en cooperativas u organizaciones sin fines de lucro que administran el sistema. Este modelo es el más común: DPN y MetaArchive son ejemplos.
De forma cooperativa y en conjunto, los nodos deben:
- Ser al menos tres,
- Estar distribuidos geográficamente y en zonas climáticas distintas,
- Estar conectados a redes energéticas distintas,
- Estar conectados entre sí de forma de poder replicar y verificar contenidos digitales.
De forma general, una organización que funciona como centro o nodo debe ser capaz de almacenar y de realizar las tareas básicas de preservación: correspondientes a la administración de objetos digitales de la que hablamos anteriormente (sumas de verificación, ingestas, administración de metadatos, etc.). Idealmente, también deben ocuparse de la migración de formatos o sistemas para asegurar la longevidad.
Por otro lado, en aquellos modelos en donde existen, los miembros - es decir, quienes entregan información al sistema - deben:
- Agrupar los contenidos a preservar
- Describir de forma precisa los contenidos (de acuerdo a los estándares y modelos del sistema)
- Enviar datos (o poner a disposición, en algunos sistemas los datos son empujados, en otros tomados)
- Priorizar y definir los tipos de contenidos que irán al sistema.
Una parte importante del funcionamiento de un sistema PDD es la elaboración de un marco de gobernanza que defina las actividades de cada nodo, miembro y la entidad administradora. Como también es necesario definir quienes tomarán las decisiones ahora y en el largo plazo. En ese sentido, varias organizaciones cuentan con juntas directivas rotativas que ofrecen una administración compartida que además refuerza la transparencia y la distribución en la toma de decisiones.
Como pueden ver, los sistemas PDD están fuertemente enfocados en realizar acciones relacionadas con el almacenamiento y la preservación de bits. Obviamente, por extensión, se ocupan además de la ingesta de objetos digitales y el almacenamiento de metadatos.
Si volvemos a nuestra lista de requerimientos para la preservación digital, veremos que hay una serie de elementos que no están cubiertos por estos sistemas, y que cada organización debe asumir por su cuenta. Incluso más, la definición de políticas internas en relación a la preservación digital podría también definir la idoneidad de un sistema PDD por sobre otro, o incluso definir si un sistema PDD es del todo posible para una organización.
Si tan sólo pensamos en un sistema PDD como la solución a ese breve segmento de los requerimientos, y dejando de lado los requerimientos particulares de cada organización, podemos evaluarlos de forma general y establecer ciertas ventajas y desventajas:
Ventajas:
- Pertenencia a una COMUNIDAD Y COLABORACIÓN: los miembros forman parte de una red de apoyo y pueden tomar decisiones de manera conjunta o apoyarse mutuamente con recursos intelectuales.
- ASISTENCIA: técnica en el proceso de ingesta y administración de objetos digitales, y también legal relacionado con el tipo de contenido subido a la red.
- SEPARACIÓN GEOGRÁFICA: que de otro modo requeriría de la adquisición y administración de almacenamiento separado para cada copia de respaldo.
- ARCHIVOS "OSCUROS" DE BAJO COSTO: en comparación con sistemas independientes. Como referencia: MetaArchive cobra alrededor de USD$8.000 anual por tres años en su opción más cara (por 2TB de contenido). Un sistema de preservación digital independiente puede costar desde unos USD50.000 anual.
- La administración de almacenamiento y monitoreo están garantizados en todos los nodos, lo que podría ser complejo de realizar teniendo tres sistemas de almacenamiento en una organización independiente.
Desventajas:
- La mayoría de los sistemas requieren de un COMPROMISO FINANCIERO INICIAL que cubre al menos un par de años de servicio. (En el caso de MetaArchive este costo correspondería a USD$24 mil en su esfera de participación más alta - tres años de servicio como mínimo). Esto da cierta sustentabilidad al programa pero podría constituir una barrera para organizaciones de menor tamaño o con menos recursos.
- La ADMINISTRACIÓN DE CONTENIDOS PARA ENTREGA A CENTROS requiere de una organización interna importante, además de la priorización de contenidos y preparación del material para ser entregado.
- Lo que implica que tienen que igualmente existir POLÍTICAS DE PRESERVACIÓN INTERNAS que regulen la participación en un programa de este tipo, además de políticas que revisen y actualicen la participación de la organización en el sistema.
- La organización debe además estar alineada con las POLÍTICAS DE PRESERVACIÓN del sistema, sobre todo en el caso en donde sólo se participa como miembro.
- Por estas razones, la ATRACCIÓN DE MIEMBROS NO ES SIEMPRE FÁCIL, lo que disminuye la sustentabilidad a largo plazo y hace que el sistema sea más costoso. Dependiendo del modelo, los sistemas pueden o no ajustar drásticamente sus precios para cubrir las funciones básicas del sistema.
- Finalmente, la CAPACITACIÓN DE PERSONAL PARA UNA CORRECTA ENTREGA DE CONTENIDOS es fundamental, pues los datos y contenidos en muchos casos requieren de estructuras y metadatos específicos que a menudo requieren de conocimiento técnico específico.
Entonces, con todas estas ideas en mente, podemos finalmente hacer una pequeña reflexión en torno a la aplicabilidad de este sistema en nuestra región. ¿Cómo podría funcionar? ¿Qué discusiones serían necesarias? ¿Cuáles podrían ser los obstáculos? Esta no es una lista exhaustiva, tal vez cada uno de ustedes en sus propias realidades y contextos pueda pensar en otras más.
- En primer lugar es posible que existan barreras internacionales en asuntos legales, ciertas organizaciones pueden no querer almacenar datos fuera de su propio país, o tal vez hay regulaciones específicas al respecto por asuntos de seguridad (ej. EU). O tal vez el pago de servicios no es posible si la entidad receptora está fuera del país, o los procesos sean más burocráticos. El apoyo de ciertas organizaciones internacionales, como el MERCOSUR, por ejemplo, podrían tal vez ayudar a mitigar o disminuir esas barreras. La única red de PDD en latinoamérica existe en Brasil, se llama Cariniana, y está administrada por el Instituto de Información de Ciencia y Tecnología (IBICT) y es una iniciativa gubernamental. Este ejemplo nos muestra que autoridades nacionales podrían también funcionar en otros contextos, creando redes al menos a este nivel.
- Por otro lado, unirse a un sistema existente puede ser más factible que crear uno nuevo, lo que podría ayudar a crear también una comunidad en habla hispana que también aporte en recursos intelectuales para el crecimiento en la participación de miembros de esta región.
- Desde el punto de vista económico, podríamos hacer una doble interpretación, dependiendo del contexto particular de cada institución: un compromiso a largo plazo podría permitir la participación de una organización que sufre de cambios estratégicos o de autoridades políticas constantes que evita la alocación de fondos de forma continua, pero podría ser un desafío conseguir los fondos iniciales o justificar una inversión a largo plazo.
- Por otro lado, la creación de un centro regional puede ser administrativamente complejo o sólo sea posible con la participación de organizaciones que tengan historial previo de colaboraciones exitosas o que tengan cierta alineación en sus políticas de forma de que sea más fácil establecer criterios comunes.
- Adicionalmente, la falta de organizaciones profesionales en la región, si bien no afecta de forma directa, podría dificultar la generación de redes de colaboración. La existencia de una podría facilitar espacios de discusión y conversación que propicien el avance de un modelo de este tipo.
- Además, cada organización debe tener cierta preparación para unirse a un sistema, tanto desde el punto de vista de las políticas internas para programas de preservación digital, como en relación a la capacitación del personal a cargo. Nuevamente, la falta de redes profesionales en la región y de literatura en nuestro idioma en relación a la preservación digital, dificulta la transferencia de conocimiento.
- La confianza, es sin duda un ingrediente importante dentro de estos sistemas. La transparencia y seguridad de un sistema determina también esta confianza. Cada miembro de la red debe tener plena confianza en que sus valiosos datos serán protegidos por los nodos correspondientes.
- Finalmente, si bien es un modelo interesante a explorar como forma de colaboración comunitaria, los sistemas de PDD no son la panacea de la preservación digital; cada organización tiene internamente su propia tarea, que como vimos está mayormente relacionada a sus políticas, protocolos, definición de roles y de responsabilidades, más allá de los sistemas, del financiamiento, o de las tecnologías que adopten.
Translated from the Spanish original
As a community faced with the responsibility of preserving the memory of our respective organizations, we have had a difficult task. Almost that of fortune tellers. When we talk about preservation and protecting and making our story available "forever" - in whatever medium it has originated, paper, objects, audiovisual, etc. - these words are great for us. But there is a lot of uncertainty in that "forever".
However, little by little we have been able to find the answers to meet these uncertain requirements, and we continue to work in that direction – towards forever. Communities are very important in our work, and how we have shaped our discipline, despite this uncertainty. Could it be that a community approach will help us develop a solution to our digital preservation needs?
What is certain is that we can no longer put it off, we end up with digital materials either way: as a result of digitization processes, and as acquisitions of born-digital materials. There is no escape, finding a way to preserve our digital legacy is urgent.
Although, about ten years ago as a community we did not know with certainty if ‘going digital’ was the definitive means of preservation, today we accept it as a standard. But it is not without challenges: what does digital preservation mean? What does it imply? What kind of technology do I need? What elements must be present?
In the case of Latin America, we have a long way to go. Not only do we have to face the prospect of digitizing a large part of our heritage - some of which is in great danger of being lost if we do not take immediate action, as is the case with magnetic video - but we must also find ways, quickly, to get on the digital preservation train. Many organizations in our region have not yet taken action: the reasons for this inactivity are manifold and not only related to economic issues (this is also true in organizations in other regions of the world). Digital preservation must be an important multi-disciplinary, cross-sector and organizational effort.
The support of the community is essential to know how other organizations have faced this challenge and have learned from their mistakes and experiences. But also, in finding allies in these titanic tasks. This is how initiatives such as the Distributed Digital Preservation (PDD) have emerged, a model that works actively in some parts of the world. The PDD is a model based on collaboration, distribution of the basic tasks of preservation and digital storage shared and geographically dispersed. Is it possible that this model is an answer to carry out this task in our region? At least we already have several examples from which we can learn. So, what have we learned from traditional models? What have we learned from the existing distributed systems?
I would like to begin by making a quick review of what tasks and responsibilities digital preservation currently involves, to put us in perspective. Understanding the requirements of digital preservation in a broad context will allow us to look at and evaluate distributed digital preservation systems with an objective and clear vision.
I would also like to talk briefly about the general model of distributed digital preservation that I hope will serve to explain the model in broad strokes, and the challenges it tries to solve.
Finally, I will conduct a small analysis of the necessary considerations - from my point of view and based on the above - in relation to the feasibility of the successful application of this model in our region. As I said, I hope this opens the conversation and that from this, questions will arise.
Often in our work as consultants we have to bust the myths of digital preservation. Many people think that digital preservation is equal to the acquisition of robust storage and a technological system that manages it. However, there are many more details behind an effective digital preservation program, which although related, do not necessarily constitute technology.
In fact, a large percentage depends on people. If you have not already done so, I invite you to review the post blog of my colleague Kara Van Malssen, entitled: "The human side of technology", which speaks precisely on this topic.
A digital preservation program requires much more than a technology, although this is undoubtedly important.
In a very general way, some of the requirements necessary for a digital preservation program to be successful include:
- Policies: create a reference framework for digital preservation, administration and access activities.
- Documentation: that offers clarity in the application of processes, workflows and assigned responsibilities.
- Storage: to deliver safe and reliable environments in addition to backup and geographical-dispersion.
- Administration: that allows a smooth development of the preservation activities and maintains the sustainability of the program,
- Planning: to provide clarity about the goals of the program and the proposed ways to achieve them,
- Staff: especially dedicated to these tasks and with the necessary competencies for the administration and performance of specific tasks,
- Systems (several): that fulfill the necessary tasks and that interact with other systems and / or users in an appropriate way,
- Standards: that allow to evaluate the status of the program, identify weaknesses, and implement improvements.
In our work in AVP, we often rely on standards and frames of reference that allow us to assess the status of our clients' digital preservation programs or their preparation for the implementation of one. Mainly, we use the OAIS framework, the ISO 16363 standard, and the NDSA Digital Preservation Levels.
The OAIS model – which of course most of you will know - is a frame of reference for the development of archival systems, beyond detailing precisely the required activities, establishing actors (people, entities), roles, responsibilities and functions for achieve content preparation, intake, file and continuous administration. It is also adaptable to the context of any organization.
The NDSA Preservation Levels are a series of recommendations structured in levels of ascending depth that allow an organization to evaluate and establish improvements for the growth and strengthening of a digital preservation program. It is a very useful tool for those who begin to embark on the creation of a program.
On the other hand, ISO 16363 was developed as an evaluation method for reliable digital repositories, based on OAIS, and which defines specific areas and metrics. It is tremendously detailed, but offers a long-term goal, both general and specific, for the creation of a truly robust program.
Focusing on these standards, we can find more details about the type of specific requirements for digital preservation:
In addition to those already mentioned above, we find requirements such as:
- Definition of roles: that allow assigning clear responsibilities, as well as expectations and performance.
- Establishment of review processes: that help to keep the program updated and ensure sustainability, facing difficulties and internal and / or external changes in a timely manner.
- Transparency: that allows to keep the documentation and necessary information visible to those who need it.
- Internal Audits: that allow to evaluation and improvement of the program.
- Financial sustainability: which ensures the economic resources necessary for the continuation of the long-term program.
- Contracts and Licenses (Rights): that define the conditions of use and access - both internal and external - of the preserved elements.
- Preservation Planning: which provides a clear action plan for present and future activities.
- Information Management: which saves the necessary information to be able to access the contents (representation information) and to be able to understand them (descriptive information).
- Access Management: that controls who can or cannot access the objects.
- Risk Mitigation: which identifies future risks and proposes plans for their mitigation.
- Digital Objects Management: which corresponds to the various activities carried out for the maintenance of digital objects. These include:
- Ingest or acquisition of content.
- Creation of Packages (known as SIP, AIP and DIP in OAIS)
- Basic processes: such as checksum or checksums, creation-extraction of metadata, assignment of identifiers, registration of activities and changes.
This portion is what is often confused with the definition of digital preservation. And as we can see, it corresponds to only a small portion of the requirements.
If we look in more detail, we realize that a large part of these requirements are related to the documentation and definition of policies that ultimately regulate the activities which occur in our technological systems. The purpose of the existence of this documentation not only supports the transparency and regulation of the complete program, but also helps the actors involved to understand what their role is and to understand their participation within it, making the interaction between entities, systems and people more fluid.
Now that we have a clear idea of the effort involved in digital preservation, we can talk a little bit about Distributed Digital Preservation systems (PDD).
The PDD system is a model that arises out of the concerns of many organizations - mostly with limited economic resources - to preserve content precisely by making the most of its available resources for the storage and administration of digital objects. Given that digital preservation requires copies maintained in different geographical locations, the PDD system has been designed to allow collaboration between organizations in order to comply with this requirement in an effective, safe but also economical way.
A PDD system has centers or "nodes" where digital information is stored and managed.
PDD systems have two modes:
- those in which the members of the organization function as participants, nodes and administrators at the same time,
- those where some participants function as members and nodes at the same time, also allowing other organizations to join without having to store content locally.
In this model, participants are grouped into cooperatives or non-profit organizations that administer the system. This model is the most common: DPN and MetaArchive are examples. Cooperatively and collectively, the nodes must:
- Be at least three,
- Be distributed geographically and in different climatic zones,
- Be connected to different energy networks,
- Be connected to each other in order to replicate and verify digital content.
In general, an organization that functions as a center or node must be able to store and perform the basic preservation tasks: corresponding to the administration of digital objects we spoke of earlier (checks, intakes, metadata management, etc.) Ideally, they should also deal with the migration of formats or systems to ensure longevity.
On the other hand, in those models where they exist, the members - that is, those who deliver information to the system - must:
- Group the contents to be preserved
- Describe the contents accurately (according to the standards and models of the system)
- Send data (or make available, in some systems the data is pushed, in others taken)
- Prioritize and define the types of content that will go to the system.
An important part of the operation of a PDD system is the development of a governance framework that defines the activities of each node, member and the administering entity, as it is also necessary to define who will make the decisions now and in the long term. In that sense, several organizations may have rotating Boards which offer a shared administration that also reinforces transparency and distribution in decision-making.
As you can see, PDD systems are strongly focused on actions related to the storage and preservation of bits. Obviously, by extension, they also deal with the ingest of digital objects and the storage of metadata.
If we go back to our list of requirements for digital preservation, we will see that there are a series of elements not covered by these systems, and that each organization must assume on its own. Even more, the definition of internal policies in relation to digital preservation could also define the suitability of one PDD system over another, or even define whether a PDD system is entirely possible for an organization.
If we only think of a PDD system as the solution to that brief segment of the requirements, and leaving aside the particular requirements of each organization, we can evaluate them in a general way and establish certain advantages and disadvantages:
Advantages:
- Membership of a COMMUNITY AND COLLABORATION: members are part of a support network and can make decisions together or support each other through information, experience and resources.
- ASSISTANCE: help in the process of ingesting and managing digital objects, and also legal support related to the type of content uploaded to the network.
- GEOGRAPHICAL SEPARATION: that would otherwise require the acquisition and management of separate storage for each backup copy.
- LOW COST "DARK" ARCHIVES: compared to independent systems. For reference: MetaArchive charges around USD $ 8,000 per year for three years at its most expensive option (per 2TB of content). An independent digital preservation system can cost from around USD50,000 per year.
- Storage management and monitoring are guaranteed at all nodes, which could be complex to perform with three storage systems in an independent organization.
Disadvantages:
- Most systems require an INITIAL FINANCIAL COMMITMENT that covers at least a couple of years of service. (In the case of MetaArchive, this cost would correspond to USD $ 24,000 in its highest sphere of participation - at least three years of service). This gives some sustainability to the program but could constitute a barrier for smaller organizations or with fewer resources.
- ADMINISTRATION OF CONTENTS FOR DELIVERY TO CENTERS requires an important internal organization, in addition to the prioritization of contents and preparation of the material to be delivered.
- That implies that there must also exist INTERNAL PRESERVATION POLICIES that regulate participation in a program of this type, as well as policies that review and update the organization's participation in the system.
- The organization must also be aligned with the PRESERVATION POLICIES of the system, especially in the case where only participates as a member.
- For these reasons, ATTRACTION OF MEMBERS IS NOT ALWAYS EASY, which decreases long-term sustainability and makes the system more expensive. Depending on the model, the systems may or may not drastically adjust their prices to cover the basic functions of the system.
- Finally, TRAINING PERSONNEL FOR A CORRECT DELIVERY OF CONTENTS is essential, since data and content in many cases require specific structures and metadata that often require specific technical knowledge.
So, with all these ideas in mind, we can finally reflect on the applicability of this system in our region. How could it work? What discussions would be necessary? What could be the obstacles? This is not an exhaustive list, perhaps each one of you in your own contexts can think of others.
- First, there may be international barriers to legal issues, certain organizations may not want to store data outside their own country, or there may be specific regulations in place for security reasons (e.g. EU). Or perhaps the payment of services is not possible if the receiving entity is out of the country, or the processes are more bureaucratic. The support of certain international organizations, such as MERCOSUR, for example, could perhaps help mitigate or diminish those barriers. The only PDD network in Latin America exists in Brazil, it is called Cariniana, and it is administered by the Institute of Science and Technology Information (IBICT); a government initiative. This example shows us that national authorities could also function in other contexts, creating networks at least at this level.
- On the other hand, joining an existing system may be more feasible than creating a new one, which could also help to create a Spanish-speaking community that also provides resources for the growth in the participation of members of this region.
- From an economic point of view, we could look at it two ways depending on the particular context of each institution: a long-term commitment could allow the participation of an organization that suffers from strategic changes or constant political authorities, which avoids allocating funds on a continuous basis, but it could be a challenge to get the initial funds or justify a long-term investment.
- On the other hand, the creation of a regional center can be administratively complex or only possible with the participation of organizations that have previous history of successful collaborations or that have some alignment in their policies in order to make it easier to establish common criteria.
- Additionally, the lack of professional organizations in the region, although this does not affect the issue directly, could hinder the generation of collaboration networks. The existence of one could facilitate spaces for discussion and conversation that propitiate the progress of a model of this type.
- In addition, each organization must have some preparation to join a system, both from the point of view of internal policies for digital preservation programs, and in relation to the training of the staff in charge. Again, the lack of professional networks in the region and literature in our language in relation to digital preservation, hinders the transfer of knowledge.
- Trust is undoubtedly an important ingredient within these systems. The transparency and security of a system also determines this confidence. Each member of the network must have full confidence that their valuable data will be protected by the corresponding nodes.
- And finally, while it is an interesting model to explore as a form of community collaboration, PDD systems are not the panacea of digital preservation; each organization has its own core remit, which as we saw is mostly related to its policies, protocols, definition of roles and responsibilities, beyond systems, financing, or the technologies they adopt.