ssm.ro Docs
Securitate, Infrastructură & OperațiuniBackup & Continuitate

Procedura de Recuperare Date

Pași de restaurare pentru Postgres și S3; scenarii DR și comunicare cu clienții afectați

Scenarii și Proceduri de Recuperare

1. Outage Platformă

Acțiuni:

  1. Monitorizare status provider — pagina de status Heroku (Model Partajat) sau AWS Health Dashboard (Model Dedicat)
  2. Notificarea clienților afectați prin email
  3. Actualizări de status emise până la rezolvare
  4. La revenire: verificare integritate aplicație și date

2. Corupere / Pierdere Date Relaționale (Postgres / RDS)

Instrumente de restaurare:

ModelInstrumentMecanism
Partajat (SaaS)Heroku Postgres (CLI / Dashboard)Restaurare din PITR sau dintr-un backup zilnic (retenție 30 zile)
Enterprise (Dedicat)AWS RDS (Consolă AWS / CLI)Restaurare din PITR sau dintr-un snapshot automat zilnic (retenție 30 zile)

Pași:

  1. Identificarea punctului de restaurare dorit (PITR sau backup/snapshot zilnic)
  2. Inițierea restaurării prin instrumentul managed (întotdeauna prin canal HTTPS)
  3. Verificarea integrității datelor după restaurare
  4. Notificarea clienților afectați

3. Pierdere / Corupere Documente (AWS S3)

Opțiunea A — Restaurare din versioning S3:

  • Recuperarea versiunii anterioare a documentului afectat direct din S3
  • Aplicabil pentru ștergere sau suprascriere accidentală

Opțiunea B — Restaurare din CRR Replica:

  • La outage regional AWS sau pierdere masivă de date
  • Replica cross-region este un backup pasiv în regiune separată
  • Nu este o țintă de failover live — necesită proceduri de recuperare manuale

4. Release Defect (Bad Release)

Rollback la release-ul anterior prin instrumentele de release managed:

  • Model Partajat — Heroku Releases: rollback cu un click la orice release anterior (CLI sau Dashboard)
  • Model Dedicat — redeploy AWS ECS pe versiunea (task definition) anterioară

5. Compromitere Credențiale

Procedura imediată:

  1. Rotație tuturor secretelor afectate — Heroku config vars (Partajat) sau AWS Secrets Manager (Dedicat)
  2. Rotație chei AWS (generare nou set IAM, dezactivare chei compromise)
  3. Rotație tokeni Postmark / AWS SES și furnizor semnătură electronică
  4. Verificare log-uri de activitate pentru acces neautorizat
  5. Notificare clienților dacă sunt date ale clienților afectate

RTO — Recovery Time Objective

ScenariuRTO estimat
Outage platformă aplicație (Heroku / AWS dedicat)4 ore
Restaurare bază de date (Heroku Postgres / AWS RDS)4 ore
Recuperare documente din replica S38 ore

Comunicare cu Clienții

  • Clienții afectați sunt notificați prin email la identificarea unui eveniment
  • Actualizări de status sunt emise pe parcursul incidentului până la rezolvare
  • La rezolvare: confirmare finală trimisă clienților afectați

Post-Incident

Pentru orice eveniment cu impact în producție:

  1. Review scris al incidentului — cauze, impact, acțiuni întreprinse
  2. Acțiuni corective identificate și urmărite până la implementare
  3. Actualizarea procedurii dacă sunt lecții de însuşit

Arhivă Externă Client (Opțional)

Clienții pot configura un export zilnic automat al documentelor semnate la o destinație de stocare externă la alegerea lor (stocare cloud, e-arhivă calificată etc.). Această arhivă externă oferă:

  • O cale suplimentară de recuperare în afara platformei
  • Portabilitate a datelor la orice moment
  • Control deplin al clientului asupra propriei copii de backup