Securitate, Infrastructură & OperațiuniBackup & Continuitate
Procedura de Recuperare Date
Pași de restaurare pentru Postgres și S3; scenarii DR și comunicare cu clienții afectați
Scenarii și Proceduri de Recuperare
1. Outage Platformă
Acțiuni:
- Monitorizare status provider — pagina de status Heroku (Model Partajat) sau AWS Health Dashboard (Model Dedicat)
- Notificarea clienților afectați prin email
- Actualizări de status emise până la rezolvare
- La revenire: verificare integritate aplicație și date
2. Corupere / Pierdere Date Relaționale (Postgres / RDS)
Instrumente de restaurare:
| Model | Instrument | Mecanism |
|---|---|---|
| Partajat (SaaS) | Heroku Postgres (CLI / Dashboard) | Restaurare din PITR sau dintr-un backup zilnic (retenție 30 zile) |
| Enterprise (Dedicat) | AWS RDS (Consolă AWS / CLI) | Restaurare din PITR sau dintr-un snapshot automat zilnic (retenție 30 zile) |
Pași:
- Identificarea punctului de restaurare dorit (PITR sau backup/snapshot zilnic)
- Inițierea restaurării prin instrumentul managed (întotdeauna prin canal HTTPS)
- Verificarea integrității datelor după restaurare
- Notificarea clienților afectați
3. Pierdere / Corupere Documente (AWS S3)
Opțiunea A — Restaurare din versioning S3:
- Recuperarea versiunii anterioare a documentului afectat direct din S3
- Aplicabil pentru ștergere sau suprascriere accidentală
Opțiunea B — Restaurare din CRR Replica:
- La outage regional AWS sau pierdere masivă de date
- Replica cross-region este un backup pasiv în regiune separată
- Nu este o țintă de failover live — necesită proceduri de recuperare manuale
4. Release Defect (Bad Release)
Rollback la release-ul anterior prin instrumentele de release managed:
- Model Partajat — Heroku Releases: rollback cu un click la orice release anterior (CLI sau Dashboard)
- Model Dedicat — redeploy AWS ECS pe versiunea (task definition) anterioară
5. Compromitere Credențiale
Procedura imediată:
- Rotație tuturor secretelor afectate — Heroku config vars (Partajat) sau AWS Secrets Manager (Dedicat)
- Rotație chei AWS (generare nou set IAM, dezactivare chei compromise)
- Rotație tokeni Postmark / AWS SES și furnizor semnătură electronică
- Verificare log-uri de activitate pentru acces neautorizat
- Notificare clienților dacă sunt date ale clienților afectate
RTO — Recovery Time Objective
| Scenariu | RTO estimat |
|---|---|
| Outage platformă aplicație (Heroku / AWS dedicat) | 4 ore |
| Restaurare bază de date (Heroku Postgres / AWS RDS) | 4 ore |
| Recuperare documente din replica S3 | 8 ore |
Comunicare cu Clienții
- Clienții afectați sunt notificați prin email la identificarea unui eveniment
- Actualizări de status sunt emise pe parcursul incidentului până la rezolvare
- La rezolvare: confirmare finală trimisă clienților afectați
Post-Incident
Pentru orice eveniment cu impact în producție:
- Review scris al incidentului — cauze, impact, acțiuni întreprinse
- Acțiuni corective identificate și urmărite până la implementare
- Actualizarea procedurii dacă sunt lecții de însuşit
Arhivă Externă Client (Opțional)
Clienții pot configura un export zilnic automat al documentelor semnate la o destinație de stocare externă la alegerea lor (stocare cloud, e-arhivă calificată etc.). Această arhivă externă oferă:
- O cale suplimentară de recuperare în afara platformei
- Portabilitate a datelor la orice moment
- Control deplin al clientului asupra propriei copii de backup