Ketika bisnis dijalankan dengan TI, tentu gangguan pada TI akan berimbas pada terganggunya kegiatan bisnis. Oleh karena itu, tim TI perlu menyusun strategi-strategi Business Continuity Plan.
Dalam menyusun Business Continuity Plan, hal yang dilakukan adalah memastikan bisnis tetap dapat berjalan meski adanya disrupsi. Salah satu bentuk disrupsi yang sering terjadi adalah IT failure.
IT failure bisa bermacam-macam bentuk dan sebabnya. Misalnya, kerusakan pada server, putusnya komunikasi jaringan, software crash, listrik padam, ruang server kebocoran air hujan, kerusuhan yang melumpuhkan infrastruktur teknologi dan lain sebagainya.
Dalam rangka mencegah disrupsi bisnis yang disebabkan oleh IT failure, tim TI perlu menyusun strategi-strategi yang menjamin keberlangsungan layanan TI meskipun ada kegagalan pada infrastruktur TI. Dalam bahasa TI, hal ini kita kenal dengan istilah High Availability (HA).
CIA Triad
Pada NIST Security Framework ada 3 prinsip keamanan informasi yang kita kenal dengan istilah CIA Triad. Ketiga prinsip itu adalah:
- Confidentiality: data/informasi tidak boleh diakses oleh yang tidak berhak
- Integrity: data/informasi tidak boleh diubah oleh yang tidak berhak
- Availability: data/informasi harus dapat diakses ketika dibutuhkan oleh yang berhak
Selain Confidentiality dan Integrity, Availability menjadi prinsip penting dalam keamanan informasi. Sehingga, menjamin ketersediaan informasi dengan membangun high availability infrastructure menjadi salah satu keharusan agar prinsip-prinsip keamanan informasi tetap terjaga.
Mengenal Infrastruktur High Availability
Dalam membangun infrastruktur HA, setidaknya ada 2 hal yang harus diperhatikan: capacity dan fault tolerant.
Capacity penting untuk dijaga ketersediaanya untuk menjamin keberlangsungan layanan TI. Masalah-masalah yang disebabkan oleh kurangnya kapasitas tentu akan membuat bisnis dan layanan menjadi terhambat. Contoh masalah disrupsi karena habisnya kapasitas:
- Seorang dokter tidak dapat melakukan CT scan karena kapasitas penyimpanan pada harddisk server telah habis
- Kasir tidak bisa entry transaksi karena aplikasi lambat yang disebabkan oleh kapasitas prosesor mendekati 100%
Pada infrastruktur TI, kapasitas dapat dijaga dan ditingkatkan dengan 2 cara: scale-up dan scale-out.
- Scale-up: meningkatkan kemampuan komponen, atau mengganti komponen dengan kemampuan yang lebih tinggi. Contoh: meningkatkan kemampuan web server dengan cara mengganti prosesor dengan yang lebih cepat dan menambah memory.
- Scale-out: meningkatkan keseluruhan kinerja sistem dengan cara menambah jumlah “tenaga kerja”. Contoh: menambah jumlah web server untuk menangani request dari ribuan pengakses.
Selain capacity, kita juga perlu memperhatikan aspek fault tolerant.
Fault tolerant dapat dicapai dengan redundansi. Redundansi dapat dilakukan mulai level komponen terkecil hingga level sistem yang lebih besar.
Contoh redundansi di level komponen terkecil misalnya: dual power supply dan RAID pada harddisk (kerusakan pada salah satu komponen tidak membuat server menjadi padam).
Sedangkan contoh redundansi di level sistem yang lebih besar misalnya: DC-DRC (Data Center – Disaster Recovery Center). Semisal kita punya DC di Jakarta dan DRC di Kalimantan, semisal ada disaster terjadi di Jakarta, kita masih punya sistem yang siap mengambil alih (failover) workload dan menjamin layanan TI tetap dapat diakses.
Membangun Infrastruktur High Availability
Infrastruktur HA harus mudah di-scaling. Artinya, ketika kapasitas mendekati habis, kita harus dapat menambah kapasitas baru tanpa menyebabkan layanan TI padam (zero downtime). Nggak lucu kalau dokter harus menunggu tim TI pengadaan harddisk baru agar dapat melakukan CT scan 🙂
Selain mudah di-scaling, infrastruktur HA juga harus fault-tolerant. Sehingga kerusakan pada salah satu atau beberapa komponen tidak akan membuat server padam dan layanan TI menjadi terdisrupsi.
Secara umum, untuk membangun infrastruktur HA, kita membutuhkan server yang lebih dari satu sebagai computing power, yang kemudian kita jadikan satu dalam sebuah cluster agar dapat saling membagi beban dan dapat melakukan failover ketika ada masalah di salah satu server.
Selain beberapa server, kita juga membutuhkan storage array yang terpisah dari server, agar penyimpanan data dilakukan secara terpusat dan independen dari sisi server. Storage array ini dapat berupa all-flash (untuk memaksimalkan performa) maupun hybrid (untuk menyeimbangkan performa dan kapasitas). Storage array ini biasa kita kenal dengan SAN Storage.
Kemudian kita akan membutuhkan storage networking untuk menghubungkan beberapa storage array dengan server-server. Networking ini biasa kita kenal dengan SAN (Storage Area Network). SAN berbeda dengan LAN. SAN menggunakan protokol khusus yaitu FC (Fibre Channel) atau iSCSI dan membutuhkan switch khusus yang kita kenal dengan istilah SAN Switch.
Server dan storage kita hubungkan melalui SAN switch. Dan kita harus melakukan instalasi dan konfigurasi software dengan sedemikian rupa sehingga kita dapat membuat suatu sistem infrastruktur High Availability yang dapat mengurangi disrupsi pada layanan TI ketika terjadi gangguan pada hardware.