Bioinformatika (bahasa
Inggris: bioinformatics)
adalah (ilmu yang mempelajari)
penerapan teknik komputasional untuk mengelola dan menganalisis informasi biologis.
Bidang ini mencakup penerapan metode-metode matematika,
statistika,
dan informatika
untuk memecahkan masalah-masalah biologis, terutama dengan menggunakan sekuens DNA dan asam amino
serta informasi yang berkaitan dengannya. Contoh topik utama
bidang ini meliputi basis data untuk mengelola informasi biologis,
penyejajaran sekuens (sequence
alignment), prediksi struktur untuk meramalkan bentuk struktur protein
maupun struktur sekunder RNA,
analisis filogenetik, dan analisis ekspresi gen.
Bioinformatika
merupakan ilmu terapan yang lahir dari perkembangan teknologi informasi
dibidang molekular. Pembahasan dibidang bioinformatik ini tidak terlepas dari perkembangan biologi molekular modern, salah
satunya peningkatan pemahaman manusia dalam bidang genomic yang terdapat dalam
molekul DNA.
Kemampuan untuk memahami
dan memanipulasi kode genetik DNA ini sangat didukung oleh teknologi
informasi melalui perkembangan hardware dan soffware. Baik pihak pabrikan
sofware dan harware maupun pihak ketiga dalam produksi perangkat lunak. Salah
satu contohnya dapat dilihat pada upaya Celera Genomics, perusahaan
bioteknologi Amerika Serikat yang melakukan pembacaan sekuen genom manusia yang
secara maksimal memanfaatkan teknologi informasi sehingga bisa melakukan
pekerjaannya dalam waktu yang singkat (hanya beberapa tahun).
Perkembangan teknologi DNA
rekombinan memainkan peranan penting dalam lahirnya bioinformatika. Teknologi
DNA rekombinan memunculkan suatu pengetahuan baru dalam rekayasa genetika
organisme yang dikenala bioteknologi. Perkembangan
bioteknologi dari bioteknologi tradisional ke bioteknologi modren salah satunya
ditandainya dengan kemampuan manusia dalam melakukan analisis DNA organisme, sekuensing
DNA dan manipulasi DNA.
Sekuensing DNA satu organisme,
misalnya suatu virus memiliki kurang lebih 5.000 nukleotida atau molekul DNA
atau sekitar 11 gen, yang telah berhasil dibaca secara menyeluruh pada
tahun 1977. Kemudia Sekuen seluruh DNA manusia terdiri
dari 3 milyar nukleotida yang menyusun 100.000 gen dapat dipetakan dalam waktu
3 tahun, walaupun semua ini belum terlalu lengkap. Saat ini terdapat milyaran
data nukleotida yang tersimpan dalam database DNA, GenBank di AS yang didirikan
tahun 1982.
Bioinformatika ialah ilmu yang mempelajari
penerapan teknik komputasi untuk
mengelola dan menganalisis informasi hayati. Bidang ini mencakup penerapan
metode-metode matematika, statistika, dan informatika untuk
memecahkan masalah-masalah biologi, terutama yang terkait dengan penggunaan
sekuens DNA dan asam amino. Contoh topik
utama bidang ini meliputi pangkalan datauntuk
mengelola informasi hayati, penyejajaran sekuens (sequence alignment),
prediksi struktur untuk meramalkan struktur protein atau pun
struktur sekunder RNA,
analisis filogenetik,
dan analisis ekspresigen.
Bioinformatika
pertamakali dikemukakan pada pertengahan 1980an untuk mengacu
kepada penerapan ilmu komputer dalam
bidang biologi. Meskipun demikian, penerapan bidang-bidang dalam bioinformatika
seperti pembuatan pangkalan data dan
pengembangan algoritma untuk
analisis sekuens biologi telah
dilakukan sejak tahun 1960an.
Kemajuan
teknik biologi
molekuler dalam mengungkap sekuens biologi protein (sejak awal1950an) dan asam nukleat (sejak
1960an) mengawali perkembangan pangkalan data dan teknik analisis sekuens
biologi. Pangkalan data sekuens protein mulai dikembangkan pada tahun
1960an di Amerika
Serikat, sementara pangkalan data sekuens DNA dikembangkan pada akhir 1970an di Amerika Serikat dan Jerman pada
Laboratorium Biologi Molekuler Eropa (European
Molecular Biology Laboratory).
Penemuan teknik sekuensing DNA yang
lebih cepat pada pertengahan 1970an menjadi landasan terjadinya ledakan jumlah
sekuens DNA yang dapat diungkapkan pada 1980an dan 1990an. Hal ini menjadi
salah satu pembuka jalan bagi proyek-proyek pengungkapan genom, yang meningkatkan
kebutuhan akan pengelolaan dan analisis sekuens, dan pada akhirnya menyebabkan
lahirnya bioinformatika.
Perkembangan
jaringan internet juga
mendukung berkembangnya bioinformatika. Pangkalan data bioinformatika yang
terhubungkan melalui internet memudahkan ilmuwan dalam mengumpulkan hasil
sekuensing ke dalam pangkalan data tersebut serta memperoleh sekuens biologi
sebagai bahan analisis. Selain itu, penyebaran program-program
aplikasi bioinformatika melalui internet
memudahkan ilmuwan dalam mengakses program-program tersebut dan kemudian memudahkan
pengembangannya.
Pangkalan Data sekuens
biologi dapat berupa pangkalan data primer untuk menyimpan sekuens primer asam nukleat dan protein, pangkalan data
sekunder untuk menyimpan motif sekuens protein, dan pangkalan data struktur
untuk menyimpan data struktur protein dan asam nukleat.
Pangkalan data
utama untuk sekuens asam nukleat saat ini adalah GenBank (Amerika
Serikat), EMBL (the European
Molecular Biology Laboratory, Eropa), dan DDBJ (DNA Data Bank of Japan, Jepang). Ketiga
pangkalan data tersebut bekerja sama dan bertukar data secara harian untuk
menjaga keluasan cakupan masing-masing pangkalan data. Sumber utama data
sekuens asam nukleat adalah submisi (pengumpulan) langsung dari peneliti
individual, proyek sekuensing genom,
dan pendaftaran paten.
Selain berisi sekuens asam nukleat, entri dalam pangkalan data sekuens asam
nukleat pada umumnya mengandung informasi tentang jenis asam nukleat (DNA atau RNA), namaorganisme sumber asam
nukleat tersebut, dan segala sesuatu yang berkaitan dengan sekuens asam nukleat
tersebut.
Selain asam
nukleat, beberapa contoh pangkalan data penting yang menyimpan sekuens primer
protein adalah PIR (Protein
Information Resource, Amerika Serikat), Swiss-Prot (Eropa), danTrEMBL (Eropa). Ketiga pangkalan
data tersebut telah digabungkan dalam UniProt, yang didanai
terutama oleh Amerika Serikat. Entri dalam UniProt mengandung informasi tentang
sekuens protein, nama organisme sumber protein, pustaka yang berkaitan, dan komentar
yang pada umumnya berisi penjelasan mengenai fungsi protein tersebut.
Perangkat
bioinformatika yang berkaitan erat dengan penggunaan pangkalan data sekuens
Biologi ialah BLAST (Basic
Local Alignment Search Tool). Penelusuran BLAST (BLAST search) pada
pangkalan data sekuens memungkinkan ilmuwan untuk mencari sekuens baik asam
nukleat maupun protein yang mirip dengan sekuens tertentu yang dimilikinya. Hal
ini berguna misalnya untuk menemukan gen sejenis pada
beberapa organisme atau
untuk memeriksa keabsahan hasil sekuensingatau
untuk memeriksa fungsi gen hasil sekuensing. Algoritma yang
mendasari kerja BLAST adalah penyejajaran sekuens.
PDB (Protein
Data Bank, Bank Data Protein) ialah pangkalan data tunggal yang menyimpan
model struktur tiga dimensi protein dan asam nukleat hasil
penentuan eksperimental (dengankristalografi
sinar-X, spektroskopi
NMR, dan mikroskopi
elektron). PDB menyimpan data struktur sebagai koordinat
tiga dimensi yang menggambarkan posisi atom-atom dalam protein
atau pun asam nukleat.