DEFINISI
Bioinformatika (bahasa Inggris : bioinformatics)
adalah ilmu yang mempelajari atau penerapan tehnik komputasional untuk
mengelola dan menganalisis informasi biologis. Bidang ini mencakup penarapoan
metode-metode matematika, statistika, dan informatika untuk memecahkan
masalah-masalah biologis, terutama dengan menggunakan sekuens DNA dan asam
amino serta informasi yang berkaitan dengannya. Contoh topik utama bidang ini
meliputi basis data untuk mengelola informasi biologis. penyejajaran sekuens
( sequence alignment ), prediksi struktur untuk meramalkan
bentuk struktur protein maupun struktur sekunder RNA, analisis filogenetik, dan
analisis ekspresi gen.
SEJARAH
Istilah bioinformatics mulai dikemukakan pada
pertengahan era 1980-anuntuk mengacu padapenerapan komputerdalam
biologi. Namun demikian, penerapan bidang-bidang dalam bioinformatika(seperti
pembuatan basis data dan pengembangan algoritmauntuk analisis sekuens
biologis) sudahdilakukan sejak tahun 1960-an. Kemajuan teknik biologi
molekulardalam mengungkap sekuens biologis dari protein (sejak
awal 1950-an) dan asam nukleat(sejak 1960-an) mengawali
perkembangan basis data dan teknik analisis sekuensbiologis. Basis data sekuens
protein mulai dikembangkan pada tahun 1960-an di Amerika
Serikat, sementara basis data sekuens DNA dikembangkan pada akhir 1970-an
di Amerika Serikatdan Jerman(pada European Molecular Biology
Laboratory , Laboratorium Biologi Molekular Eropa).Penemuan
teknik sekuensingDNA yang lebih cepat pada pertengahan 1970-an menjadi
landasanterjadinya ledakan jumlah sekuens DNA yang berhasil diungkapkan pada
1980-an dan 1990-an, menjadisalah satu pembuka jalan bagi
proyek-proyek pengungkapan genom, meningkatkan kebutuhan
akanpengelolaan dan analisis sekuens, dan pada akhirnya menyebabkan
lahirnya bioinformatika.
BIDANG
YANG TERKAIT BIOINFORMATIKA
1. Biophysics
Merupakan sebuah
bidang interdisiplier yang mengaplikasikan teknik-teknik dari ilmu fisika untuk
memahami struktur dan ilmu biologi. Ilmu ini terkait dengan bioinformatika
karena untuk mengenal teknik-teknik dari ilmu fisika untuk memahami struktur
tersebut membutuhkan penggunaan TI.
2. Computational
Biology
Bidang ini merupakan
bagian dari bioinformatika yang paling dekat dengan bidang Biologi umum klasik.
Fokus dari Computational Biology adalah gerak evolusi,
populasi, dan biologi teoritis daripada biomedis dalam molekul dan sel. Pada
penerapan bidang ini model-model statistika untuk fenomena biologi lebih di
pakai dibandingkan dengan model sebenarnya.
3. Medical
Informatics
Merupakan sebuah
disiplin ilmu yang baru yang didefinisikan sebagai pembelajaran, penemuan, dan
implementasi dari struktur dan algoritma untuk meningkatkan komunikasi,
pengertian, dan manajemen informasi medis. Disiplin ilmu ini, berkaitan dengan
data-data yang didapatkan pada level biologi yang lebih “rumit”, dimana
sebagian besar bioinformatika lebih memperhatikan informasi dari sistem dan
struktur biomolekul dan seluler.
4. Proteomics
Pertama kali digunakan
utnuk menggambarkan himpunan dari protein-protein yang tersusun oleh genom.
Mengkarakterisasi banyaknya puluhan ribu protein yang dinyatakan dalam sebuah
tipe sel yang diberikan pada waktu tertentu melibatkan tempat penyimpanan dan perbandingan
dari data yang memiliki jumlah yang sangat besar, tak terhindarkan lagi akan
memerlukan bioinformatika.
5. Genomics
Adalah bidang ilmu
yang ada sebelum selesainya sekuen genom, kecuali dalam bentuk yang
paling kasar. Genomics adalah setiap usaha untuk menganalisa
atau membandingakna seluruh komplemen genetik dari satu spesies atau lebih.
PENERAPAN
UTAMA BIOINFORMATIKA
Basis data sekuens
biologis
Basis data sekuens
biologis dapat berupa basis data primer untuk menyimpan sekuens primer asam
nukleat maupun protein, basis data sekunder untuk menyimpan motif sekuens
protein, dan basis data struktur untuk menyimpan data struktur protein maupun
asam nukleat. Basis data utama untuk asam nukleat adalah GenBank (Amerika
Serikat), EMBL (Eropa), dan DDBJ (Jepang). Ketiga basis data tersebut
bekerjasama dan bertukar data secara harian untuk menjaga keleluasaan cakupan
masing-masing basis data. Sumber utama data sekuens asam nukleat adalah submisi
langsung dari periset individual, proyek sekuensing genom, dan pendaftaran
paten. Selain berisi sekuens asam nukleat, entri dalam basis data sekuens asam
nukleat umumnya mengandung informasi tentang jenis asam nukleat (DNA atau RNA),
nama organisme sumber asam nukleat tersebut, dan pustaka yang berkaitan dengan
sekuens asam nukleat tersebut.Contoh beberapa basis data penting yang menyimpan
sekuens primer adalah PIR (Protein Information Resource, Amerika Serikat),
Swiss-Prot (Eropa), dan TrEMBL (Eropa). Ketiga basis data tersebut telah
digabungkan dalam UniProt yang didanai terutama oleh Amerika Serikat. Entri
dalam UniProt mengandung informasi tentang sekuens protein, nama organisme
sumber protein, pustaka yang berkaitan, dan komentar yang umumnya berisi
penjelasan mengenai fungsi protein tersebut.BLAST (Basic Local Alignment Search
Tool) merupakan perkakas bioinformatika yang berkaitan erat dengan penggunaan
basis data sekuens biologis. Penelusuran BLAST pada basis data sekuens
memungkinkan ilmuwan untuk mencari sekuens asam nukleat maupun protein yang
mirip dengan sekuens tertentu yang dimilikinya. Hal ini berguna untuk menemukan
gen sejenis pada beberapa organisme atau untuk memeriksa keabsahan hasil
sekuensing maupun untuk memeriksa fungsi gen hasil sekuensing. Algoritma yang
mendasari kerja BLAST adalah penyejajaran sekuens.PDB (Protein Data Bank)
adalah basis data tunggal yang menyimpan model struktural 3D protein dan asam
nukleat hasil penentuan eksperimental dengan kristalografi sinar X,
spektroskopi NMR dan mikroskopi elektron. PDB menyimpan data struktur sebagai
koordinat 3D yang menggambarkan posisi atom-atom dalam protein maupun asam
nukleat.
Bioinformatika dalam Dunia Kedokteran
1. Bioinformatika
dalam bidang klinis
Perananan
Bioinformatika dalam bidang klinis ini sering juga disebut sebagai informatika
klinis (clinical informatics). Aplikasi dari clinical informatics ini adalah
berbentuk manajemen data-data klinis dari pasien melalui Electrical Medical Record
(EMR) yang dikembangkan oleh Clement J.
2. Bioinformatika
untuk penemuan obat
Penemuan obat yang
efektif adalah penemuan senyawa yang berinteraksi dengan asam amino yang
berperan untuk aktivitas (active site) dan untuk kestabilan enzim tersebut.
Karena itu analisa struktur dan fungsi enzim ini biasanya difokuskan pada
analisa asam amino yang berperan untuk aktivitas (active site) dan untuk
kestabilan enzim tersebut.. Dengan adanya Bioinformatika, data-data protein
yang sudah dianalisa bebas diakses oleh siapapun, baik data sekuen asam
amino-nya seperti yang ada di SWISS-PROT (http://www.ebi.ac.uk/swissprot/)
maupun struktur 3D-nya yang tersedia di Protein Data Bank (PDB)
(http://www.rcsb.org/pdb/). Dengan database yang tersedia ini, enzim yang baru
ditemukan bisa dibandingkan sekuen asam amino-nya, sehingga bisa diperkirakan
asam amino yang berperan untuk active site dan kestabilan enzim tersebut. Hasil
perkiraan kemudian diuji di laboratorium. Dengan demikian, akan lebih menghemat
waktu dari pada analisa secara random.
Bioinformatika dalam Sistem
Informasi Geografi (SIG)
1. SIG
adalah Pengintegrasian data sistem informasi geografi (SIG) seperti peta,
sistem cuaca, dengan hasil kesehatan dan data genotipe, akan membantu kita
untuk memprediksi hasil sukses dari penelitian agrikultural.Dengan adanya
bioinformatika yang sudah menjalar pada beberapa bidang membuat kita lebih
dimudahkan dalam menyelesaikan masalah. Ini membuktikan bahwa setiap
waktunya teknologi berkembang sangat pesat dan kita sangat membutuhkannya untuk
mempermudah hidup. Tentu diharapkan kemajuan ini tidak hanya berhenti sampai
disini, melainkan ada inovasi-inovasi baru dalam bioinformatika yang
dapat dibuat dibidang lain.
PENYAJARAN
SEKUENS
Penyejajaran
sekuens (sequence alignment) adalah proses penyusunan/pengaturan
dua atau lebih sekuens sehingga persamaan sekuens-sekuens tersebut
tampak nyata. Hasil dari proses tersebut juga disebut sebagai sequence
alignment atau alignment saja. Baris sekuens dalam
suatu alignment diberi sisipan (umumnya dengan tanda “–”)
sedemikian rupa sehingga kolom-kolomnya memuat karakter yang identik atau sama
di antara sekuens-sekuens tersebut. Berikut adalah contoh alignment DNA
dari dua sekuens pendek DNA yang berbeda, “ccatcaac” dan “caatgggcaac” (tanda
“|” menunjukkan kecocokan atau match di antara kedua sekuens)
(Krane, D.E., dan M.L. Raymer. 2003)
Sequence alignment merupakan metode
dasar dalam analisis sekuens. Metode ini digunakan untuk
mempelajari evolusi sekuens-sekuens dari leluhur yang sama (common
ancestor). Ketidakcocokan (mismatch) dalam alignment diasosiasikan
dengan proses mutasi, sedangkan kesenjangan (gap, tanda “–”)
diasosiasikan dengan proses insersi atau delesi. Sequence alignment memberikanhipotesis atas
proses evolusi yang terjadi dalam sekuens-sekuens tersebut. Misalnya,
kedua sekuens dalam contoh alignment di atas bisa jadi
berevolusi dari sekuens yang sama “ccatgggcaac”. Dalam kaitannya dengan hal
ini, alignment juga dapat menunjukkan posisi-posisi yang
dipertahankan (conserved) selama evolusi dalam
sekuens-sekuens protein, yang menunjukkan bahwa posisi-posisi tersebut
bisa jadi penting bagi struktur atau fungsi protein tersebut (Krane, D.E., dan
M.L. Raymer. 2003). Selain itu, sequence alignment juga
digunakan untuk mencari sekuens yang mirip atau sama dalam basis
data sekuens. BLAST adalah salah satu metode alignment yang
sering digunakan dalam penelusuran basis data sekuens. BLAST menggunakan
algoritma heuristik dalam penyusunanalignme (Mount, D.W.
2001).
Beberapa metode alignment lain
yang merupakan pendahulu BLAST adalah metode “Needleman-Wunsch” dan
“Smith-Waterman”. Metode Needleman-Wunsch digunakan untuk menyusun alignmentglobal di
antara dua atau lebih sekuens, yaitu alignment atas
keseluruhan panjang sekuens tersebut. Metode Smith-Waterman menghasilkan alignment lokal,
yaitu alignment atas bagian-bagian dalam sekuens. Kedua metode tersebut
menerapkan pemrograman dinamik (dynamic programming) dan hanya
efektif untuk alignment dua sekuens (pairwise alignment)
(Mount, D.W. 2001). Clustal adalah program bioinformatika untuk alignment multipel
(multiple alignment), yaitu alignment beberapa sekuens
sekaligus. Dua varian utama Clustal
adalah ClustalW dan ClustalX. (Mount, D.W. 2001). Metode
lain yang dapat diterapkan untuk alignment sekuens adalah
metode yang berhubungan dengan Hidden Markov Model (“Model
Markov Tersembunyi”, HMM). HMM merupakan model statistika yang mulanya
digunakan dalam ilmu komputer untuk mengenali pembicaraan manusia (speech
recognition). Selain digunakan untuk alignment, HMM juga digunakan dalam metode-metode
analisis sekuens lainnya, seperti prediksi daerah pengkode protein
dalam genom dan prediksi struktur sekunder protein (Mount, D.W. 2001)