База данных генов
Ба́за да́нных ге́нов (генетическая база данных), информация о нуклеотидных (генетических) последовательностях, собранная и организованная по определённым признакам.
Выделяют несколько типов баз данных генов:
Архивные базы данных, куда может добавлять данные любой исследователь, и он же несёт ответственность за содержимое созданных им записей. Особенности: информация плохо структурирована, возможны ошибки. Пример: GenBank & EMBL.
Курируемые базы данных, в которых информация проверяется экспертами со стороны владельцев базы. Особенности: информация отбирается экспертами из архивных баз данных и проходит проверку на достоверность. Пример: COG (Cluster of Ortologous Genes), CTD (Comparative Toxicogenomics Database).
Производные базы данных, результат компьютерной обработки информации из архивных и курируемых баз данных и объединение их с целью классификации, унификации и др. Особенности: единообразие представленной информации, удобство поиска. Пример: GO (Gene Ontology).
Интегрированные базы данных, результат объединения информации из разных баз данных. Особенности: позволяют сразу получить всю имеющуюся информацию по конкретному гену, но эта информация слабо систематизирована. Пример: поисковая система ENTREZ, включающая в себя базы PubMed, Genomes и MMDB.
По роду представленной информации выделяют следующие виды баз данных генов:
Базы данных ДНК. Первичные базы данных ДНК содержат исходную информацию о нуклеотидных последовательностях. Пример: Международная база данных нуклеотидных последовательностей (International Nucleotide Sequence Database, INSD), объединяющая японскую DDBJ (DNA Data Bank of Japan), европейскую EMBL (European Molecular Biology Laboratory) и американскую базы данных GenBank. Вторичные базы данных более специализированы. Пример: HapMap, RefSeq, OMIM и др.
Базы данных экспрессии генов, создаваемые по информации, полученной в ходе исследований с помощью микрочипов. Пример: ArrayTrack, ImmGen и др.
Геномные базы данных, содержащие геномные последовательности для разных видов (Ensembl Genomes) или для конкретного модельного организма (FlyBase, Legume Information System, Xenbase и др.). В эту же группу входят базы данных по наследственным заболеваниям (Gene Disease Database).
Базы данных фенотипов, связывающие информацию о генах с данными о фенотипе. Пример: PHI-base и др.
Базы данных РНК. Пример: miRBase, Rfam.
(Миронов А. А. Биоинформатика // Московский физико-технический институт.)