Таксономическая база даних ncbi

Відео: 9. Бази даних. MySQL і порівняння з PostgreSQL | Технострим

Таксономическая база даних NCBI є частиною бази GenBank, підрозділи Національного центру біотехнологічної інформації США (NCBI). Вона містить понад 165 000 організмів, які представлені в базах даних як мінімум однієї нуклеотидної або білкової послідовності. Таксономічний браузер (TaxBrowser) може використовуватися для перегляду позицію організму або таксону в таксономической ієрархії або щоб отримати дані з будь-якого з основних баз даних системи Entrez для цього організму. TaxBrowser також дозволяє доступ до систем «Map Viewer», «BLAST» і «Trace Archive» через зовнішні посилання.
Пошук в базі даних може робитися з цілого, часткової або фонетичної назвою організму. На додаток до цього, посилання на організми, які часто використовують в біологічних дослідженнях, наведені окремо. Система відображення здатна показувати таксономічні дерева обраного користувачем фрагменту всієї бази даних NCBI.
Створена в 1988 році, NCBI стала будинком бази даних нуклеотидних послідовностей GenBank. У той же час стала очевидною необхідність створення таксономічної бази даних щоб доповнити нуклеотидні бази даних. Проблеми з таксономії, які використовують такі бази даних, були давно відомі: кожна з баз даних має свою власну таксономії, кожна відмінна від інших, і жодна з них не знаходяться в угоді з поточними таксономическими угодами (навіть якщо можна уявити, що така річ існує) , і всі вони містять широке розмаїття різних видів помилок і неузгодженостей. В результаті, не завжди відомо (навіть в межах тієї ж бази даних), або два записи відносяться до одного і того ж виду.
Щоб запобігти цих проблем, команда NCBI створила інструмент для інтеграції декількох відомих таксономічних баз як нуклеотидних баз даних, так і деяких інших, наприклад міжнародну систему ICTV для вірусів, USDA для рослин і FlyBase для Drosophilidae. Після цього була проведена конференція на базі морської біології в Мітч-Согін представників таксономічних баз даних і фахівців з систематики для уніфікації бази даних. Представники Європейської лабораторії молекулярної біології (EMBL), Швейцарської бази даних білків (SwissProt) і Японської бази даних ДНК (DDBJ) погодилися прийняти цю базу за таксономический стандарт.


Однією з особливостей системи NCBI є можливість легкої модифікації виданих даних користувачем, щоб він міг розташувати їх відповідно до однієї з класичних систем. Другий - практично повний перехід на філогенетична таксономії.
В результаті цього підходу, класична концепція таксономічних категорій (рангів) зникає. Наприклад, при редагуванні таксономічної бази Протозоа, співробітники NCBI замінили суфікси рангу сім`ї (-idae, -ida, -iformes т.п.) на загальні суфікси (-ids), хоча попередні назви залишилися в базі як синоніми, так що користувач може проводити по ним пошук.


Співробітники NCBI також намагаються зібрати статистику по використанню всіх можливих назв організму або таксону і формалізувати систему назв, приходячи до єдиного стандарту.
База даних NCBI не була створена виключно фахівцями з систематики та слід трохи іншим цілям. Тому результуюча база даних дещо відрізняється від провідних виключно систематичних баз, таких як «Робоча група по таксономическим баз даних» (TDWG), «Міжнародна організація інформації про рослини» (IOPI) і «Види 2000» (Species 2000). Наприклад, база NCBI дещо менше через відсутність молекулярних даних, необхідних для точної класифікації (що є стандартом NCBI), для великої кількості організмів (хоча вона швидко поповнюється).
Ще одним відомим конкурентом є «Об`єднана таксономическая інформації» (ITIS). ITIS перш за все використовує таксономічну літературу, яка спирається на екологічні дані. Система будується «зверху вниз», маючи в своєму розпорядженні організми певною системі таксонів. На відміну від неї, система NCBI повинна знайти місце для кожного організму, яких потрапляє в молекулярних баз даних. Крім того, як вже було згадано вище, система NCBI використовує строго філогенетичний підхід, що іноді призводить до розбіжностей з класичними системами. В результаті система відрізняється значною кількістю «некласифікованих» організмів і груп, хоча вважається найточнішою з філогенетичної / кладістіческіх точки зору.
Поділися в соц. мережах:

Увага, тільки СЬОГОДНІ!
По темі: